![基于数据挖掘的国际贸易客户流失的预测分析毕业论文_第1页](http://file4.renrendoc.com/view/5a5f54cf67060532c18db9f9c9635a38/5a5f54cf67060532c18db9f9c9635a381.gif)
![基于数据挖掘的国际贸易客户流失的预测分析毕业论文_第2页](http://file4.renrendoc.com/view/5a5f54cf67060532c18db9f9c9635a38/5a5f54cf67060532c18db9f9c9635a382.gif)
![基于数据挖掘的国际贸易客户流失的预测分析毕业论文_第3页](http://file4.renrendoc.com/view/5a5f54cf67060532c18db9f9c9635a38/5a5f54cf67060532c18db9f9c9635a383.gif)
![基于数据挖掘的国际贸易客户流失的预测分析毕业论文_第4页](http://file4.renrendoc.com/view/5a5f54cf67060532c18db9f9c9635a38/5a5f54cf67060532c18db9f9c9635a384.gif)
![基于数据挖掘的国际贸易客户流失的预测分析毕业论文_第5页](http://file4.renrendoc.com/view/5a5f54cf67060532c18db9f9c9635a38/5a5f54cf67060532c18db9f9c9635a385.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于数据挖掘的国际贸易客户流失的预测分析PAGE2目录TOC\o"1-2"\h\z\u1前言………………2
1.1设计背景………………………2
1.2数据挖掘简介…………………2
1.3决策树ID3和C4.5算法简介………………32客户数据训练集的预处理………3
2.1选择训练集……………………4
2.2去除训练集的冗余数据………42.3训练集中连续值的离散化……………………43结合信息增益和信息增益率进行决策树归纳…………………6
3.1计算对D中元组分类所需的期望信息………6
3.2计算每个属性的期望信息需求(即信息熵)………………73.3计算每个属性的信息增益率………………144构建决策树……………………16
4.1构建根节点决策树…………16
4.2构建最终决策树……………17
5客户群流失的预测和分析……………………176总结……………18结束语……………18致谢………………18参考文献…………18附录………………19基于数据挖掘的国际贸易客户流失的预测分析摘要:企业客户流失是一个企业最大的损失,但大部分企业并未找到一个切实有效的方法来解决这个问题,文章从数据挖掘角度,利用关联规则对国际贸易客户流失的预测进行一些分析,找出流失率比较高的并有价值的客户群体的特点,为企业提供一些具体策略来减少客户流失,最终获得较大的经济效益!关键词:数据挖掘客户流失决策树ID3算法c4.5算法离散化Abstract:Lossofbusinesscustomersarethebiggestlossofanenterprise,butmostenterpriseshaveNtfoundaneffectivewaytosolvethisproblem,dataminingarticlefromthepointofview,theuseofassociationrulesoninternationaltradethelossofcustomerstoconductsomeanalysisofthepredictiontoidentifythelossofrelativelyhighrateandvaluablecharacteristicsofclientgroups,providinganumberofspecificstrategiestoreducethelossofcustomers,andultimatelytheecoNmicbenefitsofalarger.Keywords:DataMining,Thelossofcustomers,DecisionTree,ID3algorithm,c4.5algorithm,DiscretizationPAGE191前言1.1设计背景随着中国加入世贸组织,互联网信息化高速发展带来的机遇,有着越来越多的企业或者个人)参加到国际贸易当中并从中获利,在营销和推广的手段的多元化的同时,客户群成了一个非常不稳定的群体,商人无非重视的是个利字,那么这些客户群很有可能会流向竞争对手那里,那么如何提升公司客户群的忠诚度就成为了首要解决的问题,为了满足外贸企业和外贸soho对客户流的需求以及掌控,由于数据量的复杂,也就非常有必要开发一个基于数据挖掘的国际贸易客户流失数据预测处理系统来来管理客户数据和预防客户的流失,这样不仅可以及时检测到客户的流失动向和原因,而且也为外贸企业外贸soho提供了更加快捷的方式来尽量减少客户端流失。1.2数据挖掘简介数据挖掘(datamining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以tb计,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术,是知识发现(kNwledgediscoveryindatabase)的关键步骤.1.3决策树ID3与C4.5算法简介ID3算法是J.RossQuinlan开发的一种数据挖掘[1]决策树算法[2]【3】,后来C4.5(ID3的后继),成为新的监督学习算法,两者都采用贪心非回溯的方法,其中决策树以自顶向下递归的分治方法,从训练元祖集和它们的相关联的类标号开始构造决策树,随着树的构建,训练集递归地划分成较小的子集,并分别引进信息增益和信息增益率来进行构造决策树。
2客户数据训练集的预处理
由于数据挖掘的对象是大量的数据,非常的庞乱繁杂,所以非常有必要将这些数据进行预处理[4][5],以适用于挖掘,这需要三个步骤
2.1选择训练集
将不相关的数据剔除掉,只保留一些与挖掘有关的,比如姓名电话号码,地址,取值太多,如果进行概化,将大于概化阀值,所以予以删除,还有对以前输入的数据不完整的,不规范的,也不予以选取,将予以剔除,还有一些属性关联比较密切的[6],可以删除个别,只留下代表属性。2.2去除训练集的冗余数据从逻辑上判断一些属性对训练集类属性结果不相关的,还有一些属性关联比较密切的,可以删除掉一个,从而极大的提高计算的效率和准确度,因为一些不相关的属性可能导致数据挖掘的准确度下降,以表一为例,成功率基本上都大于90%,但是跟数据挖掘的结果没有必然联系,将可能导致数据挖掘的准确度下降比如交易次数,交易总额,所以予以删除,另外支付宝担保交易付款和银行转帐付款关联性大于90%,将支付宝担保交易属性也予以删除。
2.3训练集中连续值的离散化
将连续的数值进行离散化处理,如年龄分为三类:
A1:<20A2:20—30A3:>30可以将订购款式分为四类,B1:板鞋B2:帆布鞋B3:跑鞋B4综合各种款式属性年龄简称A订购款式简称B批发简称C学生简称D银行汇款简称E
结合上面归纳,给出转化后的训练集表一,并给出相关的数据库图表,见图一,二编号年龄A订购款式B批发C学生D银行转帐E流失1A2B1YNYN2A2B3NYYY3A3B1NNYN4A1B2NYYN5A3B2NYNN6A1B2NYNN7A3B4YNYN8A3B3YNYN9A1B2NYNY10A3B4YNYN11A2B2NYYN12A1B4YNYY13A2B2NYYY14A1B1NYNN15A2B1YYYN16A3B3NNNY17A2B3YNYY18A1B4NNYY19A2B4YNYY20A3B1NNNY表一经过预处理对客户数据训练集图一创建的数据库tradedb图二数据库中的trade表数据3结合信息增益和信息增益率进行决策树归纳
3.1计算对D中元组分类所需的期望信息表一给出了一个类标记的元组的训练集D,每个属性都是离散值(连续值属性已经被离散化),类标号属性“是否流失”有两类,(即m=2),设类c1对应Y类c2对应N,类C1有11个元组,类C2有9个元组,由D中的元组创建(根)节点N,为了找出这些元组的分裂准则,必须计算每个属性的信息增益,计算对D中元组分类所需的期望信息(即信息熵):Info(D)=-log2(Pi)其中Pi是D中的任意元组属于Ci的概率,并用|Ci,D|/|D|估计,使用vb.Net构造的函数代码如下:PublicFunctiontradefuc(ByVala,ByValb)AsStringDimkAsStringk=a+btradefuc=-a/k*Log(a/k)/Log(2)-b/k*Log(b/k)/Log(2)Ifa=0Thentradefuc=-b/k*Log(b/k)/Log(2)EndIfIfb=0Thentradefuc=-a/k*Log(a/k)/Log(2)EndIfEndFunction计算对D中元组分类所需的期望信息:Info(D)=-log2(Pi)=0.992774453987808源代码如下'客户流失Dimt1AsDoubleDimsCon1AsString="SelectCount(*)Fromtradewhere流失='Y'"sCom.Connection=sConsCon.Open()sCom.CommandText=sCon1t1=sCom.ExecuteScalarDimt2AsDoubleDimsCon2AsString="SelectCount(*)Fromtradewhere流失='N'"sCom.Connection=sConsCom.CommandText=sCon2t2=sCom.ExecuteScalar'计算训练集D中元组分类的期望信息DimIAsDoubleI=tradefuc(t1,t2)计算如图三图三计算Info(D)的值3.2计算每个属性的期望信息需求(即信息熵):从属性age开始,查询age各个属性对应的流失是否个数,并计算它的信息增益Info年龄(D)=0.00196975696587331'年龄Dimage1AsDoubleDimageCon1AsStringageCon1="SelectCount(*)fromtradewhere年龄='A1'"sCom.Connection=sConsCom.CommandText=ageCon1age1=sCom.ExecuteScalarDimage11AsDoubleDimageCon11AsStringageCon11="SelectCount(*)fromtradewhere年龄='A1'and流失='Y'"sCom.Connection=sConsCom.CommandText=ageCon11age11=sCom.ExecuteScalarDimage12AsDoubleDimageCon12AsStringageCon12="SelectCount(*)fromtradewhere年龄='A1'and流失='N'"sCom.Connection=sConsCom.CommandText=ageCon12age12=sCom.ExecuteScalarDimage2AsDoubleDimageCon2AsStringageCon2="SelectCount(*)fromtradewhere年龄='A2'"sCom.Connection=sConsCom.CommandText=ageCon2age2=sCom.ExecuteScalarDimage21AsDoubleDimageCon21AsStringageCon21="SelectCount(*)fromtradewhere年龄='A2'and流失='Y'"sCom.Connection=sConsCom.CommandText=ageCon21age21=sCom.ExecuteScalarDimage22AsDoubleDimageCon22AsStringageCon22="SelectCount(*)fromtradewhere年龄='A2'and流失='N'"sCom.Connection=sConsCom.CommandText=ageCon22age22=sCom.ExecuteScalarDimage3AsDoubleDimageCon3AsStringageCon3="SelectCount(*)fromtradewhere年龄='A3'"sCom.Connection=sConsCom.CommandText=ageCon3age3=sCom.ExecuteScalarDimage31AsDoubleDimageCon31AsStringageCon31="SelectCount(*)fromtradewhere年龄='A3'and流失='Y'"sCom.Connection=sConsCom.CommandText=ageCon31age31=sCom.ExecuteScalarDimage32AsDoubleDimageCon32AsStringageCon32="SelectCount(*)fromtradewhere年龄='A3'and流失='N'"sCom.Connection=sConsCom.CommandText=ageCon32age32=sCom.ExecuteScalar'计算年龄的信息增益DimIage1AsDoubleIage1=tradefuc(age11,age12)DimIage2AsDoubleIage2=tradefuc(age21,age22)DimIage3AsDoubleIage3=tradefuc(age31,age32)DimIageAsDoubleIage=age1/t*Iage1+age2/t*Iage2+age3/t*Iage3DimGainageAsDoubleGainage=I-Iage类似的,Gain(订购款式)的代码如下'订购款式Dimdg1AsDoubleDimdgCon1AsStringdgCon1="SelectCount(*)fromtradewhere订购款式='B1'"sCom.Connection=sConsCom.CommandText=dgCon1dg1=sCom.ExecuteScalarDimdg11AsDoubleDimdgCon11AsStringdgCon11="SelectCount(*)fromtradewhere订购款式='B1'and流失='Y'"sCom.Connection=sConsCom.CommandText=dgCon11dg11=sCom.ExecuteScalarDimdg12AsDoubleDimdgCon12AsStringdgCon12="SelectCount(*)fromtradewhere订购款式='B1'and流失='N'"sCom.Connection=sConsCom.CommandText=dgCon12dg12=sCom.ExecuteScalarDimdg2AsDoubleDimdgCon2AsStringdgCon2="SelectCount(*)fromtradewhere订购款式='B2'"sCom.Connection=sConsCom.CommandText=dgCon2age2=sCom.ExecuteScalarDimdg21AsDoubleDimdgCon21AsStringdgCon21="SelectCount(*)fromtradewhere订购款式='B2'and流失='Y'"sCom.Connection=sConsCom.CommandText=dgCon21dg21=sCom.ExecuteScalarDimdg22AsDoubleDimdgCon22AsStringdgCon22="SelectCount(*)fromtradewhere订购款式='B2'and流失='N'"sCom.Connection=sConsCom.CommandText=dgCon22dg22=sCom.ExecuteScalarDimdg3AsDoubleDimdgCon3AsStringdgCon3="SelectCount(*)fromtradewhere订购款式='B3'"sCom.Connection=sConsCom.CommandText=dgCon3dg3=sCom.ExecuteScalarDimdg31AsDoubleDimdgCon31AsStringdgCon31="SelectCount(*)fromtradewhere订购款式='B3'and流失='Y'"sCom.Connection=sConsCom.CommandText=dgCon31dg31=sCom.ExecuteScalarDimdg32AsDoubleDimdgCon32AsStringdgCon32="SelectCount(*)fromtradewhere订购款式='B3'and流失='N'"sCom.Connection=sConsCom.CommandText=dgCon32dg32=sCom.ExecuteScalarDimdg4AsDoubleDimdgCon4AsStringdgCon4="SelectCount(*)fromtradewhere订购款式='B4'"sCom.Connection=sConsCom.CommandText=dgCon4dg4=sCom.ExecuteScalarDimdg41AsDoubleDimdgCon41AsStringdgCon41="SelectCount(*)fromtradewhere订购款式='B4'and流失='Y'"sCom.Connection=sConsCom.CommandText=dgCon41dg41=sCom.ExecuteScalarDimdg42AsDoubleDimdgCon42AsStringdgCon42="SelectCount(*)fromtradewhere订购款式='B4'and流失='N'"sCom.Connection=sConsCom.CommandText=dgCon42dg42=sCom.ExecuteScalar'计算订购款式的信息增益DimIdg1AsDoubleIdg1=tradefuc(dg11,dg12)DimIdg2AsDoubleIdg2=tradefuc(dg21,dg22)DimIdg3AsDoubleIdg3=tradefuc(dg31,dg32)DimIdg4AsDoubleIdg4=tradefuc(dg41,dg42)DimIdgAsDoubleIdg=age1/t*Idg1+dg2/t*Idg2+dg3/t*Idg3+dg4/t*Idg4DimGaindgAsDoubleGaindg=I-IdgGain(批发)的源代码如下'批发Dimpifa1AsDoubleDimpifaCon1AsStringpifaCon1="SelectCount(*)fromtradewhere批发='Y'"sCom.Connection=sConsCom.CommandText=pifaCon1pifa1=sCom.ExecuteScalarDimpifa11AsDoubleDimpifaCon11AsStringpifaCon11="SelectCount(*)fromtradewhere批发='Y'and流失='Y'"sCom.Connection=sConsCom.CommandText=pifaCon11pifa11=sCom.ExecuteScalarDimpifa12AsDoubleDimpifaCon12AsStringpifaCon12="SelectCount(*)fromtradewhere批发='Y'and流失='N'"sCom.Connection=sConsCom.CommandText=pifaCon12pifa12=sCom.ExecuteScalarDimpifa2AsDoubleDimpifaCon2AsStringpifaCon2="SelectCount(*)fromtradewhere批发='N'"sCom.Connection=sConsCom.CommandText=pifaCon2pifa2=sCom.ExecuteScalarDimpifa21AsDoubleDimpifaCon21AsStringpifaCon21="SelectCount(*)fromtradewhere批发='N'and流失='Y'"sCom.Connection=sConsCom.CommandText=pifaCon21pifa21=sCom.ExecuteScalarDimpifa22AsDoubleDimpifaCon22AsStringpifaCon22="SelectCount(*)fromtradewhere批发='N'and流失='N'"sCom.Connection=sConsCom.CommandText=pifaCon22pifa22=sCom.ExecuteScalar'计算批发的信息增益DimIpifa1AsDoubleIpifa1=tradefuc(pifa11,pifa12)DimIpifa2AsDoubleIpifa2=tradefuc(pifa21,pifa22)DimIpifaAsDoubleIpifa=pifa1/t*Ipifa1+pifa2/t*Ipifa2DimGainpifaAsDoubleGainpifa=I-IpifaGain(学生)的源代码如下'学生Dimstudent1AsDoubleDimstudentCon1AsStringstudentCon1="SelectCount(*)fromtradewhere学生='Y'"sCom.Connection=sConsCom.CommandText=studentCon1student1=sCom.ExecuteScalarDimstudent11AsDoubleDimstudentCon11AsStringstudentCon11="SelectCount(*)fromtradewhere学生='Y'and流失='Y'"sCom.Connection=sConsCom.CommandText=studentCon11student11=sCom.ExecuteScalarDimstudent12AsDoubleDimstudentCon12AsStringstudentCon12="SelectCount(*)fromtradewhere学生='Y'and流失='N'"sCom.Connection=sConsCom.CommandText=studentCon12student12=sCom.ExecuteScalarDimstudent2AsDoubleDimstudentCon2AsStringstudentCon2="SelectCount(*)fromtradewhere学生='N'"sCom.Connection=sConsCom.CommandText=studentCon2student2=sCom.ExecuteScalarDimstudent21AsDoubleDimstudentCon21AsStringstudentCon21="SelectCount(*)fromtradewhere学生='N'and流失='Y'"sCom.Connection=sConsCom.CommandText=studentCon21student21=sCom.ExecuteScalarDimstudent22AsDoubleDimstudentCon22AsStringstudentCon22="SelectCount(*)fromtradewhere学生='N'and流失='N'"sCom.Connection=sConsCom.CommandText=studentCon22student22=sCom.ExecuteScalar'计算学生的信息增益DimIstudent1AsDoubleIstudent1=tradefuc(student11,student12)DimIstudent2AsDoubleIstudent2=tradefuc(student21,student22)DimIstudentAsDoubleIstudent=student1/t*Istudent1+student2/t*Istudent2DimGainstudentAsDoubleGainstudent=I-IstudentGain(银行转帐)的源代码实现'支付方式--银行转帐Dimbank1AsDoubleDimbankCon1AsStringbankCon1="SelectCount(*)fromtradewhere银行='Y'"sCom.Connection=sConsCom.CommandText=bankCon1bank1=sCom.ExecuteScalarDimbank11AsDoubleDimbankCon11AsStringbankCon11="SelectCount(*)fromtradewhere银行='Y'and流失='Y'"sCom.Connection=sConsCom.CommandText=bankCon11bank11=sCom.ExecuteScalarDimbank12AsDoubleDimbankCon12AsStringbankCon12="SelectCount(*)fromtradewhere银行='Y'and流失='N'"sCom.Connection=sConsCom.CommandText=bankCon12bank12=sCom.ExecuteScalarDimbank2AsDoubleDimbankCon2AsStringbankCon2="SelectCount(*)fromtradewhere银行='N'"sCom.Connection=sConsCom.CommandText=bankCon2bank2=sCom.ExecuteScalarDimbank21AsDoubleDimbankCon21AsStringbankCon21="SelectCount(*)fromtradewhere银行='N'and流失='Y'"sCom.Connection=sConsCom.CommandText=bankCon21bank21=sCom.ExecuteScalarDimbank22AsDoubleDimbankCon22AsStringbankCon22="SelectCount(*)fromtradewhere银行='N'and流失='N'"sCom.Connection=sConsCom.CommandText=bankCon22bank22=sCom.ExecuteScalar'计算支付方式--银行转帐的信息增益DimIbank1AsDoubleIbank1=tradefuc(bank11,bank12)DimIbank2AsDoubleIbank2=tradefuc(bank21,bank22)DimIbankAsDoubleIbank=bank1/t*Ibank1+bank2/t*Ibank2DimGainbankAsDoubleGainbank=I-Ibank3.3计算每个属性的信息增益率信息增益度量偏向具有许多输出的测试,信息增益率可以克服这种偏倚,使用分裂信息值将信息增益规范化,分裂信息类似于Info(D),定义如下SplitInfoA(D)=-log2()该值代表通过将训练数据集D划分成对应于属性A测试的V个输出的V个划分产生的信息,每个输出,关于D中元祖总数考虑具有该输出的元组数,他不同于信息增益,信息增益关于分类度量基于相同划分所需要的信息。增益率定义为:GainRatio(A)=选择具有最大增益率的属性作为分裂属性,随着分裂信息趋向于0,该比例变的不稳定,为了避免这种情况,增加一个约束,选取测试的信息增益必须较大,至少与所考察的所有测试的平均增益一样大。计算每个属性的信息增益率,“年龄”计算如下:SplitInfoA(D)的源代码实现'计算年龄的分裂信息DimSplitageAsDoubleSplitage=tradefuc2(age1,age2,age3)GainRatio(A)的源代码实现'计算年龄的信息增益率DimGainradioageAsDoubleGainradioage=Gainage/Splitage类似的订购款式的分裂信息和信息增益率为'计算订购款式的分裂信息DimSplitdgAsDoubleSplitdg=tradefuc(dg1,dg2)+tradefuc(dg3,dg4)'计算订购款式的信息增益率DimGainradiodgAsDoubleGainradiodg=Gaindg/Splitdg批发的分裂信息和信息增益率为'计算批发的分裂信息DimSplitpifaAsDoubleSplitpifa=tradefuc(pifa1,pifa2)'计算批发的信息增益率DimGainradiopifaAsDoubleGainradiopifa=Gainpifa/Splitpifa批发的分裂信息和信息增益率为'计算学生的分裂信息DimSplitstudentAsDoubleSplitstudent=tradefuc(student1,student2)'计算学生的信息增益率DimGainradiostudentAsDoubleGainradiostudent=Gainstudent/Splitstudent银行转帐的分裂信息和信息增益率为'计算支付方式--银行转帐的分裂信息DimSplitbankAsDoubleSplitbank=tradefuc(bank1,bank2)'计算支付方式--银行转帐的信息增益率DimGainradiobankAsDoubleGainradiobank=Gainbank/Splitbank输出计算结果,如图四图四第一次各属性的信息增益率计算结果选取信息增益率最大但是同时获取的信息增益又不低于所有属性平均值的属性作为测试属性,以该属性作为节点,属性的每一个分布引出一个分支,据此划分样本,要是节点中所有样本都在同一个类,则该节点成为树叶,以该客户类别标记树叶,如此类推,递归的形成初始决策树,另外,在节点处记下符合条件的统计数据。4构建决策树4.1构建根节点决策树比较5个属性的信息增益率,选择信息增益率最大的属性作为分裂属性,将训练集分成若干个子集,程序结果如下,见图五图五比较5个属性的信息增益率,并输出源代码如下DimGainradio1AsDoubleGainradio1=max(TextBox8.Text,TextBox9.Text)DimGainradio2AsDoubleGainradio2=max(TextBox11.Text,TextBox1.Text)DimGainradio3AsDoubleGainradio3=max(TextBox10.Text,Gainradio1)DimGainradio4AsDoubleGainradio4=max(Gainradio2,Gainradio3)TextBox20.Text=Gainradio4里面的max函数在附录代码里有注释根据计算结果得出,第一次的根节点决策树,如图六所示,图六根节点决策树4.2构建最终决策树下面接着对四个结点继续类似分类,生成最终数据流失决策树,如下图2图七最终决策树5客户群流失的预测和分析我们来对决策树结果做一些总结,从图2中可以看出,决策树的第一选择属性是“订购款式”说明订购款式是客户流失的最重要因素,这个跟经验比较接近,下来的就是批发,学生,银行汇款,年龄等属性,根据最终决策树模型,可以得到以下一些特征,当客户订购款式时,不管客户是批发,零售,还是学生,客户都不容易流失;当客户身份是学生时,建议选购B2(帆布鞋),则客户不容易流失;当客户只订购B3(跑鞋)时,建议客户选购其他款式,B3的客户非常容易流失,也可以确定B3款式质量不过硬,应该加强质量;当客人选择B1(板鞋),建议客人选择银行汇款方式付款,而不建议客人选用支付宝交易,这样客人不容易流失;当客户是批发的话,查看客户的年龄,如果客户年龄属于A3,此类客户不容易流失,如果不属于A3,则这类客户很容易流失。根据上面分析的结果,应该采取一些措施来尽量减少客户的流失,并切实的提出一些具体的方案来改进,尽可能的增大客户的忠诚度,为企业创造更大的经济效益。6总结本文引用数据挖掘来预测和分析贸易公司客户的流失,挖掘出了一定数量相当宝贵的关联规则,以及解决方法,选取了实际的客户数据训练集进行挖掘分析,引用决策树ID3算法,c4.5算法,信息增益,信息增益率等技术,最后生成了最终决策树,挖掘出了这些数据的一些关联特征,公司可以借鉴这些规则来进行2000年-2008等其他数据来预测和分析客户数据的流失。结束语经过三个月的学习和研究,基于数据挖掘的国际贸易客户流失的预测分析基本完成,在完成过程中遇到的问题,迫使我去认真的查询资料、搜索引擎网上搜索求助他人。经过这三个月,对数据挖掘这门新兴的课程有了更深的理解,对里面的决策树ID3算法,c4.5算法等有了更为透彻的领悟。在这里我对一句话深有感悟,那就是“实践是检验学习的最好方法!”。但是,由于时间和我个人的经验等原因,还有一些不完善的地方。这些将在下一步的工作中继续完成。致谢经过半年的认真学习和工作,我的毕业设计已经接近尾声,但是作为一个本科毕业生来做一个研究生的课题的毕业设计,由于经验的匮乏,阅读资料的难度,难免有许多考虑不周全的地方,如果没有导师的督促指导,以及一起工作的同学们的支持,想要完成这个设计是难以想象的。在本次毕业设计中,无论在理论上还是在实践中以及精神鼓励,指导老师黄海老师都给予我很大的帮助,在设计中,遇到的问题都能很认真的讲解,有什么不足的地方都能及时指出并提出个人相关的建议,促使论文设计能够顺利的完成,真诚的感谢他细心而又耐心的指导。最后再次感谢黄海老师的认真指导!参考文献HanJiawei.数据挖掘概念与技术[M].北京:机械工业出版社,2007。3-6184-195Quinlan,J.R..C4.5:ProgramsforMachineLearning.MorganKaufmann.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《AT供电技术》课件
- 《投资概论》课件
- 《贸易条约与协定》课件
- 《新生儿出血症》课件
- 绿色手绘风大学生互联网+创新创业项目计划书主题
- 智能农业设备介绍模板
- 2025年医用气体系统项目合作计划书
- 工商管理发展方向以及模式研究论文
- 妊娠期糖尿病患者糖脂代谢水平及肠道菌群变化情况对妊娠结局的影响
- 处分申请书范文
- 《黑神话:悟空》跨文化传播策略与路径研究
- 员工食堂服务外包运营管理方案
- DB31-T 329.17-2019 重点单位重要部位安全技术防范系统要求 第17部分:监管场所
- 居家养老上门服务投标文件
- 长沙市公安局交通警察支队招聘普通雇员笔试真题2023
- 2024年学校科研工作计划(6篇)
- 民航客舱应急设备
- 2025高考语文复习之60篇古诗文原文+翻译+赏析+情景默写
- 成长型思维课件
- 高中学生宿舍楼建设项目可行性研究报告
- 2024-2025学年物理人教版八年级上册-6.4-密度的应用-课件
评论
0/150
提交评论