数据挖掘试验报告三_第1页
数据挖掘试验报告三_第2页
数据挖掘试验报告三_第3页
数据挖掘试验报告三_第4页
数据挖掘试验报告三_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验三一、实验原理K-Means算法是一种cluster analysis 的算法,其主要是来计算数据聚集的算法, 主要通过不断地取离种子点最近均值的算法。在数据挖掘中,K-Means算法是一种cluster analysis的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。算法原理:(1)随机选取k个中心点;(2)在第j次迭代中,对于每个样本点,选取最近的中心点,归为该类;(3)更新中心点为每类的均值;(4) j<-j+1 , 重复(2)(3)迭代更新,直至误差小到某个值或者到达一定的迭代步 数,误差不变.空间复杂度o(N)时间复杂度o(I*K*N)其中N为

2、样本点个数,K为中心点个数,I为迭代次数二、实验目的:1、利用R实现数据标准化。2、利用R实现K-Meams聚类过程。3、了解K-Means聚类算法在客户价值分析实例中的应用。三、实验内容依据航空公司客户价值分析的LRFMC模型提取客户信息的 LRFMC指标。对其进行标准差标准化并保存后,采用k-means算法完成客户的聚类,分析每类的客户特征,从而获得每类客户的价值。编写R程序,完成客户的k-means聚类,获得聚类中心与类标号,并统计每个类别的客户数四、实验步骤1、依据航空公司客户价值分析的LRFMC莫型提取客户信息的 LRFMC旨标。H 5cw<« ari-SiH 

3、9;4 |r- RlhF» lEMKI 1 对:; 一二金 WxJ修篌*|i|4 & 由 1 Arwjl csv( 'du/alr-dua. cs-v1 ,hi-T> gW首出RI 单附空由UL集'dtier_na darc-ariie rthschi! i. iraidaTariie55W"_v-li 1I,&E:的事tjL2T空i 阳。Lm " 151 =CMWli rCRT*tri h-YiSnMKW1uii-dO:工“事看为0,平大作|11工不为。,目15%里油大干呷|记*> Intliu « (Cdi

4、l-it_rM15UH_Yft_l。O du e._rwilai*l_¥K_2 " 叫+(d«l AT.nilan.dl s-coum p- 4)+h fjj41M naJsQ + sw > OJ>> 4«lii:Tdna - dtl jn_m-wh1(h1nidfrx - 1* cieftrertti erdanc-v>置工依空白> i-iEMiid pD: .-howw-k4A若把货11> idlEHTI Imd. ,?由»/*”_#» CSw'.lMHtii> >£

5、;!%网3的鼠弟:" dtlM_na - dixaril s -rfiil dhCls. MitdiTifT1 £-531*_511_15 I+f J. naCdarjri lell-sw-T-Zj J s :再申UM.枷、千为身Hl率事加,.9行也皆耨|大干啪证¥新 1rrlM 忖_ru!|i£lM_曹.一 口 A drliic_jw1JUM_V:_7 n 吟+f chi rt_u1n,9_-di i-courrt r- 唠+1 (d«l AL_iiktSG_i«_5W » 0)事 出1 帆d*n - d«lA&

6、#39;_ni-siil£h<lrid*ji i),'-Tgg的”r- cleir.ecif 1 it-riei tidirjJ H igxrtM" - 卡Lat - NbiiErwiErmn: -口g FUI«£Fwm C I9S5OPS0 ALi TE9TU«3$1 obs, a* * v-wl-iJblwij traanfujc 7-44 at»i. af d vjir 1 JiblsiiQ>TWWM1 口才用 b田E西七口曰L13C X tAMkIursJ£QirKyai.OtUlUlKBlESc

7、alxBlrCnfuHQnUh* 1m: 1:Z. 1;2| m 1?1GlInd1m1111211111 -and«3cint 1:E27» ODOODOODO-* FW> FadwaHet! rwSi 3Jk Zawi 舁Lipisri - -Q /占 hUih -NEMEER idFFF DATE54993棚#棚脚28065551062007/2/1211S9#39544曲神曲内5697244924#226312010/4/9321972011/6/7316452010/7/55BS7T«#137994#2R012#5494357B8112542010

8、/2/1#¥8253ffflflflffflfl#nflffflfffffl; 2007/8/3#挪#鞘才#糊#的2011/7/1#"# 踹#朗 #¥ 2010/2/1 2008/4/5GE男男男男男男男女男女女男R男女男男WORK.Cin WRK_FR5 WOF.K.COUKAGE ,北京CNS北京CN4CH4USECW4cheCH4CNSFRECN4州东疆江71 CA奏广新浙浙YAn本市g 5阳州鲁州AH州 LO贡广乌温DR温PARISPARISFK3北京,CH4SAN NARTKCA USE深圳广东CH4广州广东CW4BO1FLAND HCALIFOR1TI

9、US马鲁木齐新勰 CN2、确定要探索分析的变量1. c i miwoti iv -nr i r- =uir jIN _ ” p - E I »1E N2Cfi 设事7 rlitjf iilfi-rvad. civ ' dxt j jacorcajitfl. ri'.- , hn上J:辛 6昨宜世3 UCdi'vdf H* Mila dM1湘 ”77 ;! 立耳 A.2E- Vlcti ClVfZ3C«r-tdf 114 .' .<U<ir*tt«Ek. U¥r)I?1M Q64-: 看 3 r>r Efb

10、lo0<dti«ridj£ii发屯” ofc. M *4 0rtibl”川3仁青鼻g li;m, z i- -* r -LAfft Kuril CXQ工的 上<*»<$星Ql,k.II!»!int |i :«22wj a a a a a a «ran»HLM4dw (i:« w y *' ,0' BiMaluv%F L<1 =-函触幽A Sll5«d”l讶/小嗽上“,裳Hff金臼A UKlWriC'El: -dCTBl -,onA 丽¥11T5C0

11、re44Q4i-CFv' ahe.f)> 勒中l it a xic-crndf iL<*c>F I> wr I ta. c.av(X3ctr*dl4'l«l xscnr-iddfltd. tav3 1MtM - UWMe MHirEn 14* rb»ik«iri*q3 luKtani IDffnly g阳匕单*UW修产UkrHH'FMLftf Gui rt CUU'. CUXH drtliyCri,l33*rabc n»l < &<nM>»ta todc 1Mti

12、 In It空"”"1" ftCpniiip %hmSXf“LKNUHHim0*in.: cMin,e M91st10C11st Qu:7加1ft Qlld747Median?nooV-pni=in:"八Ki>-ri-i jnT 44UMean弓”为Mean:MMMeant 171243r d qu.&S743rd加:右jrd qu;21271Man.W豹找心芦小国.;2341MMU.;5flO7irfclA's5S1W's;13«OEGIhLTDjrilflSTLST-TO-rhOAVG-INTRVALMin.Q

13、g£ 1.0N1FV.:轧M1st Qy.SCI15t QU.t肛01st QU.523.37MedianW.iOyechan门&8 口Median zdd.67MlMTI1ZC,1Nedri;17CalHEdll :(17.753rd Qu.L«.O3rd Qu.拗加。3rd Qu.;83gMax.729-. CMax.:731.41Nax. 5建九gQOGHNMGJUCn小噂discQurrtd. WOOFin,?o,owolr qu9c.oooaqiL :它.片1翔MedianO.DDGOmedian so.ziiMKdfl0.115h6Kedfi:o.72i

14、d3rd qm-O.OOCO3rd;舵955BKWOOHIM.5M0Mi n.;Qlit Qw- : 1219M«ri1 m : 5QFR 首电an : izrrr Srd Qu:z 153DO MWMAX_INTLRVAL Mln, 3 0QU.1 W Median 1143 M电却d : Lfl4 3rd Qu. ;£24* 一JLEGNT.£NNTKim i 0.”g1*1 Fir:0.0IeC Qu. t Ch 12B&lit qu. e m翡,QMPcHaHi r 0 H7WIApcH an *F, 了, A晚m :U'ja?Wan t

15、1471.43rd qll : 1. Q73D市 d Utk ; 169Q. 3&D.P0NT5C.A1Mioa :Or Ditt qu sa o内电却干号q;0.Dhe-an :54 D. 33rd Qu;0. D二 633州,Dl«t Qu. iVR-23、利用R实现数据标准化。Fie Eg Ccrtfe 阴= *o+s SH5kn Mup Profile goH Hdp今 H EiWiri PaiiKi $ihl、 G4aM Ermonviri: q心/01肝/青C24H 血,肝 di vGAl+*D Dvt-k2,51 他5u <jf 0 YjflahlHrDd

16、mcifble写t3& obs. af > varl-ibhcs4> del«_jiaI5H9S Dbs. M 4d varlib-lcs.11毋 dElHdkt*百州5J.曲5, oF 44 varl-ables-H4 idaJI«Eh" l:fi0, 1:71 "A T "A JB "* I' "* 4" "* f *N 防EjHt: PlDHI "Em4wv»nc Mdw-.0*Jlfl *:M-":»-厂*x * :7-:<

17、1HHn R / ,如,f - f4wDt 丁金 iffrit-t. csvi. racorectti e. racortSMca.csv'!x打 31 | 二“ii金工fF堂日 11 iKBtMdi/D-: .Hte»wrk4rl) 技,靛稔岑取 3 5 1 npinTII U Feaik csvf' dnVzsccrc4dm. csv' .he-113?*» « C. |<:JLB nbpLrvtfl I*土甲 01庠通g,,qF等 fTM;”<D nnet. Wkl'iLilt of 194> wtpy<

18、;-n"« cr«in&1口7 xiriablw® Mput_tret. cr«1n_24Q ah5. M 7 wlablH;L13T fff, 5Cwaolr IdttiH一口> 包甘T作a0>.' hOHwiM'k4-1)>FPK4W- mo ifeW一口/ 2g9 -Xi Ej4N1 t 室*呼"> flCfffftt-rMF3.crvC3ti-, F3C«iM!arC3W,i >j- NtcwUlyalMdicril力» wr1 ce.«5v(

19、E5tw«tf lie.'Escar«ldacai口事, > ,出甘工行空彳> 54CHdC',&: .-'hoiWwwM-'> krputf dlrsr-FAd. |iV(1 rint Ji.i'ivc-gr-Fdrit . q9v' |Fw-bT)-> 奥=计看 > r4£UlT-kFAa5(1 npwTf11 &,>卡勒Ifi出> Type-rwult 54lUFt-tr> 1曲修£1印0*1宾期力解 TJrtM123« SIJ

20、-IOQ 124aH 1J-IDH 32-iaq 39-11D4、采用k-means算法完成客户的聚类,分析每类的客户特征,从而获得每类客户的价值。O西“ Lcfit Cjcdte :囱曲mJiiH Qvfaug Erafh look J9>,Q <r a H H J*,i ri ,-V HJ1 事 gttTL 电 i/rartiikaa-RMtH licuitr on 1«h4 ,1a21 «»««« *22 1imrF11 -><tad.cs: Fira. js£ct«4i.ia.civ

21、".h*-丁21?4 ?RUM *也23 u-cor edfi 1 c-s-cil t datjf+lt) 妙27U2 11- £* m*df 11,1' “邪tJ,, J24291 ”#营工作空一3皿 r; df .)99 FH*1TJ* InpvtFI 1 eireiii- csvt'tf-ii 4 7,Eke444rt-liGn宣he37 f+S4jl E1 HpuEffllfl ,.15IB咐事<1惴=上 口 TWInTEMjlkSclu&ClF4i i#bi»小) 之蝶 w 42 cem srtciiuTf 1ic»

22、;r1*r il4JLM gpLE iCiTim -a* 1 npiitf f ItpCMd. CJVC-riMA/fKjCir-MMAEi. EliW ' , hil-T)一 门(HMCMkMICpMWrtlMfi一.ifam* %uhi i H - inpwl MfliH 金UK44EnmnmmtMC3GlSMU* 7centerveEO±1nun (US, l;£j LlAE Of a| nQU JM39 9 5441 31MlgiclBinedfIla47CSI obi, tri1*k H3廿安|修11科daliEm位2J9 obi. atM MilFtil

23、bliES1 前1初H sH 皿行 1npiJirilil51豉-城<hr1;0国Wl g£._ ofm vkiisibniE71"I'* |* *.6 virlEts4rvtult1dl>t flf 9| i&»Eartdf lieLikf-g* UEf 1 m (110-32(1 mTmm-cs, 2.* 阈values CQ-lif Iq1 国*H6l g Ifit 11曲*J音ML :LI一口M (l;VWi fihr (1;B|ii.ci,工u n,911a的 r«xu H-kPt-iini ImpMtf 1)>

24、;DBt«r12-3411N<W110r "E"¥!K-rHaHwn”NiHi FML fMkAfH Mp WWW i IMUfl UMriUMVHliiM、和e IBnrf 修ef1->ilQBtff加r第 cicufwctarn Fm CLnaAcvbonTiUtkaEv'FiHrtng-Iirn4a m D«li': Cbilvi ihMtrui2A¥五、实验结果客户的k-means聚类,获得聚类中心与类标号,并统计每个类别的客户数IMtlOi centervM.口 clQd。成现时11rM-ZOdc

25、lctdit-iISM 114&r m2 * 。1K 宙 p心 + -1, 'jff * H IrJl 0* AiMm 叩3 M 。UnMlidl- # UnMMJ' ' UwtI«tHwm 例* w、,21 *A IE <v27 dit-lFCiv: ' dlt i. £1C0r-sS4iT 品 dM' T N力” 的裾昨地2,ZftC.®rrff1le-S!Cile: dallfllc24” * l*福号人2- WritE» E3-V Z>£Qr Kiff Dt. ' n匚

26、kttkSJrt.il.i)2?IQ11 ”由直工你京我 ivtud "0: d“N”N -IH 承中Ui npvl f i 1 E F-CHdl. E3V 'lME-1 ZSiCOrC9¥°' ihe-TJS34 目直£事P r«wl t bjpwns 3 linfftrt f i It, i : as押证儡比-口 Eyprrnult iclv»tc*“ t,bl 工;tM! 口 事 H 二歌 r 3 cirittrwC:-mull bccntfr T44 Ji修 plEf:OR ote,. of 7 wWg-q r

27、w 0力+19打加川” tis- t of 9S20S1 obs. (rf 44 vju-1iJ>4«S fi2044 岫5. of 5 什#r1 尚1” 奴酬手,M 丸 Vif tifritl 4jail ob- vf 4 viir 1ablc»日仃MgChr 1 ;V-30. 1:7J N 1" F V "* 1" 1He Inpsf il#,M (31H 工Lin >aP Dnux蕾*H-Lirg utrlH (310220 «lwMHts-i 7.4 v«.1uisC4”fit.1MEmIm口前2$ 河口raw9KL1Eg+frtt1:43Qt«1I 4 I ;Sl 11 3%,0tP*1iJm

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论