下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验三一、实验原理K-Means算法是一种cluster analysis 的算法,其主要是来计算数据聚集的算法, 主要通过不断地取离种子点最近均值的算法。在数据挖掘中,K-Means算法是一种cluster analysis的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。算法原理:(1)随机选取k个中心点;(2)在第j次迭代中,对于每个样本点,选取最近的中心点,归为该类;(3)更新中心点为每类的均值;(4) j<-j+1 , 重复(2)(3)迭代更新,直至误差小到某个值或者到达一定的迭代步 数,误差不变.空间复杂度o(N)时间复杂度o(I*K*N)其中N为
2、样本点个数,K为中心点个数,I为迭代次数二、实验目的:1、利用R实现数据标准化。2、利用R实现K-Meams聚类过程。3、了解K-Means聚类算法在客户价值分析实例中的应用。三、实验内容依据航空公司客户价值分析的LRFMC模型提取客户信息的 LRFMC指标。对其进行标准差标准化并保存后,采用k-means算法完成客户的聚类,分析每类的客户特征,从而获得每类客户的价值。编写R程序,完成客户的k-means聚类,获得聚类中心与类标号,并统计每个类别的客户数四、实验步骤1、依据航空公司客户价值分析的LRFMC莫型提取客户信息的 LRFMC旨标。H 5cw<« ari-SiH
3、9;4 |r- RlhF» lEMKI 1 对:; 一二金 WxJ修篌*|i|4 & 由 1 Arwjl csv( 'du/alr-dua. cs-v1 ,hi-T> gW首出RI 单附空由UL集'dtier_na darc-ariie rthschi! i. iraidaTariie55W"_v-li 1I,&E:的事tjL2T空i 阳。Lm " 151 =CMWli rCRT*tri h-YiSnMKW1uii-dO:工“事看为0,平大作|11工不为。,目15%里油大干呷|记*> Intliu « (Cdi
4、l-it_rM15UH_Yft_l。O du e._rwilai*l_¥K_2 " 叫+(d«l AT.nilan.dl s-coum p- 4)+h fjj41M naJsQ + sw > OJ>> 4«lii:Tdna - dtl jn_m-wh1(h1nidfrx - 1* cieftrertti erdanc-v>置工依空白> i-iEMiid pD: .-howw-k4A若把货11> idlEHTI Imd. ,?由»/*”_#» CSw'.lMHtii> >£
5、;!%网3的鼠弟:" dtlM_na - dixaril s -rfiil dhCls. MitdiTifT1 £-531*_511_15 I+f J. naCdarjri lell-sw-T-Zj J s :再申UM.枷、千为身Hl率事加,.9行也皆耨|大干啪证¥新 1rrlM 忖_ru!|i£lM_曹.一 口 A drliic_jw1JUM_V:_7 n 吟+f chi rt_u1n,9_-di i-courrt r- 唠+1 (d«l AL_iiktSG_i«_5W » 0)事 出1 帆d*n - d«lA&
6、#39;_ni-siil£h<lrid*ji i),'-Tgg的”r- cleir.ecif 1 it-riei tidirjJ H igxrtM" - 卡Lat - NbiiErwiErmn: -口g FUI«£Fwm C I9S5OPS0 ALi TE9TU«3$1 obs, a* * v-wl-iJblwij traanfujc 7-44 at»i. af d vjir 1 JiblsiiQ>TWWM1 口才用 b田E西七口曰L13C X tAMkIursJ£QirKyai.OtUlUlKBlESc
7、alxBlrCnfuHQnUh* 1m: 1:Z. 1;2| m 1?1GlInd1m1111211111 -and«3cint 1:E27» ODOODOODO-* FW> FadwaHet! rwSi 3Jk Zawi 舁Lipisri - -Q /占 hUih -NEMEER idFFF DATE54993棚#棚脚28065551062007/2/1211S9#39544曲神曲内5697244924#226312010/4/9321972011/6/7316452010/7/55BS7T«#137994#2R012#5494357B8112542010
8、/2/1#¥8253ffflflflffflfl#nflffflfffffl; 2007/8/3#挪#鞘才#糊#的2011/7/1#"# 踹#朗 #¥ 2010/2/1 2008/4/5GE男男男男男男男女男女女男R男女男男WORK.Cin WRK_FR5 WOF.K.COUKAGE ,北京CNS北京CN4CH4USECW4cheCH4CNSFRECN4州东疆江71 CA奏广新浙浙YAn本市g 5阳州鲁州AH州 LO贡广乌温DR温PARISPARISFK3北京,CH4SAN NARTKCA USE深圳广东CH4广州广东CW4BO1FLAND HCALIFOR1TI
9、US马鲁木齐新勰 CN2、确定要探索分析的变量1. c i miwoti iv -nr i r- =uir jIN _ ” p - E I »1E N2Cfi 设事7 rlitjf iilfi-rvad. civ ' dxt j jacorcajitfl. ri'.- , hn上J:辛 6昨宜世3 UCdi'vdf H* Mila dM1湘 ”77 ;! 立耳 A.2E- Vlcti ClVfZ3C«r-tdf 114 .' .<U<ir*tt«Ek. U¥r)I?1M Q64-: 看 3 r>r Efb
10、lo0<dti«ridj£ii发屯” ofc. M *4 0rtibl”川3仁青鼻g li;m, z i- -* r -LAfft Kuril CXQ工的 上<*»<$星Ql,k.II!»!int |i :«22wj a a a a a a «ran»HLM4dw (i:« w y *' ,0' BiMaluv%F L<1 =-函触幽A Sll5«d”l讶/小嗽上“,裳Hff金臼A UKlWriC'El: -dCTBl -,onA 丽¥11T5C0
11、re44Q4i-CFv' ahe.f)> 勒中l it a xic-crndf iL<*c>F I> wr I ta. c.av(X3ctr*dl4'l«l xscnr-iddfltd. tav3 1MtM - UWMe MHirEn 14* rb»ik«iri*q3 luKtani IDffnly g阳匕单*UW修产UkrHH'FMLftf Gui rt CUU'. CUXH drtliyCri,l33*rabc n»l < &<nM>»ta todc 1Mti
12、 In It空"”"1" ftCpniiip %hmSXf“LKNUHHim0*in.: cMin,e M91st10C11st Qu:7加1ft Qlld747Median?nooV-pni=in:"八Ki>-ri-i jnT 44UMean弓”为Mean:MMMeant 171243r d qu.&S743rd加:右jrd qu;21271Man.W豹找心芦小国.;2341MMU.;5flO7irfclA's5S1W's;13«OEGIhLTDjrilflSTLST-TO-rhOAVG-INTRVALMin.Q
13、g£ 1.0N1FV.:轧M1st Qy.SCI15t QU.t肛01st QU.523.37MedianW.iOyechan门&8 口Median zdd.67MlMTI1ZC,1Nedri;17CalHEdll :(17.753rd Qu.L«.O3rd Qu.拗加。3rd Qu.;83gMax.729-. CMax.:731.41Nax. 5建九gQOGHNMGJUCn小噂discQurrtd. WOOFin,?o,owolr qu9c.oooaqiL :它.片1翔MedianO.DDGOmedian so.ziiMKdfl0.115h6Kedfi:o.72i
14、d3rd qm-O.OOCO3rd;舵955BKWOOHIM.5M0Mi n.;Qlit Qw- : 1219M«ri1 m : 5QFR 首电an : izrrr Srd Qu:z 153DO MWMAX_INTLRVAL Mln, 3 0QU.1 W Median 1143 M电却d : Lfl4 3rd Qu. ;£24* 一JLEGNT.£NNTKim i 0.”g1*1 Fir:0.0IeC Qu. t Ch 12B&lit qu. e m翡,QMPcHaHi r 0 H7WIApcH an *F, 了, A晚m :U'ja?Wan t
15、1471.43rd qll : 1. Q73D市 d Utk ; 169Q. 3&D.P0NT5C.A1Mioa :Or Ditt qu sa o内电却干号q;0.Dhe-an :54 D. 33rd Qu;0. D二 633州,Dl«t Qu. iVR-23、利用R实现数据标准化。Fie Eg Ccrtfe 阴= *o+s SH5kn Mup Profile goH Hdp今 H EiWiri PaiiKi $ihl、 G4aM Ermonviri: q心/01肝/青C24H 血,肝 di vGAl+*D Dvt-k2,51 他5u <jf 0 YjflahlHrDd
16、mcifble写t3& obs. af > varl-ibhcs4> del«_jiaI5H9S Dbs. M 4d varlib-lcs.11毋 dElHdkt*百州5J.曲5, oF 44 varl-ables-H4 idaJI«Eh" l:fi0, 1:71 "A T "A JB "* I' "* 4" "* f *N 防EjHt: PlDHI "Em4wv»nc Mdw-.0*Jlfl *:M-":»-厂*x * :7-:<
17、1HHn R / ,如,f - f4wDt 丁金 iffrit-t. csvi. racorectti e. racortSMca.csv'!x打 31 | 二“ii金工fF堂日 11 iKBtMdi/D-: .Hte»wrk4rl) 技,靛稔岑取 3 5 1 npinTII U Feaik csvf' dnVzsccrc4dm. csv' .he-113?*» « C. |<:JLB nbpLrvtfl I*土甲 01庠通g,,qF等 fTM;”<D nnet. Wkl'iLilt of 194> wtpy<
18、;-n"« cr«in&1口7 xiriablw® Mput_tret. cr«1n_24Q ah5. M 7 wlablH;L13T fff, 5Cwaolr IdttiH一口> 包甘T作a0>.' hOHwiM'k4-1)>FPK4W- mo ifeW一口/ 2g9 -Xi Ej4N1 t 室*呼"> flCfffftt-rMF3.crvC3ti-, F3C«iM!arC3W,i >j- NtcwUlyalMdicril力» wr1 ce.«5v(
19、E5tw«tf lie.'Escar«ldacai口事, > ,出甘工行空彳> 54CHdC',&: .-'hoiWwwM-'> krputf dlrsr-FAd. |iV(1 rint Ji.i'ivc-gr-Fdrit . q9v' |Fw-bT)-> 奥=计看 > r4£UlT-kFAa5(1 npwTf11 &,>卡勒Ifi出> Type-rwult 54lUFt-tr> 1曲修£1印0*1宾期力解 TJrtM123« SIJ
20、-IOQ 124aH 1J-IDH 32-iaq 39-11D4、采用k-means算法完成客户的聚类,分析每类的客户特征,从而获得每类客户的价值。O西“ Lcfit Cjcdte :囱曲mJiiH Qvfaug Erafh look J9>,Q <r a H H J*,i ri ,-V HJ1 事 gttTL 电 i/rartiikaa-RMtH licuitr on 1«h4 ,1a21 «»««« *22 1imrF11 -><tad.cs: Fira. js£ct«4i.ia.civ
21、".h*-丁21?4 ?RUM *也23 u-cor edfi 1 c-s-cil t datjf+lt) 妙27U2 11- £* m*df 11,1' “邪tJ,, J24291 ”#营工作空一3皿 r; df .)99 FH*1TJ* InpvtFI 1 eireiii- csvt'tf-ii 4 7,Eke444rt-liGn宣he37 f+S4jl E1 HpuEffllfl ,.15IB咐事<1惴=上 口 TWInTEMjlkSclu&ClF4i i#bi»小) 之蝶 w 42 cem srtciiuTf 1ic»
22、;r1*r il4JLM gpLE iCiTim -a* 1 npiitf f ItpCMd. CJVC-riMA/fKjCir-MMAEi. EliW ' , hil-T)一 门(HMCMkMICpMWrtlMfi一.ifam* %uhi i H - inpwl MfliH 金UK44EnmnmmtMC3GlSMU* 7centerveEO±1nun (US, l;£j LlAE Of a| nQU JM39 9 5441 31MlgiclBinedfIla47CSI obi, tri1*k H3廿安|修11科daliEm位2J9 obi. atM MilFtil
23、bliES1 前1初H sH 皿行 1npiJirilil51豉-城<hr1;0国Wl g£._ ofm vkiisibniE71"I'* |* *.6 virlEts4rvtult1dl>t flf 9| i&»Eartdf lieLikf-g* UEf 1 m (110-32(1 mTmm-cs, 2.* 阈values CQ-lif Iq1 国*H6l g Ifit 11曲*J音ML :LI一口M (l;VWi fihr (1;B|ii.ci,工u n,911a的 r«xu H-kPt-iini ImpMtf 1)>
24、;DBt«r12-3411N<W110r "E"¥!K-rHaHwn”NiHi FML fMkAfH Mp WWW i IMUfl UMriUMVHliiM、和e IBnrf 修ef1->ilQBtff加r第 cicufwctarn Fm CLnaAcvbonTiUtkaEv'FiHrtng-Iirn4a m D«li': Cbilvi ihMtrui2A¥五、实验结果客户的k-means聚类,获得聚类中心与类标号,并统计每个类别的客户数IMtlOi centervM.口 clQd。成现时11rM-ZOdc
25、lctdit-iISM 114&r m2 * 。1K 宙 p心 + -1, 'jff * H IrJl 0* AiMm 叩3 M 。UnMlidl- # UnMMJ' ' UwtI«tHwm 例* w、,21 *A IE <v27 dit-lFCiv: ' dlt i. £1C0r-sS4iT 品 dM' T N力” 的裾昨地2,ZftC.®rrff1le-S!Cile: dallfllc24” * l*福号人2- WritE» E3-V Z>£Qr Kiff Dt. ' n匚
26、kttkSJrt.il.i)2?IQ11 ”由直工你京我 ivtud "0: d“N”N -IH 承中Ui npvl f i 1 E F-CHdl. E3V 'lME-1 ZSiCOrC9¥°' ihe-TJS34 目直£事P r«wl t bjpwns 3 linfftrt f i It, i : as押证儡比-口 Eyprrnult iclv»tc*“ t,bl 工;tM! 口 事 H 二歌 r 3 cirittrwC:-mull bccntfr T44 Ji修 plEf:OR ote,. of 7 wWg-q r
27、w 0力+19打加川” tis- t of 9S20S1 obs. (rf 44 vju-1iJ>4«S fi2044 岫5. of 5 什#r1 尚1” 奴酬手,M 丸 Vif tifritl 4jail ob- vf 4 viir 1ablc»日仃MgChr 1 ;V-30. 1:7J N 1" F V "* 1" 1He Inpsf il#,M (31H 工Lin >aP Dnux蕾*H-Lirg utrlH (310220 «lwMHts-i 7.4 v«.1uisC4”fit.1MEmIm口前2$ 河口raw9KL1Eg+frtt1:43Qt«1I 4 I ;Sl 11 3%,0tP*1iJm
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024秋八年级英语上册 Unit 10 If you go to the party you'll have a great time Section B (2a-2e)教案(新版)人教新目标版
- 2023七年级历史下册 第二单元 辽宋夏金元时期:民族关系发展和社会变化第8课 金与南宋的对峙说课稿 新人教版
- 喜达屋酒店内部员工管理制度
- 高考地理一轮复习第一章地球与地图第一节经纬网和地图课件
- 自营业务外包合同(2篇)
- 脑卒中相关课件
- 布纹个性简历幻灯片模板
- 西京学院《应用统计学》2022-2023学年第一学期期末试卷
- 西京学院《家具设计》2023-2024学年第一学期期末试卷
- 西京学院《发电厂电气系统》2022-2023学年期末试卷
- 某标准件厂冷镦车间低压配电系统及车间变电所设计(超详细)
- 紫金矿业污染事件商业伦理分析
- 体检指标分析课件
- 2023年口腔医学期末复习-牙周病学(口腔医学)考试历年真题精华集选附答案
- 2023年全国硕士研究生考试考研英语二试题真题(含答案)
- 中小学教师教育教学水平能力测试成绩单
- 骨科细化分级护理标准
- 互联网医院整体方案介绍-PPT
- 4.2.1指数函数的概念 课件(共21张PPT)
- 婴幼儿盥洗照料(婴幼儿回应性照护课件)
- 银杏树介绍-课件
评论
0/150
提交评论