大数据与商务智能 基于SPSSSATISTICS软件的数据分析_第1页
大数据与商务智能 基于SPSSSATISTICS软件的数据分析_第2页
大数据与商务智能 基于SPSSSATISTICS软件的数据分析_第3页
大数据与商务智能 基于SPSSSATISTICS软件的数据分析_第4页
大数据与商务智能 基于SPSSSATISTICS软件的数据分析_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于SPSS SATISTICS软件的数据分析1.某地区家庭用车状况的描述统计分析描述统计数字最小值(M)最大值(X)平均值(E)标准偏差家庭收入(千元)64009.001070.0069.887077.99393家用汽车价格(千元)64004.10100.0030.283621.99823有效N (成列)6400统计量家庭收入(千元)家用汽车价格(千元)N有效64006400缺失00平均值69.887030.2836标准平均值误差.97492.27498中位数44.000022.0000方式23.0011.70标准偏差77.9939321.99823方差6083.053483.922范围10

2、61.0095.90最小值9.004.10最大值1070.00100.00合计447277.00193815.20百分位数(P)2528.000014.00005044.000022.00007580.000039.9000i直月图直方图N - 6.4D&-:rt-fl = 68 89 m ni 讪 oa集庭收人(干元J茎叶图家用汽生许络q千无Stffm-and-Lwf FlctFre-TJeaeyStem & Leaf1834.0031,D0 11B5.Q0 1Q09.00726-00544.04 他-g310.00203.00167.00 1他401ZQ.OQ136.00132.00193

3、.00 1妁400 .44Q$鮎5师弱不TT?TT7了T?盟朋關日朝目輻旳刖洱日旳日旳弱即汕1 QOOO0OOOQOOOO0Q1L11111111111111L11122222222222222222 33333333 3333333334444444H44444H441 555555555555555556666656666677777777777777&96&9668988869995992 00000000000001111111111112222222222233333333333444444442 .弓另弓站弓强肯昶詐站力rr?rr?自甜自甜目9网汕朝3 Q0000011111122

4、2222233 轴钳軒3 55555666677777eaeB899994 00011122223394444 5SS6S67776fia95 .OOOH12223S144-G5 557709 0011223344S 556770&97 B 0011122223334447 .55弟誉計力軸26Q, 00 Ejctrcqiics 尸丁和St皂皿 widthsEach. ia10.0013 ea.se (s3,938 6,025100 oo-呂 O.OO60.00-40.00-20.00-00-2. 某地区家庭用车状况的相关性分析描述统计平均值标准偏差N家用汽车价格(千元)30.283621.9

5、98236400年龄41.9812.2526400家庭收入(千元)69.887077.993936400教育程度2.611.1976400工作行业1.94.7936400相关性家用汽车价 格(千元)年龄家庭收入(千元)教育程度工作行业家用汽车价格Pearson相关(千元)性1.384 *.798 *.093 *.592 *显著性尾)(双.000.000.000.000平方与叉积的和3096617.104662904.5578765644.86115699.96666027.376协方差483.922103.5951369.8462.45410.318N64006400640064006400年

6、龄Pearson性相关.384 *1.355 *-.124 *.561 *显著性尾)(双.000.000.000.000平方与叉积的和662904.557960506.0672172935.523-11643.77334854.994协方差103.595150.103339.574-1.8205.447N64006400640064006400家庭收入(千元)Pearson性相关.798 *.355 *1.075 *.481 *显著性尾)(双.000.000.000.000平方与叉积的和8765644.8612172935.52338925459.32444519.222190387.750协

7、方差1369.846339.5746083.0536.95729.753N64006400640064006400教育程度Pearson性相关.093 *-.124 *.075 *1-.221 *显著性尾)(双.000.000.000.000平方与叉积的和15699.966-11643.77344519.2229164.040-1341.795协方差2.454-1.8206.9571.432-.210N64006400640064006400工作行业Pearson性相关.592 *.561 *.481 *-.221 *1显著性尾)(双.000.000.000.000平方与叉积的和66027.3

8、7634854.994190387.750-1341.7954022.144协方差10.3185.44729.753-.210.629N64006400640064006400*.在置信度(双测)为0.01时,相关性是显著的。3. 某地区家庭用车状况的多元回归分析1)散点图分析家用汽车价格与家庭收入家用汽车价格与年龄DClE3X1EODOM COIMQ Ei軍曲收人(干元、0.6 ),说明模型性能较好。ANOVA模型平方和自由度均方F显著性1回归2183589.2514545897.3133823.556.000 b残差913027.8536395142.772总计3096617.104639

9、9a. 因变量:家用汽车价格(千元)b. 预测变量:(常量),工作行业,教育程度,家庭收入(千元),年龄Sig为0,说明至少存在一个变量对因变量有显著影响。系数模型非标准化系数标准系数t显著性B标准错误贝塔1(常量)-4.230.708-5.974.000年龄-.006.015-.003-.408.683家庭收入(千元).181.002.64280.442.000教育程度2.083.131.11315.904.000工作行业8.589.252.31034.038.000a.因变量:家用汽车价格(千元)常量的Sig为0,说明回归方程中存在常量,收入、教育和行业的Sig都为0,说明此三个变量对因变

10、量存在显著影响。共线性诊断模型维度特征值条件指数方差比例(常量)年龄家庭收入(千元)教育程度工作行业114.2881.000.00.00.01.01.002.4423.116.01.00.71.04.003.1944.699.00.03.12.46.114.0479.580.09.36.09.22.885.03012.014.90.61.07.27.00a.因变量:家用汽车价格(千元)基于SPSS MODELER的模型分析客户关系管理实验二【项目内容】应用Modeler 14.1的决策树模型(C&RT )与贝叶斯网络模型进行客户数据分析,获得客户分类 结果。【方案设计】注意:在建模操作过程中,

11、将模型名称修改为自己的学号+姓名。应用exp2.xls数据,预测产生服务预订行为(是否预订本服务=1)的客户特征。a)选择性别为女性的顾客,使用C&RT模型进行预测,设置好树的停止生长条件,生成决策树,找岀决策树中索引指数最高的两个节点,并分析这些最可能预订服务的客户 特征;分析模型预测准确性。b)按照自己学号最后两位,随机抽取该比例加30%的数据记录(学号为 1号,抽取31%的数据记录),使用特征选择模型选取重要性等于1的字段,使用贝叶斯网络模型获得贝叶斯网络图;分析模型预测准确性。【实验(实训)过程】(步骤、记录、数据、程序等)a) C&RT模型1. 选择数据源exp2.xls,并设置目标

12、数据和测量类型。口ju Fflw Tjpss. AnniXJhisntMeamramiprtMsm 叩宜谨用啞用蕃膚 Contihu(xj$Norw、Input擠 Camnji:uiNone- Incul? CorwnwuNOfte、孑 Conind4u&Narw In jxi l4 CnntnuousNone InwH海搖百1初巾怏Mg.、”整哲1 珥塑J* Camnji:uENont Imul昱岳也:工埔1Eninwus:Nenei IjtpjI壽 Conlnu0u&Norw% Inii孑 Camnji-UEMont InwrlLSB3tl.ll-*/ Corwhv$j6NOW臂 Coni

13、niKU&NciM-、Inpul毎星需損订泳孑 CorfinywsNmwTaigrt# ojTtol fiNds Yltw unused field sellingsk尺细也h国叶T時紅FiYiji Arm卿|阿1 Oav vaum |daaiiMI valuKFabU 适 uio 饰 rriVBiUKklmtr昭Ralt容档奉 CmtnuDusI13.D7DDINiMHV iTflUl序!TB.Rag1.M.0-S inpiflCDAtnUMid直;1师站Nm% irpul:电NWMi1 2 0.3 4* 0N叭、KM砂SJR凤耐讥冴Xj褂 CixWmuMiS|41.1DD0|Non*% h

14、pul护只區所网玄fcW.ZOJdIM申、EmF 忖DFnai1.02.00.4.0.3 0Naoe hpul窗工时詛令 Cuibnuibs|O.5feD|Nmn Inpun$ FUg1.M.GNm InpulNtfnd10.2flJ.tiHana%旳U1ijjus星 FlagHwe、InpiflS-SIWE1金CnynuDusHO.页一Hom%理U1矽昱旨l用誥!卫EI F眄NW、InpiflMil呷厦用苗厘电1缶 Flap1.BDJ0NdoiS kvul軒昱音僵叩呼414咖1g*Nm、f Flag1.MJ.0Nm% Inpulti F唧1腆*科和、叶un鄴吉If侑中!車清 FUgtow .

15、a、iTSUlti Flag1 anoHmh*理m4 FgTDffl.OHweS Inpifl噜星否坤1* FUfl1 moNana% IffSUI Ftagi . Ort JiHwe、hpirt* FUflI.MUOiHan Inpulii阳9MM、InSHfl和舌和加耐f FkiflNoh kpulS F附1 MO-竣T和|ftnld5 0 Vler# urnstd likt silirF;2. 插入“类型”节点3. 插入“选择”节点,选择性别为女性。.色旳严卅Se3fi5基&却11弘 Nodrins j Cmkm4. 插入C&R树模型,更改最小记录数,更名为 M201673571 CHE

16、N CHUAN.5. 生成决策树,并展开观察。哼 M2aU7!S7L 亡HEM CHUAN* File 卫 EdH 彳如ewTre e0Viewer Gams Risks .VjnoOUws-直1 电d M201S73571 CHEN CHUl. 己 J 苕|昱否理订苯弘幽Noda Dcateaary%n0 00010.255 233 1.000B9.745 2039To帕I100.000 22726. 在“ Gai ns”选项中可见索引直属最高节点为17 (111.43% )和21 (110.67% )。7.8.在树图中可见节点 17的客户特征:拥有个人电脑,使用网络功能,家庭收入在 至3档

17、之间,工作年限小于等于 2.5年。节点 用网络功能,使用传呼功能,工作年限小于等于 生成模型,再插入“分析”节点经行验证。221的客户特征为:拥有个人电脑,使9.5年,不使用呼叫等待。Seld M201&73571 CH EN CHUA”U2D1673S71 CHEN CHUAnalysis sources Record Qps Field Dps A Graphs Moafiing ffl a.lalrix AhdIvcIe Cmh Audit TronflDmi Swbsiiu rdtaans RjaboH Sal Glctialt【结论】经分析,正确率为 90.22%,模型有效。b)贝叶

18、斯网络模型:1. 选择数据源exp2.xls,并设置目标数据和测量类型。2. 插入type”节点。3. 插入sample”节点并设置随机样本量,(1+30)=31%。Sample nrtiad. 8D SimiSe- OTypeSarnieWade.BaniplcOCisur-dsjmpIfi Firar0豹 RaMam %Usa tJadc-lGMl tamlno fm-dilaba&E antv)Sei ranctan seedIX L Cannl缈 $ Res-rtO 并 誌 臟 !*q*4翊Wl* gil|贬 RFH2*4特tEHW4I4.插入模型库中的feature selectio

19、n”节点。eKp2xJ5Tipe310%呈否理订本闍肴5.运行此流程序并选择所有重要性大于等于1的指标。Model2 file O Genwarte k Frewew | fj $uninidryAnnldtairlf嘉 Swms iFieidOps-.Graphs ModelingGHMDLirw Hwm* PCAFicijmQKme,L7JRankField用甬站功能2燉.盟否揭琢卜人电陌專11!(入所図档占 XXilJLWTfiM 6吝I电月”用毒描議话 9 0 3FHRSA (千元 1 弋焰匕否地用;tit设昔 11 12 jS TfFftll 佔如否砌帰HUI 14盘工件年陀 It參

20、匕否地用1耳旨库叫17 jXSWRPCA1E回*1別i F*a(* 1力网NIQA NominalE impcrt. 10NominalHE Import. 1.0畲 CvUjhuoue imiwri i.Oibi NominalEl impcirL. 1.0X w# iiTipiri IQ* Flag叵 import 0.909少 COilUnuOiiS居 imirl 就 NominalE HvgpriH a 026H Flag匡 imarQini 0.916 CMiUnuaiisH-山泗l Fao叵 Unirnp M 曰3品 i NominalBunimp. g.5igy F*S0U*iirnp期守41 Flag unlmp. 0.267 CMlUnudliSgunirngi. 0.162* F畑Evnirnp. fl.OfrS 目Measuremenl Imporlance V-alue | 阳口|SlmiMrL. 1.0Ssleded 7 Tctal fle

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论