SPSS期末大作业_第1页
SPSS期末大作业_第2页
SPSS期末大作业_第3页
SPSS期末大作业_第4页
SPSS期末大作业_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据分析方法及软件应用课程作业学号:13125689姓名:柏喜红班级:1306北京交通大学2013年10月数据分析方法和软件应用作业第5题:方差分析(2)分析思路根据所给的表定义变量,进而进行数据录入。在进行单因素和多因素对销售量的影响分 析的时候,应先提出相应的零假设, 进而选择检验统计量,对检验统计量进行计算,并计算 出概率p值,将计算出的概率 p值与给定的显著性水平进行比较,做出相应的决策。目标一:给出SPSS数据集格式定义变量,进行数据录入。从题意以及所给的表中可以得出,这里有四个变量,分别为销售地点、销售方式、月份和销售量。其中,销售地点和销售方式为控制变量,月份为随机 变量,销售量

2、为观测变量,结合所给的表,进行数据的录入,录入四十个观测变量值。炸归城回加岫骨#但莒怕 胜也骊迪-怅A院是1_心aG暗步=土a/M.Si、敝2s08乩 5XIM3aG(T.照 ±8s右/=Utl、似i心0ai足耶.i、拟图1 变量视图销楼方式Hl宙如这MWrnfcS1133龙1243179131419014249616341务41F;441加1&1S310251舞1935t75204S1822111272222129&233127724412SO2b12之S62622296N3Z2/42942282913230232B13133z用3243N日33314734242i

3、na3634so36A4z733715as3(1252as39367740460图2数据视图目标二:分析销售地点对销售量的影响(1)操作步骤第一步:提出零假设。零假设 H0是“销售地区对销售量没有产生显著影响”。第二步:选择检验统计量,并计算检验统计量的观测值和概率P值。选择菜单【分析一一比较均值一一单因素】将销售量指定到【因变量列表(E)】中,将销售地区指定到【因子(F)】中,点击确定按钮,出现图3所示的结果。销售量图师因素方差分析平方和df均方F显著性组间254.600463.6501.107.369组内2013.0003557.514总数2267.60039第三步:给定显著性水平 0=0

4、.05,根据表1,做出决策。(2) 结果分析从图3中可以看出,观测变量销售量的总变差(2267.600)中“销售地区”可解释的变差为254.600,抽样误差引起的变差为2013.000,他们的方差为63.650和57.514,相除所得的F统计量为1.107,对应的概率 P值接近于0.369。(3) 结论因为显著性水平0=0.05,概率P值大于a,因而应接受原假设,认为不同的销售地区度销售量不产生显著影响。目标三:分析销售地点、销售方式和他们的交互作用对对销售量的影响(1)操作步骤第一步:提出零假设。零假设 H。是“销售地区对销售量没有产生显著影响,销售方式对销售量没有产生显著影响,销售地区和销

5、售方式对销售量没有产生显著的交互影响。”第二步:选择检验统计量,并计算检验统计量的观测值和概率P值。选择菜单【分析一一一般线性模型一一单变量】;将销售量指定到【因变量(D)】中,将销售地区和销售方式指定到【固定因子( F)】中,将月份指定到【随机因子( A )】中;点击“模型”按钮,在指定因子中选择 【设定】,在构建项中选择 【交互】,将销售地区、销售方式以及销售地区*销售方式指定到【模型(M )】中,点击“继续”按钮;点击“确定”按钮,出现如图 4所示的结果:图4主体间效应的检验因变量:销售量源III 型平方和df均方FSig.校正模型2156.60019113.50520.451.000截

6、距269616.4001269616.40048579.532.000销售地区254.600463.65011.468.000销售方式1193.8003397.93371.700.000销售方式*销708.2001259.01710.634.000售地区误差111.000205.550总计271884.00040校正的总计2267.60039a. R 方=.951 (调整 R 方=.905 )第三步:给出显著性水平 0=0.05,做出决策。(2)结果分析从图4中所示的结果可以看出,第一列是对销售量总变差分解的说明,第二列是对销售量变差分析的结果,第三列是自由度,第四列是均方,第五列是对 F检验

7、量的观察值,第 六列是检验统计量的概率P值。从图中可以看到,销售量的总变差为2267.600,他被分解为四个部分,分别是销售地区不同引起的变差(254.600),销售方式不同引起的变差(1193.800),销售方式与销售地区交互作用引起的变差(708.200)以及随机因素引起的变差( 111.000)。这些变差除以各自的自由度后,得到各自的均方,可计算出各F检验统计量的观测值和在一定自由度下的概率P值,概率P值分别为0.00, 0.00和0.00.(3)结论因为显著性水平0=0.05,概率P值小于显著性水平,因而应拒绝原假设,认为不同的销 售地区、不同的销售方式和销售地区与销售方式的交互作用均

8、为销售量带来了影响。这与单因素分析时得到的结果并不相同,本人认为可能因为随机变量月份的存在所导致的结果。R 方为0.951,调整后的R方为0.905 ,因而拟合度还是比较高的。第9题:回归分析(4)分析思路根据题中所给的解释变量和被解释变量建立多元回归模型,利用回归方程的统计检验对建立的多元回归模型进行检验, 首先对解释变量采取强行进入策略, 分析他们之间的线性关 系以及多重共线性;然后对解释变量采用向前筛选策略,做方差齐性和残差的自相关性检验。(1)操作步骤第一步:确定多元回归方程中的解释变量和被解释变量。以课题总数 Y为被解释变量,解释变量为投入人年数XI、投入科研事业费 X2、论文数X3

9、、获奖数X4。第二步:建立多元线性回归模型。1)强制进入,分析线性关系和多重共线性 选择菜单中【分析一一回归一一线性】 将课题总数指定到 【因变量(D)】中,将销售地区和销售方式指定到【固定因子(F)】中,将投入人年数、投入科研事业费、论文数和获奖数指定到【自变量(I)】中,在【方法(M )】框中选择回归分析中解释变量的筛选策略为“进入”。 点击“统计量(S)”按钮,在回归系数框中选择【估计(E)】,在回归分析框的右边选中【模型拟合度(M)】、【R方变化(S)】、【描述性】和【共线性判断 (L)】,在残差框中选择【Durbin-Watson(U)】和【个案诊断(C)】,点击“继续”按钮。 点击

10、“绘制”按钮,在线性回归中,指定 *ZPRED给“Y ”,指定*ZRESID给“X ”,在标准化残差图中选【正态概率图(R)】,点击“继续”按钮。 点击“保存”按钮,将预测值和均值均选中“标准化”。 点击“确定”按钮,出现如下图5、图6、图7和图8。(2)结果分析及结论瞄,点牧料 LL 土 A谷 fl研串 白Pears町相*性LQQ0,9598技837一砌9S91.000.0569526Z7卜入丽奉业赞(白0B62BS61.0007B14828B79527811.000.7*2我案歆665.s?7.4027421.DOOSig. ( W>误画总我.000.000OOC-000OCO.00

11、0000.00<拍事业泉i百元j000000-.000.003他5neonononaOl)0怦物mTioco003000N区地玖理3131313131在盘应3131313131强插卜再事伫日曰H313131313 131313131313131313131图5相关性从图5中可以看出投入人年数、 投入科研事业费、 论文数、获奖数对课题总数的的相关性还是比较强的,其中投入人年数与课题总数的相关性最为显著。RR打1Curtin-WatsonR七融an配Sig F 杞1碱.937927226 5E2093T9B.135A261776a. fSIISft: .投御曜岫I百t .亡谶衣X匕年靠b 6

12、 S.侨."一图6模型汇总依据图6,从调整的R方(0.927)可以看出,回归方程的拟合度较高, 并且Durbin-Watson(1.776)在1.5和2.5之间,因而可以用线性回归模型来拟合数据。慢知非蜜化命tSigD用粉7F(A9I-2973173.C47-一和8.6&75531021 C705 41100006116.925杉罪事IL您 白宁,.0D2C011521.525.13&.2494.069-.038.045-348-1.934.064.D7S13.309Tlfi120I泸1?52 355 13皿:瞄总敷图7系数共好诊配憧引 维物眷正1 值集格I投入人罩散

13、R7 fWBT. 1114 ”31.00001.0001皿.0123693.J01.54.00佰.00003.277392514.00D9.0C.5440677.937.31,075913415.01316 195.00.9317.67.04日因霍:课慰总数图8共线性诊断从图7中可以看出,容忍度均小于 0.5,并且论文数的容差为 0.075,接近于0,方差膨 胀因子投入人年数和论文数都大于10,因而有理由认为这些变量之间存在着多重共线性;依据图8,从方差比可以看出,第 5个特征根既能解释投入人年数方差的93%,又能解释论文数方差的87%,因而有理由认为这些变量之间存在着多重共线性;再从条件指数

14、来看,第5个条件指数大于10,认为其共线性较强。2)采用“向前进入”策略,残差的自相关性检验和方差齐性。(1)操作步骤 选择菜单中【分析一一回归一一线性】; 将课题总数指定到 【因变量(D)】中,将销售地区和销售方式指定到【固定因子(F)】中,将投入人年数、投入科研事业费、论文数和获奖数指定到【自变量( I)】中,在【方法(M )】框中选择回归分析中解释变量的筛选策略为“向前 + ”。 点击“统计量(S) ”按钮,在回归系数框中选择【估计( E)】,在残差框中选择【Durbin-Watson(U)】和【个案诊断(C )】,点击“继续”按钮; 点击“确定”按钮,出现如图7、图8、图9所示。(2)

15、结果分析及结论t a i细Duirtjin-WaE口 nFdfldf?F145时.§17241 KQ39曾311 flrm23rcn1 717a、:京 SE +图9模型汇总12Fin 化残滋的际新p-p底图10观察的累积频率散点图因洋饿;棵农e数IIIIHI-1-10123回!d标滩化技羔四!|-|钉汗化*值图11回归标准化残差从图9中可以看出,Durbin-Watson (1.776)在1.5和2.5之间,因而残差序列相对独立;从 图10中可以看出,数据点围绕基准线存在一定的规律性,近似服从标准正态分布,即残差 均值为0,因而残差序列相对独立,方差齐性良好;从图 11中可以看出,回

16、归标准化残差 及预测值均在土 3个标准差范围内,无异常点,且数据点无明显规律,因而残差序列相对独第11题:聚类分析(1)分析思路因为销量和价格和其他变量存在着数量级上的差异,因而首先需要对销量和价格进行标准化。其次,根据车种类型,对汽车销售样本数据进行层次聚类分析,将11种车型分为三类,其中个体距离采用欧式距离,类间距离采用平均组间链锁距离。最后用频数分析对各类的竞争力进行评价。(1)操作步骤第一步:对变量进行标准化。选择菜单中【分析一描述统计一描述】,将销量和价格指定到变量中,选中“将标准化得分另存为变量”,点击“确定”按钮。第二步:层次聚类分析。 选择菜单中【分析一分类一系统聚类】; 将引

17、擎型号、马力、轴距、宽度、长度、限重、储油量、用油效率和标准化后的销量和价格指定到“变量”框中,将车型指定到“标注个案”框中,在“聚类”中选择“个案” , 在“输出”中选择“统计量”和“图”; 点击“统计量”按钮,选择“合并进程表”,在【聚类成员】框汇总选择【单一方案一聚类数:3】,点击“继续“按钮; 点击“绘制”按钮,选中“树状图”,在【冰柱】框中选择“所有聚类”,在【方向】框中选择“垂直”,点击“继续”按钮; 点击“方法”按钮,在【聚类方法】框中选择"组间联接” ,在【度量标准】框中选 择【区间一Euclidean距离】,在【标准化】框中选择“ Z”得分,点击“继续”按钮; 点击

18、“保存”按钮,在【聚类成员】 框中选择【单一方案一聚类数:3】,点击“继续” 按钮; 点击“确定”按钮,出现如图12、图13、图14所示。价睛择数卜一阶所1曲1辞隼21a101.1 69072591.2770063231.3370044242.1523055122.471041065112.6612097732.7900198562.9626099573.691e71 010155.341590图12聚类表案例1- 6-SM产VPH8-C8-!-图13冰柱图使用平抱取接(粗间)的材状图D£10U2D2611L'.Accord8 Camry ITaLns7Malbu* '

19、;Crmd Am§A MuslarigImpale G Focus2CMic3 Corllq4 pCiij-aief11图14树状图(2)结果分析及结论从图13、图14可以看出,Focushe和Civic相似性较高且较早地聚为了一类,Accord和Gamry相似性较高且较早地聚为了一类,Malibu和Grand Am相似性较高且较早的局为了一类。根据题意,将11种车型分为三类,从图中可以看出,Cavalier、Focus、Civic和Corolla 为一类(第 1 类),Malibu、Impala、Grand Am 和 Mus tang 为一类(第 2 类),Taurus、Accor

20、d 和Camry为一类(第 3类)。第三步:对各类的竞争力情况进行判别分析如图15所示,对各类的竞争力情况分析,则主要通过对各类的销量和价格均值的乘积进行比较,即可得出各类的竞争力情况。Cavalier、Focus、Civic和Corolla为第1类,它的销量和价格之积为(121.89675*19.17625 ), Malibu、Impala、Grand Am 和 Mus tang 为第 2类,它的销量和价格之积为(165.85225*12.89200 ), Taurus、Accord和Camry为第3类,它的销量和价格之积为(241.57033*16.91767 ),三类进行对比,可以看出第

21、三类Taurus、Accord和Camry的竞争力最强,第一类 Cavalier、Focus、Civic和Corolla的竞争力次之,Malibu、Impala、Grand Am 和 Mus tang 的竞争力最弱。重策指三1NE d-ifig斯耋1 .00料耳皇41 07.9951 3 5.1 201 21 .8967513 236803DOO)41 6 53521 5S019176252 OB4552mi孕理号43 13a3 4252S72jj. -f-l4II 701 9011 70.758.5394101.3110.510§.45C3.9092宅rtx469.473.171.4751.8644A1 S3.2200

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论