SPSS期末大作业-完整版演示教学_第1页
SPSS期末大作业-完整版演示教学_第2页
SPSS期末大作业-完整版演示教学_第3页
SPSS期末大作业-完整版演示教学_第4页
SPSS期末大作业-完整版演示教学_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1题:基本统计分析1分析:本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据一选择个案一随机个案样本一大约(A)80所有个案的%。1、基本思路:(1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,5002000元,20003500元,35005000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。(2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。操作

2、步骤:(1)数据分组:【转换一重新编码为不同变量】,然后选择存取款金额到【数字变量一输出变量(V)】框中。在【名称(N)】中输入“存取款金额1",单击更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。存取款金额1频率百分比有效百分比累积百分比1.008234.634.634.62.007632.132.166.73.00104.24.270.9有效4.00229.39.380.25.004719.819.8100.0合计237100.0100.0(2)【分析一描述统计一频率】;选择“存款金额分组”变量到【变量(V)】框中;单击图标(C)按钮,选择【直方图】和【在直方图上显示正

3、态曲线】;选中【显示频率表格】,确定。(3)【数据一拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析一描述统计一频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】一继续一确定。统计量存(取)款金额有效1N缺失020岁以下2550.00百分位数5050.007550.00有效131N缺失02035岁25500.00百分位数501000.00755000.00有效73N缺失03550岁25500.00百分位数501000.00754500.00有效32N缺失050岁以上25525.00百分位数501000.0075200

4、0.00结果及结果描述:频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。年龄在20岁以下的人有1人,其存取款金额的四分位差是 0 (50-50)统计量表格表明,元,年龄在2035岁之间的人有131人,其存取款金额的四分位差是4500(5000-500)元,年龄在3550岁之间的人有73人,其存取款金额的四分位差是4000(4500-500)元,年龄在50岁以上的人有32人,其存取款金额的四分位差是1475(2000-525)元。可见,2035,3550两个年龄段的

5、离散程度比较大,其余两个年龄段的离散程度较小。2、基本思路:本问题涉及到两个变量户口和物价趋势,考虑两者之间的联系,因而需要用到交叉列联表。该列联表的行变量为户口,列变量为物价趋势,需要在列联表中输出各种百分比、期望频数、剩余、标准剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对物价趋势的态度是否一致进行分析。操作步骤:(1)【分析一描述统计一交叉表】,选择“户口”至ij【行】框中,选择“物价趋势”到【列】框中;并选中【显示复式条形图】(2)单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】各框一继续;(3)单击【统计量】,选中【卡方】框一继续

6、;结果及其结果分析:户口*物价趋势交叉制表物价趋势合计上升稳定下降计数2113118170期望的计数20.1122.727.3170.0城镇户口户口中的12.4%77.1%10.6%100.0%物价趋势中的75.0%76.6%47.4%71.7%总数的8.9%55.3%7.6%71.7%户口计数7402067期望的计数7.948.310.767.0农村户口户口中的10.4%59.7%29.9%100.0%物价趋势中的25.0%23.4%52.6%28.3%总数的3.0%16.9%8.4%28.3%计数2817138237期望的计数28.0171.038.0237.0合计户口中的11.8%72.

7、2%16.0%100.0%物价趋势中的100.0%100.0%100.0%100.0%总数的11.8%.72.2%16.0%100.0%.卡方检验值df渐进Sig.(双侧)13.27Pearson卡方6a2.00112.15似然比92.002线性和线性组合7.7501.005有效案例中的N237a.0单元格(0.0%)的期望计数少于5。最小期望计数为7.92上面交叉列联表表明,I共有237名被访者,其中170名有城镇户口,67名是农村户口,占样本总数的71.7%,28.3%;认为物价趋势为上升、稳定、下降的人数分别为28、171、38,各占总数的11.8%,72.2%,16.0%。II对不同户

8、口的人群进行分析:城镇户口的人数总共有170人,对物价稳定趋势为上升、稳定、下降的比例分别为12.4%、77.1%、10.6%,认为物价趋势稳定的人数多于总比例,认为物价趋势下降的人数少于总比例;农村户口的总人数为67人,对物价稳定趋势为上升、稳定、下降的比例分别为10.4%、59.7%、29.9%,认为物价趋势稳定的人数少于总比例,认为物价趋势下降的人数多于总比例;III对物价趋势不同态度的人群分析:认为物价上升的人数总共有28人,其中城镇户口和农村户口所占比例分别为75%,25%,有城镇户口的比例略高于总比例;认为物价稳定的人数总共有171人,其中城镇户口和农村户口所占比例分别为76.6%

9、,23.4%,有城镇户口的比例略高于总比例;认为物价下降的人数总共有28人,其中城镇户口和农村户口所占比例分别为47.4%,52.6%,有城镇户口的比例明显低于总比例;总体来说,不同户口的人群对物价趋势的态度存在一定的一致性。从所得卡方检验结果来看,概率p值为0.001,小于显著性水平,因此拒绝原假设,认为行列变量具有较强的相关性。3、对居民一次存款金额分别按照收入水平进行分类,得到均值、中位数、方差和偏度。3、基本思路本题中的分类变量为收入水平,因而需按照收入水平对数据进行拆分,然后分别计算一次存款金额的均值、中位数、方差和偏度。操作步骤:【数据一拆分文件,选择“收入水平”变量到【分组方式】

10、框中,选中【比较组】和【按分组变量排序文件】,确定;【分析一描述统计一频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选中【均值】、【中位数】、【方差】、【偏度】一继续一确a£o结果及其分析:统计量存(取)款金额300元以下有效N缺失均值4102043.17中值300.00方差30740437.195偏度4.066偏度的标准误.369有效N137缺失0均值4314.15300800元中值1000.00方差134185788.508偏度6.490偏度的标准误.207有效N46缺失0均值5687.678001500元中值1750.00方差116385836.002偏度4.41

11、5偏度的标准误.3501500元以有效N13上缺失0均值11026.92中值7000.00方差197942756.410偏度2.193偏度的标准误.616第2题:基本统计分析2用随机抽样中的近似抽样方法选取85%勺1¥本,数据一选择个案一随机样本一大约(A)85所有个案的%第一问基本思路:由于存款金额是定距型变量,考虑先进行数据分组再编制频数分布表。进行数据拆分,分别计算“300以下”、“300-800”、“800-1500”、“1500以上”收入的四分位数,并通过四分位数比较上述四者分布上的差异。操作步骤:【转换一重新编码为不同变量(R);选择“存款金额”到【数字变量一输出变量(V

12、)】框中;在名称(N)】中输入“存款金额分组”,单击【更改(m按钮;单击【旧值和新值】按钮进行分组区间定义。存款金额分组频率百分比有效百分比累积百分比1.008534.334.334.32.007731.031.065.33.00166.56.571.8有效4.002510.110.181.95.004518.118.1100.0合计248100.0100.0【分析一描述统计一频率】;选择“存款金额分组”变量到【变量(V)框中;单击【图标(C)按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显小频率表格】,确定。【数据一拆分文件,选择“收入水平”变量到【分组方式】框中,选中【比较组】和

13、【按分组变量排序文件】,确定;【分析一描述统计一频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】一继续一确定。统计量存(取)款金额有效43N缺失0300元以下25200.00百分位数50300.00751000.00有效148N缺失0300800元25500.00百分位数501000.00754475.00有效41N缺失08001500元25710.00百分位数502000.00756000.00有效16N缺失01500元以上253000.00百分位数504450.00759750.00第二问基本思路:该问题中设计到两个变量,应采用交叉分组下的频数分析,行变量为“年

14、龄”,列变量为“未来收入状况的变化趋势”,在列联表中输出观测频数、期望频数、各种百分比,显示各交叉分组下频数分布柱形图,并利用卡方检验,针对各年龄段对“未来收入状况的变化趋势”的态度是否一致进行分析。操作步骤:【分析一描述统计一交叉表】,选择“年龄”到【行】框中,选择“未来收入情况”到【列】框中;单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】各框一继续;单击【统计量】,选中【卡方】框一继续;选中【显示复式条形图】一确定。年龄*未来收入情况交叉制表未来收入情况合计增加基本不变减少计数0213期望的计数.71.8.53.020岁以下年龄中的0.0%66.7%33.3%10

15、0.0%未来收入情况中的0.0%1.3%2.4%1.2%总数的0.0%0.8%0.4%1.2%计数356527127期望的计数28.277.321.5127.0203啰年龄中的27.6%51.2%21.3%100.0%未来收入情况中的63.6%43.0%64.3%51.2%总数的14.1%26.2%10.9%51.2%年龄计数16551081期望的计数18.049.313.781.03550岁年龄中的19.8%67.9%12.3%100.0%未来收入情况中的29.1%36.4%23.8%32.7%总数的6.5%22.2%4.0%32.7%计数429437期望的计数8.222.56.337.05

16、0岁以上年龄中的10.8%78.4%10.8%100.0%未来收入情况中的7.3%19.2%9.5%14.9%总数的1.6%11.7%1.6%14.9%计数5515142248合计期望的计数55.0151.042.0248.0年龄中的%22.2%60.9%16.9%100.0%未来收入情况中的%100.0%100.0%100.0%100.0%总数的%22.2%60.9%16.9%100.0%卡方检验值fd惭进Sig.(双侧)Pearson卡方12.895a13.6.045似然比905.016.031线性和线性组合有效案例中的N72481.895a.3单元格(25.0%)的期望计数少于5最小期望

17、计数为.51第三问基本思路:首先按照户口对数据进行拆分,然后计算存款金额的统计量:均值、四分位数和标准差。操作步骤:【数据一拆分文件,选择“户口”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析一描述统计一频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选中【均值】、【四分位数】、【标准差】一继续一确定。统计量存(取)款金额有效178N缺失0均值4476.84城镇户口标准差8813.36925500.00百分位数501000.00755000.00有效70N缺失0均值2856.47农村户口标准差8317.29525300.00百分位数50775.0075

18、2000.00第3题:基本统计分析3利用居民储蓄调查数据,从中随机选取85%勺样本,进行频数分析,实现以下分析目标:1 .分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;2 .分析不同年龄的储户对什么合算的认同是否一致。3 .检验城镇储户的一次存款金额的均值为500OK,是否可信?利用居民储蓄调查数据,从中随机选取85%勺样本,进行频数分析,实现以下分析目标:基本思路:首先通过随机抽样中的近似抽样方式,对居民储蓄调查数据进行抽样。操作步骤:选择菜单一数据一选择个案一随机个案样本,样本尺寸填大约所有个案85%收益矛业人开口!一口后,的到痴rTx. 学£%*

19、整士LJ1O月口累乐杵鼻昆分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;基本思路:(1)由于存(取)款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。(2)进行数据拆分,并分别计算城镇储户和农村储户的一次存(取)款金额的四分位数,并通过四分位数比较两者分布上的差异。操作步骤:转换一重新编码为不同变量一选择存(取)款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。最后点击确定。

20、再分析一描述统计一频率一变量:存款金额分组,图表选择直方图,选择显示正态曲线。也更新吗到具他迎I日值和平值旧值门道呼O电如触失色)电税喊用白结失口范鼠斯使做使qj:二'.'耙膏城失0)3t#JI0fI(F)ora®,从最低到值电):旧c新:0 ttiru 500 -> 1501 thru 2000 -> 2£Q01 thru 3500 - 33501 thru 5QQQ -> 45000 thru Highest-* 5望式率施显L.%出芫量对字符币但)-百分位伯7四分位敬泡)VMM口百分晚(£】:相等俎所有其他值心下添加二更改&

21、#169;删除因京甲趋势一/均仅M)I ,中位数L.众取!'合计r.倡为期的申点也)n咖哪平做 d物雁势版 4>W±mia10 金利率糅准备固寸 金现金不存的原因【 品出口因可 i触团M d锚晒 品大好恒频映(究量也Q碎噫显神率表格靛计量.图表.Mots 聊曲.标瞪差鼻小值_|方重 L_i晶大值一I通国i均也的标徙译世)分布偏度Like步骤:数据一拆分文件一分组方式:户口一确定。分析一描述统计一频率一统计量一四分位数前打勾一确定。、-=B分都文件:分析所竟个家,不&催担出比较狙谈俎职喊i出色组方式值ra_Bmjd目的三a7,3d物圻水平3B|fi枷介超招归到晶物

22、中上祗准者3101任禾悻不荚准备a11禽现金不存的厚因I济明业,14】315名大妁小军的86%I.转存款能物分组g1西娼受量排序文件但)二哀件已排序(D明定L粘贴下爰®/取naj需朗j存款金额分组频率百分比有效百分比累积百分比后效1.008735.435.435.42.007630.930.966.33.00145.75.772.04.00208.18.180.15.004919.919.9100.0合计246100.0100.0存款金撷分?11统计量存款金额分组城镇户口N后效177缺失0百分位数252.0000503.0000755.0000农村户口N功效69缺失0百分位数251.

23、5000503.0000753.0000存款在500以下所占百分比最大,有35.4%,其次是500-1000的人数。而可能是因为城镇居民比存款在5000以上的也有19.9%,说明存款数额悬殊较大从输出图表中看出城镇储户较农村储户有两倍之多,较富裕而且存款意识比较强。农村户口的居民可能更愿意把钱藏在家里而不是拿到银行去存。分析不同年龄的储户对什么合算的认同是否一致。基本思路:该问题列联表的行变量为年龄,列变量为什么合算,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对不同年龄的储户对什么合算的认同是否一致进行分析.操作步骤:分析一描述统

24、计一交叉表,显示复式条形图前打勾,行选择年龄,列选择什么合算,统计量选择卡方,点击单元格,在观察值、期望值、行、歹I、总计、四舍五入单元格计数前打勾,最后确认。极.源|R羽未采畋入情况幅3行3):仁1的力J空空用E冲-1_2_3叫叫福母甲 尔7.7_31 aei! "日富学篇 一一二=一水产上千不g- -的的的价讷讷T金口“ 开口日日的叫电到现户一卡方检验值df渐进Sig.(双侧)Pearson卡方3.997a3.262似然比3.9863.263线性和线性组合3.3371.068有效案例中的N246a.2单元格(25.0%)的期望计数少于5。最小期望计数为.77。分析:因为卡方值小于

25、0.05拒绝原假设,认为行列变量之间相关,年龄对什么合算的认同有影响,说明不同年龄的储户对什么合算的认同不一致.3.检验城镇储户的一次存款金额的均值为5000元,是否可信?单个样本统计量户口N均值标准差均值的标准误城镇户口存(取)款金48719643.177.11647724.861额农村户口存(取)款金4517145281749.0069.45.3407额单个样本检验户口检验值=5000tdfSig.(双侧)均值差值差分的95%置信区间下限上限城镇户口存(取)款金额-17.859-128-1551301.6.1786.8879.425存(取)款金额-482-3973007.5农村户口.276

26、68.783.5512.644由上表可知,城镇储户的一次存款金额的均值为5000元,不可信.第4题:方差分析I解题思路问题(2)是研究一个控制变量即浓度的不同水平是否对观测变量收率产生了显著影响,因而应用单因素方差分析。建立原假设为:不同浓度没有对收率产生显著影响,对原假设进行检验。问题(3)首先是研究两个控制变量浓度及温度的不同水平对观测变量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影响,因而应该采用多因素方差分析。建立原假设为:Hoi不同浓度没有对收率产生显著影响;Ho2不同温度没有对收率产生显著影响;H03浓度和温度对化工厂的收率没有产生显著性的交互影响。操作步骤

27、问题(2):选择菜单【分析一比较均值一单因素】,将收率选入到因变量列表中,将浓度选入到因子框中,则SPSS会将结果显示到输出窗口中。问题(3):选择菜单【分析一一股线性模型一单变量】,把收率制定到因变量中,把浓度与温度制定到固定因子框中,则SPSS会将结果显示到输出窗口。输出结果解释与结论问题(1):熊,悔槌11股3邸=51.S口懒.5S去2a螂)SC期腿悟咒力3卦/HISI上修螂)3C髀2器/m单因素方差分析收率平方和df均方F显著性组间39.083219.5425.074.016组内80.875213.851总数119.95823单因素方差分析结果解释:可以看到观测变量收率的总离差平方和为

28、119.958,如果仅考虑浓度单个因素的影响,则收率总变差中,浓度可解释的变差为39.083,抽样误差引起的变差为80.875,他们的方差分别为19.542和3.851,相除所得的F统计量的观测值为5.074,对应的概率p值近似为0.016。由于显著性水平a=0.05,概率p值小于显著性水平,则应拒绝原假设,认为不同浓度对收率产生了显著影响。问题(3):主体间效应的检验因变量:收率源III型平方和df均方FSig.校正模型70.458a116.4051.553.230截距2667.04212667.042646.556.000浓度39.083219.5424.737.030温度13.79234

29、.5971.114.382浓度*温度17.58362.931.710.648庆方49.500124.125总计2787.00024校正的总计119.95823a.R方=.587(调整R方=.209)多因素方差分析结果解释:输出结果中,第一列是对观测变量总变差分解的说明,第二列是观测变量变差分解的结果,第三列是自由度,第四列是均方,第五列是F检验统计量的观测值,第六列是检验统计量的概率p值。可以看到观测变量收率的总变差为119.958,由浓度不同引起的变差是39.083,由温度不同引起的变差为13.792,由浓度和温度的交互作用引起的变差为17.583,由随机因素引起的变差为49.500。浓度,

30、温度和浓度*温度的概率p值分别为0.030,0.382和0.648。浓度的概率p值小于显著性水平行0.05,则应拒绝原假设,认为不同浓度给收率带来了显著影响;同时温度的概率p值和浓度*温度的概率p值均大于显著性水平,因此不应拒绝原假设,可以认为不同温度没有对收率产生显著影响,不同浓度和温度没有对收率产生显著的交互作用。第5题:方差分析2某电器公司想知道某产品销售量与销售方式及销售地点是否有关,根据近2个月的情况得到下表的数据,以0.05的显著性水平进行检验:(1)给出SPS激据集的格式(列举前4个样本即可);(2)销售方式对销售量的影响;(3)销售方式和销售地点以及它们的交互作用对销售量的影响

31、。某电器公司想知道某产品销售量与销售方式及销售地点是否有关,根据近2个月的情况得到下表的数据,以0.05的显著性水平进行检验:(1)给出SPSSt据集的格式(列举前4个样本即可);(2)销售方式对销售量的影响;(3)销售方式和销售地点以及它们的交互作用对销售量的影响。笆种组合下白两个律本事巩77,72白翼&69叽8目83,S5手布F1OU73,7*fiU74,77"I等二8U等丹-U-F耳口基本思路:本道题重点考察我们对于在SPSS应用过程中对于方差分析的应用情况。先将这组数据输入SPSS然后进行两个方面的计算:单因素方差分析和多因素方差分析。利用SPSS勺非必须功能,从而得

32、出它们的方差数据,进而进行分析和结果的得出。(1)操作步骤:分别定义分组变量A(方式)、X(销售量)、B(地区),在变量视图与数据视图中输入表格数据赳IKD11771217213183241862518336179371904S1584918551835二128911229511329221429621527832813(2)销售方式对销售量无显著性影响操作步骤:分析-比较均值-单因素ANOVA-S变量列表:收率,因子列表单因素方差分析X平方和df均方F显著性组间1221.3003407.10013.244.000组内1106.6003630.739总数2327.90039结果分析:显著性0.

33、05说明拒绝原假设(销售方式对销售量无显著性影响)证明销售方式对销售量有显著性影响。(3)操作步骤:分析-一般线性模型-单变量-因变量:收率,固定因子主体间效应的检验因变量:X源III型平方和df均方FSig.校正模型2211.900a19116.41620.072.000截距269288.1001269288.10046428.983.000A1221.3003407.10070.190.000B269.650467.41211.623.000A*B720.9501260.07910.358.0004H至庆方116.000205.800总计271616.00040校正的总计12327.900

34、39-1a.R方二=.950(调整R方=.903)根据图可知,因子A和B是显著地,方差分析可以很好的去辨别两个事物之间存在联系的紧密性。7.以高校科研研究数据为例,建立回归方程研究以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X6、论文数X7。解释变量采用(强制)进入策略,对回归方程和回归系数的显著性检验结果进行解释分析,并给出最终的回归模型(=0.05)。以高校科研研究数据为例,建立回归方程研究以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X&论文数X7。解释变量采用(强制)进入策略,对回归方程和回归系数的显著性检验

35、结果进行解释分析,并给出最终的回归模型(。=0.05)。95%模型汇总步骤:菜单分析回归线性。统计量选择回归系数估计,置信区间模型RR方调整R方标准估计的误差1.966a.933.923232.3360a.预测变量:(常量),论文数,投入科研事业费(百元),专著数,投入人年数。aAnova残差1403480.2653980.072428总计2107681030.000a.因变量:课题总数b.预测变量:(常量),论文数,投入科研事业费(百元),专著数,投入人年数。系数模型非标准化系数标准系数tSig.B标准4H至庆方试用版(常量)-55.26775.625-.731.471投入人年数.571.1

36、061.1135.367.0001投入科研事业费(百元).003.002.2311.611.119专著数-.282.267-.177-1.058.300论文数-.051.043-.203-1.184.247a.因变量:课题总数由表可知常量0.471>0.05,0.119>0.05,0.300>0.05,0.247>0.05,故他们不能通过方程的显著性检验。课题总数=0.571*投入人年数把回归方程写出来第6题:回归分析1基本思路:(1)建立多元线性回归模型,分析汽车特征与销售量之间的关系,并利用回归结果给出改进汽车设计方案的建议,以促进销售量的提高。(2)做多重共线性、

37、方差齐性和残差的自相关检验。操作步骤&结果分析I(强制进入策略):(1)分析一回归一线性,把“销售量”选入【因变量(D)】框中,把“车型”、“价格”、“发动机规格”、“马力”、“轴距”、“宽度”、“长度”、“净重”、”燃料箱容量”和“燃料效率”这十个变量选进【自变量(I)】框中,采用进入筛选策略;(2)单击【统计量(S)】,选中【估计(E)】、【模型拟合度(凶】、【共线性诊断(L)】和【Durbin-Watson(U)框,继续,确定;表6-1模型汇总模型RR方调整R方标准估计的误差Durbin-Watson1.697a.486.449.989601.481a.预测变量:(常量),燃料效

38、率,长度,价格,车型,宽度,发动机规格,燃料箱容量,轴距,净重,马力。b.因变量:销售量分析:依据该表可尽心回归方程拟合优度检验,由于该方程中有多个解释变量,因此应参考调整的判定系数,调整的判定系数为0.449,离1较远,所以拟合优度较低,被解释变量可以被模型解释的部分较少,未能别解释的部分较多。表6-2Anova模型平方和df均方FSig.回归130.3001013.03013.305.000b1残差138.082141.979总计268.383151a.因变量:销售量b.预测变量:(常量),燃料效率,长度,价格,车型,宽度,发动机规格,燃料箱容量,轴距,净重,马力。分析:被解释标量的总离差

39、平方和为268.38,由回归平方和130.3丽剩余平方和138.0821&成;回归平方和的均方为13.030,剩余平方和的均方为0.979;F检验统计量的观测值为13.305,对应的概率P值近似为0。依据该表可进行回归方程的显著性检验。若显著性水平为0.05,由于概率P小于0.05,拒绝回归方程显著性检验的零假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。表6-3系数模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF-3.01-1.10(常量)72.7411.273车型.883.331.2932.670.008.3043

40、.2931-3.59价格-.046.013-.5026.000.1875.337发动机规格.356.190.2811.871.063.1626.159马力-.002.004-.092-.509.611.1128.896轴距.042.023.2411.785.076.2004.997宽度-.028.042-.073-.676.500.3133.193长度.015.014.1481.032.304.1785.605净重.156.350.075.447-1.20.655.1317.644燃料箱容量-.057.047-.1673.231.1895.303燃料效率.081.040.2622.023.04

41、5.2174.604a.因变量:销售量分析:由表6-3可进行回归系数显著性检测,写出回归方程和检测多重共线性。如果显著性水平为0.05,除了车型、价格,燃料效率外,其他变量的回归系数显著性t检验的概率P值都大于显著性水平,因此不应该拒绝零假设,认为这些偏回归系数与0无显著差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。由于该模型保留了一些不应被保留的变量,因此该模型目前是不可用的,应该重新建模。从膨胀因子看,VIF都小于10,各解释变量都不存在严重的多重共线性,从容忍度看,容忍度接近于0,但却没有小于0.1,不存在严重的多重共线性。表6-4共线性诊断模型数博征值条件索引方差比例

42、(常旦里)车型价格发动机规格马力轴距宽度长度净重燃料箱容量燃料效率9.1.00.00.0.001920.703.6700.00.00.000000.00.00.00.0.0.00233.286.1900.28.00.010000.00.00.00.0.0.01359.0314.000.00.07.140000.00.00.00.0.0.021450.05122.500.12.30.100000.00.00.00.0.1.05519.08935.900.27.01.620700.00.00.03.8.0.05608.04244.200.00.26.057300.00.00.01.1.7.1370

43、5.07558.400.00.00.030001.00.01.29.8.0.428038001002417070103592.076.1.00.1.0.2590275180703011111070001.0130.00.0.01001747061003016708800211.0148.05.0.0810026775160700158008050a.因变量:销售量分析:由表6-4,从方差比例看,并没有哪个特征值对应的解释变量的方差比例有同时存在0.7以上的,由此认为,不存在严重的多重共线性。由表6-4,从条件指数看,第3,4,5,6,7,8条件指数都大于10,说明变量之间确实存在多重共线型,第

44、9,10条件指数大于100,说明变量之间存在严重的多重共线性。综合以上三个关于多重共线性的检验,认为变量间存在多重共线性。通过以上分析可知,上面的方程存在一些问题,应重新建立回归方程,采用向前筛选策略让spssi动完成解释变量的选择。操作步骤&结果分析II(向前筛选策略):(1)点击绘制,Y:ZRESID,X:ZPRED,标准化残差图:正态概率图、直方图,点击保存,预测值:标准化,残差:标准化。最后点击确定。(2)分析一相关一双变量,变量选择:StandardizedPredictedValueStandardizedResiduaJ相关系数中,spearman丁勾。确定。表6-5模型

45、汇总c模型RR方调整R方标准估计的误差Durbin-Watson1.552a.304.3001.115532.655b.430.4221.013571.371a.预测变量:(常量),价格。b.预测变量:(常量,价格,轴距。c.因变量:销售量分析:由表6-5可知,最终保留的变量有价格和轴距,调整R方较接近于0,认为方程的拟合优度较低。由表6-5中的DW值,DW=1.371,表明残差存在一定程度正自相关表6-6Anova模型平方和df均方FSig.回归81.720181.72065.670.000b1残差186.6621501.244总计268.383151回归115.311257.65656.122.000c2残差153.0721491.027总计268.383151a.因变量:销售量b.预测变量:(常量,价格。c预测变量:(常量),价格,轴距。分析:由表6-6可进行回归方程的显著性检验,如果显著性水平为0.05,概率P

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论