《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)_第1页
《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)_第2页
《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)_第3页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计分析与SPSS的应用(第五版)(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条 形图。分析一一描述统计一一频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表一一条形图一一图表值(频率)一一继续,勾选显示频率表格,点击确定。Statistics户口所在 地职业年龄Valid282282282NMissi ng000 |户口所在地FrequencyPerce ntValidPerce ntCumulative Perce nt中心城市20070.970.970.9Valid边远郊区8229.

2、129.1100.0Total282100.0100.0职业FrequencyPerce ntValidPerce ntCumulative Perce nt国家机关248.58.58.5商业服务业5419.119.127.7文教卫生186.46.434.0公交建筑业155.35.339.4Valid 经营性公司186.46.445.7学校155.35.351.1一般农户3512.412.463.5种粮棉专业 户41.41.464.9种果菜专业 户103.53.568.4工商运专业 户3412.112.180.5退役人员176.06.086.5金融机构3512.412.498.9现役军人31.

3、11.1100.0Total282100.0100.0. 'I.賊 M - It r'i Itl年龄Freque ncyPerce ntValidPerce ntCumulative Perce nt20岁以下41.41.41.42035 岁14651.851.853.2Valid 3550 岁9132.332.385.550岁以上4114.514.5100.0Total282100.0100.0分析:本次调查的有效样本为 282份。常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有 82人;职业的分布状况是:在商业服务业的人最多,其次是一 般农户和金融机构;

4、 年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分 布表中的百分比相同。2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款 金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行 对比分析。分析一一描述统计一一描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最 大值、围、偏度、峰度、按变量列表,点击继续一一确定。NMeanStd. orationSkegnessKu 电 $1$StatisticStatisticSladitirStd FitrrStatisticRtri F

5、rror存AT)裁金舉Valic N血2:473S.0010C45.5696.234.14533.B5G.289分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是4738.09,标准差为10945.09,峰度系数为33.656,偏度系数为5.234。与标准正态分布曲线进行对比,由峰 度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。Descnptii/e StatisticsPartin忖MpahSM DeMationKuirinsigfisticStatisticC ta

6、li=ticStatisticCid. LrraiCtDt SticSid Error屮右城市存徳)款盡额Valic N JisViise)20C2004S5A949T92JS1 S4.293J 723i20S.342vane 円(liaise)旺4304 3213402 4255.94E.20E9.060526分析:由表中可以看出,中心城市有200人,边远郊区为82人。两部分样本存取款金额均呈右偏尖峰分布,且边远郊区更明显。3、 利用第2章第7题数据,如果假设存款金额服从正态分布,能否利用本章所讲解的功能, 找到存款金额“与众不同”的样本,并说明理由。分析一一描述统计一一描述,选择存款金额到

7、变量中。对“将标准化得分另存为变量” 打上勾,然后对数据编辑窗口中的最后一列变量标准化 Z变量进行排序,并观察,找到它的绝对 值大于3的都是“与众不同”的样本 。理由:标准化值反映的是样本值与样本均值的差是几个标准差单位。如果标准化值等于0,则表示该样本值等于样本均值;如果标准化值大于0,则表示该样本值大于样本均值;如果标准化值小于0,则表示该样本值小于样本均值。如果标准化值的绝对值大于3,则可认为是异常值。4、利用第2章第7题数据,结合被调查者的常住地或职业或年龄状况,分析储户的收入分布特征。分析一一描述统计一一交叉表,选择常住地、职业、年龄到行中,选择收入水平到列中,勾选“显示复式 条形图

8、”。点击单元格选择观测值、期望、行、列、合计。点击统计量选择卡方。点击继续。确定利用列联分析实现。首先编制列联表,然后进行卡方检验。以户口和收入的列联分析为例:收K拭平moo元心1000*30003C3 (WO 讪(WO 元和nn以b户 口Count讯12740u203Exreed Ccun'3551 16.335.5I2.Switi in 戶匚jVtFA9.5%63 5%70J%T.O% within36.0%77 4*1FO.ITO 9$count31371Ui32E 强曲on coLiniU5IT 71455 Js? n'fewitrin 尸:所在:ft37. B %45

9、.1%13.2%4.9%wan%<4. within62.0%20.0%22.2%29TotalCount5016450ieZ32tv|c«c:«aEOJO1讨II5001fe.U282.J%witHn戶匚貼在池17.7<<se.ife17 7%6.4%100 0% within100.0%ioao%100.0%100.0%100.0%Chi-Siiikrf! FestsValuectfAsi/mip. Big. (2-sicledjPeran ClhkSquare32.06 4 J3.aooUkrlihood Rdiiu29.3H3.000Uriear-

10、Ly-Llneai Associationu.aae1.000N ofValid Cases282d 0 crIR (0) hsv= rented count les? Ihqn 5 The rriiniHihm ofttod count is 5 20.05,表中,卡方统计量的观测值等于32.064,概率-P值等于0.001。若显著性水平设为由于0.001<0.05,拒绝原假设,表明户口地与收入水平不独立。5、说明第2章第7题资料中的多选项问题是按照哪种拆分方式拆分的。利用多选项分析被调查者本次存 款的最主要目的是什么。答:第2章第7题资料的多选项问题是按照分类法拆分的。目的是为了把多

11、选项问题的分析转化为对多个 问题的分析,即对多个 SPSS变量的分析。多选项分类法;feet FrequenciesRmm卩on?«sPertent flf 二豪殒NPenant缸邮买抽也贵品&77.9%21.0%51E.D%正鬲生牯零周10J21.3%63.0%52e.1%1B.4%购买我业生产資料161.Q%57%3440%12.1%买另或逢扇091 Q4%31,2%立讨孩子載育吏73S.O%2LD%1 9.5%107126%3Z.9%毎利J1120U 3%42 B%_otal100.0.:QD.Oa. Oroup存款的最主要目的是正常生活零用6、三代同堂的家庭中,婆婆与

12、儿媳妇关系紧的现象并不少见,为了了解住房条件对婆媳关系的影响,对600户家庭进行了调查并进行了列联分析,如下表:1)补充表中第一行和第四行空缺的计算结果。婆媳关系*住房条件CrosstabulationX2(fo fe)2住房条件Total差一般好婆媳关系紧张Count577860P195Expected Count48.7568.2578195% within婆媳关系29.23%40.00%30.77%100.00% within住房条件38.00%37.14%25.00%32.50%一般Count458763195Expected Count48.7568.2578195% within婆

13、媳关系23.08%44.62%32.31%r 100.00% within住房条件30.00%41.43%26.25%32.50%和睦Count4845117210'Expected Count52.573.584210% within婆媳关系22.86%21.43%55.71%100.00% within住房条件32.00%21.43%48.75%35.00%TotalCount150210240600Expected Count150210240600% within婆媳关系25.00%35.00%40.00%100.00% within住房条件100.00%100.00%100.

14、00%100.00%2)写岀卡方检验的统计量并说明其构造基本原理3)婆媳关系与住房条件有无联系?判断婆媳关系与住房条件有无关系:因为P值为0.000,小于显著性水平0.01,属于高度显著,拒绝原假 设,所以婆媳关系与住房条件有关系计算结果:5770501Q548.869.378.0195.029 2%40.0%30.8%100.038 0%37.1%25.0%32 5%4587S31S546.868.376.01S5.023.1%44,0%3?辭100,0%30.0%41 4%26.3%32.5%434511721052 573.fi94.0210.022,9%21 4%55.7%100.0%

15、32.0%21.4%48.8%35.0%150210240600150.0210.0240.0600.025.0%35.0%40.0%100.0%100.0%100,0%100 0%100,0%r c( f.o f e)2卡方统计量:2j ,用于测度各个单元格的观测频数与期望频数的差异,i 1 j1f并依卡方理论分布判断差异是否统计显著。由于期望频数代表的是行列变量独立下的分布,所以卡方值越大表明实际分布与期望分布差异越明显。本例中,由于概率 P值小于显著性水平,应拒绝原假设,婆媳关系与住房条件有关系。7、利用第2章第4题资料,分析两种减肥产品所产生的效果分布是否一致。分析一一描述统计一一交叉

16、表,选择“产品类型”到行,选择“体重变化”到列。点击统计量一一勾选卡方。点击单元格一一选择观察值、期望值、行、列、总计。点击继续,确定。将计数数据还原为原始数据,采用交叉分组下的频数分析,并进行卡方检验。产品类型体至喪化交貝制喪休重褻北阴显减轻无朋显变北葡+庐品类型 第种吝品 计數271946期望的计數21.824.24&.0产品类型中的滋58.7%41 3%1 00.0%体車畫化由的滋57.4%36.5%465%总敎的箱27.3%19.2%4G.5%寿二种产品计数203363期望的计教25.227 853.0产品类型中的37.7%62.3%1 00.0%怪重叢化中的%42.6%63.

17、5%535%总数的*20.2%33.3%53.5%合计计数475299期望的膠47.052.059.0产品类型中的%47.5%S2.5%1 000%体重喪化中的*1C0 0%100.0%1 00.0%总数的张47 5%52.5%1 00.0%卡方檻验值df新遊Sig.嗽 侧)Pearson 卡方<339*1.037连簇核正b3 5391.060刚匕4 3671,037Fisher的轄礦檢验.045.030餃性和线性组合4 2951有數案例中的Nyya. 0单気格3旳的期望计数少于弘最小期望计数沟21.940b-W 2x2表计算表中,卡方统计量观测值为 4.339,对应的概率P-值为0.0

18、37,小于显著性水平 0.05 , 应拒绝原假设,说明减肥效果并不一致。8、根据第2章第8题数据,回答以下问题:(1)该问卷中的多选项问题是按照哪种方式分解的?(2)请给出调查问卷数排在前三位的城市编码。这三个城市的有效问卷共有多少份?(3)股民中有多大比例的人赚钱了?有多大比例的人亏钱了?(4)股民买卖股票主要依据的是哪种办法?股民买卖股票最少依据的是哪种办法?(5) 要研究专职投资者与业余投资者在股票投资结果上是否有差异,请给出你的分析思路、 计算结果和分析绪论。(1 )多选项二分法;(2)FreauentyP&rtenlVRd PercentCLiinulatii/ePercer

19、rlVlid 10?观14 114 11411015149.19.1232O14C0r.1M3036U22464,4+.43461D3m3.93.93B617J11SC3.43.4r a3fl118G3.42 4d53102 ( 794 份)、101 ( 514 份)、401 (400 份)(3)剁3湎賞I卜腌制烬雲鮪览嬰品FraquancvPercentValid Perce HitCurriulativePercentValidCM37.738J?e.ij175031 j631 965 7碗I 8 3 7301X.31000Total5606gg.v100.3Missing935j6&qu

20、ot;Otfll5641100 JO赚钱比例:30.3%,赔钱比例38%(4)运 st FrequenciotRaponsesPe rcent ofCases'iFtJicenl於日F 丟龔按崇主妄祇曙:荃本tyrg25%32.丟碧秽弟丰事依購:祎术164527.3%29EW买卖誥祟圭要依据:跟凤 方法目跖13J8%H.C%史養頤H麦我据:凭感1772如化31.G%ToldG02S100.0%iDaata Diclxitoinrqrouptabulated 3talue I主要依据:基本因素法;Icot FrquoncnRes polite 5Ptrceni or casesNperc

21、entetd 評好王爰俺転:誌车3TTI有;3超58. U«算趣舲霍主碧休拧:菇卞 分斬法306341%70斤暮耳妾魅宾1:要依協:跟凤 方袪7202995.2%玉卖曄主要依观:S®3770234X)00.2TbTMdllairsIOOOK291Ea iirhctorrv jrnijptahultRd ati/slupn最少依据:更跟方法(5)鼻啊股票投资者还足壘余股聲駅爺着1剰目前力止感做服弟的竝果足Crosslab ulcitia 11Court到H罚为止您做屬曲皓果星Total不I暗不8®您皇年昶魁裏旻圭誉珏县162231755/全毅莽找资若业余段資老13$

22、0161119354旳&Tota1682177321 2G5581Chi &)ua TotsvaneJTSig.(2-siaed)reaison crnsauaieB7.6GT-1oauLibel braod Retlo676682tn(iLineakby-LincarAsociatkn275t71OQDN otValiicI Case3a 0 cels (JO%) have spacted count less than S.The rnhrnim axpeciBci count is ?<3usa采用列联分析。卡方检验结果表明:专职和业余投资者在投资结果上存在显著差异

23、。9、为分析私家车主倾向接受的汽车销售价格是否与其居住地区有关,一家汽车企业的销售 部门对东部地区、中部地区和西部地区的400名消费者作了抽样调查,得到如下结果:汽车价格东部地区中部地区西部地区10万兀以下20404010万20万元50605020万30万元30202030万兀以上402010(1 )指出表中所涉及的变量,并说明变量的类型。(2)可使用哪种分析方法分析上表?请说明分析的基本思路并利用SPSS进行分析。(1 )变量:汽车价格、居住地区;类型:定序型变量、定类型变量(2)上述是计数数据的组织方式,应首先组织到SPSS的数据编辑器窗口中, 再利用交叉分组下的频数分析方法。利用【交差表】来分析上表,步骤如下:先将上表中数据录入 SPSS 中。共有400个个案。 【分析】T【描述统计】T【交叉表】,将“地区”作为列变量,将“汽车价格”作为行变量,在【统计量】中选择“卡方”,在【单元格】中选择观察值、期望值、行、列和总计,得到分析结果。提出原假设:认为地区和汽车价格无关系。民件怫図汽花怕搭交灵制

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论