《统计分析和SPSS的应用(第五版)》(第四章)课后练习与答案_第1页
《统计分析和SPSS的应用(第五版)》(第四章)课后练习与答案_第2页
《统计分析和SPSS的应用(第五版)》(第四章)课后练习与答案_第3页
《统计分析和SPSS的应用(第五版)》(第四章)课后练习与答案_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

...wd......wd......wd...《统计分析与SPSS的应用〔第五版〕》〔薛薇〕课后练习答案第4章SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。分析——描述统计——频率,选择“常住地〞,“职业〞和“年龄〞到变量中,然后,图表——条形图——图表值〔频率〕——继续,勾选显示频率表格,点击确定。Statistics户口所在地职业年龄NValid282282282Missing000户口所在地FrequencyPercentValidPercentCumulativePercentValid中心城市20070.970.970.9遥远郊区8229.129.1100.0Total282100.0100.0职业FrequencyPercentValidPercentCumulativePercentValid国家机关248.58.58.5商业服务业5419.119.127.7文教卫生186.46.434.0公交建筑业155.35.339.4经营性公司186.46.445.7学校155.35.351.1一般农户3512.412.463.5种粮棉专业户41.41.464.9种果菜专业户103.53.568.4工商运专业户3412.112.180.5退役人员176.06.086.5金融机构3512.412.498.9现役军人31.11.1100.0Total282100.0100.0年龄FrequencyPercentValidPercentCumulativePercentValid20岁以下41.41.41.420~35岁14651.851.853.235~50岁9132.332.385.550岁以上4114.514.5100.0Total282100.0100.0分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有200人,而在遥远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分布表中的百分比一样。2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进展比照。进一步,对不同常住地储户存款金额的基本特征进展比照分析。分析——描述统计——描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。分析:由表中可以看出,有效样本为282份,存〔取〕款金额的均值是4738.09,标准差为10945.09,峰度系数为33.656,偏度系数为5.234。与标准正态分布曲线进展比照,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,说明此表的存款金额均值对平均水平的测度偏大。分析:由表中可以看出,中心城市有200人,遥远郊区为82人。两局部样本存取款金额均呈右偏尖峰分布,且遥远郊区更明显。3、利用第2章第7题数据,如果假设存款金额服从正态分布,能否利用本章所讲解的功能,找到存款金额“与众不同〞的样本,并说明理由。分析——描述统计——描述,选择存款金额到变量中。对“将标准化得分另存为变量〞打上勾,然后对数据编辑窗口中的最后一列变量标准化Z变量进展排序,并观察,找到它的绝对值大于3的都是“与众不同〞的样本。理由:标准化值反映的是样本值与样本均值的差是几个标准差单位。如果标准化值等于0,则表示该样本值等于样本均值;如果标准化值大于0,则表示该样本值大于样本均值;如果标准化值小于0,则表示该样本值小于样本均值。如果标准化值的绝对值大于3,则可认为是异常值。4、利用第2章第7题数据,结合被调查者的常住地或职业或年龄状况,分析储户的收入分布特征。分析——描述统计——穿插表,选择常住地、职业、年龄到行中,选择收入水平到列中,勾选“显示复式条形图〞。点击单元格——选择观测值、期望、行、列、合计。点击统计量——选择卡方。点击继续。确定利用列联分析实现。首先编制列联表,然后进展卡方检验。以户口和收入的列联分析为例:表中,卡方统计量的观测值等于32.064,概率-P值等于0.001。假设显著性水平设为0.05,由于0.001<0.05,拒绝原假设,说明户口地与收入水平不独立。5、说明第2章第7题资料中的多项选择项问题是按照哪种拆分方式拆分的。利用多项选择项分析被调查者本次存款的最主要目的是什么。答:第2章第7题资料的多项选择项问题是按照分类法拆分的。目的是为了把多项选择项问题的分析转化为对多个问题的分析,即对多个SPSS变量的分析。多项选择项分类法;存款的最主要目的是正常生活零用6、三代同堂的家庭中,婆婆与儿媳妇关系紧张的现象并不少见,为了了解住房条件对婆媳关系的影响,对600户家庭进展了调查并进展了列联分析,如下表:1〕补充表中第一行和第四行空缺的计算结果。2〕写出卡方检验的统计量并说明其构造基本原理。3〕婆媳关系与住房条件有无联系判断婆媳关系与住房条件有无关系:因为P值为0.000,小于显著性水平0.01,属于高度显著,拒绝原假设,所以婆媳关系与住房条件有关系。计算结果:卡方统计量:,用于测度各个单元格的观测频数与期望频数的差异,并依卡方理论分布判断差异是否统计显著。由于期望频数代表的是行列变量独立下的分布,所以卡方值越大说明实际分布与期望分布差异越明显。本例中,由于概率P值小于显著性水平,应拒绝原假设,婆媳关系与住房条件有关系。7、利用第2章第4题资料,分析两种减肥产品所产生的效果分布是否一致。分析——描述统计——穿插表,选择“产品类型〞到行,选择“体重变化〞到列。点击统计量——勾选卡方。点击单元格——选择观察值、期望值、行、列、总计。点击继续,确定。将计数数据复原为原始数据,采用穿插分组下的频数分析,并进展卡方检验。表中,卡方统计量观测值为4.339,对应的概率P-值为0.037,小于显著性水平0.05,应拒绝原假设,说明减肥效果并不一致。8、根据第2章第8题数据,答复以下问题:〔1〕该问卷中的多项选择项问题是按照哪种方式分解的〔2〕请给出调查问卷数排在前三位的城市编码。这三个城市的有效问卷共有多少份〔3〕股民中有多大比例的人赚人民币了有多大比例的人亏人民币了〔4〕股民买卖股票主要依据的是哪种方法股民买卖股票最少依据的是哪种方法〔5〕要研究专职投资者与业余投资者在股票投资结果上是否有差异,请给出你的分析思路、计算结果和分析绪论。〔1〕多项选择项二分法;〔2〕102〔794份〕、101〔514份〕、401〔400份〕〔3〕赚人民币比例:30.3%,赔人民币比例38%〔4〕主要依据:基本因素法;最少依据:更跟方法〔5〕采用列联分析。卡方检验结果说明:专职和业余投资者在投资结果上存在显著差异。9、为分析私家车主倾向承受的汽车销售价格是否与其居住地区有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的400名消费者作了抽样调查,得到如下结果:汽车价格东部地区中部地区西部地区10万元以下20404010万~20万元50605020万~30万元30202030万元以上402010〔1〕指出表中所涉及的变量,并说明变量的类型。〔2〕可使用哪种分析方法分析上表请说明分析的基本思路并利用SPSS进展分析。〔1〕变量:汽车价格、居住地区;类型:定序型变量、定类型变量〔2〕上述是计数数据的组织方式,应首先组织到SPSS的数据编辑器窗口中,再利用穿插分组下的频数分析方法。利用【交差表】来分析上表,步骤如下:①先将上表中数据录入SPSS中。共有400个个案。②【分析】→【描述统计】→【穿插表】,将“地区〞作为列变量,将“汽车价格〞作为行变量,在【统计量】中选择“卡方〞,在【单元格】中选择观察值、期望值、行、列和总计,得到分析结果。③提出原假设:认为地区和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论