版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
内容简介高校历年考研专业课的试题一般没有提供答案,虽然各校所用参考教材各异,但万变不离其宗,很多考题也是大同小异。我们参考统计学权威教材、全国各大院校统计学考卷的结构和内容、统计硕士考试大纲、同等学力人员申请硕士学位试题和相关资料,收集和整理了众多高校历年考研真题和典型试题,并进行了详细的解答,以减轻读者寻找试题及整理答案的困难,让读者用最少的时间获得最多的重点题、难点题(包括参考答案),这是本书的目的所贾俊平的《统计学》是一本经典的统计学优秀教材。作为该教材的学习辅导书,本书具有以下几个方面的特点:1.浓缩内容精华,整理名校笔记。本书每章的复习笔记对本章的重难点进行了整理,并参考了国内名校名师讲授贾俊平的《统计学》的课堂笔记,因此,本书的内容几乎浓缩了经典教材的知识精华。2.解析课后习题,总结知识考点。国内外教材一般没有提供课(章)后习题答案或者答案很简单,本书对每章的习题进行了详细的分析。我们在不违背原书原意的基础上结合其他相关经典教材对相关重要知识点进行了必要的整理和分析。3.补充相关要点,强化专业知识。对每章复习笔记的一些重要知识点和一些习题的解答,我们在不违背原书原意的基础上结合其他相关经典教材进行了必要的整理和分析。需要特别说明的是:有些考题的时间较早或内容有点过时,但很值得参考,不失为优秀考题,因此仍然选用。我们深深感谢贾俊平教授和中国人民大学出版社为我们提供了这样一本优秀的统计学教材。要深深牢记:考研不同一般考试,概念题(名词解释)要当作简答题来回答,简答题要当作论述题来解答,而论述题的答案要像是论文,多答不扣分。有的论述题的答案简直就是一份优秀的论文(其实很多考研真题就是选自一篇专题论文),完全需要当作论文来回答!统计类国内外经典教材习题详解系列是一套全面解析统计类国内外经典教材的辅导资料。贾俊平的《统计学》是国内最受欢迎的统计学经典教材之一,本书基本遵循该书第6版的章目编排,共分14章,每章由三部分组成:第一部分为复习笔记,总结本章的重难点内容;第二部分是课后习题详解,对第6版的所有习题都进行了详细的分析和解答;第三部分是典型习题详解,精编了每章的典型习题并作了较为详细的分析和解答。|统计类()提供统计学考研考博、应用统计硕士、统计从业人员考试、全国统计专业技术资格考试(初级、中级、高级)、市场调查分析师(初级、中级、高级)、统计学自考等各类统计考试以及经典教材辅导方案【保过班、网授班、3D电子书、3D题库等】。本书特别适用于在硕士研究生入学考试中参加统计学科目考试的考生,也可供各大院校学习统计学的师生参考。与传统图书相比,本书具有以下七大特色:1.互动学习:摇一摇,找学友,交友学习两不误摇一摇,找到学习本书的所有学友,可精确查找学友的具体位置;与学友互动,交流学习(视频、语音等形式),交友学习两不误;学习圈内有学霸解答本书学习中的问题,并配有专职教师指导答疑解惑。2.720度立体旋转:好用好玩的全新学习体验带给你超逼真的3D学习体验,720度立体场景,任意角度旋转,模拟纸质书真实翻页效果,让你学起来爱不释手!3.质量保证:每本e书都经过图书编辑队伍多次反复修改,年年升级我们拥有一支强大图书编辑团队,他们专门从事图书的编辑工作,对各类职称考试、考研考博等教材教辅深入研究,以及各类职称考试、考研考博的历年真题进行详尽仔细研究与分析,4.手机扫码即可阅读,精彩内容,轻松分享扫码即可在手机阅读,随处随学。可以不用客5.免费升级:更新并完善内容,终身免费升级6.功能强大:记录笔记、答案遮挡等十大功能(1)知识点串联列举相同知识点内容列表呈现,便于读者记忆和复习,举一反三,触(2)划线添加笔记——使用颜色笔工具,划一条线,写笔记,提交纠错。【独家推出】(3)答案遮挡——先看题后看答案,学习效果好。【独家推出】(4)全文检索——输入关键词,本书相关内容一览无余。【独家推出】7.多端并用:电脑手机平板等多平台同步使用本书一次购买,多端并用,可以在PC端(在线和下载)、手机(安卓和苹果)、平板(安卓和苹果)等多平台同步使用。同一本书,使用不同终端登录,可实现云同步,即更换不同()是一家为全国各类考试和专业课学习提供辅导方案【保过班、网授班、3D电子书、3D题库】的综合性学习型视频学习网站,拥有近100种考试(含418个考试科目)、194种经典教材(含英语、经济、管理、证券、金融等共16大类),合计近万小时的面授班、网授如您在购买、使用中有任何疑问,请及时联系我们,我们将竭诚为您服务!详情访问:/(统计类)1.2课后习题详解第2章数据的搜集第3章数据的图表展示第4章数据的概括性度量第5章概率与概率分布第6章统计量及其抽样分布第7章参数估计第8章假设检验第9章分类数据分析第10章方差分析第11章一元线性回归第12章多元线性回归第13章时间序列分析和预测1.统计学2.数据分析所用的方法(1)描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法;(2)推断统计:研究如何利用样本数据来推断总体特征的统计方法。1.分类数据、顺序数据、数值型数据(按计量尺度不同分类)(1)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表(2)顺序数据:只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些(3)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。现实中所处理的2.观测数据和实验数据(按收集方法分类)(1)观测数据:通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条(2)实验数据:在实验中控制实验对象而收集到的数据。3.截面数据和时间序列数据(按被描述的现象与时间的关系分类)(1)截面数据:在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间(2)时间序列数据:在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于1.总体和样本(1)总体总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。组成总体a.有限总体:指总体的范围能够明确确定,而且元素的数目是有限可数的;(2)样本、样本量2.参数和统计量(1)参数(2)统计量3.变量(1)变量、变量值变化。(2)变量的类型a.离散型变量:只能取可数值的变量,它只能取有限个值,而且其取值都以整位数断开,b.连续型变量:可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能(3)变量的其他分类1.什么是统计学?2.解释描述统计和推断统计。(1)描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。(2)推断统计是研究如何利用样本数据来推断总体特征的统计方法。比如,对产品的质量3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?答:统计数据是对现象进行测量的结果,可以从不同角度对统计数据进行分类:(1)按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。①在分类数据中,各类别之间是平等的并列关系,无法区分优劣或大小,各类别之间的顺序是可以改变的;②顺序数据也表现为类别,但这些类别之间是可以比较顺序的;③数值型数据具有分类数据和顺序数据的特点,并且还可以进行加、减、乘、除运算。(2)按照统计数据的收集方法,可以将其分为观测数据和实验数据。①观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据;②实验数据则是在实验中控制实验对象而收集到的数据,自然科学领域的大多数数据都为实验数据;(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。①截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况;②时间序列数据是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于所描述现象随时间变化的情况。4.解释分类数据、顺序数据和数值型数据的含义。答:(1)分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。为便于统计处理,对于分类数据可以用数字代码来表示各个类别。(2)顺序数据是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的。(3)数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。5.举例说明总体、样本、参数、统计量、变量这几个概念。答:(1)总体是包含所研究的全部个体(数据)的集合。比如,要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。(2)样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。比如,从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。(3)参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。比如总体平均数、总体标准差、总体比例等。(4)统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。比如,样本平均数表示,样本标准差用s表示,样本比例用p等。(5)变量是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差值称为变量值。6.变量可分为哪几类?(1)分类变量,是说明事物类别的一个名称,其取值是分类数据;(2)顺序变量,是说明事物有序类别的一个名称,其取值是顺序数据;(3)数值型变量,是说明事物数字特征的一个名称,其取值是数值型数据。7.举例说明离散型变量和连续型变量。答:(1)离散型变量是指其数值只能用自然数或整数单位计算的变量。如,企业个数、职(2)连续型变量是指在一定区间内可以任意取值的变量,其数值是连续不断的,相邻两个8.请举出统计应用的几个例子。(1)每隔10年进行一次的全国人口普查;(2)对居民手存现金情况的调查;(3)对某学校历年考研成绩的调查。9.请举出应用统计的几个领域。(1)企业发展战略;(2)人力资源管理;(3)企业进行市场研究;(4)财务分析;(5)经济预测;(6)企业产品质量管理。1.指出下面变量的类型。(1)年龄。(2)性别。(3)汽车产量。(4)员工对企业某项改革措施的态度(赞成、中立、反对)。(5)购买商品时的支付方式(现金、信用卡、支票)。答:变量可以分为:分类变量、顺序变量和数值型变量。(2)(5)属于分类变量;(4)属于顺序变量;(1)(3)属于数值型变量。2.某研究部门准备抽取2000个职工家庭推断该城市所有职工家庭的年人均收入。要求:(1)描述总体和样本。(2)指出参数和统计量。人均收入”。3.一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?(2)月收入是数值型变量;(3)消费支付方式是分类变量;(4)这项研究涉及的是截面数据。4.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主(1)这一研究的总体是什么?(3)研究者所关心的参数是什么?(4)“消费者每月在网上购物的平均花费(5)研究者所使用的主要是描述统计方法还是推断统计方法?(5)研究者所使用的主要是推断统计方法。1.下列选项中,属于分类变量的有()。A.年龄C.汽车产量D.性别(男、女)【答案】D查看答案2.下列选项中,属于数值型变量的有()。C.购买商品时的支付方式(现金、信用卡、支票)D.员工对企业某项改革措施的态度(赞成、中立、反对)【答案】A查看答案3.某研究部门准备在全市500万个家庭中抽取5000个家庭,推断该城市所有职工家庭的年A.500万个家庭;500万个家庭的人均消费;5000个家庭B.500万个家庭的人均消费;500万个家庭;5000个家庭C.500万个家庭;5000个家庭;500万个家庭的人均消费D.500万个家庭的人均消费;5000个家庭;500万个家庭【答案】C查看答案【解析】总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成;4.对某市高等学校科研所进行调查,统计总体是()。A.某市所有的高等学校B.某一高等学校科研所C.某一高等学校D.某市所有高等学校科研所【解析】总体是包含所研究的全部个体的集合。5.有200个公司全部职工每个人的工资资料,如要调查这200个公司职工的工资水平情况,则统计总体为()。B.200个公司C.200个公司职工的全部工资D.200个公司每个职工的工资6.下列属于数值型变量的是()。A.月工资B.学历C.健康状况【答案】A查看答案7.某研究部门准备在全市500万个家庭中抽取5000个家庭,推断该城市所有职工家庭的年人均消费。这项研究的统计量是()。A.5000个家庭B.500万个家庭C.5000个家庭的年人均消费D.500万个家庭的年人均消费【答案】C查看答案等。5000个家庭的年人均消费为样本平均数,因此为统计量。A项为样本容量;B项为总8.某省的统计机构要考察本省居民的人均住房面积。随机抽取了8000个家庭进行调查。这里的总体是()。A.本省所有居民B.本省所有居民的住房面积C.8000户家庭D.8000户家庭的住房面积【答案】A查看答案9.在同一时间序列中,各指标值的时间单位一般要求()。A.必须为月B.必须为年C.相同D.必须为日10.某地区2000~2009年的每年年末人口数是()。A.时间序列数据B.截面数据C.分类数据D.顺序数据【答案】A查看答案【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。11.2009年城镇家庭的人均收入数据属于()。A.分类数据B.顺序数据C.截面数据D.时间序列数据【答案】C查看答案【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。12.下列不属于描述统计问题的是()。A.根据样本信息对总体进行的推断B.了解数据分布的特征C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A查看答案200名学生,发现他们每月平均生活费支出是600元。该统计量是()。A.该大学的所有学生B.所有大学生的总生活费支出C.该大学所有的在校本科生D.200名学生每月平均生活费支出【答案】D查看答案【解析】统计量是样本的函数,是用来描述样本特征的概括性数字度量。14.在下列叙述中,采用推断统计方法的是()。A.用饼图描述某企业职工的年龄构成B.某日从某食品厂随机抽取了50袋饼干,利用这50袋饼干的平均重量估计这天生产的所C.一个城市在1月份的平均汽油价格D.反映大学生统计学成绩的条形图【答案】B查看答案15.一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。调查结果表明:45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。该调查所收集的数据是()。A.观测数据B.顺序数据C.分类数据D.实验数据16.根据样本计算的用于推断总体特征的概括性度量值称作()。C.样本【答案】D查看答案17.为了估计某城市中拥有空调的家庭比例,抽取500个家庭的一个样本,得到拥有空调的家庭比例为80%,这里的80%是()。B.统计量的值C.样本量D.变量【答案】B查看答案某一个管理人员跟踪了50名顾客并记录下他们找到车位的时间。这里管理人员感兴趣的总A.管理人员跟踪过的50名顾客B.上午在商场停车的顾客C.在商场停车的所有顾客D.到商场购物的所有顾客19.只能归于某一有序类别的非数字型数据称为()。A.分类数据B.顺序数据C.数值型数据D.观测数据【答案】B查看答案20.通过调查或观测而收集到的数据称为()。A.观测数据B.实验数据C.时间序列数据D.截面数据【答案】A查看答案21.最近发表的一份报告称,“由150部新车组成的一个样本表明,外国新车的价格明显高A.对样本的描述B.对样本的推断C.对总体的描述D.对总体的推断【答案】D查看答案【解析】推断统计是研究如何利用样本数据来推断总体特征的统计方法1.按照所采用的计量尺度,统计数据可以分为()。A.分类数据B.实验数据C.顺序数据D.二手数据E.数值型数据【答案】ACE查看答案2.数值型变量根据其取值的不同,可以分为()。B.顺序变量C.连续变量D.随机变量E.非随机变量【答案】AC查看答案3.分类数据和顺序数据统称()。A.二手数据B.定性数据C.品质数据D.定量数据E.数值型数据【答案】BC查看答案4.连续变量具有的特点包括()。A.可以取无穷多个值B.取值连续不断C.只可以取有限值D.其取值都以整位数断开E.取值不能一一列举【答案】ABE查看答案5.下列数值型变量中,属于连续变量的有()。D.人口数E.零件尺寸【答案】ABE查看答案【解析】ABE三项均可以取无穷多个值,其取值是连续不断的,不能一一列举,故属于连第2章数据的搜集1.数据的间接来源(1)间接来源的数据(二手资料)(2)二手资料的优点(3)二手资料的局限性(4)对二手资料进行评估的内容①资料是谁搜集的?这主要是考察数据搜集者的实力和社会信誉度。②为什么目的而搜集?为了某个集团的利益而搜集的数据是值得怀疑的。③数据是怎样搜集的?搜集数据可以有多种方法,不同方法所采集到的数据,其解释力和说④什么时候搜集的?对于过时的数据,其说服力自然受到质疑。2.数据的直接来源(1)调查数据它是通过调查方法获得的数据。调查数据通常取自有限总体,即总体所包含的个体单位是有限的。普查是对总体中所有个体单位进行的调查,普查数据具有信息全面、完整的特点,对普查数据的全面分析和深入挖掘是统计分析的重要内容。但是,当总体较大时,进行普查将是一项很大的工程,由于普查涉及的范围广,接受调查的单位多,所以耗时、费力,调查的成本也非常高,因此普查是不可能经常进行的。(2)实验数据实验数据是指在实验中控制实验对象而搜集到的变量的数据。实验是检验变量间因果关系的一种方法。在实验中,研究人员要控制某一情形的所有相关方面,操纵少数感兴趣的变量,然后观察实验的结果。二、调查数据(1)概率抽样概率抽样(随机抽样):指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。①特点a.抽样时是按一定的概率以随机原则抽取样本。所谓随机原则就是在抽取样本时排除主观上有意识地抽取调查单位,使每个单位都有一定的机会被抽中。b.每个单位被抽中的概率是已知的,或是可以计算出来的。c.当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。概率抽样与等概率抽样的区别:概率抽样是指总体中的每个单位都有一定的非零概率被抽中,单位之间被抽中的概率可以相等,也可以不等。若是前者,称为等概率抽样;若是后者,称为不等概率抽样。概率抽样最主要的优点是可以依据调查结果,计算估计量误差,从而得到对总体目标量进行推断的可靠程度。从另一个方面讲,也可以按照要求的精确度,计算必要的样本单位数目。②概率抽样的方式进行概率抽样需要抽样框,抽样框通常包括所有总体单位的信息,其作用是不仅在于提供了备选单位的名单以供抽选,还是计算各个单位入样概率的依据。简单随机抽样:从包括总体N个单位的抽样框中随机地、一个一个地抽取n个单位作为样本,每个单位入样的概率是相等的。简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础。①特点简单、直观,在抽样框完整时,可以直接从中抽取样本,由于抽选的概率相同,用样本统计量对目标量进行估计及计算估计量误差都比较方便。②局限性:第一,它要求包含所有总体单位的名单作为抽样框,当N很大时,构造这样的抽样框并不第二,根据这种方法抽出的单位很分散,给实施调查增加了困难;第三,没有利用其他辅助信息以提高估计的效率。将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。第一,保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相近,从而可以有效地提高估计的精度;第二,在一定条件下为组织实施调查提供了方便(当层的划分是按行业或行政区划进行时);第三,既可以对总体参数进行估计,也可以对各层的目标量进行估计等等。将总体中若干个单位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,这样的抽样方法称为整群抽样。与简单随机抽样相比,整群抽样的特点在于简化了编制抽样框的工作量,并且调查的地点相对集中,从而节省了调查费用,方便了调查的实施。整群抽样的主要弱点是估计的精度较差。要得到与简单随机抽样相同的精度,需要增加基本调查单位。将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。主要优点:操作简便,如果有辅助信息,对总体内的单位进行有组织的排列,可以有效地提高估计的精度。缺点:对估计量方差的估计比较困难。采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。第一,保证了样本相对集中,从而节约了调查费用;第二,不需要包含所有低阶段抽样单位的抽样框;第三,由于实行了再抽样,使调查单位在更广泛的范围内展开。在较大规模的抽样调查中,多阶段抽样是经常被采用的方法。(2)非概率抽样指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样的方式:①方便抽样调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。方便抽样的最大特点是容易实施,调查的成本低,但是由于方便样本无法代表有明确定义的总体,将方便样本的调查结果推广到总体是没有任何意义的。②判断抽样指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本,实施时根据不同的目的有重点抽样、典型抽样、代表抽样等方式。重点抽样:从调查对象的全部单位中选择少数重点单位,对其实施调查。这些重点单位的数量虽然不多,但在总体中占有重要地位。典型抽样:从总体中选择若干个典型的单位进行深入的调研,目的是通过典型单位来描述或揭示所研究问题的本质和规律。因此,选择的典型单位应该具有研究问题的本质或特征。类似于概率抽样中的分层抽样,它是首先将总体中的所有单位按一定的标志(变量)分为若(3)概率抽样与非概率抽样的比较2.搜集数据的基本方法(1)自填式②弱点c.自填式方法的调查周期通常都比较长,调查人员也需要对问卷的递送和回收方法进行仔d.对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。(2)面访式a.可以提高调查的回答率;b.可以提高调查数据的质量,并且可以对识字率低的群体实施调查;c.在问卷设计中可以采用更多的技术手段,使得调查问题的组合更为科学、合理;d.在面访调查中,还可以借助其他调查工具(图片、照片、卡片、实物等)丰富调查内容;b.面访这种搜集数据的方式对调查过程的质量控制有一定难度;c.对于敏感性问题,在面对面条件下,被调查者通常不会像自填式方法下那样放松,也不(3)电话式a.速度快,能够在很短的时间内完成调查;b.适合样本单位十分分散的情况,由于不需要支付调查员的交通费,数据搜集的成本大大c.对调查员也是安全的;d.在电话调查中,对访问过程的控制也比较容易。②电话调查的局限a.在电话拥有率不高的地区,电话调查这种方式就受b.使用电话进行访问的时间不能太长;c.问卷答案的选项过长、过多,不仅造成调查进度的延缓,被调查者还很容易挂断电话;d.在被访者不愿意接受调查时,要说服他们就更为困难。3.数据搜集方法的选择三种搜集数据方法的特点如表2—3所示。1.实验组和对照组实验法的基本逻辑:有意识地改变某个变量的情况(设为A项),然后看另一个变量变化的情况(设为B项)。如果B项随着A项的变化而变化,就说明A项对B项有影响。2.实验中的若干问题遇到一些问题:(1)人的意愿;(2)心理问题;(3)道德问题。3.实验中的统计(1)统计在实验的过程中的作用(2)一个好的实验,应该在两个方面都有效:②外部的有效性1.抽样误差(1)抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;(2)总体被研究标志的变异程度。在其他条件不变的情况下,总体标志的变异程度越小,(3)抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采用不重复抽样比(4)抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽2.非抽样误差(1)抽样框误差(2)回答误差(3)无回答误差(4)调查员误差(5)测量误差3.误差的控制非抽样误差与抽取样本的随机性无关,因而在概率抽样和非概误差仅在概率抽样中存在)。有很多的原因造成非抽样误差,因此控制起来比较困难。1.什么是二手资料?使用二手资料需要注意些什么?答:(1)如果与研究内容有关的原信息已经存在,只是对这些原信息重新加工、整理,使(2)在使用二手资料前,对二手资料进行评估是必要的。对二手资料进行评估应考虑如下①资料是谁搜集的?这主要是考察数据搜集者的实力和社会信誉度。②为什么目的而搜集?为了某个集团的利益而搜集的数据是值得怀疑的。③数据是怎样搜集的?搜集数据可以有多种④什么时候搜集的?对于过时的数据,其说服力自然受到质疑。2.比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况答:(1)由于非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因(2)非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析提供3.调查中搜集数据的方法主要有自填式、面访式、电话式。除此之外,还有哪些搜集数据4.自填式、面访式、电话式调查各有什么利弊?答:(1)①自填式的长处:a.调查组织者对自填式方法的管理相对容易,只要把问卷正确地送达被调查者手c.有利于被调查者,他们可以选择方便的时间填答问卷,可以参考有关记录而不必依靠记b.自填式方法不适合结构复杂的问卷,对调查的内容有所局限;d.对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。(2)①面访式的长处:a.可以激励被调查者的参与意识,提高调查的b.调查员可以在现场解释问卷,回答被调查者的问题,同时,对被调查者的回答进行鉴别c.在问卷设计中可以采用更多的技术手段,使得调查问题的组合更为科学、合理。而且,可以借助其他调查工具(图片、照片、卡片、实物等)丰富调查内容;a.调查的成本比较高;对调查过程的质量控制有一b.对于敏感性问题,被调查者可能不愿意回答;c.对于敏感性问题,在面对面条件下,被调查者通常不会像自填式方法下那样放松,也不(3)①电话式的长处:a.速度快,能够在很短的时间内完成调查;b.由于不需要支付调查员的交通费,数据搜集的成本大大下降;d.对访问过程的控制也比较容易。d.由于不是面对面的交流,在被访者不愿意接受调查时,要说服他们就更为困难。5.请举出(或设计)几个实验数据的例子。6.你认为应当如何控制调查中的回答误差?差需要根据导致回答误差的原因进行分析,导致回答误(1)对于理解误差,要注意问卷中的措辞,设计一份好的调查问卷;(2)对于记忆误差,要缩短调查所涉及的时间范围;(3)对于有意识误差,调查人员要做好被调查者的思想工作,让他们打消顾虑;调查人员7.怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。(1)如果无回答误差是随机的,可以通过增大样本量的方式解决。例如:调查设计要求完成1000个样本单位,结果回答了800个,无回答率为20%,这时可以再随机抽250个单位,并对其进行调查,如果无回答率仍旧为20%,就可以得到200个(2)如果无回答误差是系统性误差,解决的途径主要在两个方面:2.3典型习题详解1.二手数据的特点是()。A.搜集方便、数据采集快、采集成本低B.采集数据的成本低,搜集比较困难C.数据可靠性较好D.数据的相关性较好【答案】A查看答案2.从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()。A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样【答案】A查看答案【解析】简单随机抽样就是从包括总体N个单位的抽样框中随机地、一个个地抽取n个单(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按3.为了调查某校学生的每月的生活费支出,从全校抽取8个班级的学生进行调查,这种调A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样【答案】D查看答案的学生为群,从全校抽取8个班级的学生进行调查,这种调查方法是整群抽样。4.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方法是()。A.代表抽样B.典型抽样C.简单随机抽样D.重点抽样【答案】D查看答案5.有意识地选择三个农村点调查农业收入情况,此调查方法属于()。A.重点抽样B.简单随机抽样C.代表抽样D.典型抽样【答案】D查看答案6.为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是()。A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样【答案】C查看答案【解析】系统抽样是将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随排序后,每隔50名学生抽一名进行调查,属于系统抽样。7.在商店进行拦截式调查获得样本数据的方式属于()。B.方便抽样调查C.判断抽样调查D.随机抽样调查【答案】B查看答案A.自愿抽样B.配额抽样C.方便抽样D.判断抽样【答案】D查看答案9.为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用()。A.分层抽样B.简单随机抽样C.等距抽样D.整群抽样【答案】A查看答案10.一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是()。A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样【答案】D查看答案在总体中分布最不均匀。在这方面,简单随机抽样、11.下列选项中,抽样调查的结果不能用于对总体有关参数进行估计的是()。A.分层抽样B.判断抽样C.整群抽样D.系统抽样【答案】B查看答案12.如果要对稀少群体的进行调查,适宜采用的调查方式是()。A.滚雪球抽样B.判断抽样C.系统抽样D.整群抽样【答案】A查看答案13.下列选项中,属于概率抽样的有()。A.重点抽样B.配额抽样C.系统抽样D.滚雪球抽样【答案】C查看答案14.先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。这种抽样方式称为()。A.分类抽样B.配额抽样C.系统抽样D.整群抽样【答案】B查看答案总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断15.与概率抽样相比,非概率抽样的优点是()。A.样本统计量的分布是确定的B.可以利用样本的结果对总体相应的参数进行推断C.操作简便、时效快、成本低D.技术含量更高【答案】C查看答案问卷发给上自习者,填写后再收上来。此种收集数据的方法属于()。A.面访式问卷调查B.自填式问卷调查C.实验调查D.观察式调查【答案】B查看答案【解析】自填式指在没有调查员协助的情况下由被调查者自己填写,完成调查问卷。B.公开发表的资料C.随机抽样D.实验调查18.下列关于抽样误差的说法,正确的是()。A.抽样误差是针对某个具体样本的检测结果与总体真实结果的差异而言的B.样本量越大,抽样误差就越小C.抽样调查变成普查时,抽样误差大于零D.总体的变异性越大,抽样误差也就越小【答案】B查看答案19.如果一个样本因人故意操纵而出现偏差,这种误差属于()。A.抽样误差B.实验误差C.设计误差D.非抽样误差20.某餐厅为了解顾客对餐厅的意见和看法,管理人员随机抽取了50名顾客,上门通过问卷进行调查。这种数据的收集方法称为()。A.观察式调查B.实验调查C.面访式问卷调查D.自填式问卷调查【答案】C查看答案21.下列叙述错误的是()。A.抽样误差只存在于概率抽样中B.非抽样误差只存在于非概率抽样中C.无论是概率抽样还是非概率抽样都存在非抽样误差D.在全面调查中也存在非抽样误差【答案】B查看答案22.下列选项中,属于抽样误差的有()。A.随机误差B.抽样框误差C.回答误差D.无回答误差【答案】A查看答案【解析】随机误差属于抽样误差;抽样框误差、回答误差、无回答误差属于非抽样误差。23.某居民小区为了解住户对物业服务的看法,准备采取抽样调同时有些是新入住的居民户。这种调查产生的误差属于()。A.随机误差B.抽样框误差C.回答误差D.无回答误差【答案】B查看答案24.某居民小区的物业管理者为了解住户的每月的用水情况,采户进行调查,发现有些居民户有虚报或瞒报情况。这种调查产生的误差属于()。A.回答误差B.抽样框误差C.有意识误差D.无回答误差【答案】C查看答案25.某居民小区的物业管理者为了解住户每月的用水情况,采取抽样调查方式对部分居民户进行调查。调查员在登记水表数时有抄错的数据。这种调查产生的误差属于()。A.有意识误差B.抽样框误差C.调查员误差D.无回答误差【答案】C查看答案26.下列关于误差的叙述,错误的是()。A.抽样误差是可以避免的B.抽样误差是可以控制的C.抽样误差是不可避免的D.非抽样误差是控制起来比较困难【答案】A查看答案【解析】抽样误差是由于抽样的随机性带来的,只要采用概率抽样,抽样误差就不可避免。二、多项选择题1.随机抽样的特点有()。A.遵循随机原则B.适合探索性的研究C.每个单位被抽中的概率是已知的,或是可以计算出来的D.适合市场调查中的概念测试E.估计量不仅与样本单位的观测值有关,也与其入样概率有关【答案】ACE查看答案2.评价二手资料的准则包括()。A.资料是由谁生产的B.资料是为什么目的而生产的C.资料是怎样生产的D.资料是什么时候生产的E.资料的搜集是否方便【答案】ABCD查看答案【解析】评价二手资料的准则:①资料是谁搜集的?②为什么目的而搜集的?③数据是怎样搜集的?④什么时候搜集的?另外,使用二手数据,要注意数据的定义、含义、计算口径和3.下列抽样方式中属于非概率抽样的有()。A.系统抽样B.判断抽样C.整群抽样D.滚雪球抽样E.方便抽样【答案】BDE查看答案AC两项为概率抽样。4.下列属于判断抽样的有()。A.重点抽样B.方便抽样C.典型抽样D.代表抽样E.配额抽样【答案】ACD查看答案5.下列关于简单随机抽样的说法,正确的有()。A.简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础B.简单随机抽样突出特点是简单、直观C.在规模较大的调查中,也可以采用简单随机抽样的方法D.抽选的概率是相同的E.根据简单随机抽样抽出的单位比较集中【答案】ABD查看答案1.统计数据的间接来源有哪些?2.简述二手数据的特点。3.简述概率抽样与非概率抽样的区别。答:(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,这时样本统计量4.简述搜集数据的基本方法及其特点。(1)自填式。自填式方法的弱点:首先,问卷的返回率比较低。其次,自填式方法不适合(2)面访式。面访式的弱点主要有:首先,调查的成本比较高。其次,面访这种搜集数据(3)电话式。电话调查也有一定的局限。因为电话调查的工具是电话,如果被调查者没有5.数据的误差来源有哪些?6.分层抽样与整群抽样有何异同?它们分别适合于什么场合?答:(1)相同点:分层抽样和整群抽样都是需要事先按某一标志对总体进行划分的随机抽而整群抽样的抽样误差取决于总体的群间方差;分层抽样的目的(优点)主要是缩小抽样误差,满足推断各子总体数量特征的需要,而整群抽样的目的(优点)主要是扩大抽样单位,(2)适用场合:分层抽样用于层间差异大而层内差异小时,以及为了满足分层次管理决策第3章数据的图表展示1.数据审核(1)原始数据主要从完整性和准确性两个方面去审核(2)二手数据着重审核数据的适用性和时效性2.数据筛选3.数据排序1.分类数据的整理与图示(1)频数与频数分布二维的列联表(两个变量交叉分类)也称为交叉表。③比例(构成比)、百分比和比率比例是一个样本(或总体)中各个部分的数据与全部数据之比,通常用于反映样本(或总体)的构成或结构。将比例乘以100得到的结果称为百分比,用%表示。比率是样本(或总体)中各不同类别数据之间的比值。其比值可能大于1。(2)分类数据的图示②帕累托图③饼图指用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中2.顺序数据的整理与图示类数据。对于顺序数据,还可以计算累积频数和累积频率(百分比)。(1)累积频数和累积频率a.向上累积:从类别顺序的开始一方向类别顺序的最后一方累加频数(数值型分组数据则是从变量值小的一方向变量值大的一方累加频数);b.向下累积:从类别顺序的最后一方向类别顺序的开始一方累加频数(数值型分组数据则是从变量值大的一方向变量值小的一方累加频数)。(2)顺序数据的图示1.数据分组(1)数据分组的概念和目的(2)数据分组的方法(3)分组和编制频数分布表的具体步骤一般情况下,一组数据所分的组数不应少于5组且不多于15组,即5≤K≤15。实际应用时,定,即组距=(最大值一最小值)÷组数。注意:为便于计算,组距宜取5或10的倍数,而且第一组的下限应低于最小变量值,最后(4)组距分组的注意事项时,恰好等于某一组上限的变量值不算在本组内,而计②组距分组要避免出现空白组(即没有变量值的组)或个别极端值被漏掉(5)等距分组、不等距分组(6)组中值2.数值型数据的图示(1)分组数据:直方图①直方图:用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)来表示a.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固b.由于分组数据具有连续性,直方图的各矩形通常是连续排列,c.条形图主要用于展示分类数据,而直方图则主要用于展示数值(2)未分组数据:茎叶图和箱线图①茎叶图②箱线图a.箱线图b.箱线图的绘制方法(3)时间序列数据:线图方形,其长宽比例大致为10:7。图形过扁或过于瘦高,不仅不美观,而且会给人造成视觉(4)多变量数据的图示散点图是用二维坐标展示两个变量之间关系的一种图形。它是用坐标横轴代表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个③雷达图1.鉴别图形优劣的准则(1)一张好图应具有的基本特征(2)五种鉴别图形优劣的准则③一张好图应当能在最短的时间内以最少的笔墨给读者提供最大量的信息;④一张好图应当是多维的;⑤一张好图应当表述数据的真实情况。2.统计表的设计(1)统计表的构成①表头:应放在表的上方,它说明的是统计表的主要内容。②行标题和列标题:通常安排在统计表的第一列和第一行,它表示的主要是所研究问题的类别名称和变量名称,如果是时间序列数据,行标题和列标题也可以是时间,当数据较多时,通常将时间放在行标题的位置。③数字资料:行标题和列标题的其余部分是具体的数字资料。④表外附加:必要时可以在统计表的下方加上表外附加,主要包括数据来源、变量的注释和必要的说明等内容。(2)设计和使用统计表时的注意事项①要合理安排统计表的结构,比如行标题、列标题、数字资料的位置应安排合理。应使统计表的横竖长度比例适当,避免出现过高或过宽的表格形式。②表头一般应包括表号、总标题和表中数据的单位等内容。总标题应简明确切地概括出统计表的内容,一般需要表明统计数据的时间(When)、地点(Where)以及何种数据(What),即标题内容应满足3W要求。如果表中的全部数据都是同一计量单位,可在表的右上角标明;若各变量的计量单位不同,则应放在每个变量后或单列出一列标明。③表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒目。通常情况下,统计表的左右两边不封口;列标题之间在必要时可用竖线分开,而行标题之间通常不必用横线隔开。总之,表中尽量少用横竖线。表中的数据一般是右对齐,有小数点时应以小数点对齐,而且,小数点的位数应统一;对于没有数字的表格单元,一般用“—”表示;一张填好的统计表不应出现空白单元格。④在使用统计表时,必要时可在表的下方加上注释,特别要注意注明数据来源,以表示对他人劳动成果的尊重,以备读者查阅使用。3.2课后习题详解1.数据的预处理包括哪些内容?答:数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。(1)数据审核就是检查数据中是否有错误。对于通过调查取得的原始数据,主要从完整性和准确性两个方面去审核。(2)数据筛选是根据需要找出符合特定条件的某类数据。(3)数据排序是按一定顺序将数据排列,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。除此之外,排序还有助于对数据检查纠错,以及为重新归类或分组等提供方便。2.分类数据和顺序数据的整理和图示方法各有哪些?答:(1)分类数据的整理方法:首先列出分类数据所分的类别,然后计算出每一类别的频数、频率或比例、比率等,即可形成一张频数分布表。图示方法:条形图、帕累托图、饼图和环形图。(2)分类数据的频数分布表和图示方法,如频数、比例、百分比、比率、条形图和饼图等,也都适用于对顺序数据的整理与显示。但一些适用于顺序数据的整理和显示方法,并不适用于分类数据。对于顺序数据,除了可使用分类数据的整理和显示技术外,还可以计算累积频数和累积频率。图示方法:累积频数分布图和环形图。3.数值型数据的分组方法有哪些?简述组距分组的步骤。答:(1)数据分组的方法有单变量值分组和组距分组两种。①单变量值分组是把每一个变量值作为一组,这种分组通常只适合离散变量,且变量值较少的情况下使用。②在连续变量或变量值较多的情况下,通常采用组距分组。它是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。(2)组距分组步骤:①确定组数。组数的确定应以能够显示数据的分布特征和规律为目的。一般情况下,一组数据所分的组数不应少于5组且不多于15组,即5≤K≤15。②确定各组的组距。组距是一个组的上限与下限的差。组距可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值一最小值)÷组数。③根据分组整理成频数分布表。4.直方图与条形图有何区别?答:直方图与条形图的区别:(1)条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。(2)由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。(3)条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。5.绘制线图应注意哪些问题?(1)时间一般绘在横轴,观测值绘在纵轴;(2)一般应绘成横轴略大于纵轴的长方形,其长宽比例大致为10:7;(3)图形过扁或过于瘦高,不仅不美观,而且会给人造成视觉上的错觉,不便于对数据变化的理解;(4)一般情况下,纵轴数据下端应从“0”开可以采取折断的符号将纵轴折断。6.饼图和环形图有什么不同?答:环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示。饼图只能显示一个样本或总体各部分所占的比例,而环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环。7.茎叶图与直方图相比有什么优点?它们的应用场合是什么?答:(1)茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。(2)直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。8.鉴别图表优劣的准则有哪些?答:鉴别图形优劣的准则有:(1)一张好图应当精心设计、有助于洞察问题的实质;(2)一张好图应当使复杂的观点得到简明、确切、高效的阐述;(3)一张好图应当能在最短的时间内以最少的笔墨给读者提供最大量的信息;(4)一张好图应当是多维的;(5)一张好图应当表述数据的真实情况。9.制作统计表应注意哪几个问题?(2)表头一般应包括表号、总标题和表中数据的单位等内容。总标题应简明确切地概括出(3)表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒(4)在使用统计表时,必要时可在表的下方加上注释.特别要注意注明数据来源,以表示1.为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量(1)指出上面的数据属于什么类型。(3)绘制一张条形图,反映评价等级的分布。(4)绘制评价等级的帕累托图。解:(1)服务质量的等级属于顺序数据。(2)制作频数分布表,如表3-2所示。表3-2服务质量等级评价的频数分布(3)绘制评价等级的条形图,如图3-1所示。图3-1评价等级的条形图(4)绘制评价等级的帕累托图,如图3-2所示。图3-2评价等级的帕累托图2.某行业管理局所属40个企业2002年的产品销售收入数据,如表3-3所示。表3-340个企业2002年的产品销售收入数据单位:万元(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。解:(1)编制频数分布表,如表3-4所示。表3-440个企业按产品销售收入分组表(2)按先进企业、良好企业、一般企业、落后企业进行分组(如表3-5所示)。表3-5某管理局下属40个企业分组表3.某百货公司连续40天的商品销售额如表3-6所示。表3-6某百货公司连续40天的商品销售额单位:万元要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。解:编制频数分布表,如表3-7所示。表3-7某百货公司日商品销售额分组表按销售额分组(万元)企业数(个)频率(%)4696绘制直方图,如图3-3所示。图3-3直方图表3-8图3-4茎叶图图3-4茎叶图图3-5箱线图表3-9灯泡使用寿命单位:小时713699725726704729703要求:(1)利用计算机对上面的数据进行排序。(2)以组距为10进行等距分组,整理成频数分布表。(3)根据分组数据绘制直方图,说明数据分布的特点。(4)制作茎叶图,并与直方图作比较。(2)编制频数分布表,如表3-11所示。表3-11100只灯泡使用寿命的频数分布(3)绘制灯泡使用寿命分布的直方图,如图3-6所示。图3-6灯泡使用寿命分布的直方图(4)构建灯泡使用寿命分布的茎叶图,如图3-7所示。图3-7灯泡使用寿命分布的茎叶图从灯泡使用寿命分布的直方图和茎叶图可以看出,灯泡使用寿命基本上是对称分布的。直方图和茎叶图所反映的分布特征是一致的,但茎叶图的好处是保留了原始数据的信息。6.一种袋装食品用生产线自动装填。每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如表3-12所示。按重量分组(g)频数(包)44~4648~5050~5252~5454~56237843表3-15从直方图可以看出,零件重量误差的分布基本上是对称的。8.表3-16是北方某城市1—2月份各天气温的记录数据。表3-16北方某城市1—2月份各天气温数据单位:℃(2)对上面的数据进行适当的分组。(3)绘制直方图,说明该城市气温分布的特点。解:(1)属于数值型数据。(2)将数据用5作为组距进行分组,得到频数分布表,如表3-17所示。表3-17频数分布表(3)根据表3-17绘制的直方图,如图3-10所示。图3-10北方某城市1—2月份各天气温直方图从直方图可以看出,该城市1~2月份气温的分布基本上是对称的,温度在—10℃~—5℃之9.表3-18是某考试管理中心对2005年参加成人自学考试的12000名学生的年龄分组数据。表3-18(1)对这个年龄分布作直方图。(2)从直方图分析成人自学考试人员年龄分布的特点。解:(1)绘制成人自学考试年龄分布的直方图,如图3-11所示。表3-19图3-11(2)从直方图可以清楚地看出,成人自学考试人员年龄的分布为右偏,也就是年龄在20~24岁的人占绝大比例,而年龄在40岁以上的人所占的比例很小。要求:(1)将两个班的考试成绩用一个公共的茎制成茎叶图。(2)比较两个班考试成绩分布的特点。11.对表3-19的数据绘制散点图。后234187解:绘制散点图,如图3-13所示。图3-13散点图12.甲乙两个班各有40名学生,期末统计学考试成绩的分布如表3-20所示。表3-20甲乙两班期末统计学考试成绩考试成绩(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。(2)比较两个班考试成绩分布的特点。(3)画出雷达图,比较两个班考试成绩的分布是否相似。解:(1)绘制对比条形图,如图3-14所示。图3-14甲乙两班期末统计学考试成绩条形图绘制环形图,如图3-15所示(内环为甲班的成绩)。图3-15甲乙两班期末统计学考试成绩环形图(2)对比条形图可以看出,甲班考试成绩在中等水平的人数较多,而优秀和良好的人数则较少,不及格的人数也比乙班要多。乙班则不同,考试成绩为优秀和良好的人数较多,而中等以下的人数则较少。这说明乙班学生的平均成绩比甲班要好。从环形图的百分比中也可以清楚地看出这一点。(3)绘制两个班考试成绩的雷达图,如图3-16所示。图3-16甲乙两班期末统计学考试成绩雷达图从雷达图的形状可以看出,两个班考试成绩没有相似性。13.2005年4月北京亚运村汽车交易市场的汽车销售数据,如表3-21所示。东方之子本田长安奥拓爱丽舍6(1)画出国产汽车和进口汽车销售量的对比条形图。(2)画出国产汽车和进口汽车销售量的环形图。解:(1)绘制国产车和进口车销售量的对比条形图,如图3-17所示。图3-17国产车和进口车销售量的对比条形图(2)绘制国产车和进口车销售量的环形图,如图3-18所示。图3-18国产车和进口车销售量的环形图14.已知1995~2004年我国的国内生产总值数据,如表3-22所示(按当年价格计算)。表3-22我国的国内生产总值单位:亿元要求:78345.2117390.2第一产业第二产业第三产业(1)用Excel绘制国内生产总值的线图。(2)绘制第一、二、三产业国内生产总值的线图。(3)根据2004年的国内生产总值及其构成数据绘制饼图。(2)绘制第一、二、三产业国内生产总值的线图,如图3-20所示。图3-20第一、二、三产业国内生产总值的线图(3)绘制2004年国内生产总值构成的饼图,如图3-21所示。并分析各城市平均相对湿度的分布特征。月份北京长春南京郑州武汉广州成都昆明兰州西安123456789从箱线图可以看出,各城市的月平均相对湿度有较大差异。离散程度较大的城市主要是北京和长春(箱子较大);离散程度较小的是成都、广州和武汉(箱子较小);相对湿度最大的箱子中间,最大值和最小值与箱子的距离大体相等);相对湿度不对称的城市主要有南京、一、单项选择题1.饼图的主要用途是()。A.反映一个样本或总体的结构B.比较多个总体的构成C.反映一组数据的分布D.比较多个样本的相似性【答案】A查看答案(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。2.某公司共有员工80人,其构成的饼图如图3-23所示,则中级管理人员数为()人。图3-23公司结构构成图【答案】B查看答案【解析】职工总数为80人,中级管理人员占10%,其人数为80×10%=8。3.样本或总体中各不同类别数值之间的比值称为()。【答案】D查看答案【解析】比例是一个样本(或总体)中各个部分的数据与全部数据之比,通常用于反映样本(或总体)的构成或结构;比率是样本(或总体)中各不同类别数值之间的比值。比率可以是一个样本(或总体)中各不同部分的数量对比。4.下列各项中,适合于比较研究两个或多个样本或总体的结构性问题的是()。A.环形图C.直方图D.茎叶图5.在连续变量或变量值较多的情况下,通常采用的分组方法是()。A.单变量值分组B.组距分组C.等距分组D.连续分组【答案】B查看答案6.对数据进行分组时,采用等距分组还是不等距分组,取决于()。A.变量值的多少B.次数的多少C.研究现象的特点D.组数的多少【解析】在组距分组时,如果各组的组距相等,则称为等距分组;如果各组的组距不相等,组。7.组距数列中每组上限是指()。A.每组的最小值B.每组的最大值C.每组的中点数值D.每组的起点数值【答案】B查看答案8.在坐标轴中,横轴刻度表示直方图的()。B.组中值D.组限【解析】直方图是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)9.各组的组中值代表组变量值的()。A.一般水平B.最高水平C.最低水平D.随机水平【答案】A查看答案10.某同学统计学考试成绩为80分,应将其计入()。A.成绩为80分以下人数中B.成绩为70~80分的人数中C.成绩为80~90分的人数中D.根据具体情况来具体确定【答案】C查看答案11.在编制组距数列时,当资料中存在少数特大和特小的变量值时,宜采用()形式处A.开口组C.闭口组D.不等距【答案】A查看答案12.组距、组限和组中值之间的关系是()。A.组距=(上限一下限)÷2B.组中值=(上限+下限)÷2C.组中值=(上限一下限)-2【答案】B查看答案数来确定,即组距=(最大值一最小值)÷组数。13.对于大批量的数据,最适合于描述其分布的图形是()。A.环形图B.茎叶图C.直方图D.饼图【答案】C查看答案【解析】直方图通常适用于大批量数据,ABD14.下列关于茎叶图的说法,错误的是()。A.茎叶图保留了原始数据的信息B.对于大批量的数据最适合采用茎叶图C.对于小批量的数据最适合采用茎叶图D.对于未分组数据可采用茎叶图【答案】B查看答案15.为描述身高与体重之间是否有某种关系,适合采用的图形是()。A.雷达图B.气泡图C.散点图D.箱线图【答案】C查看答案16.为了研究多个不同变量在不同样本间的相似性,适合采用的图形是()。A.环形图B.茎叶图C.雷达图D.箱线图【答案】C查看答案17.5家公司的月销售额(万元)数据分别为:29,26,25,23,23。下列哪种图形不宜用A.茎叶图B.散点图C.条形图D.饼图【答案】B查看答案18.图3-24是描述一组数据的一个图形,这个图是()。A.饼图B.直方图C.散点图D.茎叶图图3-24【答案】D查看答案19.与直方图相比,茎叶图()。A.没保留原始数据的信息B.更适合描述分类数据C.不能有效展示数据的分布D.保留了原始数据的信息【答案】D查看答案20.下列图形中,适合描述顺序数据的是()。A.直方图B.茎叶图C.环形图D.箱线图21.将某企业职工的月收入依次分为2000元以下、2000元~3000元、3000元~4000元、4000元~5000元、5000元以上几个组。第一组的组中值近似为()。【答案】B查看答案开口组的组距和组中值的确定,一般以其邻近组的组距为准。所以邻组组距/2=2000-1000/2=1500。22.某连续变量的分组中,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为()。【答案】C查看答案限即为末组的下限值200,相邻组的组距/2=200-170=30。所以,末23.直方图与条形图的区别之一是()。A.条形图的各矩形通常是连续排列的,而直方图则是分开排列的B.直方图的各矩形通常是连续排列的,而条形图则是分开排列的C.直方图主要用于描述分类数据,条形图则主要用于描述数值型数据D.直方图主要用于描述各类别数据的多少,条形图则主要用于描述数据的分布【答案】B查看答案24.统计表的行标题表示各组的名称,一般应写在统计表的()。B.左方D.均可以【答案】B查看答案25.填写统计表时,当发生某项不应有数字时,应用()符号表示。D..【答案】B查看答案1.在组距数列中,组距大小与()。A.全距的大小成正比B.全距的大小成反比C.只与全距大小有关D.组数多少成正比E.组数多少成反比【答案】AE查看答案【解析】组距=(最大值一最小值)/组数=全距/组数,因此组距大小与全距的大小成正比,2.在组距数列中,组中值()。A.是上限与下限的中间的值B.在开口组中可参照相邻组来确定C.在开口组中无法计算D.是用来代表各组标志值的一般水平E.就是组平均数【答案】ABD查看答案【解析】在开口组中,组中值可以计算,其公式为:首组的组中值=首组的上限—邻组的组距/2;末组的组中值=末组的下限+邻组的组距/2。组中值是上限与下限3.从形式上看,统计表由()组成。A.表头B.行标题D.数字资料【答案】ABCD查看答案4.下列各项中,不适合描述分类数据的有()。A.条形图B.饼图C.帕累托图D.茎叶图E.箱线图【答案】DE查看答案5.下列关于数据分组的说法,正确的有()。A.数据分组的组数一般与数据本身的特点及数据的多少有关B.对于数据分组的组数并没有什么要求,可以任意分组C.一般情况下,一组数据所分的组数不应少于5组且不多于15组D.如果组数太少,数据的分布就会过于集中E.一般情况下,一组数据所分的组数应大于10组数据的分布特征和规律为目的。一般情况下,一组数据所分的组数不应少于5组且不多于15组,即5≤K≤15。6.对于分组数据的组中值的计算方法有()。A.闭口组组中值=(上限+下限)/2B.开口组末组组中值=下限+上限/2C.开口组首组组中值=上限一下限/2D.开口组首组组中值=上限一邻组组距/2E.开口组末组组中值=下限+邻组组距/2【答案】ADE查看答案组中值=(上限十下限)/2末组的组中值=最大组的下限+相邻组的组距/27.一张好的图形应具有的特征是()。A.显示数据B.避免歪曲C.强调数据之间的比较D.应当是多维的E.有对图形的统计和文字说明【答案】ABCE查看答案1.简述直方图和茎叶图的区别。答:(1)直方图虽然能很好地显示数据的分布,但不能保留原始的数值;茎叶图类似于横(2)在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。2.在等距数列中,组距和组数具有什么关系?如何计算组中值?组中值=(上限+下限)÷2对于缺上限的开口组:组中值=下限+邻组组距/2对于缺下限的开口组:组中值=上限一邻组组距/21.某家商场为了了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。其学历表示为:1:初中,2:高中或中专,3:大专,4:本科及以上。调查结果如表3-24所表3-24(1)上表中的数据属于什么类型?(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度办公楼安防系统维修维护合同样本4篇
- 二零二五年度个人仓储租赁合同(冷链物流专用)4篇
- 厦门市茶叶买卖合同
- 车辆租用协议
- 字画赠与合同
- 2025-2030全球平行双主轴车铣中心行业调研及趋势分析报告
- 2025年全球及中国胶片扫描仪行业头部企业市场占有率及排名调研报告
- 二零二四年环保设备上门清洁与性能优化合同3篇
- 二零二五年度电商客服团队协作与沟通协议
- 二零二五版酒店窗帘更换与节能减排服务合同3篇
- 2024年乡村振兴(产业、文化、生态)等实施战略知识考试题库与答案
- 现代科学技术概论智慧树知到期末考试答案章节答案2024年成都师范学院
- 软件模块化设计与开发标准与规范
- 网络安全基础知识入门教程
- AI智慧物流园区整体建设方案
- 2024年辽宁铁道职业技术学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 无痛人工流产术课件
- 有机农业种植模式
- 劳务派遣招标文件
- 法医病理学课件
- 采空区稳定性可靠度分析
评论
0/150
提交评论