统计学基础复习提纲A.doc_第1页
统计学基础复习提纲A.doc_第2页
统计学基础复习提纲A.doc_第3页
统计学基础复习提纲A.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学基础复习提纲 A一、名词解释1. 书本第 6 页, 数值型数据 按数字尺度测量的观察值, 称为数值型数据。 数值型数据是使用自然或度量衡单位对事 物进行计量的结果, 其结果表现为具体的数值。 因此, 数值型数据可以进行加、 减、乘、除。2、书本 15 页, 抽样调查 从调查对象的总体中随机抽取一部分单位作为样本进行调查, 并根据样本调查结果来推 断总体数量特征的一种数据收集方法,称为抽样调查。3. 书本 119 和 123 页, 相关关系和相关系数A、变量之间存在的不确定的数量关系,称为相关关系;B、根据样本数据计算的对两个变量之间线性强度的度量值,称为相关系数。二、填空1. 书本第 5

2、 页(3 个空),统计数据按照所采用的计量尺度不同,可以分为 分类数 据、顺序数据和数值型数据 三种。2. 对数据进行预处理需要审核数据,对于通过调查取得的原始数据,应主要从完整性和准确性 两个方面去审核;对于其他渠道取得的二手数据,应着重审核数据的 适用性和时效性。3. 时间序列中除 去趋势、周期性和季节性 之后的偶然性波动,称为随机性或不规 则波动。三、简答题1. 书本 23 页 , 设计调查问卷的提问项目时应注意哪些问题 。答:第一,提问的内容尽可能短。如果提问的问题太长,不仅会给被调查者的理解带来一定的困难,也会使其感到厌烦,从而不利于对问题的回答。特别是访问调查中使用的问卷,提问的部

3、分过长,会使被调查者忘记开头的内容,不利于对整个问 题的理解和回答; 第二, 用词要确切、 通俗。 问卷中的用词一定要保证所要提问的问题清楚明了。用词是否确切,可参照 5W1H准则; 第三,一项提问只包含一项内容。如果在一项提问中包含了两项以上的内容, 被调查者就很难回答; 第四,避免诱导性提问。问卷中提问的问题不能带有倾向性,而应保持中立。语词中不应暗示出调查者的观点,不要引导被调查者作出何种回答或如何选择。引导性提问容易使被调查者从心理上产生顺应反应,从而按照提示作出回答或选择; 第五,避免否定式提问。在日常生活中,人们往往习惯肯定陈述的提问,而不 习惯否定陈述的提问。否定式提问会影响被调

4、查者的思维,或者容易造成相反意愿 的回答或选择,因此,在问卷中尽量不要使用否定式的提问; 第六, 避免敏感性问题。 敏感性问题是指被调查者不愿意别人知道答案的问题。问卷中要尽量避免提及敏感性问题或容易引起人们反感的问题。对于这类问题,被 调查者可能会拒绝回答,或者采用虚报、假报的方法来应付回答,从而影响整个调 查的质量。2. 书本 46 页, 简要谈谈直方图与条形图的区别。答 :首先, 条形图的每一个矩形表示一个类别,其宽度没有意义, 而直方图的宽度则表示各组的组距;其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列的,而条形 图则是分开排列的;最后,条形图主要用于展示数据,而直方图则

5、主要用于展示定量数据。3.书本54页练习题第6题下面是A、B两个班学生的数学考试成绩数据:A班:4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396B班:3539404444485152525455565657575758596061616263646668687070717173747479818283838485909191949596100100100(1)将两个班的考试成绩用一个公共的茎制成茎叶图。(2)比较两个班考试成绩分布的特点。答:(

6、1)茎叶图如下:A班树茎B班数据个数树叶树叶数据个数035921440448429751224566777892119)76653321106 011234688923988377766555554443332100700113449876655200812334566632220901145660100003(2)A班考试成绩的分布比较集中, 且平均分数较高;B班考试成绩的分布比 A班分散;且平均成绩较 A班低。四、计算题(书本 72页练习题2)随机抽取25个网络用户,得到他们的年龄数据如下(单位:周岁)19152925242321382218302019191623272234244120

7、311723(1) 计算众数、中位数。(2) 根据定义公式计算四分位数。(3) 计算平均数和标准差。(4) 对网民年龄的分布特征进行综合分析。分析:从众数、中位数和平均数来看,网民年龄在2324岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看, 年龄分布为右偏,由于偏态系数大于1,所以偏斜程度很大。由于峰态系 数为正值,所以为尖峰分布。答:具体答案参考书本 184页练习题第二题答案。统计学基础复习提纲 B一、名词解释1. 书本第2页,描述统计和推断统计答:描述统计是研究数据收集、处理和描述的统计学方法;推断统计是研究如何利用样本数 据来推断总体特征的统计学方法。2.

8、书本第77页,简单随机抽样答:从含有N个元素的总体中,抽取n个元素作为样本, 使得每一个容量为n的样本都有相 同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样,也称为纯随机抽样。3. 书本172页,消费者价格指数和生产者价格指数答:消费者价格指数缩写为 CPI,是反映一定时期内消费者所购买的生活消费品价格和服务 项目价格的变动趋势和程度的相对数。生产者价格指数是测量在初级市场上出售的货物(即非零售市场上首次购买某种商品时)的价格变动的一种价格指数。、填空题1. 书本第5页,按照被描述得对象与时间的关系,可以将统计数据分为截面数据和时间序列数据。2. 书本15页抽样调查具有经济性、时效性强

9、、适用面广、准确性高的特点。3. 书本38页,定性数据包括分类数据和顺序数据,他们的图表展示方法基本相同。通常 可以用频数分布表和图形来描述。4. 书本144页,时间序列是按时间顺序记录的一组数据,它可以分为平稳序列和非平稳序列两大类。三、简答题。1书本30页,数据的质量评价标准可以概括为哪六个方面?答:(1)精度,即最低的抽样误差或随机误差;(2)准确性,即最小的非抽样误差或偏差;(3)关联性,即满足用户决策、管理和研究的需要;(4)及时性,即在最短的时间里取得并公布数据;(5)一致性,即保持时间序列的可比性;(6 )最低成本,即在满足已上标准的前提下,以最经济的方式取得数据。2书本156页

10、,时间序列分解法预测通常按照三个步骤进行,请简要谈谈。答:第一步:确定并分离季节成分。计算季节指数,以确定时间序列中的季节成分,然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数,以消除季节成分。第二步:建立预测模型并进行预测。对消除季节成分的时间序列建立适当的预测模型, 并根据这一模型机型预测。第三步:计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。3书本93页练习题第2题:某快餐店想要估计每位顾客午餐的平均花费金额,在为期三周 的时间里选取49名顾客组成了一个简单随机样本。(1)假定总体标准差为 15元,求样本均值的抽样标准误差。(2)在95%的置信水平下,求估计误差。(3)如果样本均值为 120元,求总体均值 u的95%的置信区间。四、计算题。书本176页,练习题第1题。某商场出售的三种商品的销售量和销售价格资料如下:某商场的三种商品的销售资料

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论