统计学复习提纲讲解学习_第1页
统计学复习提纲讲解学习_第2页
统计学复习提纲讲解学习_第3页
统计学复习提纲讲解学习_第4页
统计学复习提纲讲解学习_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章导论1. 什么是统计学?统计方法可以分为哪两大类?统计学是收集、分析、表述和解释数据的科学。统计方法可分为:1.描述统计是研究数据收集、整理和描述的统计学分支,是用图、表、统计量等方式对已有数据的特征进行描述。内容包括:搜集数据、整理数据、展示数据、描述性分析。目的:描述数据特征、找出数据的基本规律。2.推断统计是研究如何利用样本数据推断总体特征统计学分支,是指利用这种概率关系,由样本统计量推估总体参数。内容包括:参数估计、假设检验。目的:对总体特征作出推断。2. 统计数据可分为哪几种类型?不同数据的类型各有什么特点?按计量尺度分:1.分类数据:对事物进行分类的结果,数据表现为类别,用文

2、字来表述。2.顺序数据:对事物类别顺序的测度,数据表现为类别,用文字来表述。3.数值型数据:对事物的精确测度,结果表现为具体的数值。按收集方法分:1.观测的数据:通过调查或观测而收集到的数据。2.试验的数据:在试验中控制试验对象而收集到的数据,在没有对事物人为控制的条件下而得到的。按时间状况分:1.截面数据:在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况。2.时间序列数据:在不同时间上收集到的数据,描述现象随时间变化的情况。3. 总体、样本、参数、统计量、变量的概念。总体:所研究的全部元素的集合。样本:从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量。参数:

3、用来描述总体特征的概括性数字度量。统计量:用来描述样本特征的概括性数字度量。变量:说明现象某种特征的概念。4. 变量的类型、特点及应用。类型和特点:1.分类变量的取值只有类别属性之分,无大小。2.顺序变量的取值除类别属性之外,还有等级、次序的差别。3.数值变量的取值:数值。应用:分类数据和数值数据都可以计算众数,但数值数据还能计算平均数,前者却不能。第二章数据的收集1.简述普查和抽样调查的特点。普查:1.为特定目的专门组织的非经常性全面调查。2.通常是一次性或周期性的。3.一般需要规定统一的标准调查时间。4.数据的规范化程度较高。5.应用范围比较狭窄。抽样调查:1. 从总体中随机抽取一部分单位

4、(样本)进行调查。2.目的是推断总体的未知数字特征。3.最常用的调查方式。4.具有经济性、时效性强、适应面广、准确性高等特点。2. 统计数据的具体收集方法有哪些?数据的搜集方法:1.询问调查:访问调查、邮寄调查、电话调查、电脑辅助调查、座谈会、个别深度访问。2.观察实验:观察法、实验法。3. 调查方案包括那几个方面的内容?调查方案的内容包括:调查目的、调查对象和调查单位、调查项目和调查表等。调查目的应说明调查所要达到的具体目标是什么;调查对象和调查单位是确定要向谁调查;调查项目和调查表说明的是调查的具体内容。4. 什么是问卷?它由哪几部分组成?设计问卷的提问项目应注意哪些问题?封闭型问题答案的

5、设计主要有哪些方法?问卷中问题顺序的设计应注意哪些问题?问卷是用来搜集调查数据的一种工具。一般由开头部分、甄别部分、主体部分和背景部分组成。设计问卷的提问项目应注意:提问的内容尽可能短、用词要确切通俗、一项提问只包含一项内容、避免诱导性提问和否定形式的提问、避免敏感性问题等。封闭型问题答案的设计方法有:两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法五种。问卷中问题顺序的设计应注意:问题的安排应具有逻辑性、问题的顺序应先易后难、能引起被调查者兴趣的问题放在前面、开放性问题放在后面、版面格式的设计等。5. 统计数据的误差种类。1.抽样误差:所有样本可能的结果与总体真值之间的平均性差异。

6、在利用样本数据推断时所产生的随机误差。2.非抽样误差:除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异。6.统计数据的质量要求是什么?1.精度:最低的抽样误差或随机误差。2.准确性:最小的非抽样误差或偏差。3.关联性:满足用户决策、管理和研究的需要。4.及时性:在最短的时间里取得并公布数据。5.一致性:保持时间序列的可比性。6.最低成本:以最经济的方式取得数据。第三章数据整理与展示1. 数据的预处理包括哪些内容?数据的预处理:1.数据的审核:检查数据中的错误。2.数据的筛选:找出符合条件的数据。3.数据排序:升序和降序,寻找数据的基本特征。2. 分类数据和顺序数据的整理和图

7、示方法各有哪些?分类数据和顺序数据的结果均表现为类别,这类数据本身就是分了类的,因此整理时主要是在分类的基础上计算各类别的频数、比例、比率以及百分比等,同时给出频数分布。常用的图示方法有条形图和圆形图等。3. 数值型数据的分组方法有哪些?简述组距分组的步骤。数据分组的方法有单变量值分组和组距分组两种。组距分组的步骤:1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K,即:组数=1+lg(n)/lg(2)。2.确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即:组距=(最大值-最小

8、值)/组数。3.统计出各组的频数并整理成频数分布表。4. 直方图与条形图有何区别?直方图与条形图的区别:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义。2.直方图的各矩形通常是连续排列;条形图则是分开排列。3.条形图主要用于展示分类数据;直方图则主要用于展示数值型数据。第四章数据分布特征的测度1. 一组数据的分布特征可以从哪几个方面进行测度?数据特征的测度:1.集中趋势:众数、中位数、均值。2.离散程度:异众比率、四分位差、方差和标准差、离散系

9、数。3.分布的形状:偏态、峰态。2. 怎样理解均值在统计学中的地位?均值在统计学中具有重要的地位,是集中趋势的最主要测度值,其缺点是易受极端值的影响。它主要适用于数值型数据,而不适用于分类数据和顺序数据。3. 简述众数、中位数和均值的特点和应用场合。1. 众数:不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用。2.中位数:不受极端值影响,数据分布偏斜程度较大时应用。3.平均数:易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用。4. 简述异众比率、四分位差、方差或标准差的适用场合。1. 异众比率:用于测度分类数据的离散程度,衡量众数对一组数据的代表程度。2.四分位差:用于测

10、度顺序数据的离散程度,衡量中位数对一组数据的代表程度。3.方差或标准差:用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。第五章抽样与参数估计1. 什么是抽样分布?在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布,称为样本统计量的抽样分布。2. 抽样均值抽样分布的两个主要特征值是什么?他们与总体参数有什么关系?特征值是:数学期望和方差。这两个特征一方面与总体分布的均值和方差有关,另一方面也与抽样方法是重复抽样,还是不重复抽样有关,无论是重复抽样,还是不重复抽样,样本均值的数学期望始终等于总体均值,而样本均值的方差则与抽样方法有关,在重复抽样下,

11、样本均值的方差为总体方差的1/n,在不重复抽样的条件下,样本均值的方差则需要用修正系数(N-n)/(N-1)去修正重复抽样时样本均值的方差。3. 样本统计量的分布与总体分布的关系是什么?如果原有总体是正态分布,无论样本容量大小,样本统计量也服从正态分布。如果原有总体是非正态分布,当n为大样本时(n>=30),由中心极限定理可知,当样本容量n增大时,不管原来的总体是否服从正态分布,样本统计量的抽样分布都将服从于正态分布。当n为小样本时,其分布则不是正态分布,这时就不能按正态分布进行推断。4. 什么是置信度?将构造置区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例(概率)称为置

12、信度。如抽取了100个样本,根据每一个样本均构造了一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%的置信区间则没有包含。这里,95%这个值被称为置信水平(或置信度)。5. 什么是参数区间估计?参数区间估计的含义:估计总体参数的区间范围,并给出区间估计成立的概率值。P(010。2)=1-a。其中:1-a(0<a<1)称为置信度;a是总体参数未在区间内的比例,其取值大小由实际问题确定,经常取1%5%口10%置信区间是。1,02,样本容量一定时置信度越大(估计的可靠性越大)相应置信区间也越宽(总体参数的取值范围越大,估计越不

13、精确)。第六章假设检验1. 什么是检验统计量?什么是标准化检验统计量?根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。标准化检验统计量=(点估计量-假设值)/点估计量的抽样标准差。2. 什么是显著性水平?它对于假设检验决策的意义是什么?在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,称为P值,也称为观察到的显著性水平。一般是在原假设成立条件下,所规定的小概率的数量界限。对应拒绝域的面积大小。该面积对应的底边代表z的取值区间。也就是统计量处于该区间,则否定H0。3. 统计学中是如何表述假设检验的?统计学中表述假设检验思想为:对某总体

14、抽样,如果根据样本计算的某个统计量表明在原假设H0成立的条件下是几乎不可能发生的,就否定H0,并接受其对立面H1。反之,如果在H0成立的条件下,根据样本所计算的某个统计量发生的可能性并非很小,则接受原假设。4. 简述假设检验的一般步骤。1 .陈述原假设H0和备择假设H1。2.从所研究的总体中抽出一个随机样本。3.确定一个适当的检验统计量,并利用样本数据算出其具体数值。4.确定一个适当的显著性水平a,并计算出其临界值,指定拒绝域。5.将统计量的值与临界值进行比较,作出决策:若统计量的值落在拒绝域内,才I绝原假设H0,否则不拒名原假设H0=双侧本金验:|统计量|>临界值,拒绝H0;左侧检验:

15、统计量<-临界值,拒绝H0;右侧检验:统计量>临界值,拒绝H0。第七章相关与回归分析1. 解释相关关系的含义,说明相关关系的特点。相关关系是指变量之间存在的不确定的数量关系。其特点是:1.变量间关系不能用函数关系精确表达。2.一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个,各观测点分布在直线周围。3.可以用散点图粗略判断相关,用相关系数定量判断相关程度。2. 简述相关系数的取值及其意义。取值及其意义:相关系数r:对变量之间线性关系强度的度量1.r的取值范围是-1,1。2.|r|=1,为完全相关(r=1,为完全正相关,r=-1,为完全负相关)。3.

16、r=0,不存在线性相关关系相关。4.-1r<0,为负相关。5.0<r1,为正相关。6.|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切。3. 解释回归模型、回归方程、估计的回归方程的含义及回归方程的作用。1. 描述因变量y如何依赖于自变量x和误差项的方程称为回归模型。2.描述因变量y的平均值或期望值如何依赖于自变量x的方程称为回归方程。3.利用最小二乘法,根据样本数据球出的回归方程的估计称为估计的回归方程。回归方程的作用:对未知情况进行估计和预测。如果已经根据样本数据建立了回归方程,并且该方程通过了各种检验,可以用它预测从现有样本数据中找不到的值。4. 什么是回归分析?回归分析与相关分析区别。回归分析:1.根据样本数据,确定变量之间的数学关系式。2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多因素中找出哪些因素的影响显著,哪些不显著。3.利用所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论