统计学第五版复习_第1页
统计学第五版复习_第2页
统计学第五版复习_第3页
统计学第五版复习_第4页
统计学第五版复习_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

复习第一章

基本概念:统计学、描述统计、推断统计分类数据、顺序数据、数值型数据观测数据、实验数据截面数据、时间序列数据、面板数据总体、样本、样本量参数、统计量第二章数据的搜集一、数据的来源1、间接来源(二手数据):数据的特点和评估2、直接来源(原始数据):调查数据和实验数据二、概率抽样:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样非概率抽样:方便抽样、判断抽样、自愿抽样、滚雪球抽样、第二章数据的搜集三、概率抽样与非概率抽样的比较四、搜集数据的基本方法五、数据的误差:抽样误差、非抽样误差、误差的控制第三章数据的图表展示一、数据的预处理数据审核、数据筛选、数据排序、数据透视表二、分类数据的整理与展示概念:频数、频数分布表、比例、百分比、比率图示:条形图、帕累托图、饼图、环形图第三章数据的图表展示三、顺序数据的整理与图示概念:累积频数、累积频率累积频数分布图四、数值型数据的整理与展示概念:数据分组、组距分组、等距分组、不等距分组频数分布表的制作步骤(不重不漏、上限不在其内)图示:直方图、条形图、折线图第四章数据的概括性度量一、集中趋势的度量1、位置平均数:众数、中位数、分位数2、数值平均数:简单平均数、加权平均数、几何平均数3、众数、中位数和平均数的比较:三者在分布上的关系、三者的特点及应用场合第四章数据的概括性度量二、离散程度的度量1、异众比率:衡量众数的代表程度2、四分位差:衡量中位数的代表程度3、方差和标准差:衡量平均数的代表程度概念:极差、平均差、方差、标准差4、标准分数:度量数据的相对位置5、离散系数:用于不同组数据离散程度的比较

第四章数据的概括性度量三、偏态与峰态的度量1、偏态系数:数据分布对称性的测度偏态系数为0,对称;大于0,右偏或正偏2、峰态系数:数据分布平峰或尖峰程度的测度,与正态分布相比较。大于0,比正态分布更尖;小于0,比正态分布更平

第七章参数估计一、概念:估计量与估计值、点估计与区间估计、置信区间、置信水平区间估计的图示

x95%的样本

-1.96

x

+1.96

x99%的样本

-2.58

x

+2.58

x90%的样本

-1.65

x

+1.65

x第七章参数估计二、评价估计量的标准无偏性有效性一致性一个总体参数的区间估计总体参数符号表示样本统计量均值比例方差一个总体参数的区间估计

(小结)待估参数均值比例方差大样本小样本大样本

2分布

2已知

2已知Z分布

2未知Z分布Z分布Z分布

2未知t分布第八章假设检验一、假设检验的基本问题遵循原理:小概率事件是不可能发生的

1、假设问题的提出:原假设和备择假设

2、两类错误

3、假设检验的流程:提出假设、确定适当的检验统计量、规定显著性水平、计算检验统计量的值、作出统计决策4、临界值检验与p值检验5、单侧检验与双侧检验一个总体参数的检验Z检验(单尾和双尾)

t检验(单尾和双尾)Z检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比例方差总体均值的检验

(检验统计量)总体是否已知?用样本标准差S代替

t检验小样本量n否是z检验

z检验大第九章分类数据分析数据的类型与列联分析数据定量数据(数值型数据)定性数据(品质数据)离散数据连续数据列联分析

分类数据与卡方统计量

卡方检验是对分类数据的频数进行分析的统计方法。包括拟合优度检验和独立性检验

统计量用于检验列联表中变量间拟合优度和独立性用于测定两个分类变量之间的相关程度

计算公式为列联表中的相关测量品质相关对品质数据(分类和顺序数据)之间相关程度的测度列联表变量的相关属于品质相关列联表相关测量的统计量主要有

相关系数列联相关系数V

相关系数

、C、V的比较同一个列联表,

、C、V的结果会不同不同的列联表,

、C、V的结果也不同在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数

列联分析中应注意的问题

条件百分表的方向通常将自变量放在列的位置,将因变量放在行的位置。如果因变量在样本中的分布和在总体中的分布不同时,可以进行调整。第十章方差分析一、方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量的影响。1、概念因素(因子)、水平(处理)、组内误差、组间误差、总平方和、组内平方和、组间平方和

卡方分布的期望值准则准则一:如果只有两个单元,每个单元的期望频数必须≥5准则二:如果有两个以上单元,20%以上的单元期望频数<5时,不能使用卡方检验如果期望值过小,

会不适当的增大,造成对

的高估,导致不适当的拒绝原假设的结论什么是方差分析(ANOVA)?

(analysisofvariance)检验多个总体均值是否相等通过分析数据的误差判断各总体均值是否相等研究分类型自变量对数值型因变量的影响一个或多个分类型自变量两个或多个(k个)处理水平或分类一个数值型因变量有单因素方差分析和双因素方差分析单因素方差分析:涉及一个分类的自变量双因素方差分析:涉及两个分类的自变量第十章方差分析二、方差分析的基本思想和原理

1、图形描述

2、误差分解数据的误差用平方和来表示平方和除以自由度即为均方如果总体均值不存在显著差异,则组间误差应只包含随机误差,不包含系统误差,也就是说组间均方与组内均方的比值应接近于1。

方差分析的基本假定每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本比如,每个行业被投诉的次数必须服从正态分布各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的比如,4个行业被投诉次数的方差都相等观察值是独立的比如,每个行业被投诉的次数与其他行业被投诉的次数独立三、单因素方差分析的基本步骤1.提出假设2.构建检验统计量3.统计决策提出假设一般提法H0

:m1=m2=…=

mk

自变量对因变量没有显著影响

H1:m1

,m2

,…

,mk不全相等自变量对因变量有显著影响

注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等构造检验的统计量构造统计量需要计算水平的均值全部观察值的总均值误差平方和均方(MSA和MSE)构造检验的统计量

(计算检验统计量

F)将MSA和MSE进行对比,即得到所需要的检验统计量F当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为n-k的F分布,即统计决策

(F分布与拒绝域)如果均值相等,F=MSA/MSE

1a

F分布F

(k-1,n-k)0拒绝H0不能拒绝H0F四、关系强度的测量变量间关系的强度用自变量平方和(SSA)占总平方和(SST)的比例大小来反映自变量平方和占总平方和的比例记为R2,即3.其平方根R就可以用来测量两个变量之间的关系强度

第十四章指数一、基本问题1、指数的含义:狭义指数与广义指数2、指数的分类个体指数和总体指数数量指标指数和质量指标指数简单指数和加权指数第十四章指数二、指数编制的基本原理(一)引入同度量因素(二)确定同度量因素所属的时期如果把同度量因素所属的时期固定在基期,为拉氏指数;把同度量因素所属的时期固定在报告期,为帕氏指数拉氏指数一般用于数量指标指数(如销售量)的编制。即将质量指标(如价格)作为同度量因素固定在基期。帕氏指数较多的用于质量指标(如价格)指数的编制。即将报告期销售量作为同度量因素,反映的是在现实商品(产品)帕氏公式计算价格指数

第十四章指数三、指数体系1、广义的指数体系与狭义的指数体系2、因素分析的一般步骤首先计算现象总量指数和总量变动的绝对差额;其次分别计算各个因素指数及其分子分母之差,用以反映各个因素对所研究总量变动的影响程度和影响数量;最后将以上分析进行综合和验证,作出文字分析说明两因素指数分析实际分析中,比较常用的指数体系由拉氏数量指标指数和帕氏质量指标指数相乘构成。四、平均数变动因素分析总平均指

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论