统计学期末复习教材_第1页
统计学期末复习教材_第2页
统计学期末复习教材_第3页
统计学期末复习教材_第4页
统计学期末复习教材_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学期末复习2012.12.10统计数据的分类按计量层次分类数据顺序数据数值型数据按收集方法观察数据试验数据按时间状况截面数据时序数据统计中的几个基本概念

总体和样本参数和统计量变量抽样方法数据的误差品质数据的整理与显示分类数据的整理与图示可计算的统计量:频数、比例、百分比、比率分类数据的图示:条形图、对比条形图、帕累托图、饼图顺序数据的整理与图示可计算的统计量:累积频数、累积频率顺序数据的图示—累计频数分布图、环形图数值型数据的整理与展示数据分组:组距分组、单变量值分组数值型数据的图示:分组数据—直方图和折线图(直方图与条形图的区别)未分组数据—茎叶图和箱线图时间序列数据—线图多变量数据的图示

两个变量间的关系—二维散点图三个变量间的关系—气泡图多变量数据—雷达图确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5

K15,可以按Sturges

提出的经验公式确定组数K确定组距:组距(classwidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即

组距=(最大值-最小值)÷组数

统计出各组的频数并整理成频数分布表数据分布特征和描述统计量1集中趋势的度量1分类数据:众数2顺序数据:中位数和分位数3数值型数据:平均数4众数、中位数和平均数的比较众数、中位数、平均数的特点和应用众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用2离散程度的度量1分类数据:异众比率2顺序数据:四分位差举例3数值型数据:方差和标准差4相对离散程度:离散系数标准差系数越大则说明平均数的代表性越差4.3偏态与峰态的度量4.3.1偏态及其测度:偏态系数偏态系数=0为对称分布偏态系数>0为右偏分布偏态系数<0为左偏分布4.3.2峰态及其测度:峰态系数峰态系数=0扁平峰度适中峰态系数<0为扁平分布峰态系数>0为尖峰分布样本均值的抽样分布1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布推断总体均值

的理论基础当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值

x也服从正态分布,

x

的数学期望为μ,方差为σ2/n。即

x~N(μ,σ2/n)中心极限定理从均值为

,方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布。样本比例的抽样分布在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布当样本容量很大时,样本比例的抽样分布可用正态分布近似。样本比例的数学期望样本比例的方差参数估计矩估计(样本的矩替代总体矩)以具体数值复习例3.2样本方差是否是中心二阶矩?最大似然估计以具体数值复习例3.3参数估计的一般问题点估计:用样本的估计量的某个取值直接作为总体参数的估计值区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到。置信水平:将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。置信区间:由样本统计量所构造的总体参数的估计区间称为置信区间。一个总体参数的区间估计总体均值的区间估计正态总体、

2已知,或非正态总体、大样本正态总体、

2未知、小样本总体比例的区间估计1.假定条件总体服从二项分布可以由正态分布来近似2.使用正态分布统计量z3.总体比例

在1-

置信水平下的置信区间为样本量的确定估计总体均值时样本量的确定估计总体比例时样本量的确定其中:假设检验假设检验的基本问题第一类错误(显著性水平恰好是?)第二类错误能否同时减少?一个总体参数的检验假设检验中的其他问题假设检验的流程提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策一个总体参数的检验Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比例方差总体均值的检验(检验统计量)是z检验

总体是否已知?样本量n否z检验大用样本标准差S代替t检验小总体均值的检验(

2

已知或

2未知大样本)1.假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n

30)2.使用Z-统计量

2

已知:

2

未知:一个总体比例检验1.假定条件有两类结果总体服从二项分布可用正态分布来近似2.比例检验的Z统计量两个总体方差比的检验

(例题分析)【例】一家房地产开发公司准备购进一批灯泡,公司打算在两个供货商之间选择一家购买。这两家供货商生产的灯泡平均使用寿命差别不大,价格也很相近,考虑的主要因素就是灯泡使用寿命的方差大小。如果方差相同,就选择距离较近的一家供货商进货。为此,公司管理人员对两家供货商提供的样品进行了检测,得到的数据如右表。检验两家供货商灯泡使用寿命的方差是否有显著差异

(

=0.05)

两家供货商灯泡使用寿命数据

样本1650569622630596637628706617624563580711480688723651569709632样本2568540596555496646607562589636529584681539617两个总体方差比的检验

(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:

12/

22=1H1:

12/

221H0:

12/

22

1H1:

12/

22<1H0:

12/

22

1H1:

12/

22>1统计量拒绝域P值决策拒绝H0原假设与备择假设的确定一般情况下,原假设为“原有的”、“传统的”观点或结论,被大多数人认可、接受的东西,是不容易否定的命题。备择假设为人们比较感兴趣的、新的、猜测的、需要验证的命题。接受备择假设一定意味着原假设错误,而没有拒绝原假设并不能表明备择假设是错的,只是还没有足够的证据推翻原假设。第11章一元线性回归11.1

变量间关系的度量11.2一元线性回归11.3利用回归方程进行估计和预测相关分析变量之间是否存在关系?如果存在关系,它们之间是什么样的关系?变量之间的关系强度如何?样本所反映的变量之间的关系能否代表总体变量之间的关系?相关系数的性质性质1:r

的取值范围是[-1,1]|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关

r=0,不存在线性相关关系

-1

r<0,为负相关0<r

1,为正相关|r|越趋于1表示关系越强;|r|越趋于0表示关系越弱相关系数的性质性质2:r具有对称性。即x与y之间的相关系数和y与x之间的相关系数相等,即rxy=ryx性质3:r数值大小与x和y原点及尺度无关,即改变x和y的数据原点及计量尺度,并不改变r数值大小性质4:仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。这意为着,r=0只表示两变量之间不存在线性相关关系,并不说明变量之没有任何关系性质5:r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系相关系数的经验解释1.|r|

0.8时,可视为两个变量之间高度相关2.0.5

|r|<0.8时,可视为中度相关3.0.3

|r|<0.5时,视为低度相关4.|r|<0.3时,说明两个变量之间的相关程度极弱,可视为不相关上述解释必须建立在对相关系数的显著性进行检验的基础之上回归分析1.从一组样本数据出发,确定变量之间的数学关系式2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度相关分析与回归分析的区别

相关系数和回归系数的联系?在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。1.变量间关系的度量2.估计的回归方程3.回归直线的拟合优度4.回归分析中的显著性检验F检验T检验5.估计和预测40时间数列举一盈利的例子1、时间数列的概念、构成要素、分类2、时间数列的编制原则:可比性3、发展水平:报告期水平、基期水平最初水平、中间水平、最末水平4、平均发展水平(序时平均数)5、增长量、平均增长量

(关系、计算、逐期增长量与累计增长量之间的关系,平均增长量与逐期增长量、累计增长量之间的关系)6、发展速度、增长速度、增长1%的绝对值(关系、计算、定基增长速度与环比增长速度之间的关系)7、平均发展速度、平均增长速度------举例环比增长速度算平均增长速度(关系、计算)

时间序列的分类与成分时间序列的分类:平稳序列和非平稳序列时间序列的成分:趋势性:持续向上或持续下降的状态或规律季节性:时间序列在一年内重复出现的周期性波动周期性:围绕长期趋势的一种波浪形或振荡式变动随机性:除去趋势、周期性和季节性之后的偶然性波动

时间序列预测的程序确定时间序列所包含的成分选择合适的预测方法对可能的预测方法进行评估,以确定最佳预测方案利用最佳预测方案进行预测平稳序列的预测简单平均法移动平均法指数平滑法对时间序列进行指数平滑,通常情况下,数据的变化波动小,平滑系数取较小值,数据的变化波动大,平滑系数取较大值。441、指数的概念

(狭义的概念,广义的概念)2、指数的种类(个体指数、总指数;数量指标指数、质量指标指数;同度量因素)3、综合指数(拉氏指数、派氏指数的观点;综合指数计算)在报告期销售量条件下,价格综合变动的程度454、平均数指数(计算、指数体系)465、指数体系(因素分析,分析每个因素对总变动的影响。)②绝对数分解:分子减去分母Σp1q1-Σp0q0=(Σ

p0q1-Σ

p0q0)+(Σ

p1q1–Σp0q1)①相对数分解476、平均指标指数体系可变构成指数=结构影响指数*固定构成指数本章计算题类型:(1)计算指数(综合指数与平均数指数、平均指标指数)(2)进行因素分解:绝对数、相对数的关系。由阿贝(Abbe)

于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)

分别于1875年和19

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论