管理统计学-第3章抽样分布及参数估计_第1页
管理统计学-第3章抽样分布及参数估计_第2页
管理统计学-第3章抽样分布及参数估计_第3页
管理统计学-第3章抽样分布及参数估计_第4页
管理统计学-第3章抽样分布及参数估计_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

管理统计学-第3章抽样分布及参数估计第一页,共70页。3.1抽样分布

为什么要抽样? 为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。抽样原因元素多,搜集数据费时、费用大,不及时而使所得的数据无意义总体庞大,难以对总体的全部元素进行研究检查具有破坏性炮弹、灯管、砖等第二页,共70页。统计学基本概念总体(全体)Population所有感兴趣的对象样本Sample总体的一部分总体参数Parameter关于总体的概括性度量统计量Statistic关于样本的概括性度量抽样从所研究的对象中随机取出一部分进行观察,由此获得有关总体的信息。第三页,共70页。抽样分为概率抽样与非概率抽样其中概率抽样分为:纯随机抽样、等距抽样、分层抽样、整群抽样第四页,共70页。常用的总体参数总体平均数总体方差总体标准差总体比率(总体成数)第五页,共70页。样本平均数样本方差样本标准差样本比率(样本成数)第六页,共70页。样本统计量经常被用作估计总体参数。点估计就是运用样本数据值计算出一个样本统计量的值,将其作为总体参数的估计值。如用去估计问题是不同的样本提供不同的估计值样本越大,估计的性质越好,但成本也越高了解估计的性质有多好解决办法:以样本的抽样分布作为理论基础。第七页,共70页。抽样分布从一个总体中随机抽出容量相同的各种样本,从这些样本计算出的某统计量所有可能值的概率分布,称为这个统计量的抽样分布。从一个给定的总体中抽取(不论是否有放回)容量(或大小)为n的所有可能的样本,对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布。样本统计量是一个随机分布量。第八页,共70页。设由四个同学组成的总体,样本总体N=4。随机变量X表示某个学生的年龄X的所在取值为18,20,22,24。总体均值和总体方差各为多少?212.236总体概率分布?第九页,共70页。所有样本容量为2的样本第十页,共70页。第十一页,共70页。第十二页,共70页。总体分布与样本抽样分布的关系第十三页,共70页。第十四页,共70页。第十五页,共70页。第十六页,共70页。样本均值的抽样分布一个总体10,5,8,7,10,第十七页,共70页。有放回(withreplacement)抽样105871010{10,10} 10{10,5} 7.5{10,8} 9{10,7} 8.5{10,10} 105{5,10} 7.5{5,5} 5{5,8} 6.5{5,7} 6{5,10} 7.58{8,10} 9{8,5} 6.5{8,8} 8{8,7}7.5{8,10} 97{7,10} 8.5{7,5} 6{7,8} 7.5{7,7} 7{7,10} 8.510{10,10}10{10,5} 7.5{10,8} 9{10,7}8.5{10,10} 10第十八页,共70页。一个样本统计量的概率分布被称为该统计量的抽样分布

样本均值抽样分布直方图0510678910其他频率0.00%50.00%100.00%150.00%频率累积%第十九页,共70页。第二十页,共70页。第二十一页,共70页。第二十二页,共70页。正态分布均匀分布总体分布样本均值分布(n=2)样本均值分布(n=10)样本均值分布(n=30)指数分布第二十三页,共70页。中心极限定理的作用建立起值与样本均值之间的数值关系.不论该总体服从何种分布,只要当样本容量足够大(),样本均值的分布都大致服从正态分布。第二十四页,共70页。例:某高校在研究生入学体检后对所有结果进行统计分析,得出其中某一项指标的均值是7,标准差2.2。从这个总体中随机选取一个容量为31的样本。(1)计算样本均值大于7.5的概率,(2)计算样本均值小于7.2的概率,(3)计算样本均值在7.2和7.5之间的概率。第二十五页,共70页。样本容量大于30,由中心极限定理可知,样本均值的分布近似均值为即第二十六页,共70页。(1)(2)(3)第二十七页,共70页。例:在北京一居室的房租平均为每月1500元,房租的分布并不服从正态分布,随机抽取容量为50的样本,样本的标准差是200元,请问样本均值至少为1600元的概率是多少?第二十八页,共70页。第二十九页,共70页。第三十页,共70页。第三十一页,共70页。第三十二页,共70页。第三十三页,共70页。例:已知某高校女生比例为46%,现对全体学生做两次随机抽样,n=200和n=1000,求这两次抽样中女生的比例在50%以上的概率。第三十四页,共70页。3.2点估计第三十五页,共70页。3.2.1点估计的概念点估计是以样本统计量作为相应总体参数的估计量例如:用样本均值直接作为总体均值的估计值点估计的优点能够提供总体参数的具体估计值,可以作为行动决策的数量依据点估计的不足任何点估计不是对就是错,并不能提供误差情况如何、误差程度有多大的信息第三十六页,共70页。3.2.2点估计的优良性标准无偏性设总体的参数为,其估计量为,如果即估计量的数学期望等于被估计的总体参数,我们称估计量是参数的无偏估计量样本平均数是总体平均数的无偏估计量无偏性是对估计量的一个常见而重要的要求第三十七页,共70页。点估计的优良标准(续)一致性设是参数估计量,若对于任意的,当时依概率收敛于,则称为的一致估计量对任意有,有效性设和都是参数的无偏估计量,若对任意,,且至少对于某个上式中的不等号成立,则称较有效第三十八页,共70页。矩估计法借助样本矩去估计总体的矩用样本的一阶原点矩来估计总体的均值用样本的二阶中心矩来估计总体的方差第三十九页,共70页。例3.1矩法估计例题设总体,为总体的样本,求,

的矩法估计量。解:第四十页,共70页。例3.2

灯泡平均寿命分析设从某灯泡厂某天生产的灯泡中随机抽取10只灯泡,测得其寿命为(单位:小时)1050,1100,1080,1120,1200,1250,1040,1130,1300,1200。试用矩法估计该厂这天生产的灯泡的平均寿命及寿命分布的方差。

解:第四十一页,共70页。极大似然估计法求极大似然估计的一般步骤写出似然函数对似然函数取对数,并整理求导数解似然方程第四十二页,共70页。例3.4极大似然估计例题设总体X服从N(,

),是X的样本值,求,

的极大似然估计解:似然方程为:,S2的极大似然估计量分别为

,,第四十三页,共70页。频次分析模块Analyz→DescriptiveStatistics→FrequenciesStatistics

均值

中位数

众数

样本数据值总和数据分布的斜度

数据分布的峰度

最大值与最小值之差

标准差

方差

均值标准差

最大值

最小值

计算四分点

按顺序分组

设置指定的百分点

第四十四页,共70页。频次分析模块(续)Statistics净重NValid100Missing0Mean343.76Std.Deviation4.130Variance17.053从100个样本中推断总体的净重均值为343.76g,方差为17.053

从100个样本中推断总体的净重均值为343.76g,方差为17.053

从100个样本中推断总体的净重均值为343.76g,方差为17.053

样本方差

样本均值

第四十五页,共70页。描述统计模块Analyze→DescriptiveStatistics→Descriptives→Options标准差

均值

方差

DescriptiveStatisticsNMeanStd.DeviationVariance净重100343.764.13017.053ValidN(listwise)100净重均值、方差估计值,结果同Statistics表标准差

均值

方差

标准差

均值

净重均值、方差估计值,结果同Statistics表

方差

标准差

均值

标准差

均值

标准差

均值

方差

标准差

均值

第四十六页,共70页。3.3区间估计第四十七页,共70页。3.3区间估计第四十八页,共70页。第四十九页,共70页。用一个区间去估计未知参数,即把未知参数值估计在某两界限之间

设是来自密度的样本对给定的,如能找到两个统计量及,使得是置信度,置信度也称为置信概率是置信度为的θ的置信区间称为显著性水平(SignificanceLevel)

。第五十页,共70页。第五十一页,共70页。置信区间区间示意图置信区间表达了区间估计的精确度,置信概率表达了区间估计的可靠性,它是区间估计的可靠概率;而显著性水平表达了区间估计的不可靠的概率可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度第五十二页,共70页。第五十三页,共70页。3.3.1总体方差已知时,总体均值µ的估计

,为来自总体的样本样本均值服从数学期望为μ、方差为/n的正态分布,即当已知时,可得到1-α置信度下,μ的置信区间为置信区间的宽度为:第五十四页,共70页。第五十五页,共70页。例3.6零件直径问题已知某零件的直径服从正态分布,从该批产品中随机抽取10件,测得平均直径为202.5mm,已知总体标准差σ=2.5mm,试建立该种零件平均直径的置信区间,给定置信度为0.95。解:已知,=202.5mm,n=10,=0.95,查标准正态分布表,得

=1.96,所以在置信度下,的置信区间为即[202.5-1.96×2.5/,202.5+1.96×2.5/],计算结果为:[200.95,204.05]第五十六页,共70页。第五十七页,共70页。第五十八页,共70页。3.3区间估计用一个区间去估计未知参数,即把未知参数值估计在某两界限之间

设是来自密度的样本对给定的,如能找到两个统计量及,使得是置信度,置信度也称为置信概率是置信度为的θ的置信区间称为显著性水平(SignificanceLevel)

。第五十九页,共70页。置信区间区间示意图置信区间表达了区间估计的精确度,置信概率表达了区间估计的可靠性,它是区间估计的可靠概率;而显著性水平表达了区间估计的不可靠的概率可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度第六十页,共70页。3.3.1总体方差已知时,总体均值µ的估计

,为来自总体的样本样本均值服从数学期望为μ、方差为/n的正态分布,即当已知时,可得到1-α置信度下,μ的置信区间为置信区间的宽度为:第六十一页,共70页。例3.6零件直径问题已知某零件的直径服从正态分布,从该批产品中随机抽取10件,测得平均直径为202.5mm,已知总体标准差σ=2.5mm,试建立该种零件平均直径的置信区间,给定置信度为0.95。解:已知,=202.5mm,n=10,=0.95,查标准正态分布表,得

=1.96,所以在置信度下,的置信区间为即[202.5-1.96×2.5/,202.5+1.96×2.5/],计算结果为:[200.95,204.05]第六十二页,共70页。3.3.2总体方差未知时,总体均值µ的估计

n≥30时通常用样本方差

来估计,只需将中的σ用S近似代替即可

n<30时即1-α置信度下,μ的置信区间为第六十三页,共70页。例3.7

大学生平均完成作业时间

某大学从该校学生中随机抽取100人,调查到他们平均每人每天完成作业的时间为120分钟,样本标准差为30分钟,试以95%的置信水平估计该大学平均每天完成作业时间。

解:根据题意可知:=120,S=30,n=100且=0.95,

=1.96故在95%的置信度下,的置信区间为即[120-1.96×30/10,120+1.96×30/10],计算结果为:[114.12,125.88]第六十

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论