




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大学应用统计学经典课件06——抽样和参数估计第一页,共118页。第二页,共118页。第三页,共118页。P102(107):例5.1;例5.2例5.3第四页,共118页。第五页,共118页。第六页,共118页。第七页,共118页。样本,个体哪个大?第八页,共118页。定义5.1抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。定义5.2定义5.3定义5.4从含有N个元素的总体中,抽取n个元素作为样本,使得每一个容量为n的样本都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样,也称纯随机抽样。从总体中抽取一个元素后,把这个元素放回总体中再抽取第二个元素,直至抽取n个元素为止。这样的抽样方法称为重复抽样。一个元素后被抽中后不再放回总体,然后再从剩下的元素中抽取第二个元素,直至抽取n个元素为止。这样的抽样方法称为不重复抽样。第九页,共118页。参考定义5.5,5.6,5.7(P103-104)。见P109,分层抽样就是类型抽样分层抽样与整群抽样的区别在那里?第十页,共118页。分层抽样与整群抽样的区别在那里?(1)非随机分层,层内随机抽样;随机分群,群内全面调查(非随机)。(2)层间差异大于层内差异;群内差异大于群间差异。所以,事先对总体结构又一定认识时,可以用分层抽样;在总体没有原始资料可利用时,可以用整群抽样。例:分层抽样与整群抽样的区别:分专业抽样(分层抽样/分类型抽样)分班抽样(整群抽样)见P109第十一页,共118页。例:各种概率抽样的区别非随机分层,层内随机抽样(测量地层)第十二页,共118页。例:各种概率抽样的区别40m随机随机分群,群内全面调查(非随机)(计算植物样方)240m10m第十三页,共118页。例:各种概率抽样的区别第十四页,共118页。第十五页,共118页。什么是样本指标的分布?什么是容量相同的所有可能的样本?为何样本统计量是随机变量?第十六页,共118页。这是一个均匀分布,即每个元素出现的机会(概率)是一样的。Y轴和x轴分别代表什么?见P105(110)均值在那里?1.25为何概率为0.25?第十七页,共118页。第十八页,共118页。第十九页,共118页。例5.4(P105;p109)M是什么?
n是什么?n变大的结果如何?第二十页,共118页。从这两张图中要明白:(1)为什么样本统计量是随机变量。(2)什么是样本均值的均值。n变大,抽样分布方差越小。第二十一页,共118页。
样本均值的数学期望就是样本均值的均值。图中那条曲线的均值更接近总体的均值?第二十二页,共118页。在这张图中总体均值在那里?第二十三页,共118页。第二十四页,共118页。第二十五页,共118页。用什么估计总体均值?总体分布,样本分布,(总体的)抽样分布的关系…….μxxxxxxxµxf总体分布样本分布抽样分布μμxx第二十六页,共118页。总体元素个数、样本容量、样本(组)所有可能取值总体元素个数N(总体的所有个体)样本容量n(每一次取样的数量)容量为n的样本的所有可能取值(所有的Nn种可能都出现为止)重复抽样…….μxxxxxxxµxfx第二十七页,共118页。修正系数(当N很大时修正系数趋于1)P109第二十八页,共118页。注意标准差与标准误差的区别。第二十九页,共118页。表5.1(P106),例5.4(P105;P109)第三十页,共118页。第三十一页,共118页。样本均值的抽样分布、样本方差的抽样分布总体的均值、方差方差的样本分布均值的样本分布方差抽样分布(均值、方差)均值抽样分布(均值、方差)…….μxxxxxxxµxfσσμDDDDDDDDµDσDDX第三十二页,共118页。注意:服从正态分布和服从卡方帆布分布的区别第三十三页,共118页。n
是什么?此处红色曲线分布形成的均值是什么?是总体的µ还是σ?第三十四页,共118页。样本均值的抽样分布、样本方差的抽样分布、…样本均值的抽样分布均值方差……样本方差的抽样分布均值方差……样本其他参数的抽样分布均值方差……第三十五页,共118页。第三十六页,共118页。第三十七页,共118页。第三十八页,共118页。=N0/N第三十九页,共118页。第四十页,共118页。第四十一页,共118页。第四十二页,共118页。第四十三页,共118页。第四十四页,共118页。定义5.9用来估计总体参数的统计量的具体数值,称为估计量,用符号θ表示。定义5.10定义5.11定义5.12用来估计总体参数时计算出来的估计量的具体数值,称为估计值。在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计值。用样本估计量θ的值直接作为总体参数θ的估计值,称为参数的点估计。第四十五页,共118页。第四十六页,共118页。第2点是什么意思?第四十七页,共118页。这是什么意思?第四十八页,共118页。第四十九页,共118页。第五十页,共118页。第五十一页,共118页。第五十二页,共118页。第五十三页,共118页。第五十四页,共118页。点估计与抽样分布的关系…….μxxxxxxxµxxf总体分布样本分布抽样分布误差=|µx-x|nn>根据中心极限定理当n越大,样本(参数)的抽样分布越接近总体(参数)的真值。为何只用一个样本估计,而不是用抽样分布估计?x第五十五页,共118页。定义5.13估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为θ,所选择的估计量为θ,如果E(θ)=θ,称θ为θ的无偏估计。定义5.15定义5.14对同一总体参数的两个无偏估计量θ1和θ2,若D(θ1)<D(θ2),称θ1是比θ2更有效的估计量。随着样本容量的增大,点估计量的值越来越接近总体的参数。第五十六页,共118页。A=总体参数第五十七页,共118页。第五十八页,共118页。定义5.16由样本统计量所构造的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。定义5.17如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平或置信系数。第五十九页,共118页。置信水平=1-αα/2α/2置信区间是统计量的取值范围;置信水平是概率。第六十页,共118页。Za/2是什么?第六十一页,共118页。什么是将构造置信区间的步骤重复多次?第六十二页,共118页。如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平或置信系数。x1x2第六十三页,共118页。第六十四页,共118页。置信水平是概率,是曲线下包含的面积。95%的置信水平就是有95%的区间包含了总体参数的真值。第六十五页,共118页。点估计与抽样分布的关系…….μxxxxxxxµxxf总体分布样本分布抽样分布nn>以一定的概率出现根据中心极限定理当n越大,样本(参数)的抽样分布越接近总体(参数)的真值。|µx–x|≤△x误差?µxµ=x第六十六页,共118页。区间估计与抽样分布的关系以一定的概率(1-α)出现P(x-△x≤µx≤x+△x)=1-α△x△x抽样分布µxxf…….μ总体分布样本分布xx-△xx+△xP(μx-△x≤x≤μx+△x)=1-α|µx-x|≤△x误差x-△x
≤
X
≤
x+△x
µxx区间▲x▲x第六十七页,共118页。此处σ是总体的标准差,还是样本的标准差?Zα/2是什么?P117(125)Zα/2
N(0,1)Z=可靠性系数(临界值)μx
Zα/2(σ/n)估计误差=△x=置信上(下)限Z=σ/nx-µN(0,1)~第六十八页,共118页。置信下(上)限风险值置信水平边际误差误差范围可靠性系数临界值这是什么?P125第六十九页,共118页。第七十页,共118页。第七十一页,共118页。第七十二页,共118页。此处σ为总体标准差,σ未知时以样本标准差s代替。第七十三页,共118页。1.求产品平均重量的范围,而不是平均重量.2.需要多大的范围.才能以概率为95%(0.95)的准确率包含真正的平均重量。第七十四页,共118页。α/2=0.025,查(1-0.025),(0.975-0.5)第七十五页,共118页。α/2=0.025,查(1-0.025),(0.975-0.5)反查正态概率分布表第七十六页,共118页。和上题的差别:没有总体标准差.第七十七页,共118页。总体标准差未知,以样本标准差代替。查0.95第七十八页,共118页。查0.95第七十九页,共118页。第八十页,共118页。自由度为n-1的t分布第八十一页,共118页。第八十二页,共118页。第八十三页,共118页。第八十四页,共118页。查t0.025第八十五页,共118页。第八十六页,共118页。XB(n,p)pN(p,p(1–p))1n二项分布,p为成功率、比例等。N(μ,σ
2)Z=
N(0,1)
X-µσ第八十七页,共118页。第八十八页,共118页。第八十九页,共118页。自由度为n-1的卡方分布置信下限置信上限第九十页,共118页。α/2α/2置信下限置信上限第九十一页,共118页。第九十二页,共118页。第九十三页,共118页。第九十四页,共118页。第九十五页,共118页。第九十六页,共118页。样本容量与抽样分布的关系…….μxµxxf总体分布样本分布抽样分布误差=|x-µx|nn>根据中心极限定理当n越大,样本(参数)的抽样分布越接近总体(参数)的真值。只用一个样本估计,而不是用抽样分布估计。△x△x[]第九十七页,共118页。估计误差=△xμx
Zα/2(σ/n)=置信上(下)限置信区间置信水平=1-α(1)如果确定了置信区间,就可以确定估计误差(边际误差)
。(2)如果确定了置信水平,就可以确定Zα/2。(3)如果确定了估计误差和置信水平,再知道总体标准差σ,就可以求一定误差范围内和一定置信水平下所需要的样本容量n。如果只知道置信区间,能否确定Zα/2?第九十八页,共118页。边际误差可靠性系数不重复抽样时求样本容量n的公式(P123)。3.意义?第九十九页,共118页。样本容量n与总体方差σ2之间的关系=μxn=5σ=0μxσ=0n=10……σ→0μx1x2x3x4x5x1=x2=x3=x4=x5=……=μx总体方差越小,需要的样本容量越小。总体分布样本分布抽样分布第一百页,共118页。样本容量n与边际(估计)误差E的关系△x△x△x△x误差越大,落入误差范围的样本(参数)越多,如果缩小误差,只有加大样本容量,使抽样分布变窄,才能使同样多的样本落入误差范围内。1-α1-α1-α1-αn
=
n△x>
△x1-α>1-αn<
n△x>
△x1-α=1-α△x△x△x△x误差越大,置信水平越大第一百零一页,共118页。样本容量n与可靠性系数(Z或t)的关系估计误差=△xμx
Zα/2(σ/n)=置信上(下)限置信区间置信水平=1-α△x△xα/2α/2△x=
△xα/2>α/2Zα/2
<Zα/2n<
n
查正态分布表或t分布表可知,Z或t越大,α越小。若置信区间(误差范围)不变,加大Z,则σ/√n变小(或α变小),n就要变大,抽样分布曲线就要变窄。实际上是n和α或1-α的关系。n越大,可靠性越大。第一百零二页,共118页。(100-115)0~0.94(σ=16)0~0.75(σ=20)Z=115-10020=0.75115B20x115A16x1151151z0同样的值或误差范围边界(115),变成标准正态分布后是不一样的z值。第一百零三页,共118页。第一百零四页,共118页。第一百零五页,共118页。第一百零六页,共118页。第一百零七页,共118页。第一百零八页,共118页。第一百零九页,共118页。例1:某零件加工企业生产一种螺丝钉,对某天加工的零件每隔一定时间抽出一个,共抽出12个,测得长度(单
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二房东协议合同样本
- ktv购销合同样本
- 2025化工企业职业病防护告知合同
- 公司酒水采购合同样本
- 供价合同标准文本
- 传媒主播合同样本
- 公司授权开店合同范例
- 关于学校物业合同样本
- 众筹修路合同标准文本
- 代理采购合同样本
- 卫健系统深入开展矛盾纠纷“大走访、大排查、大化解”专项行动工作方案
- 三年级音乐上册 《法国号》课件教学
- 乡镇(街道)财政运行综合绩效评价报告及自评指标
- 餐饮部作业流程图
- 代建项目管理手册
- WS/T 510-2016病区医院感染管理规范
- GB/T 15065-2009电线电缆用黑色聚乙烯塑料
- 中层干部任期考核民主测评表
- 十二经络及腧穴课件
- 办公室工作存在问题(总结12篇)
- 精细化工产品公司企业经营战略方案
评论
0/150
提交评论