![05抽样估计资料_第1页](http://file4.renrendoc.com/view/24db9f726ab9b947bc40d1099fd9773b/24db9f726ab9b947bc40d1099fd9773b1.gif)
![05抽样估计资料_第2页](http://file4.renrendoc.com/view/24db9f726ab9b947bc40d1099fd9773b/24db9f726ab9b947bc40d1099fd9773b2.gif)
![05抽样估计资料_第3页](http://file4.renrendoc.com/view/24db9f726ab9b947bc40d1099fd9773b/24db9f726ab9b947bc40d1099fd9773b3.gif)
![05抽样估计资料_第4页](http://file4.renrendoc.com/view/24db9f726ab9b947bc40d1099fd9773b/24db9f726ab9b947bc40d1099fd9773b4.gif)
![05抽样估计资料_第5页](http://file4.renrendoc.com/view/24db9f726ab9b947bc40d1099fd9773b/24db9f726ab9b947bc40d1099fd9773b5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
抽样估计第一节抽样估计的理论基础抽样估计的基本内容就是研究如何根据总体的部分数据信息(构造样本指标也称统计量)去估计未知总体指标(也称参数)的理论和方法。念及基本原理→抽样估计的理论和方法。一、大数定律大量的独立重复测量值的算术平均值具有稳定性。对于这种稳定性的研究构成了大数定那那么对任意给定的正数ε,有其等价形式是频率m/n,依概率收敛于事件发生的概率p,这个定(二)辛钦大数定律12nk辛钦大数定律为我们用测量数据的算术平均数代替其真值的方法提供了理论依据。假定要测量某一物理量μ,在不变条件下测量n次,得到的结果X,X,…,X是不完全相同的,12n它们可以看作n个独立随机变量X,X,…,X(它们服从同一分布且数学期望均为μ)。12n这时出现较大偏差的可能性很小。一般说来,测定的次数越多,近似程度越好。二、中心极限定理当处理大样本问题时,将它作为一个非常重要的工具。下面介绍两个常用的中心极限定理。定理1:林德贝格—勒维中心极限定理,也称为独立同分布中心极限定理。n充分大时,若随机变量X~B(n,p),则近似地有X~N(np,np(1-p),于是我们可nn以利用正态分布近似地计算二项分布的概率。同时,这个定理还给离散型随机变量与连续型随机变量之间的转换提供了一种有效途径。P{1000X>120000}表示保险公司亏本的概率,(1)P{1000X>120000}=P{X>120}=1-φ(7.7693)=0(2)P{120000-1000x≥40000}=P{(X-10000×0.006)/(10000×0.006×0.994)1/2≤(80-60)/(59.64)1/2}=φ(2.5898)=0.9952第二节抽样方法与抽样分布一、抽样方法(一)重复抽样和不重复抽样(识记二者概念。重点)对于无限总体而言,抽样总是可以认为是重复抽样(即重置抽样或放回抽样),因此,它没有重复抽样和不重复抽样的区别。然而,对于有限总体而言,重复抽样与不重复抽样是不一样的。下面我们只对有限总体的重复抽样和不重复抽样进行分别介绍。首先,我们假设有限总体中所包含的个体数为N,重复抽样可以认为是有限总体条件下的简单随机抽样。其特点是:如果我们做了n次独立试验(也就是抽取n个个体的样本),2.不重复抽样不重复抽样(即不重置抽样或不放回抽样)是指每次从有限总体中随机抽取一个个体,登记结果后不放回原总体,下一个个体继续从总体中余下的个体中随机抽取。其特点是:第第二,每次抽取的结果不是独立的。体被抽中的概率是不相同的。(二)其他抽样方法二、抽样分布(一)抽样分布的概念(识记。重点)对于给定的总体和抽样方式以及样本容量,样本指标取值的概率分布就称为抽样分布。样本均值样本均值867概概率为任(二)常用的抽样分布样本均值、样本比例和样本方差(领会)。1.样本均值的抽样分布不论所考察总体的概率分布如何,只要样本容量n足够大,其样本均值的概率分布趋近于以总体均值μ为期望,以为标准误差的正态分布,即有:在实践中,总体的方差σ2总是未知的,通常需要用其估计量即样本方差S2来代替。由于修正的无偏于修正的无偏样本方差是总体方差的无偏估计,所以实际应用2.样本比例的抽样分布样本比例是总体比例的估计量,只能给出大样本条件下样本比例的抽样分布。3.样本方差的抽样分布主要是在正态分布总体中应用。第三节点估计一、总体参数与其估计量在统计中需要使用一定的方法根据样本数据来推断总体的指标数值,总体指标又称为参该估计量的数值就称为该总体指标的估计值。估计值就是其估计量在某个给定样本上的取值。二、构造估计量的方法——矩法估计(领会)所谓矩法估计,是指用样本矩作为总体同一矩的估计量或者用样本矩的函数作为总体相常用代表该总体指标的字母戴一个尖帽表示。三、判断估计量优劣的标准(领会)常用的标准主要有一致性、无偏性、有效性、充分性和稳健性等。(一)一致性对于总体指标θ,若其估计量的取值随着样本容量的增大越来越接近于总体指标的真值,计量都是所要估计的总体指标的一致估计量,即都具有相合性。如样本均值是总体均值μ的一致估计量,样本比例p是总体比例P的(二)无偏性计量。修正的无偏样本方差的数学期望正好等于被估计的总体方差σ2。本方差和无偏样本方差的值会有一定的差距,估计总体方差时应采用无偏样本方差作为其估计时,用哪一个作估计量都可以。(三)有效性计量优劣的第三个标准。和,和1211来说小于估计量的估计误差,则称估计量比有效。212两个无偏估计量比较,方差较小者较为有效。两个估计量的方差之比:称为二者的相对效率。若比率ω<1,则称估计量比有效。12对于一个总体指标来说,若在其所有无偏估计量中能够找到一个估计量,其方差最小,则该估计量就称为该总体指标的最佳估计量。可以证明,样本均值就是该总体指标均值于有偏估计量之间或有偏估计量与无偏估计量之间的比较判断。可将判断估计量是否优良的指标改为估计量的均方误差,在待估总体指标的所有估计量中,均方误差最小的估计量可认为是最好的估计量,该标准可称为均方误差最小标准。则均方误差最小者较好,所以均方误差最小标准也是无偏性标准和有效性标准的综合。(四)充分性思想,可给出判断估计量优劣的第四个标准。计量就称为总体指标θ的充分估计量。判断样本指标是否为某个总体指标的充分估计量,一般比较麻烦,不过在多数情况下,(五)稳健性的污染。显然,被污染数据的干扰或受其干扰不大,那么该估计量就是总体指标θ的一个稳健统计量。均值有效性很高,但稳健性却较低,而样本中位数稳健性很高,但有效性却较低。所以,可以将样本均值和中位数的计算方法综合折中构造一种兼具二者特点的新估计量,这类估计量主要有切尾均值等。所谓切尾均值就是将样本数据按大小顺序排列以后,切掉序列两端的部将样本数据排序序列两端各25%的数据切掉,只用中间一半数据计算的均值。唱歌比赛中,对歌手的评分就常采用评委打分的切尾均值。估计量往往很难同时具备所有这些优良性质,这就需要我们根据研究的目的和样本数据的特点性质进行权衡选择或者进行折中选择。【多选题】下列关于稳健性的说法正确的有()。A.由矩法估计所构造出来的估计量都是所要估计的总体指标的一致估计量B.样本均值是总体均值的一个稳健估计量C.常用的总体指标的估计量均是充分的D.两个无偏估计量比较,方差较大者较为有效E.对于小样本来说,估计总体方差时应采用无偏样本方差作为其估计量『答案解析』选项B,样本中位数是总体均值的一个稳健估计量,样本均值不是总体均值的一个稳健估计量。选项D,两个无偏估计量比较,方差较小者较为有效。四、估计量的标准误样本估计值与总体指标真值之间总是存在着或大或小的抽样估计误差。估计误差愈大,它控制到一个较小的范围之内,确保抽样估计的精度,减少决策的失误。(一)标准误的概念(识记)衡量抽样估计误差不能用抽样误差的直接平均,而应该采用将其平方后再平均的方法,即用样本估计量的方差或标准差。实践中一般均采用样本估计量的标准差作为衡量抽样估计中列出,由此可计算出样本均值无的方差和标准误分别为:σ2=D()=E[-E()]2=E(-μ)2=(6-7)2×1/9+(6.5-7)2+(7-7)2×3/9+(7.5-7)2×2/9+(8-7)2×1/9=1/3(二)标准误的计算(领会)指标的关系用间接的方式求出。1.样本均值的标准误同的抽样方式之下,样本均值的方差是不相同的,因而其标准误也就不相同。(1)若所得样本是采用有放回简单随机抽样方式抽取有放回简单随机抽样所得的样本就是由若干个相互独立且与总体被观测变量分布完全相同的随机变量x,x,…,x所组成的一个集合。12n样本均值的标准误公式为:放回简单随机样本,其样本均值的标准误为:σ=(2/3/2)=3/3可见,用该公式计算的结果与用样本均值标准误定义公式计算结果相同。(2)若所得样本是采用不放回简单随机抽样方式抽取则样本的各次抽取不独立,从而使样本观测变量x,x,…,x相互也不独立,前面的12n值的方差那样很容易地导出。不放回抽样下样本均值的方差为:σ=[2/3/2(3-2)/(3-1)]=6/6有放回抽样和不放回抽样各自样本均值的方差的比较:(1)不放回抽样下样本均值的方差公式中比有放回抽样下样本均值的方差公式中多了一个因子(N-n)/(N-1),由于该因子小于1,即(N-n)/(N-1)<1,所以,不放回抽样下样本均值的标准误比放回抽抽样方式。(2)当总体为无限总体时,不放回抽样下样本均值的标准误公式就简化为与有放回抽样下样本均值的标准误公式相同,故因子(N-n)/(N-1)通常称为有限总体校正因子。不过当总体容量N较大而抽样比n/N很小时,有限总体校正因子(N-n)/(N-l)或(1—n/N)通常可忽略不计。因此,实践中一般只使用有放回抽样的公式来计算其标准误。方差可得有放回抽样和不放回抽样下样本均值标准误的估计量公式分别为:检验,测得各电子元件的使用寿命分别为1256、1307、1180、1450、1225、1198、1365、1420、1295、1304小时,试估计该批电子元件的平均使用寿命及其标准误。解:由样本观测数据可计算出样本均值和样本方差分别为:=(1256+1307+…+1304)/10=13000/10=1300(小时)所以该批电子元件平均使用寿命的估计值为:而样本均值的标准误,若按放回抽样计算,则其估计值为:放回抽样计算,则其估计值为:相差很小,故为了计算简便可只使用有放回抽样的公式。2.样本比例的标准误总体比例P,即总体中具有某种特征的个体数与全部个体数的比例,是一个常用的总体pp的标准误公式可仿照上述总体均值估计量即样本均值的标准误公式给出。:1标准误公式代替不放回抽样的标准误公式进行计算。(三)影响标准误的因素(领会)准抽样方法和估计方法,以便控制抽样估计误差,具有十分重要的意义。影响估计量的标准误数值大小的因素主要有以下三个方面:(1)总体中各个体之间的差异程度。对于所考察的变量来说,总体中各个体在该变量的取值之间的差异程度越大,即σ2越大,总体指标估计量的标准误的数值也就越大,抽样估计误差也就越大。反之,若σ2较小,则估计量的标准误差也就越小。(2)样本容量的大小。样本容量越大,总体指标估计量的标准误就越小,抽样估计误差也就越小;反之,样本容量越小,抽样估计误差及其标准误也就越大。(3)抽样的方式与方法。比较不同的抽样方式下各总体指标估计量的标准误的计算公同,总体指标估计量的标准误就会不同,抽样估计误差的大小也就不同。由总体指标估计量的标准误的意义及上述因素分析可知:要提高抽样估计的精确程度,以及增加样本容量等。第四节区间估计一、区间估计的概念(识记)为了给出样本估计值精度的估计(点估计做不到),就需要对未知总体指标进行区间估定义(识记):所谓区间估计,就是在事先给定的概率保证程度下,根据样本估计量的体参数的某个区间,作为对未知总体参数的估计。本估计量的概率分布可计算出一个区间本估计量的概率分布可计算出一个区间次一方面,对某一次抽样来说,只有一个样本,只能计算出未知总体参数θ的一个置信区间,该区间或者包含未知总体参数θ,或者不包含未知总体参数θ。其中该区间包含θ的可能性也称把握程度或称可靠程度为1-α,而该区间不包含θ的可能性则为α。率,即使估计的可靠程度符合要求,又不至于使估计的精度太低。下面学习常用的总体指标置信区间的计算方法。二、总体均值的区间估计(领会)(一)大样本情形下总体均值的区间估计大样本情形下,样本均值的概率分布可看作是正态分布。概率保证为1-α。总体均值μ的置信区间为:用样本均值估计总值均值μ所产生的抽样估计误差,记为:该市民工的月平均工资进行区间估计。其标准误的估计值为:的条件下,查标准正态分布概率表得上侧分位数z=z=1.96。由此得估计的误差限为:α/20.025故可得出该市农民工月平均工资μ的置信区间为:(630-15.68)元<μ<(630+15.68)元(二)小样本情形下,正态总体均值的区间估计只讨论正态总体小样本均值的区间估计。对于来自正态总体的一个小样本,在给定的置信概率1-α之下,总体均值μ的置信区用样本均值估计总值均值μ所产生的抽样估计误差-μ,记为:【例5—8】在【例5—5】所述某工厂收到供货方发来的一批电子元件的例子中,样本子元件使用寿命的概率分布可看作正态分布,试在95%的置信概率下,对该批电子元件的平均使用寿命进行区间估计。0.95的条件下,查t分布表得自由度为n-1的t分布上侧分位数t==t=2.26,于α/20.025是用样本均值估计总体均值的估计误差的误差限为:该批电子元件平均使用寿命的置信区间为:(1300-64.62)小时<μ<(1300+64.62)小时三、总体比例的区间估计(领会)市居民家庭中由于物价上涨过快而使生活水平下降的家庭所占比例进行区间估计。布概率表得z=1.96。若采用类似于均值置信区间的计算方法,可先计算出用样本比例pσ/2由此得该市由于物价上涨而使生活水平下降的居民家庭所占比例P的置信区间为:25%-4.9%<P<25%+4.9%,即:20.1%<P<29.9%四、总体方差的区间估计10件电子元件进行检验,使用样本的方差为S2=8175.56(小时),试在95%的置信概率下区间估计。对该批电子元件使用寿命的方差和标准差进行上述正态总体方差置信区间的公式,可得该批电子元件使用寿命的方差的置信区间为:两边开平方,就可得出该批电子元件使用寿命的标准差的置信区间为:五、单侧置信区间(识记)在称为单侧则称区间置信下限,而估计值称为单侧置信上限。户,其中由于物价上涨过快使生活水平下降的家庭所占比重为25%,试在95%的置信概率下求该市居民家庭中生活水平下降的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度拆迁安置房预售合同范本(2025版)
- 2025年生物科技产品采购合同范本模板
- 2025年度餐厅窗口承包及广告投放合同
- 2025年度二手商铺贷款买卖双方合作协议
- 2025年度海洋工程担保型买卖合同
- 2025年低噪声对旋式局部通风机项目建议书
- 保安工作在社区安全提升中的实例计划
- 促进社区志愿服务团队建设的方案计划
- 学习资源共享与图书管理计划
- 主管年度员工关怀任务计划
- 节事活动策划与组织管理 节事活动概论
- 电梯安装质量手册、程序文件、作业指导书及记录表符合特种设备许可规范TSG07-2019
- 肋骨骨折病人的业务学习
- 生产建设项目水土保持补偿费免征申请表
- 全过程工程咨询服务大纲
- 日本酒类消费行业市场分析报告
- GB/T 4151-1996硝酸铈
- GB/T 31586.2-2015防护涂料体系对钢结构的防腐蚀保护涂层附着力/内聚力(破坏强度)的评定和验收准则第2部分:划格试验和划叉试验
- GB/T 29594-2013可再分散性乳胶粉
- 危房鉴定报告
- 西子奥的斯电梯ACD2调试说明书
评论
0/150
提交评论