7章抽样与估计2_第1页
7章抽样与估计2_第2页
7章抽样与估计2_第3页
7章抽样与估计2_第4页
7章抽样与估计2_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第7章参数估计(2)7.5参数估计的一般问题7.6一个总体参数的区间估计7.7两个总体参数的区间估计7.8样本容量的确定学习目标标估计量与与估计值值的概念念点估计与与区间估估计的区区别评价估计计量优良良性的标标准一个总体体参数的的区间估估计方法法两个总体体参数的的区间估估计方法法样本容量量的确定定方法参数估计计在统计计方法中中的地位位参数估计假设检验统计方法描述统计推断统计统计推断断的过程程样本总体样本统计量如:样本均值、比例、方差总体均值、比例、方差等7.5参数估计计的一般般问题7.5..1估估计计量与估估计值7.5..2点点估估计与区区间估计计7.5..3评评价价估计量量的标准准估计量与与估计值值估计量::用于估估计总体体参数的的随机变变量如样本均均值,样样本比例例、样本本方差等等例如:样样本均均值就是是总体均均值的一个估估计量参数用表示,估估计量用表表示示估计值::估计参参数时计计算出来来的统计计量的具具体值如果样本本均值x=80,,则80就是的估计值值估计量与与估计值值(estimator&estimatedvalue)点估计与与区间估估计参数估计计的方法法矩估计法最小二乘法最大似然法顺序统计量法估计方法点估计区间估计点估计(pointestimate))用样本的的估计量量直接作作为总体体参数的的估计值值例如:用用样本均均值直接接作为总体均值值的估计计例如:用用两个样样本均值值之差直直接作为总体均值值之差的的估计2.没没有给出出估计值值接近总总体参数数程度的的信息点估计的的方法有有矩估计计法、顺顺序统计计量法、、最大似似然法、、最小二二乘法等等区间估计计(intervalestimate))在点估计计的基础础上,给给出总体体参数估估计的一一个区间间范围,,该区间间由样本本统计量量加减抽抽样误差差而得到到的根据样本本统计量量的抽样样分布能能够对样样本统计计量与总总体参数数的接近近程度给给出一个个概率度度量比如,某某班级平平均分数数在75~85之间,置置信水平平是95%样本统计量

(点估计)置信区间置信下限置信上限区间估计计的图示示x95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x90%的样本-1.65x+1.65x将构造置置信区间间的步骤骤重复很很多次,,置信区区间包含含总体参参数真值值的次数数所占的的比例称称为置信信水平表示为((1--为是总体体参数未在区间内的的比例常用的置置信水平平值有99%%,95%,,90%相应的为0.01,0.05,0..10置信水平平由样本统统计量所所构造的的总体参参数的估估计区间间称为置置信区间间统计学家家在某种程度度上确信这个个区间会会包含真真正的总总体参数数,所以以给它取取名为置置信区间间用一个具具体的样样本所构构造的区区间是一一个特定定的区间间,我们们无法知知道这个个样本所所产生的的区间是是否包含含总体参参数的真真值我们只能能是希望望这个区区间是大大量包含含总体参参数真值值的区间间中的一一个,但但它也可可能是少少数几个个不包含含参数真真值的区区间中的的一个置信区间间(confidenceinterval)置信区间间与置信信水平均值的抽样分布(1-)%区间包含了%的区间未包含1–aa/2a/2影响区间间宽度的的因素1.总总体数据据的离散散程度,,用来测度样本容量量,3.置置信水平平(1-),影响响zα/2的大小评价估计计量的标标准无偏性(unbiasedness)无偏性::估计量抽抽样分布布的数学学期望等等于被估计的总总体参数数P(

)BA无偏有偏有效性(efficiency)有效性::对同一总总体参数数的两个个无偏点点估计量,有更更小标准准差的估估计量更更有效AB的抽样分布的抽样分布P(

)一致性(consistency)一致性::随着样本本容量的的增大,,估计量量的值越来越越接近被被估计的的总体参参数AB较小的样本容量较大的样本容量P(

)7.6一个总体体参数的的区间估估计7.6..1总总体体均值的的区间估估计7.6..2总总体体比例的的区间估估计7.6..3总总体体方差的的区间估估计一个总体体参数的的区间估估计总体参数符号表示样本统计量均值比例方差总体均值值的区间间估计(正态总体体、2已知,或或非正态态总体、、大样本本)总体均值值的区间间估计(大样本)1.假假定条件件总体服从从正态分分布,且方差((2)已知如果不是是正态分分布,可可由正态态分布来来近似((n30)使用正态态分布统统计量z总体均值值在1-置信水平平下的置信区间间为总体均值值的区间间估计(例题分析析)【例】一家食品品生产企企业以生生产袋装装食品为为主,为为对产量量质量进进行监测测,企业业质检部部门经常常要进行行抽检,,以分析析每袋重重量是否否符合要要求。现现从某天天生产的的一批食食品中随随机抽取取了25袋,测得得每袋重重量如下下表所示示。已知知产品重重量的分分布服从从正态分分布,且且总体标标准差为为10g。试估计该该批产品品平均重重量的置置信区间间,置信信水平为为95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体均值值的区间间估计(例题分析析)解:已知X~N(,102),n=25,,1--=95%,z/2=1.96。根据样本本数据计计算得::总体均值值在1-置信水平平下的置置信区间间为该食品平平均重量量的置信信区间为为101..44g~109.28g该批食品品的95%的重量在在101..44g~109.28g之间““?””总体参数数的真值值是固定定的,而而用样本本构造的的区间则则是不固固定的,,因此置置信区间间是一个个随机区区间,它它会因样样本的不不同而变变化,而而且不是是所有的的区间都都包含总总体参数数实际估计计时往往往只抽取取一个样样本,此此时所构构造的是是与该样样本相联联系的一一定置信信水平((比如95%))下的置置信区间间。我们们只能希希望这个个区间是是大量包包含总体体参数真真值的区区间中的的一个,,但它也也可能是是少数几几个不包包含参数数真值的的区间中中的一个个置信区间间的表述述(confidenceinterval)当抽取了了一个具具体的样样本,用用该样本本所构造造的区间间是一个个特定的的常数区区间,我我们无法法知道这这个样本本所产生生的区间间是否包包含总体体参数的的真值,,因为它它可能是是包含总总体均值值的区间间中的一一个,也也可能是是未包含含总体均均值的那那一个一个特定定的区间间总是““包含””或“绝绝对不包包含”参参数的真真值,不不存在““以多大大的概率率包含总总体参数数”的问问题置信水平平只是告告诉我们们在多次次估计得得到的区区间中大大概有多多少个区区间包含含了参数数的真值值,而不不是针对对所抽取取的这个个样本所所构建的的区间而而言的置信区间间的表述述(confidenceinterval)置信区间间的表述述(95%的置信区区间)从均值为为185的总体中中抽出n=10的20个样本构构造出的20个置信区间间我没有抓抓住参数数!点估计值值使用一个个较大的的置信水水平会得得到一个个比较宽宽的置信信区间,,而使用用一个较较大的样样本则会会得到一一个较准准确(较较窄)的的区间。。直观地地说,较较宽的区区间会有有更大的的可能性性包含参参数但实际应应用中,,过宽的的区间往往往没有有实际意意义比如,天天气预报报说“在在一年内内会下一一场雨””,虽然然这很有有把握,,但有什什么意义义呢?另另一方面面,要求求过于准准确(过过窄)的的区间同同样不一一定有意意义,因因为过窄窄的区间间虽然看看上去很很准确,,但把握握性就会会降低,,除非无无限制增增加样本本量,而而现实中中样本量量总是有有限的区间估计计总是要要给结论论留点儿儿余地置信区间间的表述述(confidenceinterval)总体均值值的区间间估计(例题分析析SPSS)Analyze→DescriptiveStatistics→Explore25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体均值值的区间间估计(例题分析析)【例】一家保险险公司收收集到由由36投保个人人组成的的随机样样本,得得到每个个投保人人的年龄龄(周岁)数据如下下表。试试建立投投保人年年龄90%的置信区区间36个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532总体均值值的区间间估计(例题分析析)解:已知n=36,,1--=90%,z/2=1.645。根据样本本数据计计算得::,,总体均值值在1-置信水平平下的置置信区间间为投保人平平均年龄龄的置信信区间为为37.37岁~41..63岁总体均值值的区间间估计(例题分析析SPSS)Analyze→DescriptiveStatistics→Explore36个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532总体均值值的区间间估计(正态总体体、2未知、小小样本)总体均值值的区间间估计(小样本)1.假假定条件件总体服从从正态分分布,且方差((2)未知小样本((n<30)使用t分布统计计量总体均值值在1-置信水平平下的置信区间间为t分布t分布是类类似正态态分布的的一种对对称分布布,它通通常要比比正态分分布平坦坦和分散散。一个个特定的的分布依依赖于称称之为自自由度的的参数。。随着自自由度的的增大,,分布也也逐渐趋趋于正态态分布xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z总体均值值的区间间估计(例题分析析)【例】已知某种种灯泡的的寿命服服从正态态分布,,现从一一批灯泡泡中随机机抽取16只,测得得其使用用寿命(小时)如下。建建立该批批灯泡平平均使用用寿命95%的置信区区间16灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470总体均值值的区间间估计(例题分析析)解:已知X~N(,2),n=16,,1--=95%,t/2=2.131根据样本本数据计计算得::,,总体均值值在1-置信水平平下的置置信区间间为该种灯泡泡平均使使用寿命命的置信信区间为为1476.8小时~1503.2小时总体均值值的区间间估计(例题分析析SPSS)16灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470Analyze→CompareMeans→One--SampleTTest总体比例例的区间间估计总体比例例的区间间估计1.假假定条件件总体服从从二项分分布可以由正正态分布布来近似似使用正态态分布统统计量z3.总体比例例在1-置信水平平下的置信区区间为总体比例例的区间间估计(例题分析析)【例】某城市想想要估计计下岗职职工中女女性所占占的比例例,随机机地抽取取了100名下岗职职工,其其中65人为女性性职工。。试以95%的置信水水平估计计该城市市下岗职职工中女女性比例例的置信信区间解:已知n=100,p=65%,1-=95%,z/2=1.96该城市下下岗职工工中女性性比例的的置信区区间为55.65%~~74..35%%总体方差差的区间间估计总体方差差的区间间估计1.估估计一个个总体的的方差或或标准差差2.假假设总体体服从正正态分布布总体方差差2的点估计计量为s2,且4.总体方差差在1-置信水平平下的置置信区间间为总体方差差的区间间估计(图示)221-2总体方差1-的置信区间自由度为n-1的2总体方差差的区间间估计(例题分析析)【例】一家食品品生产企企业以生生产袋装装食品为为主,现现从某天天生产的的一批食食品中随随机抽取取了25袋,测得得每袋重重量如下下表所示示。已知知产品重重量的分分布服从从正态分分布。以以95%的置信水水平建立立该种食食品重量量方差的的置信区区间25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体方差差的区间间估计(例题分析析)解:已知n=25,1-=95%,,根据样本本数据计计算得s2=93..212置信度为为95%的置信区区间为该企业生生产的食食品总体体重量标标准差的的的置信信区间为7.54g~13.43g7.7两个总体体参数的的区间估估计7.7..1两两个总总体均值值之差的的区间估估计7.7..2两两个总总体比例例之差的的区间估估计7.7..3两两个总总体方差差比的区区间估计计两个总体体参数的的区间估估计总体参数符号表示样本统计量均值之差比例之差方差比两个总体体均值之之差的区区间估计计(独立大样样本)两个总体体均值之之差的估估计(大样本)1.假假定条件件两个总体都服服从正态态分布,,12、22已知若不是正正态分布布,可可以用正正态分布布来近似似(n130和n230)两个样本本是独立立的随机机样本使用正态态分布统统计量z两个总体体均值之之差的估估计(大样本)1.12,22已知时,,两个总体体均值之之差1-2在1-置信水平平下的置置信区间间为12、22未知时,,两个总体体均值之之差1-2在1-置信水平平下的置置信区间间为两个总体体均值之之差的估估计(例题分析析)【例】某地区教教育委员员会想估估计两所所中学的的学生高高考时的的英语平平均分数数之差,,为此在在两所中中学独立立抽取两两个随机机样本,,有关数数据如右右表。。建立两两所中学学高考英英语平均均分数之之差95%的置信区区间

两个样本的有关数据

中学1中学2n1=46n1=33S1=5.8S2=7.2English两个总体体均值之之差的估估计(例题分析析)解:两个总体体均值之之差在1-置信水平平下的置置信区间间为两所中学学高考英英语平均均分数之之差的置置信区间间为5.03分~10..97分两个总体体均值之之差的区区间估计计(独立小样样本)两个总体体均值之之差的估估计(小样本:12=22)1.假假定条件件两个总体都服服从正态态分布两个总体体方差未未知但相相等:12=22两个独立立的小样样本(n1<30和n2<30)总体方差差的合并并估计量量估计量x1-x2的抽样标标准差两个总体体均值之之差的估估计(小样本:12=22)两个样本本均值之之差的标标准化两个总体体均值之之差1-2在1-置信水平平下的置置信区间间为两个总体体均值之之差的估估计(例题分析析)【例】为估计两两种方法法组装产产品所需需时间的的差异,,分别对对两种不不同的组组装方法法各随机机安排12名工人,,每个工工人组装装一件产产品所需需的时间间(分钟钟)下如如表。假定两种种方法组组装产品品的时间间服从正正态分布布,且方方差相等等。试以以95%的置信水水平建立立两种方方法组装装产品所所需平均均时间差差值的置置信区间间两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521两个总体体均值之之差的估估计(例题分析析)解:根据样本本数据计计算得合并估计计量为::两种方法法组装产产品所需需平均时时间之差差的置信信区间为为0.14分钟~7.26分钟两个总体体均值之之差的估估计(例题分析析SPSS)两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521Analyze→CompareMeans→Independent-SamplesTTest两个总体体均值之之差的估估计(小样本:1222)1.假假定条件件两个总体都服服从正态态分布两个总体体方差未未知且不不相等::1222两个独立立的小样样本(n1<30和n2<30)使用统计计量两个总体体均值之之差的估估计(小样本:1222)两个总体体均值之之差1-2在1-置信水平平下的置置信区间间为自由度两个总体体均值之之差的估估计(例题分析析)【例】沿用前例例。假定定第一种种方法随随机安排排12名工人,,第二种种方法随随机安排排8名工人,,即n1=12,n2=8,所得的有有关数据据如表。。假定两两种方法法组装产产品的时时间服从从正态分分布,且且方差不不相等。。以95%的置信水水平建立立两种方方法组装装产品所所需平均均时间差差值的置置信区间间两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.221两个总体体均值之之差的估估计(例题分析析)解:根据样本本数据计计算得自由度为为:两种方法法组装产产品所需需平均时时间之差差的置信信区间为为0.192分钟~9.058分钟两个总体体均值之之差的区区间估计计(匹配样本本)两个总体体均值之之差的估估计(匹配大样样本)假定条件件两个匹配配的大样样本(n130和n230)两个总体体各观察察值的配配对差服服从正态态分布两个总体体均值之之差d=1-2在1-置信水平平下的置置信区间间为对应差值的均值对应差值的标准差两个总体体均值之之差的估估计(匹配小样样本)假定条件件两个匹配配的小样样本(n1<30和n2<30)两个总体体各观察察值的配配对差服服从正态态分布两个总体体均值之之差d=1-2在1-置信水平平下的置置信区间间为两个总体体均值之之差的估估计(例题分析析)【例】由10名学生组组成一个个随机样样本,让让他们分分别采用用A和B两套试卷卷进行测测试,结结果如下下表。。试建立立两种试试卷分数数之差d=1-295%的置信区区间

10名学生两套试卷的得分学生编号试卷A试卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916STATISTICS两个总体体均值之之差的估估计(例题分析析)解:根据样本本数据计计算得两种试卷卷所产生生的分数数之差的的置信区区间为6.33分~15..67分两个总体体均值之之差的估估计(例题分析析SPSS)Analyze→CompareMeans→Paired--SamplesTTest

10名学生两套试卷的得分学生编号试卷A试卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916STATISTICS两个总体体比例之之差区间间的估计计1.假假定条件件两个总体服从从二项分分布可以用正正态分布布来近似似两个样本本是独立立的2.两两个总体体比例之之差1-2在1-置信水平平下的置置信区间间为两个总体体比例之之差的区区间估计计两个总体体比例之之差的估估计(例题分析析)【例】在某个电电视节目目的收视视率调查查中,农农村随机机调查了了400人,有32%的人收看看了该节节目;城城市随机机调查了了500人,有45%的人收看看了该节节目。试试以90%的置信水水平估计计城市与与农村收收视率差差别的置置信区间间12两个总体体比例之之差的估估计(例题分析析)解:已知n1=500,n2=400,p1=45%%,p2=32%%,1-=95%%,z/2=1.961-2置信度为为95%的置信区区间为城市与农农村收视视率差值值的置信信区间为为6.68%~19.32%两个总体体方差比比的区间间估计两个总体体方差比比的区间间估计1.比比较两个个总体的的方差比比用两个样样本的方方差比来来判断如果S12/S22接近于1,说明两个个总体方方差很接接近如果S12/S22远离1,说明两个个总体方方差之间间存在差差异总体方差差比在1-置信水平平下的置置信区间间为两个总体体方差比比的区间间估计(图示)FF1-F总体方差比1-的置信区间方差比置信区间示意图两个总体体方差比比的区间间估计(例题分析析)【例】为了研究究男女学学生在生生活费支支出(元)上的差异异,在某某大学各各随机抽抽取25名男学生生和25名女学生生,得到到下面的的结果::男学生::女学生::试以90%置信水平平估计男男女学生生生活费费支出方方差比的的置信区区间两个总体体方差比比的区间间估计(例题分析析)解:根据自由由度n1=25--1=24,n2=25--1=24,查得F/2(24))=1..98,F1-/2(24))=1//1.98=0.50512/22置信度为为90%的置信区区间为男女学生生生活费费支出方方差比的的置信区区间为0.47~1..847.8样本容量量的确定定7.8..1估估计总总体均值值时样本本容量的的确定7.8..2估估计总总体比例例时样本本容量的的确定7.8..3估估计两两个总体体均值之之差时样样本容量量的确定定7.8..4估估计两两个总体体比例之之差时样样本容量量的确定定估计总体体均值时时样本容容量的确确定估计总体体均值时时样本容容量n为样本容量量n与总体方方差2、边际误误差E、可靠性性系数Z或t之间的关关系为与总体方方差成正正比与边际误误差成反反比与可靠性性系数成成正比估计总体体均值时时样本容容量的确确定其中:估计总体体均值时时样本容容量的确确定(例题分析析)【例】拥有工商商管理学学士学位位的大学学毕业生生年薪的的标准差差大约为为2000元,假定定想要估估计年薪薪95%的置信区区间,希希望边际际误差为为400元,应抽抽取多大大的样本本容量??估计总体体均值时时样本容容量的确确定(例题分析析)解:已知=500,E=200,1-=95%%,z/2=1.96应抽取的的样本容容量为即应抽取取97人作为样样本估计总体体比例时时样本容容量的确确定根据比例例区间估估计公式式可得样样本容量量n为估计总体体比例时时样本容容量的确确定E的取值一一般小于于0.1未知时,,可取最最

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论