![第6章抽样推断_第1页](http://file3.renrendoc.com/fileroot_temp3/2021-12/19/5ae1e93b-2b2f-40f7-add6-9eb02a9f169a/5ae1e93b-2b2f-40f7-add6-9eb02a9f169a1.gif)
![第6章抽样推断_第2页](http://file3.renrendoc.com/fileroot_temp3/2021-12/19/5ae1e93b-2b2f-40f7-add6-9eb02a9f169a/5ae1e93b-2b2f-40f7-add6-9eb02a9f169a2.gif)
![第6章抽样推断_第3页](http://file3.renrendoc.com/fileroot_temp3/2021-12/19/5ae1e93b-2b2f-40f7-add6-9eb02a9f169a/5ae1e93b-2b2f-40f7-add6-9eb02a9f169a3.gif)
![第6章抽样推断_第4页](http://file3.renrendoc.com/fileroot_temp3/2021-12/19/5ae1e93b-2b2f-40f7-add6-9eb02a9f169a/5ae1e93b-2b2f-40f7-add6-9eb02a9f169a4.gif)
![第6章抽样推断_第5页](http://file3.renrendoc.com/fileroot_temp3/2021-12/19/5ae1e93b-2b2f-40f7-add6-9eb02a9f169a/5ae1e93b-2b2f-40f7-add6-9eb02a9f169a5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.第六章第六章 抽样推断抽样推断教学目的与要求教学目的与要求抽样推断是抽样调查的继续,它提供了一抽样推断是抽样调查的继续,它提供了一套利用抽样资料来估计总体数量特征的方套利用抽样资料来估计总体数量特征的方法。通过本章的学习,要理解和掌握抽样法。通过本章的学习,要理解和掌握抽样估计的概念、特点,抽样误差的含义、计估计的概念、特点,抽样误差的含义、计算方法,抽样估计的置信度,推断总体参算方法,抽样估计的置信度,推断总体参数的方法,能结合实际资料进行抽样估计。数的方法,能结合实际资料进行抽样估计。.抽样推断的意义和作用抽样误差抽样估计的方法抽样的组织设计.一、抽样推断的概念和特点一、抽样推断的概念和
2、特点概念概念抽样推断是按随机原则从全部研究对象中抽取抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计总体的数量特征作出具有一定可靠程度的估计和判断和判断。特点特点 按随机原则抽选调查单位。按随机原则抽选调查单位。 从数量上推断总体。从数量上推断总体。 抽样推断运用概率估计的方法抽样推断运用概率估计的方法。 抽样推断的误差可以事先计算并加以控制。抽样推断的误差可以事先计算并加以控制。第一节第一节 抽样推断的意义和作用抽样推断的意义和作用.二、抽样推断的作用二、抽样推断的作用三、有关抽样
3、的基本概念三、有关抽样的基本概念(一)总(一)总 体体 和和 样样 本本总体总体也称全及总体。指所要认识的研究对象全体。也称全及总体。指所要认识的研究对象全体。总体单位总数用总体单位总数用“N”N”表示。表示。样本样本又称子样。是从全及总体中随机抽取出来,作又称子样。是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。为代表这一总体的那部分单位组成的集合体。样本单位总数用样本单位总数用“n”n”表示。表示。1、有些客观现象需要了解全面情况、有些客观现象需要了解全面情况2、可以补充、核对全面调查的结果、可以补充、核对全面调查的结果3、用于工业生产过程的质量控制、用于工业生产过程
4、的质量控制4、对总体的某种假设进行检验、对总体的某种假设进行检验.(二)总体指标与样本指标(二)总体指标与样本指标总总体体指指标标研究总体中研究总体中的数量标志的数量标志总体平均数总体平均数总体方差总体方差X=X NX=XF F(X-X) N2=2(X-X)F F2=2研究总体中研究总体中的品质标志的品质标志总体成数总体成数成数方差成数方差2= P(1-P)P = N1N.样本指标样本指标研究数研究数量标志量标志 样本平均数样本平均数 样本标准差样本标准差研究品研究品质标质质标质成数标准差成数标准差 nxx2ffxxx2ppp1样本成数样本成数 nnp1fxfxnxx.(三)样本容量和样本个数
5、(三)样本容量和样本个数样本容量:样本容量:一个样本包含的单位数。用一个样本包含的单位数。用 “n”表示。表示。一般要求一般要求 n 30样本个数:样本个数:从一个全及总体中可能抽取的样本数目。从一个全及总体中可能抽取的样本数目。(四)(四)重复抽样和不重复抽样重复抽样和不重复抽样重复抽样:又称回置抽样。又称回置抽样。不重复抽样不重复抽样:又称不回置抽样。又称不回置抽样。可能组成的样本数目可能组成的样本数目可能组成的样本数目可能组成的样本数目不考虑顺序不考虑顺序)!1( !)!1(NnnN考虑顺序考虑顺序)!(!nNN不考虑顺序不考虑顺序!)!(!nnNN考虑顺序考虑顺序nN.标号为A、B、C
6、、D的四个圆球从中随机抽取两个考虑顺序考虑顺序nNAA、AB、AC、ADBA 、BB、BC、BDCA、CB、CC、CDDA、DB、DC、DD可能样本个数不考虑顺序不考虑顺序)!1( !)!1(NnnNAA、AC、BA 、BB、BDCB、CC、DA、DC、DD考虑顺序考虑顺序)!(!nNN重复不重复AB、AC、ADBA 、BC、BDCA、CB、CDDA、DB、DC不考虑顺序不考虑顺序!)!(!nnNNAB、AC、ADBD、CB、DC.第二节第二节 抽抽 样样 误误 差差一、抽样误差的含义一、抽样误差的含义由于随机抽样的偶然因素使样本各单位的结构不足由于随机抽样的偶然因素使样本各单位的结构不足以代
7、表总体各单位的结构,而引起抽样指标和全及以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。指标之间的绝对离差。二、影响抽样误差大小的因素二、影响抽样误差大小的因素1 1、总体各单位标志值的差异程度、总体各单位标志值的差异程度2 2、样本的单位数、样本的单位数3 3、抽样方法、抽样方法4 4、抽样调查的组织形式、抽样调查的组织形式.三、抽样平均误差三、抽样平均误差1、概念、概念:抽样平均误差是抽样平均数或抽样成数的抽样平均误差是抽样平均数或抽样成数的 标准差。反映了抽样平均数与总体平均数标准差。反映了抽样平均数与总体平均数 抽样成数与总体成数的平均误差程度。抽样成数与总体成数的平均
8、误差程度。2、计算方法:、计算方法:抽样平均数的平均误差抽样成数平均误差MXxx2MPpp2所有可能样本指标:x总体平均数指标:X所有可能样本数目:M所有可能样本指标:p总体成数指标:P.实例分析实例分析:设有四个工人工资分别为:设有四个工人工资分别为4040、5050、7070、8080元,现在随机从元,现在随机从其中抽取其中抽取2 2人,并求平均工资,用以代表人,并求平均工资,用以代表4 4人总体的平均工资水平,如人总体的平均工资水平,如果采用重复抽样,则所有可能样本以及平均工资如下表:果采用重复抽样,则所有可能样本以及平均工资如下表:序号序号样本变量样本变量 样本平均数样本平均数离差离差
9、离差平方离差平方123440,4040,5040,7040,8040455560-20-15-50400225250567850,4050,5050,7050,8045506065-15-1005225100025910111270,4070,5070,7070,8055607075-5010152501002251314151680,4080,5080,7080,8060657580051520025225400合计合计-96002000)(xx)(xx2)(xx.元样本可能数目样本平均数的平均数6016960)(xx元样本可能数目样抽样平均误差18.11162000)(2xxx元总平均工资
10、604240480705040NXX四个工人工资分别为四个工人工资分别为40、50、70、80元元81.15410002NXX)(标准差元抽样平均误差18.11281.15nxXx )(所以所以.NXXX,21设总体变量有N个nxxx,21样本容量有n个nxxxxn21则:则:NXXXXN21)()(21nxxxxn)()()(121nxxxn 由于 都是取自总体 中,它与总体同分布,所以nxxx,21NXXX,21XNXXxxxNiin1)()()()(121XXXXnx)(1)(所以所以.22)(xxx2Xx 221nXXXnxxxn抽样平均数的平均误差抽样平均数的平均误差2212)()(
11、)(1XxXxXxnn jijinXxXxXxXxXxn)()()()(1222212222212)()()(1XxXxXxnnnnn222)(1所以所以: :nx交叉项为零交叉项为零221222211)()()()(NXXXxXxXxNiin.抽样平均数平均误差的计算公式抽样平均数平均误差的计算公式:采用重复抽样采用重复抽样此公式说明,抽样平均误差与总体标准差成正比,此公式说明,抽样平均误差与总体标准差成正比,与样本容量成反比。(当总体标准差未知时,可与样本容量成反比。(当总体标准差未知时,可用样本标准差代替)用样本标准差代替)通过例题可说明以下几点通过例题可说明以下几点:样本平均数的平均数
12、等于总体平均数样本平均数的平均数等于总体平均数。抽样平均数的标准差仅为总体标准差的抽样平均数的标准差仅为总体标准差的可通过调整样本单位数来控制抽样平均误差可通过调整样本单位数来控制抽样平均误差。nxn1nsx.例题:假定抽样单位数增加例题:假定抽样单位数增加 2 2 倍、倍、0.50.5倍时,抽倍时,抽样平均误差怎样变化?样平均误差怎样变化?解解:抽样单位数增加抽样单位数增加 2 倍,即为原来的倍,即为原来的 3 倍倍则:则:抽样单位数增加抽样单位数增加 0.5倍,即为原来的倍,即为原来的 1.5倍倍则:则:nnnx577. 0313nnnx8165. 05 . 115 . 1即:即:当样本单
13、位数增加当样本单位数增加2 2倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.5770.577。即:即:当样本单位数增加当样本单位数增加0.50.5倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.81650.8165。.数理统计证明采用不重复抽样误差公式数理统计证明采用不重复抽样误差公式:公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与总体单位数的多少有关。例题一例题一:随机抽选某校学生随机抽选某校学生100100人,调查他们的体重。得人,调查他们的体重。得到他们的平均体重为到他们的平均体重为5858公斤,标准差为公斤,标准差为1010公斤。公斤。问抽样推断的平均
14、误差是多少?问抽样推断的平均误差是多少?例题二:例题二:某厂生产一种新型灯泡共某厂生产一种新型灯泡共20002000只,随机抽出只,随机抽出400400只作耐用时间试验,测试结果平均使用寿命为只作耐用时间试验,测试结果平均使用寿命为48004800小时,样本标准差为小时,样本标准差为300300小时,求抽样推断小时,求抽样推断的平均误差?的平均误差?NnnNnNnx1122. 下面求下面求 的无偏估计的无偏估计 的方差的方差Yy)(yV22)(YyYyyCnN对称性论证:对称性论证:2)(Yyy212)(1Yynnii22)(1Yynn)(2)(1212YyYyYynjnjiinii.)(2)
15、(1)(212YyYyYynyjnjiinii2121)()(YYNnYyNiinii)() 1() 1()(YYYYNNnnYyYyjNjiijnjiiNiNjijiiYYYYNnnNYYnNy12)(112)(1)(212121)()()()(2NiiNiiNiiNjijiYYYYYYYYYY NiiYYNNnNn12)(111NiiYYNnnNy12)()111 (1)(因为:因为:所以:所以:nNnN21 nSNn2)1( (或(或 )其中:0.Yy )()(1)()(11niiniiynnyyNXYNii1NXynNiinii11)(1NiiniiYNny11)(2121)()(YY
16、NnYyNiinii.例题一解例题一解)(110010公斤nx即即:当根据样本学生的平均体重估计全部学生的平均当根据样本学生的平均体重估计全部学生的平均 体重时体重时, ,抽样平均误差为抽样平均误差为1 1公斤。公斤。例题二解例题二解)(15400300小时nxNnnx12)(42.13200040014003002小时计算结果表明:计算结果表明: 根据部分产品推断全部产品的平均使用寿命时,采用根据部分产品推断全部产品的平均使用寿命时,采用 不重复抽样比重复抽样的平均误差要小。不重复抽样比重复抽样的平均误差要小。已知:已知:10,58,100 xn则:则:已知:已知:300,4800,400,
17、2000 xnN则:则:.抽样成数平均误差的计算公式抽样成数平均误差的计算公式采用重复抽样采用重复抽样:采用不重复抽样:采用不重复抽样:例题三例题三: 某校随机抽选某校随机抽选400400名学生,发现戴眼镜的学名学生,发现戴眼镜的学生有生有8080人。根据样本资料推断全部学生中戴人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?眼镜的学生所占比重时,抽样误差为多大?例题四例题四:一批食品罐头共一批食品罐头共6000060000桶,随机抽查桶,随机抽查300300桶桶,发现有,发现有6 6桶不合格,求合格品率的抽样平桶不合格,求合格品率的抽样平均误差?均误差?nppp1Nnn
18、ppp11.例例 题题 三三 解解已知:已知:400n801n则:样本成数则:样本成数%20400801nnp02. 04008 . 02 . 01nppp即:即:根据样本资料推断全部学生中戴眼镜的学根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为生所占的比重时,推断的平均误差为2%2%。.例题例题已知:已知:60000N300n61n则:样本合格率则:样本合格率98. 030063001nnnp(%)808. 030002. 098. 01npppNnnppp11(%)806. 060000300130002. 098. 0计算结果表明计算结果表明:不重复抽样的平均误差
19、小于重复抽样,不重复抽样的平均误差小于重复抽样, 但是但是“N”N”的数值越大,则两种方法计算的数值越大,则两种方法计算 的抽样平均误差就越接近。的抽样平均误差就越接近。.四、抽样极限误差四、抽样极限误差含义含义:抽样极限误差指在进行抽样估计时,根据研究对象的变抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围。之间可允许的最大误差范围。计算方法计算方法:它等于样本指标可允许变动的上限或下限与总体指标它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。之差的绝对值。抽样
20、平均数极限误差抽样平均数极限误差:抽样成数极限误差:抽样成数极限误差:XxxPppppPppxxXxx.五、抽样误差的概率度五、抽样误差的概率度含义含义:抽样误差的概率度是测量抽样估计可靠程度的一抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号个参数。用符号“ t ”t ”表示。表示。公式表示:公式表示: (t t 是极限误差与抽样平均误差的比值)是极限误差与抽样平均误差的比值)(极限误差是(极限误差是 t t 倍的抽样平均误差)倍的抽样平均误差)上式可变形为:上式可变形为:xxtpptxxtppt.例题一例题一:要估计某批优良水稻品种种子的平均千粒重要估计某批优良水稻品种种子的平均千
21、粒重, ,现在随机现在随机从该批种子抽取从该批种子抽取1 1市斤市斤, ,计数共计数共1250012500粒粒, ,折合平均每千粒折合平均每千粒重重, , 如果确定极限误差范围为如果确定极限误差范围为8 8克克, ,这就要求该这就要求该批种子的平均每千粒重落在批种子的平均每千粒重落在 , ,即在即在3232克到克到4848克克之间之间 克840克40 x例题二例题二:%921000801p要估计某农作物幼苗的成活率要估计某农作物幼苗的成活率, ,从播种这一品种的秧苗从播种这一品种的秧苗地快中随机抽取秧苗地快中随机抽取秧苗10001000株株, ,其中死苗其中死苗8080株株, ,则秧苗成则秧苗
22、成活率活率 。如果确定极限误差范围为。如果确定极限误差范围为5%5%,这就要求该农作物成活率这就要求该农作物成活率 p p 落在落在 即落在即落在87% 87% 至至 97% 97% 之间之间%5%92假设上例一中的抽样平均误差为假设上例一中的抽样平均误差为克4x248xxt则:则:于是抽样误差可能范围为:于是抽样误差可能范围为:克x240 假设上例二中的抽样平均误差为假设上例二中的抽样平均误差为%3p则:则:67.1%3%5ppt于是抽样误差可能范围为:于是抽样误差可能范围为:p67.1%92.六、抽样误差的可靠程度六、抽样误差的可靠程度抽样极限误差的估计总是要和一定的概率保证程度联系在一起
23、的。抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。因为既然抽样误差是一个随机变量,就不能期望抽样平均数(成数)因为既然抽样误差是一个随机变量,就不能期望抽样平均数(成数)落在一定区间内是一个必然事件,而只是给予一定的概率保证而已落在一定区间内是一个必然事件,而只是给予一定的概率保证而已所以我们在进行抽样估计时,不但要考虑抽样误差的可能范围有多所以我们在进行抽样估计时,不但要考虑抽样误差的可能范围有多大而且还必须考虑落到这一范围的概率有多少,前者是估计的精确大而且还必须考虑落到这一范围的概率有多少,前者是估计的精确度问题,后者是估计的可靠性问题,两者密不可分。度问题,后者是估计的可靠
24、性问题,两者密不可分。为了说明这个关系,我们举一个实例来说明:为了说明这个关系,我们举一个实例来说明:设有五位射击选手设有五位射击选手, ,他们的得分各为他们的得分各为2 2、4 4、6 6、8 8、1010分,很显然总分,很显然总平均成绩为平均成绩为 。现在随机选两名选手的平均成绩来估。现在随机选两名选手的平均成绩来估计总平均成绩水平。计总平均成绩水平。分6)( X.假如采用不重复取样,(不考虑顺序),样本分布为:假如采用不重复取样,(不考虑顺序),样本分布为:序号序号样本变量样本变量 样本平均数样本平均数12342,42,62,8 2,10345656784,64,8 4,106,8567
25、7910 6,10 8,1089 样本变量样本变量 3456789 概率概率 p pi i1/101/10 2/10 2/10 2/101/101/10各样本平均数的分布频率:各样本平均数的分布频率:x.根据上列概率分布,可以求出各区间抽样平均数的概率:根据上列概率分布,可以求出各区间抽样平均数的概率:2 . 0102)6(xp6 . 0106)75( xp8 . 0108)84( xp11010)93( xp2 . 00)( Xxp6 . 01)( Xxp8 . 02)( Xxp13)( Xxp上式说明抽样极限误差的概率,例如极限误差为上式说明抽样极限误差的概率,例如极限误差为1 1,即总体
26、平均,即总体平均数落在之间的概率为数落在之间的概率为0.6,0.6,极限误差为极限误差为2 2的概率为的概率为0.80.8等等。这说等等。这说明抽样极限误差一定是与概率的可靠程度联系在一起的。要确明抽样极限误差一定是与概率的可靠程度联系在一起的。要确定抽样平均数(成数)落在一定区间的概率,必须研究抽样平定抽样平均数(成数)落在一定区间的概率,必须研究抽样平均数(成数)的分布规律。均数(成数)的分布规律。.由于由于N=5 n=2 N=5 n=2 8273. 1)1525(28)1(2NnNnx极限误差用抽样极限误差用抽样平均误差来表示平均误差来表示 由不重复抽样的基本公式得:由不重复抽样的基本公
27、式得: 6 . 058. 01xx8 . 016. 12xx173. 13xx由正态分布理论,介绍两个重要定理:由正态分布理论,介绍两个重要定理:定理一:定理一:可以看出可以看出 前面的值越大,可靠程度,即概率越高前面的值越大,可靠程度,即概率越高x当总体为正态分布当总体为正态分布 N N( )( ),则从这个总体抽取容量为,则从这个总体抽取容量为 n n的的的全部样本平均数也服从于正态分布,其平均数的全部样本平均数也服从于正态分布,其平均数 ,其,其标准差为标准差为 2)(xn.定理二:定理二:XX如果变量如果变量 X X 的分布具有有限的平均数的分布具有有限的平均数 和标准差和标准差,则从这个总体抽取容量为,则从这个总体抽取容量为 n n的全部样本,其平均数的分的全部样本,其平均数的分布随着布随着 n n 的增大而趋近于平均数为的增大而趋近于平均数为 ,标准差为,标准差为的正态分布。的正态分布。n 定理定理2 2并不要求总体分布是正态的,甚至可以是不知道的,并不要求总体分布是正态的,甚至可以是不知道的,只要样本的容量增大,抽样平均数就趋于正态分布。这和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一年级数学两位数加减一位数题过关检测习题
- 2025年度酒店前台职位聘用合同范本
- 2025年度酒库房租赁与酒类旅游线路开发合同
- 度战略合作合同协议书
- 2025年度农民工安全生产责任合同
- 2025年度工业节能环保设备投资合作合同样本
- 2025年度新型绿色建筑模板合同
- 2025年度教育贷款合同范本
- 2025年度在线教育平台用户数据分析与运营优化合同
- 2025年度光伏发电站水电配套工程承包合同
- 长江委水文局2025年校园招聘17人历年高频重点提升(共500题)附带答案详解
- 2025年湖南韶山干部学院公开招聘15人历年高频重点提升(共500题)附带答案详解
- 广东省广州市番禺区2023-2024学年七年级上学期期末数学试题
- 不可切除肺癌放疗联合免疫治疗专家共识(2024年版)j解读
- 教科版科学六年级下册14《设计塔台模型》课件
- 智研咨询发布:2024年中国MVR蒸汽机械行业市场全景调查及投资前景预测报告
- JGJ46-2024 建筑与市政工程施工现场临时用电安全技术标准
- 家谱、宗谱颁谱庆典讲话
- 二年级一起长大的玩具原文一起长大的玩具.doc
- 青岛版小学科学三年级下册《太阳和影子》教学设计
- 电梯质量验收记录表
评论
0/150
提交评论