第七章抽样调查(改)_第1页
第七章抽样调查(改)_第2页
第七章抽样调查(改)_第3页
第七章抽样调查(改)_第4页
第七章抽样调查(改)_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、4 - 4 - 4 - 1 1 1引引例例1 1 如想得知全校同学的平均身高。可行的方法是什如想得知全校同学的平均身高。可行的方法是什么?么?以全校同学为以全校同学为总体总体,考虑到全校,考虑到全校2000020000名学生的规名学生的规模,模,普查普查是不可取的。是不可取的。因此可行的方法是:采用因此可行的方法是:采用随机随机抽取部分同学(如抽取部分同学(如100100或或200200名)组成一个名)组成一个样本。样本。测量每个同学的身高测量每个同学的身高(样本标志值),计算样本平均身高(样本(样本标志值),计算样本平均身高(样本统计统计量量)。然后利用样本平均身高估计总体平均身高)。然后利

2、用样本平均身高估计总体平均身高(总体参数总体参数)。)。4 - 4 - 4 - 2 2 2引引例例2 2 如想得知一批灯泡的平均寿命和合格率,若定义如想得知一批灯泡的平均寿命和合格率,若定义寿命指灯泡从点亮一直到灯丝烧掉的时间,该时间在寿命指灯泡从点亮一直到灯丝烧掉的时间,该时间在10001000小时以上为合格。可行的方法是小时以上为合格。可行的方法是以全部灯泡为以全部灯泡为总体总体,考虑到该实验是破坏性实验,考虑到该实验是破坏性实验,普查普查是不可取的。是不可取的。因此可行的方法是:采用因此可行的方法是:采用随机随机抽取部分抽取部分灯泡灯泡(如(如100100或或200200名)组成一个名)

3、组成一个样本。样本。测量每个灯泡的寿命测量每个灯泡的寿命(样本标志值),计算样本平均寿命和合格比例(样本标志值),计算样本平均寿命和合格比例(样本(样本统计量统计量)。然后利用样本平均身高估计总体)。然后利用样本平均身高估计总体平均寿命和合格率(平均寿命和合格率(总体参数总体参数)。)。4 - 4 - 4 - 3 3 3容量为容量为n n的所有的所有可能样本可能样本抽取抽取总体总体, ,容量为容量为N N计算每个样本计算每个样本统计量统计量例如:样本均值、例如:样本均值、成数、方差成数、方差对频数分布数据进行对频数分布数据进行总体数字总体数字特征(如总特征(如总体均值、成数、方差体均值、成数、

4、方差等)等)分析分析将被来自不同样本的不同将被来自不同样本的不同统计量统计量观测值分组排列观测值分组排列,将,将对应每个观对应每个观测值的测值的相对出现频数排成另一列相对出现频数排成另一列,形成样本统计量的所有可能取,形成样本统计量的所有可能取值的相对值的相对频数分布表频数分布表什么是抽样调查?4 - 4 - 4 - 4 4 4总结总结 要完成上述两个例子的目标,我们仍需回答以下要完成上述两个例子的目标,我们仍需回答以下几个问题:几个问题:1 1、为什么能够用样本统计量估计总体参数、为什么能够用样本统计量估计总体参数2 2、如何保证估计的准确性和可靠性、如何保证估计的准确性和可靠性 要回答以上

5、的问题,需要给同学们介绍以下的知要回答以上的问题,需要给同学们介绍以下的知识,无论是否具有概率论知识,以下的知识应该都能识,无论是否具有概率论知识,以下的知识应该都能理解。理解。4 - 4 - 4 - 5 5 5 第六章第六章 抽样调查抽样调查一、抽样调查的基本概念一、抽样调查的基本概念二、一个简单的假定例子二、一个简单的假定例子三、估计的方法与流程三、估计的方法与流程四、必要抽样单位数的确定四、必要抽样单位数的确定五、假设检验五、假设检验4 - 4 - 4 - 6 6 6一一、抽样调查抽样调查的概念的概念 从从研究总体中按一定的原则抽取部分研究总体中按一定的原则抽取部分单位作为单位作为样样本

6、进行观察研究,以认识总体的一本进行观察研究,以认识总体的一种统计种统计调查方法调查方法,分为随机和分为随机和非非随机抽样。这里随机抽样。这里主要指主要指随机抽样随机抽样 。指样本单位的抽取不受主观因素及指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体其他系统性因素的影响,每个总体单位都有均等的被抽中机会单位都有均等的被抽中机会按照按照随机原则随机原则 从调查对象中抽取一部分单位从调查对象中抽取一部分单位进行进行观察观察,并运用数理统计的原理,以被抽取的那部分,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体做出数量上的推断单位的数量特征为代表,对总体做出数量上的推

7、断分析分析4 - 4 - 4 - 7 7 7q抽样调查抽样调查的目的目的是的是由部分推断整体由部分推断整体q抽选部分单位时遵循抽选部分单位时遵循随机原则随机原则q抽样调查会产生抽样调查会产生抽样误差抽样误差,抽样误,抽样误差可以计算,并可以加以控制差可以计算,并可以加以控制二、抽样调查的特点二、抽样调查的特点4 - 4 - 4 - 8 8 8三、抽样调查三、抽样调查的适用范围的适用范围q有些事物在测量或试验时有破坏性,有些事物在测量或试验时有破坏性,不可以不可以进行全面调查进行全面调查q可以进行全面调查,但可以进行全面调查,但实际上不可行实际上不可行q和全面调查相比,抽样调查能和全面调查相比,

8、抽样调查能节省人力、费节省人力、费用和时间,而且比较灵活用和时间,而且比较灵活q有些情况下,有些情况下,抽样调查结果比全面调查准确抽样调查结果比全面调查准确q用抽样调查的资料用抽样调查的资料修正和补充全面调查资料修正和补充全面调查资料q利用抽样推断方法,可以利用抽样推断方法,可以对某种总体的假设对某种总体的假设进行检验进行检验,判断这种假设的真伪,决定取舍。,判断这种假设的真伪,决定取舍。4 - 4 - 4 - 9 9 9第二节第二节 抽样调查的基本概念及理论依据抽样调查的基本概念及理论依据几组基几组基本概念本概念全及总体全及总体( (总体总体) )抽样总体抽样总体( (样本样本) )重复抽样

9、重复抽样不重复抽样不重复抽样大数定律大数定律中心极限定理中心极限定理研究对象研究对象抽抽取取方方法法研研究究原原理理总体分布总体分布样本分布样本分布抽样分布抽样分布重复考虑顺序重复考虑顺序不重复不考虑不重复不考虑顺序顺序4 - 4 - 4 - 101010一、全及一、全及总体和抽样总体总体和抽样总体全及全及总体:总体:也称总体。指所要也称总体。指所要认识对象的全体认识对象的全体。用用N N表示有限总体的单位数,称表示有限总体的单位数,称总体容量总体容量。全全及及总总体体变量总体变量总体属性总体属性总体(品质标志)(品质标志)无限总体无限总体有限总体有限总体全及总体类型全及总体类型(数量标志)(

10、数量标志)4 - 4 - 4 - 111111抽样抽样总体:总体:也也称称样本样本。从全及总体中随机抽取。从全及总体中随机抽取出来,代表全及总体部分单位的集合体出来,代表全及总体部分单位的集合体用用n n表示抽样总体的表示抽样总体的单位单位数数n30n30,为大样本,为大样本; n30 n30,为,为小样本小样本对同一问题对同一问题,总体总体是唯一的是唯一的,样本样本不唯一不唯一 4 - 4 - 4 - 121212二二、全及指标和抽样指标、全及指标和抽样指标全及全及指标指标:根据全及总体各个单位的标志值或根据全及总体各个单位的标志值或标志特征计算的、反映总体某种属性的综合指标志特征计算的、反

11、映总体某种属性的综合指标。标。是唯一的是唯一的。全全及及指指标标研究总体中研究总体中的数量标志的数量标志总体平均数总体平均数总体方差总体方差研究总体中研究总体中的属性标志的属性标志总体成数总体成数成数方差成数方差X=X NX=XF F(X-X) N2=2(X-X)F F2=22= P(1-P)P = N1N4 - 4 - 4 - 131313研究研究数数量量标志标志 样本平均数样本平均数 样本标准差样本标准差研究研究属属性性标质标质成数标准差成数标准差 nxx2ffxxx2ppp1样本成数样本成数 nnp1fxfxnxx抽抽样样指指标标抽样抽样指标:指标:由抽样总体各个标志值或标志特征由抽样总

12、体各个标志值或标志特征计算的综合指标,计算的综合指标,不是唯一的不是唯一的。4 - 4 - 4 - 141414样本量样本量一个样本包含的单位数,也称样本一个样本包含的单位数,也称样本容量。用容量。用 n表示。样本量越大,抽表示。样本量越大,抽样误差越小,样误差越小,一般一般 n 30为大样本,为大样本,小于小于30为小样本为小样本样本可能样本可能数目数目按不同方式和方法从总体中可能抽按不同方式和方法从总体中可能抽取的样本个数,也称样本可能个数。取的样本个数,也称样本可能个数。一般与抽样方式和抽取要求密切相一般与抽样方式和抽取要求密切相关关三、抽样方法和样本可能数目三、抽样方法和样本可能数目4

13、 - 4 - 4 - 151515重复抽样重复抽样又被称作重置抽样、有放回抽样又被称作重置抽样、有放回抽样抽出抽出个体个体登记登记特征特征放回放回总体总体继续继续抽取抽取特点特点同一总体单位有可能被重复抽中,而同一总体单位有可能被重复抽中,而且每次抽取都是独立进行且每次抽取都是独立进行 可能样本数目可能样本数目(考虑(考虑顺序):顺序):nNNNN共共n n个个2.2.可能可能样本数目样本数目(不考虑(不考虑顺序):顺序):1nNnC 重复重复抽样和不重复抽样抽样和不重复抽样4 - 4 - 4 - 161616标号为标号为A A、B B、C C、D D的四个圆球从中的四个圆球从中随机抽取随机抽

14、取两两个个, ,分析样本个数。分析样本个数。考虑顺序考虑顺序nNAA、AB、AC、ADBA 、BB、BC、BDCA、CB、CC、CDDA、DB、DC、DD可能样本个数可能样本个数不考虑顺序不考虑顺序)!1( !)!1(NnnNAA、AC、BA 、BB、BDCB、CC、DA、DC、DD重重复复抽抽样样4 - 4 - 4 - 171717不重复抽样不重复抽样又称作不重置抽样、不放回抽样又称作不重置抽样、不放回抽样抽出抽出个体个体登记登记特征特征继续继续抽取抽取特点特点同一总体中每个单位被抽中的机会并不均等,同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行在连续抽取时,每

15、次抽取都不是独立进行是最为常用的抽样方法。是最为常用的抽样方法。1 1、 可能样本数目(考虑顺序):可能样本数目(考虑顺序):nNPnNC2 2、 可能样本数目(不考虑顺序)可能样本数目(不考虑顺序):4 - 4 - 4 - 181818标号为标号为A A、B B、C C、D D的四个圆球从中的四个圆球从中随机抽取随机抽取两两个个, ,分析样本个数。分析样本个数。可能样本个数可能样本个数考虑顺序考虑顺序)!(!nNNAB、AC、ADBA 、BC、BDCA、CB、CDDA、DB、DC不考虑顺序不考虑顺序!)!(!nnNNAB、AC、ADBD、CB、DC不不重重复复抽抽样样4 - 4 - 4 -

16、191919总体分布总体分布【例例】设一设一个总体,含有个总体,含有4 4个元素(个体),即总体单个元素(个体),即总体单位数位数N N=4=4。4 4 个个体分别为个个体分别为X X1 1=1=1、X X2 2=2=2、X X3 3=3=3、X X4 4=4 =4 。二、一个简单的假定的例子:二、一个简单的假定的例子:4个数的相对频数分别都为0.25420455.244321x我们想知道的总体参数是总体均值,假定总体均值未知,我们可以如何计算呢?4 - 4 - 4 - 202020 现从总体中抽取现从总体中抽取n n2 2的简单随机样本的简单随机样本,考虑顺序的,考虑顺序的重复抽样,重复抽样

17、,共有共有4 42 2=16=16个样本个样本。所有样本的结果如下:。所有样本的结果如下:3,43,43,33,33,23,23,13,13 32,42,42,32,32,22,22,12,12 24,44,44,34,34,24,24,14,14 41,41,44 41,31,33 32 21 11,21,21,11,11 1第二个观察值第二个观察值第一个第一个观察值观察值所有可能所有可能n n = 2 = 2 的样本(的样本(1616个)个)3.53.53.03.02.52.52.02.03 33.03.02.52.52.02.01.51.52 24.04.03.53.53.03.02.5

18、2.54 42.52.54 42.02.03 32 21 11.51.51.01.01 1第二个观察值第二个观察值第一个第一个观察值观察值1616个样本的均值个样本的均值样本均值的抽样分布1.000.10.20.3P ( x )1.53.04.03.52.02.5x1.0 1.54.0( )2.516E x统计量为均值统计量为均值相对频数相对频数24101610 x4 - 4 - 4 - 212121第一,样本均值分布的平均数,等于总体均值第一,样本均值分布的平均数,等于总体均值第二,样本均值方差等于总体方差的第二,样本均值方差等于总体方差的1/n1/n该例子可得出以下该例子可得出以下随着总体

19、规模的增大,样本可能数目将会急剧增随着总体规模的增大,样本可能数目将会急剧增加(考虑引例加(考虑引例1 1中从中从2000020000名同学中抽名同学中抽100100人),而人),而这些每一个可能样本都可以计算出一个这些每一个可能样本都可以计算出一个样本均值样本均值如果有足够的时间精力将这些样本都计算出来,如果有足够的时间精力将这些样本都计算出来,得到的分布是否符合上述例子中的结论呢?得到的分布是否符合上述例子中的结论呢?4 - 4 - 4 - 222222由概率论的知识可知,是符合的。由于太多数目由概率论的知识可知,是符合的。由于太多数目的样本均值的分布(而这是常态)我们也可以用的样本均值的

20、分布(而这是常态)我们也可以用连续的分布来描述。进一步我们可得出以下结论连续的分布来描述。进一步我们可得出以下结论一、样本单位数越大,样本分布越接近总体分布一、样本单位数越大,样本分布越接近总体分布二、如果二、如果总体很大总体很大,而且,而且服从正态分布服从正态分布,则样本,则样本均值的分布也服从正态分布;均值的分布也服从正态分布;三三、如果如果总体很大总体很大,但,但不服从正态分布不服从正态分布,只要,只要样样本单位数足够大本单位数足够大( n30 ),样本均值的分布也),样本均值的分布也趋近于正态分布。趋近于正态分布。需进一步了解的同学可自行百度需进一步了解的同学可自行百度“大数定理大数定

21、理”“”“中心极限定理中心极限定理”。这里不做进一步解释。这里不做进一步解释该例子可得出以下该例子可得出以下4 - 4 - 4 - 2323230.6827正态分布的性质(下图):正态分布的性质(下图):1 1、图形形态对称、图形形态对称2 2、离对称轴越近的值出现的概率越高、离对称轴越近的值出现的概率越高3 3、离对称轴一定距离的范围内的取值的概率(可、离对称轴一定距离的范围内的取值的概率(可能性)可以计算。能性)可以计算。请将上页及本页的结论用于说明引例请将上页及本页的结论用于说明引例1 1和引例和引例2 2中的样中的样本统计量的分布本统计量的分布xxx3x3x2x20.95450.997

22、3Z4 - 4 - 4 - 242424对引例对引例1 1,由以下结论:,由以下结论:若真能获得所有的样本,则有若真能获得所有的样本,则有1 1、如果增加被抽取的同学数量,则得到的样本身、如果增加被抽取的同学数量,则得到的样本身高分布将越来越接近于全部同学的身高分布高分布将越来越接近于全部同学的身高分布2 2、在样本容量不变时,则通过每一个样本计算出、在样本容量不变时,则通过每一个样本计算出来的平均身高将服从正态分布,且参数为来的平均身高将服从正态分布,且参数为( )回答:回答:2x4 - 4 - 4 - 252525三、估计的方法和流程三、估计的方法和流程在上节中,我们通过假定在上节中,我们

23、通过假定“所有可能样本已获得所有可能样本已获得”说说明样本统计量和总体参数的关系。明样本统计量和总体参数的关系。考虑:实际抽样中我们能否得到所有的样本?考虑:实际抽样中我们能否得到所有的样本?问题:问题:那如何根据这唯一的样本估计总体参数的那如何根据这唯一的样本估计总体参数的值呢?值呢?答:不可能。实际上我们往往只是获得了一个样本。而由这个答:不可能。实际上我们往往只是获得了一个样本。而由这个样本计算的统计量(如均值、比例)只是一个样本计算的统计量(如均值、比例)只是一个可能可能与总体参数与总体参数(均值、比例)的值较接近的值。但由于总体参数往往是未知(均值、比例)的值较接近的值。但由于总体参

24、数往往是未知的,因此究竟这唯一的样本统计量的值与总体参数值相差多远的,因此究竟这唯一的样本统计量的值与总体参数值相差多远也是未知的。也是未知的。4 - 4 - 4 - 262626方法一、方法一、点估计把把样本平均数样本平均数或或样本成数样本成数直接作为直接作为总体平均数总体平均数或或总体成数总体成数的的估计值估计值pPsxX,简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准确程无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况度与可靠程度要求不高的情况1 1、直接换算法、直接换算法【引例引例1 1】本校大学生中随机抽出本校大学生中随机抽出100100名

25、,对其身高进行测量,名,对其身高进行测量,结果表明,该结果表明,该100100名大学生的平均名大学生的平均身高身高为为1.7m1.7m,我们,我们推断推断说,本说,本校校全体大学生平均身高为全体大学生平均身高为1.7m1.7m。4 - 4 - 4 - 272727Xxx 样样本本均均值值:xxxXxPpp 样样本本成成数数:pppPp 问题问题:范围范围的的大小是谁来确定的,又应大小是谁来确定的,又应如何确定?如何确定?区间估计以唯一的样本统计量的值为中心,给定以唯一的样本统计量的值为中心,给定一个范围,将这个范围定义为一个范围,将这个范围定义为可能可能包含包含总体参数值的区间总体参数值的区间

26、方法二、方法二、4 - 4 - 4 - 282828该问题应用上节的结论解决,观察下图:该问题应用上节的结论解决,观察下图:若设唯一的样本均值恰好位于若设唯一的样本均值恰好位于 的位置,若我们的位置,若我们将区间的宽度取为样本均值分布的将区间的宽度取为样本均值分布的1 1倍标准差倍标准差,则区,则区间刚好包含总体均值。间刚好包含总体均值。xxx3x3x2x20.68270.95450.9973Z置信度置信度xxZ2/概率度概率度x4 - 4 - 4 - 292929思考思考:能否确定唯一的样本均值的位置?:能否确定唯一的样本均值的位置?所有的样本均值中有多大比例在距离总体均值一倍标所有的样本均

27、值中有多大比例在距离总体均值一倍标准差范围内?准差范围内?若真的取若真的取1 1倍标准差作为区间宽度,倍标准差作为区间宽度,则对所有则对所有的样本的样本均值均值中的每一个都作为中的每一个都作为区间中心点区间中心点,可构成多少个区,可构成多少个区间?在这些区间中有多大的比例是包含总体均值?间?在这些区间中有多大的比例是包含总体均值?xxx3x3x2x20.68270.95450.9973Z置信度置信度/2xxZ 概率度概率度4 - 4 - 4 - 303030结论:结论:1 1、取标准差的倍数作为衡量区间宽度的标准。、取标准差的倍数作为衡量区间宽度的标准。2 2、区间的宽度代表了估计的准确度,越

28、宽则准确度、区间的宽度代表了估计的准确度,越宽则准确度越低。越低。3 3、由区间单边宽度和标准差的比值可计算区间的概、由区间单边宽度和标准差的比值可计算区间的概率度和置信度,宽度越宽,则概率度和置信度越高率度和置信度,宽度越宽,则概率度和置信度越高。4 4、在实际应用中,往往是由研究者以置信度的方式、在实际应用中,往往是由研究者以置信度的方式给定区间宽度。给定区间宽度。xxx3x3x2x20.68270.95450.9973Z置信度置信度xxZ2/概率度概率度4 - 4 - 4 - 313131/2/2xxxZXxZ/2/2pppZPpZ其中,其中,区间估计把在把在一定概率一定概率保证下,用保

29、证下,用样本指标样本指标去推去推断断总体指标总体指标,在考虑抽样误差的前提下,在考虑抽样误差的前提下,是总体指标落在某一范围之内,即根据是总体指标落在某一范围之内,即根据抽样指标抽样指标定出定出置信区间和置信度置信区间和置信度. .方法二、方法二、xxn1ppppnn)(1057200211400)1(小时小时平均使用时间:平均使用时间: fxfx4 - 4 - 4 - 323232常用的置信度和概率度之间的关系常用的置信度和概率度之间的关系 概率度与信任程度(置信度)成正比,概率度与信任程度(置信度)成正比,但和准确性的要求成反比。但和准确性的要求成反比。 概率度概率度t误差范围误差范围概率

30、概率F(t)0.51.001.501.962.003.000.51.001.501.962.003.000.38290.68270.86640.95000.95450.99734 - 4 - 4 - 333333【引例引例2 2】某灯泡厂对某灯泡厂对1000010000个产品进行寿命检测,随机抽取个产品进行寿命检测,随机抽取2%2%样样本进行测试,资料如下。按质量规定,灯泡使用寿命在本进行测试,资料如下。按质量规定,灯泡使用寿命在10001000小时小时以上者为合格品,在以上者为合格品,在95.45%95.45%的概率保证程度下,计算其平均数和的概率保证程度下,计算其平均数和成数的估计区间。成

31、数的估计区间。使用时间使用时间( (小时小时) )灯泡数灯泡数fi组中值组中值xixifi900900以下以下90095090095095010009501000100010501000105010501100105011001100115011001150115012001150120012001200以上以上2 24 411117171848418187 73 3合计合计200200- - -875 875 925 925 975 975 1025 1025 1075 1075 1125 1125 1175 1175 1225 1225 1750 1750 3700 3700 10725

32、10725 72775 72775 90300 90300 20250 20250 8225 8225 3675 3675 66248 66248 69696 69696 73964 73964 72704 72704 27216 27216 83232 83232 97468 97468 84672 84672 211400211400575200575200-182 -182 -132 -132 -82 -82 -32 -32 18 18 68 68 118 118 168168xxi iifxx2 )(7922. 320063.5322小小时时重重复复抽抽样样平平均均误误差差: nx 6

33、3.53200575200)()2( ffxx 样样本本标标准准差差:)(58. 7)7922. 3(2)3(小小时时极极限限误误差差: xxt 58.106442.1049)4( X总总体体均均值值取取值值区区间间:)(1057200211400)1(小时小时平均使用时间:平均使用时间: fxfx4 - 4 - 4 - 343434【例例】某灯泡厂对某灯泡厂对1000010000个产品进行寿命检测,随机抽取个产品进行寿命检测,随机抽取2%2%样本样本进行测试,资料如下。按质量规定,灯泡使用寿命在进行测试,资料如下。按质量规定,灯泡使用寿命在10001000小时小时以以上者为合格品,在上者为合

34、格品,在95.45%95.45%的概率保证程度下,计算其平均数和成的概率保证程度下,计算其平均数和成数的估计区间。数的估计区间。使用时间使用时间( (小时小时) )灯泡数灯泡数fi组中值组中值xixifi900900以下以下90095090095095010009501000100010501000105010501100105011001100115011001150115012001150120012001200以上以上2 24 411117171848418187 73 3合计合计200200- - -875 875 925 925 975 975 1025 1025 1075 1075

35、 1125 1125 1175 1175 1225 1225 1750 1750 3700 3700 10725 10725 72775 72775 90300 90300 20250 20250 8225 8225 3675 3675 66248 66248 69696 69696 73964 73964 72704 72704 27216 27216 83232 83232 97468 97468 84672 84672 211400211400575200575200-182 -182 -132 -132 -82 -82 -32 -32 18 18 68 68 118 118 16816

36、8xxi iifxx2 279. 0085. 0915. 0)1()2( ppp 样样本本方方差差:915. 0200183)1(1 nnp合格率:合格率:%972. 1200279. 022 np 重重复复抽抽样样平平均均误误差差:%944. 3)972. 1(2)3( pxt 极极限限误误差差:44.9556.87)4( P总总体体成成数数取取值值区区间间:4 - 4 - 4 - 353535抽抽样样误误差差样本平均值样本平均值区区间间估估计计计计算算过过程程 nppp 1 Nnnppp11 nx 21xnnN 样本标准差样本标准差样本标准差样本标准差代替总体标准差代替总体标准差样本均值样

37、本均值样本成数样本成数重复抽样重复抽样不重复抽样不重复抽样重复抽样重复抽样不重复抽样不重复抽样()xx ff 极限误差极限误差xxt 总体均值区间估计总体均值区间估计xxxXx4 - 4 - 4 - 363636 必要必要抽样单位数的抽样单位数的确定确定 1 1、意义意义 控制控制抽样误差抽样误差。确保。确保样本对样本对总体代表性总体代表性的的前提下,提高抽样调查的效率及前提下,提高抽样调查的效率及经济效益经济效益。 2.2.确定抽样单位数的依据确定抽样单位数的依据1 1、总体单位之间、总体单位之间差异程度和方差差异程度和方差的影响。的影响。2 2、受、受极限抽样误差极限抽样误差的影响的影响3

38、 3、受、受概率保证程度概率保证程度的影响的影响4 4、抽样方法抽样方法。不重复抽样比重复抽样需要的抽样样。不重复抽样比重复抽样需要的抽样样本量少本量少 5 5、抽样组织形式抽样组织形式。 类型抽样和等距抽样比简单随机抽样需要的抽样样类型抽样和等距抽样比简单随机抽样需要的抽样样本量少,单个抽样比整群抽样需要的抽样样本量少本量少,单个抽样比整群抽样需要的抽样样本量少nttxx 4 - 4 - 4 - 3737371 1、重复、重复抽样条件下:抽样条件下:,nttxx22222xxtn,1nPPttpp22211PPPPPPtn3 3、必要抽样数目的计算必要抽样数目的计算 原理:原理:事先确定极限

39、误差,根据抽样事先确定极限误差,根据抽样误差求误差求n n4 - 4 - 4 - 383838,12Nnnttxx 不重复抽样条件下:不重复抽样条件下:22222222xxNNtNNtn,11NnnPPttppPPNPNPPPtNPPNtnpp111122224 - 4 - 4 - 393939【例例】对某地区某年已成熟的对某地区某年已成熟的1200012000亩某种作物进行抽亩某种作物进行抽样调查样调查( (根据以往资料,平均每亩收获量的标准差为根据以往资料,平均每亩收获量的标准差为120120千克千克) ),要求抽样推断的可靠程度达到,要求抽样推断的可靠程度达到95%95%,则该作,则该作

40、物平均每亩收获量的抽样极限误差不超过物平均每亩收获量的抽样极限误差不超过1212千克,应千克,应抽取多少样本单位数。抽取多少样本单位数。96. 1,12,120,12000tNx己知)(38516.3841212096.1222222亩亩则在重复抽样条件下:xtn亩亩在不重复抽样条件下:37324.37212096.1121200012096.1120002222222222tNNtnx4 - 4 - 4 - 404040抽抽样样误误差差样本平均值样本平均值区区间间估估计计计计算算过过程程 nppp 1 Nnnppp11 nx 21xnnN 样本标准差样本标准差样本标准差样本标准差代替总体标准

41、差代替总体标准差样本均值样本均值样本成数样本成数重复抽样重复抽样不重复抽样不重复抽样重复抽样重复抽样不重复抽样不重复抽样()xx ff 极限误差极限误差xxt 总体均值区间估计总体均值区间估计xxxXx4 - 4 - 4 - 414141 补充:假设检验基本思想补充:假设检验基本思想1 1、假设假设 对总体参数的具体数值所作的陈述2.2.假设检验:假设检验:引例引例1 1、挑西瓜高手、挑西瓜高手 2 2、学校教工的平均年龄、学校教工的平均年龄 3 3、天气预报的准确率、天气预报的准确率先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程4 - 4 - 4 - 424

42、242假设检验的过程我我认为平均认为平均年龄年龄是是5050岁岁 拒绝假设拒绝假设 别无选择别无选择! 逻辑上运用反证法,统计上依据小概率原理4 - 4 - 4 - 434343假设检验的基本思想 = 504 - 4 - 4 - 444444 补充:假设检验基本思想补充:假设检验基本思想反证法反证法 先假设某命题成立,然后推理出明显矛盾的结果,从而下结论说原假设不成立小概率原理小概率原理回答回答1 1、如何提出假设、如何提出假设 2 2、如何判断小概率事件,即样本统计量与总体、如何判断小概率事件,即样本统计量与总体参数的假设背离到什么程度才称为小概率参数的假设背离到什么程度才称为小概率一个事件

43、如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的4 - 4 - 4 - 454545原假设(null hypothesis)1. 研究者想收集证据予以反对的假设2. 又称“0假设”3. 总是有符号 , 或 p4.表示为 H0nH0 : = 某一数值 n指定为符号 =, 或 n例如, H0 : 10cm4 - 4 - 4 - 4646461. 研究者想收集证据予以支持的假设2. 也称“研究假设”3. 总是有符号 , 或 4. 表示为 H1nH1 : 某一数值,或 某一数值n例如, H1 : 10cm,或 10cm4 - 4 - 4 - 474747p【例例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设4 - 4 - 4 - 484848

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论