统计学 第六章抽样推断_第1页
统计学 第六章抽样推断_第2页
统计学 第六章抽样推断_第3页
统计学 第六章抽样推断_第4页
统计学 第六章抽样推断_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章第六章 抽样调查抽样调查 第一节第一节 抽样调查的基本范畴抽样调查的基本范畴 第二节第二节 抽样误差抽样误差 第三节第三节 抽样估计抽样估计 第四节第四节 样本容量的确定和全及总体样本容量的确定和全及总体总量指标的推算总量指标的推算第一节第一节 抽样抽样调查调查的基本范畴的基本范畴 一、抽样调查的意义一、抽样调查的意义 二、抽样调查的基本范畴二、抽样调查的基本范畴一、抽样调查的意义一、抽样调查的意义 (一)抽样调查的概念(一)抽样调查的概念 抽样调查又称抽样推断或抽样统计,是指按照随机原则从总体中抽取部分单位进行调查,并根据对这部分单位的调查结果,从数量上推断总体的特征。(二)抽样调查的

2、特征(二)抽样调查的特征 1、按随机原则抽取调查单位。 2、根据样本指标值推断总体指标值。 3、抽样误差不可避免,但可计算和控制。(三)抽样调查的作用三)抽样调查的作用 1、可用于对不可能进行全面调查的现象进行调查。 2、可用于对不必要进行全面调查的现象进行调查。 3、可用于对那些具有破坏性或消耗性的产品质量进行检查。 4、可用于对全面调查的结果进行补充、修正。 5、可用于对总体的某些假设进行检验。二、抽样调查的基本范畴二、抽样调查的基本范畴(一)总体和样本(一)总体和样本 总体是指所研究的那些社会经济现象的全体或者全部。 样本是指按照随机原则从总体中抽选出来的那些单位所构成的整体。 图图6-

3、1(二)总体单位数、样本单位数和样本数(二)总体单位数、样本单位数和样本数 总体单位数指一个总体中所包含的单位的个数。用N表示。 样本单位数又称样本容量,指一个样本中所包含的单位的个数。用n表示。 样本数指从总体中按随机原则抽样时,所有可能出现的样本数目。用M表示。第一个观察值 第二个观察值 123412341,12,13,14,1 1,2,2,23,24,2 1,32,33,34,3 1,42,43,44,4 (三)总体指标和样本指标(三)总体指标和样本指标 总体指标又称参数,是指说明总体数量特征的概念及其范畴。 样本指标又称统计量,是指说明样本数量特征的概念及其范畴。常用的总体指标和样本指

4、标计算公式表常用的总体指标和样本指标计算公式表 表表6-2指 标名 称 符号及计算公式 总 体 样 本 单位数Nn平均数平均数的方差成数Pp成数的方 差FXF或NXXfxf或nxXFFX-X)(222)(或NXXXffx-x)(222)(或nxxSx)1 (2PPP)1 (2ppSp(四)抽样方式(四)抽样方式 1、简单随机抽样、简单随机抽样 简单随机抽样是指从总体中抽取样本时,完全排除人的主观意志,每一个样本单位都严格按随机原则抽取。 从理论上讲,简单随机抽样最符合随机原则。 简单随机抽样的具体做法有信手抽样法、抽签法和随机数表法三种。2、等距随机抽样、等距随机抽样 等距随机抽样又称系统抽样

5、或机械抽样,是指在抽样之前,先将总体各单位按一定顺序排列,再按随机原则抽取第一个样本单位,最后按相等的间隔抽取其它样本单位。其抽样间隔的计算公式如下:Nn抽样间隔 等距随机抽样使总体各单位的排序方法有按无关标志排队和按有关标志排队两种。 等距随机抽样的具体做法有随机起点等距抽样、半距起点等距抽样、随机起点对称等距抽样和循环等距抽样四种。3 3、分类随机抽样、分类随机抽样 分类随机抽样又称分层随机抽样或类型随机抽样,是指从总体中抽取样本单位之前,先将总体按一定的标志分组,然后再从各组中按随机原则抽取样本单位。 分类随机抽样的特点是将分组法和随机原则有机地结合在一起,从而提高了样本的代表性。 分类

6、随机抽样的具体做法有等比例类型抽样和不等比例类型抽样两种。4 4、整群随机抽样、整群随机抽样 整群随机抽样又称集团随机抽样,是指在抽样之前,先将总体按一定标志分成R个群,然后再按随机原则从R个群中抽取r个群出来进行调查。 整群随机抽样与其它三种抽样方式的最大区别在于其它三种方式一次只能抽取一个样本单位,而整群抽样方式一次可以抽取被抽中群中的所有单位。(五)抽样方法(五)抽样方法1、重复抽样、重复抽样 重复抽样是指从总体中按随机原则抽出来的样本单位,在登记好之后,再放回总体中去继续参加以后各次的抽选。2、不重复抽样、不重复抽样 不重复抽样是指从总体中按随机原则抽出来的样本单位,在登记好之后,不再

7、放回总体中去继续参加以后各次的抽选。重复抽样与不重复抽样的区别重复抽样与不重复抽样的区别 总体中剩余的单位数不同。(见 表9-3) 可能出现的样本数目不同。(见 表9-4和表9-5) 产生的抽样误差不同。(见本章第二节) 例例6-2 从一个容量为N的总体中抽取n个单位组成样本时重复抽样与不重复抽样总体中剩余单位数的差异。 表表9-3 抽样次数(次) 总体中剩余的单位数 重复抽样 不重复抽样 123n NNNN NN-1N-2N-(n-1) 例例6-3 重复抽样与不重复抽样时样本数的差异表。 表表6-4 抽 样 方 法 是否考虑顺序 考 虑 不 考 虑 重复抽样1,1 ;1,2;1,3;1,4;

8、2,1;2,2;2,3;2,4;3,1;3,2;3,3;3,4;4,1;4,2;4,3;4,4。1,1;1,2;1,3;1,4;2,2;2,3;2,4;3,3;3,4;4,4。 不重复抽样1,2;1,3;1,4;2,1;2,3;2,4;3,1;3,3;3,4;4,1;4,2;4,3。1,2;1,3;1,4;2,3;2,4;3,4。重复抽样与不重复抽样样本数差异计算公式表重复抽样与不重复抽样样本数差异计算公式表 表表6-5抽 样方 法 是否考虑顺序 考 虑 不考虑 重 复抽 样 不重复抽 样nMN(1)!(1)!NnMn N)!NMNn!(!()!NMn Nn第二节第二节 抽样误差抽样误差 一、

9、统计误差的种类一、统计误差的种类 二、抽样实际误差二、抽样实际误差 三、抽样平均误差三、抽样平均误差 四、抽样极限误差四、抽样极限误差一、统计误差的种类一、统计误差的种类 1、登记性误差。 2、代表性误差。 非偶然性代表性误差。 偶然性代表性误差。二、抽样实际误差二、抽样实际误差(一)抽样实际误差的含义(一)抽样实际误差的含义 抽样实际误差是指在遵守随机原则的前提下所产生的样本指标值与相应总体指标值之间的差异。(二)抽样实际误差的种类(二)抽样实际误差的种类1 1、平均数的抽样实际误差。、平均数的抽样实际误差。xX例例6-56-5 平均数的抽样实际误差计算表。 表表6-66-6样本 样本 1,

10、11,21,31,42,12,22,32,4 1.01.52.02.51.52.02.53.0 -1.5-1.0-0.50.0-1.0-0.50.00.5 3,13,23,33,44,14,24,34,4 2.02.53.03.52.53.03.54.0 -0.50.00.51.00.00.51.01.5 xxXxXx2 2、成数的抽样实际误差。、成数的抽样实际误差。pP例例6-66-6 大于等于3的数所占比重的抽样实际误差计算表。 表表6-76-7样本 pp-P样本 pp-P1,11,21,31,42,12,22,32,4 000.50.5000.50.5 -0.5-0.500-0.5-0.

11、500 3,13,23,33,44,14,24,34,4 0.50.51.01.00.50.51.01.0 000.50.5000.50.5 三、抽样平均误差三、抽样平均误差(一)抽样平均误差的含义(一)抽样平均误差的含义 抽样平均误差又称抽样标准误,是指所有可能出现的样本指标值对相应总体指标值的标准差。即所有可能出现的样本指标值与相应总体指标值离差平方的算术平均数的平方根。一般用符号 表示。(二)抽样平均误差的种类及定义公式二)抽样平均误差的种类及定义公式 1、平均数的抽样平均误差。 2、成数的抽样平均误差。2()xxXM2()ppPM 例例6-76-7 要求:用定义公式计算平均数和大于等于

12、3的数所占比重的抽样平均误差。 资料见表表6-66-6和表表6-76-7。2222()(1 2.5)(1.52.5)(42.5)16100.790616xxXM222()(00.5)8(0.50.5)81620.353616ppPM (三)实际工作中不用定义公式计算抽样(三)实际工作中不用定义公式计算抽样平均误差的理由平均误差的理由 1、总体平均数(或总体成数)未知。 2、M个样本平均数(或样本成数)只知其中的一个。(四)抽样平均误差的计算公式(四)抽样平均误差的计算公式 表表6-7 抽 样 方 式 抽样平均误差的计算公式 重复抽样 不重复抽样 简单随机抽样 (等距抽样) 分类随机抽样 整群随

13、机抽样 12RrRrn2)1 (2Nnnn2)1 (2Nnn(五)对抽样平均误差计算公式的几点说明(五)对抽样平均误差计算公式的几点说明 1、表表6-7 中的任何一个公式都可以分解为两个公式,即平均数的抽样平均误差计算公式和成数的抽样平均误差计算公式。 2、实际计算时, 和 应分别用 和 来代替。 3、 和 是组内方差的平均数,其计算公式为: 22S2S22S2iiinnSS22iiiNN22 4、 是群间方差,其计算公式为: 5、当不知成数的任何资料时,可取其方差的最大值(0.25)计算。2rxxix22)(rppip22)( 例例6-8 某地区用纯随机抽样方式调查职工的受教育年限,抽样比率

14、为5%,调查结果经整理后如下表: 表表6-9 要求以95.45%的概率估计该地职工: (1)人均受教育年限的可能范围; (2)受教育年限大于等于13年者所占比重的可能范围。受教育年限(年) 抽查人数(人)f xxf36791012131617及以上 15024045015010 4.58.011.014.518.5 675192049502175185 1000 9905 9698.475 fxx2)( (年)(年)(年)(年)(年)(15.1075.920.095.920.095.920.010.0210.0%)51 (1000698475.9)1 (698475.91000475.9698

15、)(95.9100099501222XXxXxtNnnSffxxSfxfxxxxxxxx%26.18%74.13%26. 2%16%26. 2%16%26. 2%13. 12%13. 1%)51 (1000%44.13)1 (%44.13%)161 (%16)1 (%00.1610001602221PPpPptNnnSppSnnpppppppp)( 例例6-9 某高校按新生学号每隔20人抽取一人组成样本,调查新生家庭经济状况,调查结果经整理后如下表: 表表6-10 要求在99.73%的概率保证程度下估计该高校新生家庭: (1)平均年收入的可能范围; (2)年收入家庭在0.5万元以下者所占比重的

16、可能范围。按家庭年收入分组(万元) 家庭数(个)f xxf0.5以下0.51.01.02.02.03.03.0及以上 122741128 0.250.751.502.503.50 3.0020.2561.5030.0028.00 100 142.75 77.411875 fxx2)( (万元)(万元)(万元)(万元)(万元)68478. 1170232. 1257268. 04275. 1257268. 04275. 1257268. 0085756. 03085756. 0)05. 01 (100774119. 0)1 (774119. 0100411875.77)(4275. 110075

17、.142) 1 (222XXxXxtNnnSffxxSfxfxxxxxxxx%51.21%49. 2%51. 9%12%51. 9%12%51. 9%17. 33%17. 3)05. 01 (100%56.10)1 (%56.10%)121 (%12)1 (%00.12100122221PPpPptNnnSppSnnpppxxppp)( 例例6-10 6-10 某市有职工100000人,其中职员40000人、工人60000人,现等比例不重复抽样调查职工收入,调查结果经整理后如下表: 表表6-116-11职员职员 工人 月收入(元) 人数(人) 月收入(元) 人数(人) 6008001000 1

18、02010 400600700 203010 要求:在95.45%的概率保证程度下,估计该市职工人均月收入的可能范围。39006040603333.58334010003333.583360350000)(550603300010004040000)(80040320006501006500022222221211iiinnSSffxxSfxfxffxxSfxfxfxfx(元)(元)(元)元元(元)(元)48.66252.63748.1265048.1265048.1224. 6224. 6)1000001001 (1003900)1 (2XXxXxtNnnSxxxxx 例例6-11 6-11

19、 某地区有10000户居民,现分城市和农村等比例不重复抽取1000户调查彩电普及率,调查结果如下表: 表表6-126-12城乡类别 抽查户数(户) 拥有彩电户数(户) 城市农村 300700 255315 1000 570 要求:以95.45%的概率估计该市居民彩电普及率的可能范围。%15.21700300700%75.24300%75.12%75.24%)451 (%45)1 (%45700315%75.12%)851 (%85)1 (%85300255%571000570221122121121111iiinnSSppSnnpppSnnpnnp%14.61%86.52%14. 4%57%1

20、4. 4%57%14. 4%38. 13%38. 1)1000010001 (1000%15.21)1 (2PPpPptNnnSppppp 例例6-126-12 某粮食加工厂昼夜连续生产,平均每分钟加工100袋大米。现每隔144分钟抽取1分钟的袋装大米进行检查,得资料如下表: 表表6-136-13序 号 12345678910平均重量(千克/袋)包装一等品率(%) 48 65 507051725273497148724970476849695270 要求在95.45%的概率保证下,估计该厂一昼夜生产的大米: (1)平均重量的可能范围; (2)包装一等品率的可能范围。(千克)(千克)(千克)(千

21、克)(千克)(52.5048.4802.15 .4902.15 .4902.151.0251.0114401014401065.2165.2105 .2610)5 .4952()5 .4950()5 .4948()(5 .4910495105250481222222XXxXxtRrRrrxxrxxxxxxxxixi%22.72%78.67%22. 2%70%22. 2%70%22. 2%11. 12%11. 11144010144010%123. 01%123. 0100123. 010%)70%70(%)70%70(%)70%65()(%7010%70010%70%70%65)2(22222

22、2PPpPptRrRrrpprpppppPppipi(六)影响抽样(平均)误差大小的主要因素(六)影响抽样(平均)误差大小的主要因素 1、样本容量。 2、总体方差。 3、抽样方式。 4、抽样方法。四、抽样极限误差四、抽样极限误差(一)概念(一)概念 抽样极限误差又称允许误差,是指在抽样推断中所允许出现的最大误差。一般用符号 表示。(二)计算公式(二)计算公式 1、平均数的抽样极限误差。 2、成数的抽样极限误差。pptxxt概率与概率度对应关系表概率与概率度对应关系表 表表6-13概率(%)F(t)概率度t68.2795.0095.4599.7311.9623第三节第三节 抽样估计抽样估计 一、

23、抽样估计的概念 二、抽样估计的内容 三、抽样估计的特点 四、抽样估计的优良标准 五、抽样估计的方法一、抽样估计的概念一、抽样估计的概念 抽样估计又称抽样推断,是指根据样本指标的值估计相应总体指标的值。 二、抽样估计的内容二、抽样估计的内容 1、根据样本平均数估计总体平均数。 2、根据样本成数估计总体成数。 Xx Pp 三、抽样估计的特点三、抽样估计的特点 1、在逻辑上运用的是归纳推理,而不是演绎推理。 2、在方法上运用的是不确定的概率分析法,而不是确定的数学分析法。 3、抽样估计总是存在着误差,且误差的大小总是和一定的概率保证程度联系在一起。四、抽样估计的优良标准四、抽样估计的优良标准 1、无

24、偏性。即样本指标的数学期望值等于它所估计的总体指标的值。 2、一致性。即随着样本容量的增加,样本指标的值将越来越接近它所估计的总体指标的值。 3、有效性。即作为估计量的样本指标的方差必须小于其它样本指标的方差。五、抽样估计的方法五、抽样估计的方法1、点值估计法。、点值估计法。 (1)含义。)含义。 点值估计法又称定值估计法,是指直接用样本指标的值代替它所估计的总体指标的值。即直接用样本平均数代替总体平均数、直接用样本成数代替总体成数。 (2)估计公式。)估计公式。 1、 2、xX pP 2、区间估计法。、区间估计法。 (1)含义。)含义。 区间估计法是指根据样本指标值和允许误差值,去估计相应总

25、体指标值所在范围的一种估计方法。 (2)估计公式。)估计公式。 总体平均数的区间估计公式。 总体成数的区间估计公式xxxXxpppPp总体指标置信区间示意图总体指标置信区间示意图 68.27% 95.45% 99.73%xxx1xx1xx2xx2xx3xx3 图图6-2第四节第四节 样本容量的确定和全及总体总量样本容量的确定和全及总体总量指标的推算指标的推算 一、样本容量的确定一、样本容量的确定 二、全及总体总量指标的推算方法二、全及总体总量指标的推算方法一、样本容量的确定一、样本容量的确定(一)影响样本容量的主要因素(一)影响样本容量的主要因素 1、总体方差。 2、允许误差。 3、概率保证程

26、度。 4、抽样方式。 5、抽样方法。(二)必要样本容量的确定公式(二)必要样本容量的确定公式 表表6-14抽 样方 式样本容量计算公式重复抽样不重复抽样简单随机抽样(等距随机抽样)分层随机抽样整群随机抽样222222RtRtr222tn222tn22222NtNtn22222NtNtn例例6-156-15 某大学有15000名学生,近期资料表明学生人均月生活费的标准差为35元,现采用纯随机不重复抽样法进行调查。问需抽取多少人调查才能保证概率达到95.45%,抽样误差不超过10元? 解答:解答:22222222222(35)1500073500000492(35)15000 (10)1504900tNntN(人) 例例6-16 6-16 某林区对新栽小树的成活率进行调查,要求误差不超过3%、概率为95%。若过去三年新栽小树的成活率分别为89.15%、89.50%和90.10%,问至少要抽多少棵树进行调查。 解答:解答:222221.9689.15% (1 89.15%)413(30%pptn棵)二、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论