抽样与抽样分布教材_第1页
抽样与抽样分布教材_第2页
抽样与抽样分布教材_第3页
抽样与抽样分布教材_第4页
抽样与抽样分布教材_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第3章 抽样与抽样分布-2本章内容容3.1 总体与样本3.2 抽样的组织形式3.3抽样误差差与抽样样分布-33.1总体与样样本一、全及及总体与与抽样总总体1、全及总总体指调查对对象的全全部单位位构成的的整体,即具有有某种共共同性质质的若干干单位的的集合体体。简称称总体、母体。可分为有有限总体体和无限限总体总体单位位数用N来表示2、抽样总总体从全及总总体中按按照随机机原则抽抽取一部部分单位位构成的的集合体体。简称称样本、子样。大样本和和小样本本样本单位位数用n来表示-4二、全及及指标和和抽样指指标1、全及指指标根据总体体各单位位标志值值计算的的反映总总体数量量特征的的综合合指标,也称为为总体指指

2、标或总总体参数数。(1)总体平平均数-5(2)总体成成数成数是用用来表示示总体中中具有某某种性质质的单位位数在总总体全部部单位数数中所占占的比重重。定义:当当总体的的一个现现象有两两种表现现时,其其中具有有某一种种表现的的单位数数占总体体单位数数目的比比重,叫叫总体成成数,简简称成数数。例:某灯灯泡厂生生产的10000只灯泡中中,有450只不合格格,则不合格率率:P=450/10000=4.5%合格率:Q=1-P=95.5%-6(3)总体标标准差和和总体方方差说明总体体单位之之间标志志值变异异程度的的指标。-72、抽样指指标根据抽样样总体各各单位标标志值计计算的综综合指标标,又称称为样本本指标

3、(1)抽样平平均数-8(2)抽样成成数定义:在在抽样总总体中,一个现现象有两两种表现现时,其其中具有有某一种种表现的的单位数数占抽样样总体单单位数目目的比重重,叫抽抽样成数数,或样样本成数数。例:某灯灯泡厂生生产的10000只灯泡中中,从中中抽取1000只进行检检验,其其中有50只不合格格,则样本不合合格率:p=50/1000=5%合格率:q=1-p=95%-9(3)抽样总总体标准准差和抽抽样总体体方差说明抽样样总体单单位之间间标志值值变异程程度的指指标。-10三、抽样样方法1、重复抽抽样2、不重复复抽样-11四、样本本容量和和样本个个数1、样本容容量指一个样样本总体体所包含含的单位位数2、样

4、本个个数指从一个个全及总总体中可可能抽取取的样本本个数-12例:在总总体中有有A、B、C、D四个单位位,现确确定样本本容量为为2个,可能能的样本本个数有有多少个个?单位ABCDAA,AA,BA,CA,DBB,AB,BB,CB,DCC,AC,BC,CC,DDD,AD,BD,CD,D解:(1)重复抽抽样条件件下(2)不重复复抽样条条件下单位ABCDA-A,BA,CA,DBB,A-B,CB,DCC,AC,B-C,DDD,AD,BD,C-133.2抽样的组组织形式式一、简单单随机抽抽样(纯纯随机抽抽样)二、类型型抽样(分类抽抽样)三、机械械抽样(等距抽抽样)四、整群群抽样-14一、简单单随机抽抽样(纯

5、纯随机抽抽样)1、概念对全及总总体的所所有单位位不进行行任何分分类或排排队,按按照随机机原则直直接从总总体单位位N中抽取n个单位作作为样本本,保证证每个单单位在抽抽选中都都有相等等的中选选机会。2、具体抽抽样方法法将总体各各单位编编号,然然后随机机抽取,直到抽抽够预定定数目。例:现有有10000个总体单单位,随随机抽取取100个样本单单位。-15二、类型型抽样(分类抽抽样)1、概念先将总体体按某个个标志分分成若干干组,再再随机从从各组中中抽取样样本单位位。2、具体抽抽样方法法(1)不等比比例类型型抽样法法(2)等比例例类型抽抽样法例:法政政系有在在校生420人,分别别由公管管120人,法学学1

6、80,社工120三个专业业组成,现要从从中抽取取100调查其就就业倾向向,如何何抽取?-16三、机械械抽样(等距抽抽样)1、概念将总体各各单位按按某一标标志进行行排序,然后再再按固定定的顺序序和间隔隔来抽选选样本单单位。2、具体抽抽样方法法(1)无关标标志排队队法例:产品品质量检检验(2)有关标标志排队队法例:居民民家庭收收支调查查注意:间间隔k=N/n取整第一个样样本单位位的确定定:如果果是按无无关标志志排队,可以从从第一个个间隔内内的任意意一个单单位开始始抽取;如果是是按有关关标志排排队,考考虑到样样本单位位的代表表性,一一般从第第一间隔隔内居中中的单位位开始抽抽取。-17四、整群群抽样1

7、、概念将总体单单位划分分成若干干群,然然后以群群为单位位从中随随机抽取取一些群群,对被被抽中群群的所有有单位进进行全面面调查的的一种抽抽样组织织形式。例:现在在抽查农农村居民民生活水水平状况况,不直直接抽取取居民户户,而是是以村为为单位,抽选若若干村,然后对对这些村村的全体体居民户户进行调调查。-183.3抽样误差差与抽样样分布一、抽样样误差1、误差及及其种类类(1)误差:由样本得得到的估估计值与与被估计计的总体体未知真真实特征征值之差差。(2)种类登记性误差:测量、记录、计算、抄录、及被调查者所报不实、指标含义不清、口径不一致等原因造成的误差代表性误差:偏差随机误差-192、抽样误误差的概概

8、念指根据样样本数据据计算而而得到的的样本统统计量与与被估计计的未知知的总体体参数真真值之间间的随机机误差。3、影响抽抽样误差差的因素素(1)抽样单单位数目目的多少少(2)总体被被研究标标志的变变异程度度(3)抽样方方法和组组织形式式的不同同4、抽样平平均误差差指抽样平平均数(或抽样样成数)的标准准差。它它反映抽抽样平均均数(或或抽样成成数)与与总体平平均数(或总体体成数)的平均均误差程程度。-20(1)抽样平平均数的的平均误误差(抽抽样均值值误差)重复抽样样不重复抽抽样称为修正正系数注意啦:当抽样比比例小于于5%时,不区区别抽样样方法影影响-21(2)抽样成成数的平平均误差差重复抽样样不重复抽

9、抽样称为修正正系数-22二、抽样样分布在同一个个总体中中抽出样样本容量量相同的的所有可可能样本本后,计计算每个个样本统统计量的的值和相相应的概概率,就就组成样样本统计计量的概概率分布布,简称称抽样分分布。(一)重重复抽样样分布1、抽样平平均数的的抽样分分布是由所有有样本平平均数的的值与其其相应的的概率表表示。-23样本均值值的抽样样分布【例】设一个总总体,含含有4个元素(个体),即总总体单位位数N=4。4个个体分分别为X1=1、X2=2、X3=3、X4=4。总体的的均值、方差及及分布如如下均值和方方差总体概率分布14230.1.2.3-24样本均值值的抽样样分布现从总体体中抽取取n2的简单随随

10、机样本本,在重重复抽样样条件下下,共有有42=16个样本。所有样样本的结结果如下下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)-25样本均值值的抽样样分布计算出各各样本的的均值,如下表表。并给给出样本本均值的的抽样分分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)样本均值的抽样分布1.00.1.2.3P ( x )1.53.04.03.52.02.5

11、x-26所有样本本均值的的均值和和方差式中:M为样本数数目比较及结结论:1.样本均值值的均值值(数学学期望)等于总总体均值值2.样本均值值的方差差等于总总体方差差的1/n-27样本均值值的分布布与总体体分布的的比较抽样分布布= 2.52=1.25总体分布布14230.1.2.3P ( x )1.00.1.2.31.53.04.03.52.02.5x-28样本均值值的抽样样分布与与中心心极限定定理 = 50 =10X总体分布n = 4抽样分布Xn =16当总体服服从正态态分布N(,2)时,来自自该总体体的所有有容量为为n的样本的的均值x也服从正正态分布布,x的数学期期望为,方差为为2/n。即xN

12、(,2/n)-29当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布中心极限限定理(图示)中心极限限定理:设从均值值为,方差为为2的一个任任意总体体中抽取取容量为为n的样本,当n充分大时时,样本本均值x的抽样分分布近似似服从均均值为、方差为为2/n的正态分分布一个任意分布的总体X-30二、抽样样分布(一)重重复抽样样分布2、抽样成成数的抽抽样分布布例:对某某种产品品质量的的合格率率进行检检验,现现用重复复抽样方方法,从从总体中中抽取100个样本进进行检验验,其合合格率p=95%,其抽样样平均误误差为:-31根据中心心极限定定理可知知,当样本容容量足够够大时,样本均均值的抽抽样

13、分布布逐渐趋趋于正态态分布。而抽样样成数的的样本容容量足够够大的条条件是np5和n(1-p)5,而本例中中n=100,p=0.95,所以服服从正态态分布,即pN(p,p(1-p)/n) = p2 = p(1-p)/nX抽样成数分布-32二、抽样样分布(二)不不重复抽抽样分布布1、抽样平平均数的的抽样分分布【例】设一个总总体,含含有4个元素(个体),即总总体单位位数N=4。4个个体分分别为X1=1、X2=2、X3=3、X4=4。总体的的均值2.5、方差1.25-33样本均值值的抽样样分布现从总体体中抽取取n2的简单随随机样本本,在不不重复抽抽样条件件下,共共有43=12个样本。所有样样本的结结果

14、如下下表3,43,23,132,42,32,124,34,24,141,441,33211,21第二个观察值第一个观察值所有可能的n = 2 的样本(共12个)-34样本均值值的抽样样分布计算出各各样本的的均值,如下表表。并给给出样本本均值的的抽样分分布3.52.52.033.02.51.523.53.02.542.542.03211.51第二个观察值第一个观察值12个样本的均值(x)-35样本均值频数频率1.522/122.022/122.544/123.022/123.522/12合计12112个样本的的均值(x)样本均值的抽样分布-36所有样本本均值的的均值和和方差式中:M为样本数数目比

15、较及结结论:1.样本均值值的均值值(数学学期望)等于总总体均值值2.样本均值值的方差差等于总总体方差差的1/n再乘以调调整整系数-37二、抽样样分布(二)不不重复抽抽样分布布2、抽样成成数的抽抽样分布布例:某种种产品质质量的合合格率进进行检验验,现用用不重复复抽样方方法,从从总体中中抽取100个样本进进行检验验,其合合格率p=95%,N=10000,其抽样样平均误误差为:样本方差差的抽样样分布-39卡方分布布定义设X1,X2,Xn为来自总总体N(0,1)的样本本,则称称统计量量服从自由由度为n的卡方分分布简记为:-40卡方分布布定义对于给定定的正数数a,0a1,称满足足条件的点为卡方分分布的上

16、上a分位点。a-41样本方差差的分布布设总体服服从正态态分布XN(,2),X1,X2,Xn为来自该该正态总总体的样样本,则则样本方方差s2的分布为为将2(n 1)称为自由由度为(n-1)的卡方分分布-42卡方(c2)分布 选择容量为n 的简单随机样本计算样本方差S2计算卡方值2 = (n-1)S2/2计算出所有的 2值不同容量样本的抽样分布c2n=1n=4n=10n=20 ms总体-43样本统计计量样本均值值样本成数数样本方差差正态总体体或非正正态总体大大样本正态总体小样样本2分布正态分布布t分布正态分布布大样本T统计量的的分布-45学生氏分分布定义义设XN(0,1),Yc2(n),并且且X,Y独立,则则称随机机变量服从自由由度为n的t分布,记记为tt(n)-46t分布定义义对于给定定的正数数a,0a1,称满足足条件的点为t(n)分布的上上a分位点。a-47T统计量的的分布设X1,X2,Xn是来自正正态总体体N(1,12)的一个样样本,称称为统计量量,它服从自自由度为为(n-1)的t分布Xt 分布与正态分布的比较正态分布t 分布t不同自由度的t分布标准正态分布t (df = 13)t (df = 5)Z两个样本本方差比比的抽样样分布-49F分布定义义设Uc2(n1),Vc2(n2),且U,V独立,则则称随机机变量服从自由由度为(n1,n2)的F分布,记记为FF(n1,n2)-5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论