![第七章 抽样调查_第1页](http://file4.renrendoc.com/view/e91c8f8c851683cb93b11de673c0f0bf/e91c8f8c851683cb93b11de673c0f0bf1.gif)
![第七章 抽样调查_第2页](http://file4.renrendoc.com/view/e91c8f8c851683cb93b11de673c0f0bf/e91c8f8c851683cb93b11de673c0f0bf2.gif)
![第七章 抽样调查_第3页](http://file4.renrendoc.com/view/e91c8f8c851683cb93b11de673c0f0bf/e91c8f8c851683cb93b11de673c0f0bf3.gif)
![第七章 抽样调查_第4页](http://file4.renrendoc.com/view/e91c8f8c851683cb93b11de673c0f0bf/e91c8f8c851683cb93b11de673c0f0bf4.gif)
![第七章 抽样调查_第5页](http://file4.renrendoc.com/view/e91c8f8c851683cb93b11de673c0f0bf/e91c8f8c851683cb93b11de673c0f0bf5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章抽样调查第一页,共一百六十九页,编辑于2023年,星期四第一节抽样调查的意义一、抽样调查的概念和特点(一)抽样调查的概念抽样调查是一种科学的非全面调查。它是按照随机原则从调查对象的总体中抽取部分单位进行调查,并根据这部分单位的调查结果推断总体的数量特征。抽样调查必须按照随机原则来抽取被调查单位。
第七章抽样调查第二页,共一百六十九页,编辑于2023年,星期四第一节抽样调查的意义(二)抽样调查的特点1.随机抽取样本单位2.推断总体数量特征3.抽样调查结果只有可控性误差第七章抽样调查第三页,共一百六十九页,编辑于2023年,星期四第一节抽样调查的意义二、抽样调查的应用范围1.用于不可能进行全面调查的现象2.用于进行全面调查就会失去现实意义的现象3.用于经济上不允许或精度上不必要进行全面调查的现象4.用于时效性要求较强的调查第七章抽样调查第四页,共一百六十九页,编辑于2023年,星期四第一节抽样调查的意义三、抽样调查的作用1.经济性好2.准确性高3.速度快4.可以取得比较详细的统计资料5.可以对全面调查的资料进行补充和修正第七章抽样调查第五页,共一百六十九页,编辑于2023年,星期四第二节总体和样本一、全及总体和样本总体(一)全及总体也叫母体,简称为总体。(二)抽样框在实际进行抽样的总体范围内,包括全部抽样单位的名单框架称为抽样框。抽样框的主要形式有三种:①名单抽样框②区域抽样框③时间表抽样框。第七章抽样调查第六页,共一百六十九页,编辑于2023年,星期四区域抽样框在商场的大门口在微波炉柜台前在市区街道旁边在某个住宅小区中山路…桥西区桥东区…华北地区东北地区…居民一组居民二组…某外国公司在大连进行微波炉市场调查:第七页,共一百六十九页,编辑于2023年,星期四时间表抽样框连续出产的产品总体可以编制抽样框:均匀的出产时间、可以预见到的产品总量。连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。第八页,共一百六十九页,编辑于2023年,星期四第二节总体和样本(三)样本总体样本总体,又叫子样,简称样本(sample)。它是从全及总体中随机抽取出来(具体是从抽样框中抽取出来的),用来代表全及总体的那部分单位构成的总体。样本总体的单位数称为样本容量,通常用小写字母n来表示。样本容量n与总体单位数N的比值()称为抽样比。样本容量n在30以下时,称为小样本;达到或超过30时称为大样本。第七章抽样调查第九页,共一百六十九页,编辑于2023年,星期四第二节总体和样本二、总体指标和样本指标(一)总体指标总体指标是根据全及总体所有单位的标志值计算出来的,反映总体的数量特征。总体指标也称为总体参数(Parameter),或参数。。
总体指标主要有:总体平均数:总体方差:总体标准差:总体比率(或)第七章抽样调查第十页,共一百六十九页,编辑于2023年,星期四第二节总体和样本(二)样本指标由样本总体各个单位的标志值计算的综合指标称为样本指标,样本指标又称为样本统计量(Statistic),简称为统计量。样本指标主要有:样本平均数:样本方差:样本标准差:样本比率(或)第七章抽样调查第十一页,共一百六十九页,编辑于2023年,星期四第二节总体和样本三、抽样方法和样本可能数目(一)抽样方法1.重复抽样重复抽样(samplingwithreplacement)也叫重置抽样,是指每次抽取一个单位记录其标志表现后又放回,重新参加下一次的抽选。2.不重复抽样不重复抽样(samplingwithoutreplacement)也叫不重置抽样,是指每次从总体中抽取一个单位记录其标志表现后不再放回,从剩余的单位中抽取下一个单位。第七章抽样调查第十二页,共一百六十九页,编辑于2023年,星期四第二节总体和样本(二)样本可能数目样本可能数目是指抽样组织和抽样方法一定时,从总体N个单位中随机抽取一个容量为n的样本,该样本不同构成的可能数目,一般用m来表示。1.重复抽样的样本可能数目(通常为考虑单位排列顺序)2.不重复抽样的样本可能数目(通常为考虑单位排列顺序)第七章抽样调查第十三页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础一、抽样分布抽样分布(samplingdistribution)就是指样本统计量的概率分布。例如,设总体有3名学生A、B和C,他们的考试成绩分别为5分、4分和3分。现在采用抽样调查方法抽取其中的2名学生作为样本,了解这3名学生的平均成绩。样本统计量为:第七章抽样调查第十四页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础若采用重复抽样,样本构成情况如下表所示。样本均值第二次ABC第一次AAAABACBBABBBCCCACBCC重复抽样的样本统计量取值情况样本均值第二次543第一次554.5444.543.5343.53第七章抽样调查第十五页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础重复抽样的样本统计量分布表33.544.55Σ1232191/92/93/92/91/91第七章抽样调查第十六页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础二、大数定律及其意义大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。1.独立同分布大数定律独立随机变量具有相同分布,且存在有限的数学期望和方差,则对于任意小的正数ε,有第七章抽样调查第十七页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础2.贝努力大数定律设m是n次独立随机试验中事件A发生(“成功”)的次数,p是事件A在每次试验中发生的概率,则对于任意小的正数ε,有大数定理从理论上揭示了样本和总体之间的内在联系,即随着抽样单位数n的增大,样本平均数(或比率)有接近于总体平均数(或比率)的趋势。
第七章抽样调查第十八页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础大数定律可归纳如下:1)现象的某种总体性规律(或称统计规律),只有当具有这种现象的足够多数的单位综合汇总在一起的时候,才能显示出来。因此,只有从大量现象的总体中,才能研究这些现象的规律性。2)现象的总体性规律或倾向通常是以平均数(或比率)的形式表现出来的。3)当所研究的现象总体包含的单位越多,平均数(或比率)也就越能够正确反映出这些现象的规律性。第七章抽样调查第十九页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础4)各单位的共同倾向(这些表现为主要的、基本的因素)决定着平均数(或比率)的水平,而各单位对平均数(或比率)的离差(这些表现为次要的、偶然的因素)则会由于足够多数单位的综合汇总的结果,而相互抵消,趋于消失。大数定律可归纳如下:根据大数定律的内容特点,运用抽样法时,必须注意以下两个问题:第一、抽样必须遵循随机原则。第二、抽样必须遵循大量原则。第七章抽样调查第二十页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础三、正态分布及其意义(一)正态分布的概念及其特点1.正态分布的概念正态分布的分布密函数为:x为随机变量,e为自然对数的底,π为圆周率,为变量x的平均数,为变量标准差。
第七章抽样调查第二十一页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础2.关于密度函数的二个参数和平均数决定密度函数的中心位置。第七章抽样调查第二十二页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础标准差决定密度函数曲线的陡缓程度
第七章抽样调查第二十三页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础3.正态分布密度函数的特点1)对称性。2)非负性。3)在时达到极大值4)的曲线在处有拐点。5)当时,的曲线以x轴为渐近线。第七章抽样调查第二十四页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础4.标准正态分布标准正态分布的概率密度为:若随机变量服从标准正态分布,则记为它具有如下性质或结论。第七章抽样调查第二十五页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础(二)正态分布的应用求正态变量的概率,通常是先将一般正态变量转换为标准正态变量,然后从标准正态分布概率表中查出相应标准正态变量值所对应的分布函数值,再计算出所求正态变量研究区间的概率。
第七章抽样调查第二十六页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础(二)正态分布的应用部分常用z值和相应概率值z011.6451.96230.00000.68270.90000.95000.95450.9973第七章抽样调查第二十七页,共一百六十九页,编辑于2023年,星期四第三节抽样调查的数理基础四、中心极限定理及其意义中心极限定理论证了如下几点:1)如果总体服从正态分布,样本平均数也同样服从正态分布。2)如果总体很大,但不服从正态分布,只要样本足够大,样本的总和或平均数就会趋近于正态分布。。3)样本平均数分布的数学期望(该抽样的所有可能样本平均数的均值)等于总体均值。即。4)样本平均数分布的方差为:重复抽样时:不重复抽样时:第七章抽样调查第二十八页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计第七章抽样调查一、参数估计的优良标准(一)无偏性(二)有效性(三)一致性第二十九页,共一百六十九页,编辑于2023年,星期四评价准则的数学期望等于总体参数,即该估计量称为无偏估计无偏性有效性当为的无偏估计时,方差越小,无偏估计越有效。一致性对于无限总体,如果对任意则称是的一致估计。估计量第七章抽样调查第三十页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计第七章抽样调查二、抽样误差(一)抽样误差的意义1.抽样误差的概念抽样调查过程中的误差根据其来源大体上可以归纳为两类:一类是登记性误差,另一类是代表性误差。代表性误差包括系统误差和随机误差两种。第三十一页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计第七章抽样调查2.影响抽样误差的因素1)总体变异度2)样本容量3)抽样方法4)抽样组织方式第三十二页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计抽样平均误差一般如下公式表示:为第可能样本的平均数为总体平均数是样本可能数目第七章抽样调查(二)抽样平均误差1.概念:抽样平均误差是指所有可能样本的估计值与所要估计参数离差的平均数。第三十三页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计2.抽样平均误差的计算1)样本平均数的抽样平均误差重复抽样情况下:不重复抽样情况下:第七章抽样调查第三十四页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计2)样本比率的抽样平均误差在重复抽样情况下:在不重复抽样情况下:第七章抽样调查第三十五页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计(三)抽样极限误差在一次抽样中允许的最大误差范围称为抽样极限误差。是变动的抽样指标与唯一确定的但又是未知的全及指标之间离差的可能范围。设△x与△p分别表示样本平均数与样本比率的抽样极限误差,则有:第七章抽样调查第三十六页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计抽样极限误差通常需要以抽样平均误差为标准单位来加以衡量,把抽样极限误差除以相应的抽样平均误差,得出数值z,以表明抽样极限误差是抽样平均误差的多少倍。在概率统计中,z称为概率度。其计算公式为:第七章抽样调查第三十七页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计为了表示抽样误差的相对程度,需要计算抽样误差系数和由抽样误差系数还可以计算抽样估计精度(Ax或Ap)。第七章抽样调查第三十八页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计三、抽样估计的置信度抽样估计时总体参数落在某个区间的概率保证程度称为抽样估计的置信度。抽样估计的置信度(confidenceinterval)和抽样极限误差有着密切联系。当抽样极限误差范围增大时,抽样估计的置信度也随之有规律地增大,抽样估计的精确程度则随之有规律地降低,反之亦然。
第七章抽样调查第三十九页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计四、点估计与区间估计点估计也称定值估计,它是以样本指标的计算结果作为总体参数估计的结果,即用样本指标值直接作为全及总体指标的代表值。(一)点估计用于点估计的估计量一般应满足优良估计量三个标准。第七章抽样调查第四十页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计(二)区间估计区间估计就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。区间估计有三项基本要素:①估计值,主要是样本的平均数、比率和方差;②估计值的可能误差范围(或说允许误差范围),即抽样极限误差和;③与误差范围相对应的概率保证程度——参数估计的置信度。
第七章抽样调查第四十一页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计(二)区间估计这三个要素之间的关系可表示如下:第七章抽样调查第四十二页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计五、总体平均数估计(一)大样本的总体平均数估计第七章抽样调查表达式其中,为极限误差第四十三页,共一百六十九页,编辑于2023年,星期四步骤⒈计算样本平均数;⒉搜集总体方差的经验数据;或计算样本标准差,即第七章抽样调查第四十四页,共一百六十九页,编辑于2023年,星期四⒊计算抽样平均误差:重复抽样时:
不重复抽样时:⒋计算抽样极限误差:⒌确定总体平均数的置信区间:第四十五页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计五、总体平均数估计(一)大样本的总体平均数估计例:某企业生产A产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件。请以95.45%的置信度估计该日人均产量的置信区间。第七章抽样调查第四十六页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计解:①计算抽样平均误差②计算抽样极限误差由,查正态概率表得第七章抽样调查第四十七页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计③确定置信区间估计区间上限:(件)估计区间下限:(件)第七章抽样调查故,可以95.45%的置信度断言,该日人均产量在34.15~35.85件之间。第四十八页,共一百六十九页,编辑于2023年,星期四【例A】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。第七章抽样调查第四十九页,共一百六十九页,编辑于2023年,星期四按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计—100126004144100名工人的日产量分组资料第五十页,共一百六十九页,编辑于2023年,星期四解:第七章抽样调查第五十一页,共一百六十九页,编辑于2023年,星期四则该企业工人人均产量及日总产量的置信区间为:即该企业工人人均产量在124.797至127.203件之间,其日总产量在124797至127303件之间,估计的可靠程度为95﹪。第七章抽样调查第五十二页,共一百六十九页,编辑于2023年,星期四【例B】某乡水稻总面积20000亩,以不重置抽样方法从中随机抽取400亩实割实测求得样本平均亩产645公斤,标准差72.6公斤。要求极限误差不超过7.2公斤,试对该乡水稻的亩产和总产量作估计。第七章抽样调查第五十三页,共一百六十九页,编辑于2023年,星期四第一步:计算抽样平均误差第二步:计算平均亩产和总产量的上下限亩产下限=645-7.2=637.8(公斤)亩产上限=645+7.2=652.2(公斤)第七章抽样调查第五十四页,共一百六十九页,编辑于2023年,星期四第三步:计算概率度总产量下限=20000×637.8=1275.6(公斤)总产量上限=20000×652.2=1304.4(公斤)以95.45%保证该乡水稻平均亩产在637.8至652.2公斤之间,总产量在1275.6至1304.4万公斤之间。第七章抽样调查第五十五页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计(二)小样本的总体平均数估计第七章抽样调查例:某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估计这批食品平均每袋重量的区间范围。
若,当方差未知,时,简单随机样本的平均数服从自由度为
的分布,即第五十六页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计第七章抽样调查解:①计算样本指标②计算抽样平均误差第五十七页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计第七章抽样调查③计算抽样极限误差由,查t分布表得,④确定置信区间估计区间上限:(克)估计区间下限:(克)故,在95%的置信度下,这批食品平均每袋重量的置信区间是778.8~803.4克。第五十八页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计第七章抽样调查六、总体比率估计总体比率P是总体是非标志的的平均数,前面讲的平均数估计理论都适用于总体比率P的估计,只是估计量的形式略有不同。表达式其中,为极限误差第五十九页,共一百六十九页,编辑于2023年,星期四第七章抽样调查步骤⒈计算样本成数;⒉搜集总体方差的经验数据;⒊计算抽样平均误差:重复抽样条件下不重复抽样条件下第六十页,共一百六十九页,编辑于2023年,星期四⒋计算抽样极限误差:⒌确定总体成数的置信区间:第七章抽样调查第六十一页,共一百六十九页,编辑于2023年,星期四【例B】若例A中工人日产量在118件以上者为完成生产定额任务,要求在95﹪的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。第七章抽样调查第六十二页,共一百六十九页,编辑于2023年,星期四第七章抽样调查按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合计—100100名工人的日产量分组资料完成定额的人数幻灯片47第六十三页,共一百六十九页,编辑于2023年,星期四解:第七章抽样调查第六十四页,共一百六十九页,编辑于2023年,星期四第七章抽样调查则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为:即该企业工人中完成定额的工人比重在0.8432至0.9568之间,完成定额的工人总数在843.2至956.8人之间,估计的可靠程度为95﹪。第六十五页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计第七章抽样调查例:某厂对一批产品的质量进行抽样检验,随机抽取样品100只,调查得样本优质品率为80%,试计算当把握程度为90%时该批产品优质品率的区间范围。解:①计算抽样平均误差第六十六页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计②计算抽样极限误差第七章抽样调查由,查正态概率表得③确定置信区间估计区间上限:估计区间下限:即,该批产品优质品率在73.42%-86.58%之间,其把握程度为90%。第六十七页,共一百六十九页,编辑于2023年,星期四第四节总体参数估计第七章抽样调查七、总体方差估计在总体平均数的区间估计中,需要抽样平均误差的数据,在计算抽样平均误差时,需要总体方差的数据,然而总体方差是未知的,通常要以样本数据来估计。总体方差的估计量--样本方差的计算:第六十八页,共一百六十九页,编辑于2023年,星期四第五节抽样设计第七章抽样调查一、抽样设计的原则1、保证实现抽取样本时遵守随机原则。2)保证实现最大的抽样效果原则。二、抽样组织设计(一)简单随机抽样简单随机抽样(simplerandomsampling),也称纯随机抽样,它是按照随机原则直接从全及总体N个单位中抽取容量为n个单位的样本。第六十九页,共一百六十九页,编辑于2023年,星期四第七章抽样调查1.纯随机抽样的取样方法①直接抽取法②抽签法③随机数表法第五节抽样设计第七十页,共一百六十九页,编辑于2023年,星期四第七章抽样调查2.纯随机抽样的样本容量确定1)估计平均数的必要抽样数目重复抽样时,由整理得:不重复抽样时,由整理得:第五节抽样设计当N很大时:第七十一页,共一百六十九页,编辑于2023年,星期四【例A】某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45﹪的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?第七章抽样调查第七十二页,共一百六十九页,编辑于2023年,星期四解:第七章抽样调查第七十三页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计2)估计比率的必要抽样数目当估计总体比率时,确定必要抽样数目公式中的方差应换成,于是得:当N很大时,第七十四页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计例:某批产品的历史数据显示,平均重量为65.85千克,合格率为98%,方差为5.456,现准备对这批产品进行简单随机抽样检查,要求可靠程度达到99.73%,误差范围不超过0.9千克。试问检查平均重量与合格率各需要抽多少样本单位?第七十五页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计解:在区间估计中,由可知,则即检查平均重量至少应该抽取61个样品;检查合格率至少应该抽取71个样品。第七十六页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计例:某企业对一批产品进行质量检验,这批产品的总数为5000件,过去几次同类调查所得的产品合格率分别为93%、95%和96%,要求在99.73﹪的概率保证程度下,合格率的误差范围不超过3%,应抽查多少件产品?【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其中方差最大者,即P=93﹪。第七十七页,共一百六十九页,编辑于2023年,星期四解:第七章抽样调查第七十八页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计注:1)对同一总体既需要进行平均数推断,又需要进行比率推断时,按各自要求可能确定二个必要抽样数目,为了兼顾二者的共同要求,通常采用其中较大的n值作为统一的抽样单位数。2)在抽样推断的实际操作中,一般按重复抽样的公式确定必要抽样数目,按不重复抽样的方法来具体抽选调查单位,最后又按重复抽样的平均误差公式来计算抽样平均误差进行推断。以便使推断的把握程度更大。第七十九页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计3)总体方差近似值的取值方法:①根据以往调查的经验数据(取较大者)。②采用试点调查以样本方差来代替。③根据总体的分布及其数学性质加以推算。④比率的方差可以用最大值来代替。第八十页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计(二)分层抽样1.分层抽样及其组织分层抽样又叫分类抽样(stratifiedsampling)或类型抽样。它是按与调查目的有关的某个主要标志将总体划分为若干层(或类),然后从各层中按随机原则分别抽取一定数目的单位构成样本。确定各类型组抽样单位数的方法,一般有两种:1)类型适宜抽样2)等比例分层抽样第八十一页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计2.分层抽样的抽样平均误差分层抽样组织的重复抽样平均误差为:对于等比例分层抽样,其重复抽样平均误差为:或称为层(组)内方差平均数,计算式如下:第八十二页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计在不重复抽样条件下,由抽样平均误差公式和上式可知,对于给定的总体,方差(即总方差)是一定的,划分层时应尽量增大层间差异,缩小层内差异。第八十三页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计例:某农场在甲、乙、丙三种类型土地上种植某种农作物1200亩,临近收割时,按5%比例抽取60亩进行调查,得有关数据如下表所示,试以95.45%的置信度估计该种农作物的平均亩产量。土地类别种植面积(亩)抽查面积(亩)平均亩产(公斤)亩产标准差(公斤)甲乙丙600360240301812600460400202536合计120060————某农场某种农作物平均亩产量抽样调查表第八十四页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计解:①计算样本指标②计算抽样平均误差:第八十五页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计③计算抽样极限误差由,知④确定置信区间估计区间上限:(公斤)估计区间下限:(公斤)即,该种农作物的平均亩产量在511.6--524.4公斤之间,置信度为95.45%。第八十六页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计3.分层抽样的必要抽样数目确定分层抽样的必要抽样数目,与确定纯随机抽样必要抽样数目的思路相同,只是公式中的方差应使用层内方差平均数。估计平均数时:第八十七页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计估计比率时第八十八页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计(三)等距抽样等距抽样又叫机械抽样或系统抽样。它是先将总体单位按某一标志排队,然后按固定的顺序和间隔来抽取样本单位。等距抽样按照排队时所依据的标志不同,可分为按无关标志排队和按有关标志排队。按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。等距抽样的优点是:抽取方式简单,容易实施第八十九页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计等距抽样通常是按自然位置排队,其调查效果应该是介于分层抽样与简单随机抽样之间,为使抽样估计结果更加可靠,常采用简单随机抽样的估计方法计算等距抽样的抽样平均误差及相应的各项估计值。例:为调查某市居民人均可支配收入情况,对该市30万户居民采用按街区每隔1000户抽取1户的等距抽样方法进行抽样,共调查了300户,有关数据下表所示。试估计置信度为95%的居民家庭人均可支配收入的置信区间。第九十页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计人均可支配收入(千元/人)样本单位数(户)组中值6以下6~88~1010~1212~1414~1616以上8224012560301557911131517401543601375780450255-6.38-4.38-2.38-0.381.623.625.62325.64422.06226.5818.05157.46393.13473.77合计300——3414——2016.69某市居民人均可支配收入调查表第九十一页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计解:①计算样本指标②计算抽样平均误差:第九十二页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计③计算抽样极限误差由,知④确定置信区间估计区间上限:估计区间下限:即,该市居民家庭人均可支配收入在11.09~11.67千元之间,置信度为95%。第九十三页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计(四)整群抽样1.整群抽样的概念整群抽样也叫集团抽样。它是将研究对象的总体划分为若干群(或称为组),然后按随机原则从中成群(成组)地抽取样本单位,对抽中的群(组)进行全面调查的一种抽样方法。简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差。第九十四页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计2.整群抽样的估计量及其抽样平均误差设总体的全部单位划分为群,每群包含单位。现在从总体群中随机抽取群组成样本,并分别对中选群的所有单位进行调查。样本的第群第单位的标志值为,第群的样本平均数为:
样本平均数为:第九十五页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计整群抽样可以看作是以群代替总体单位,以群平均数代替总体单位标志值之后的简单随机不重复抽样。因此整群抽样的抽样平均误差的计算公式为:式中代表群间方差,计算式如下:(估计平均数时用)(估计比率时用)第九十六页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计例:某工厂生产某种电灯泡,在连续生产720小时中,每隔24小时抽取1小时的全部产品加以检查,根据抽样资料计算结果,灯泡的平均寿命为1200小时,群间方差为60。试计算样本平均数的抽样平均误差,并以95%的可靠程度推断该批灯泡的平均使用寿命。解:第九十七页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计由,知估计区间上限:估计区间下限:即,该批灯泡的平均寿命在1197.28~1200.72小时之间,置信度为95%。第九十八页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计抽样组织抽样单位样本代表性产生误差的原因抽样平均误差必要抽样数目估计的可靠程度应用分层抽样总体单位最好层内方差最小最少最高单位差异大等距抽样总体单位较好总体方差较小较少较高单位可排序简单抽样总体单位一般总体方差一般一般一般均匀总体整群抽样单位群体较差群间方差较大较多较低总体可分群常用抽样组织形式基本特点一览表第九十九页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计(五)多阶段抽样抽样方法是把抽取样本单位的过程分为若干个阶段进行,即先从总体中抽取若干一级单位,再从抽中的每个一级单位中抽取若干二级单位,接着从抽中的二级单位里抽三级单位,依此类推,一直到最后才抽取样本基本单位。
多阶段抽样估计量的方差,取决于各阶段的群间方差和最后抽中各群的群内方差,下面以两阶段抽样为例说明该种抽样估计量的抽样平均误差。第一百页,共一百六十九页,编辑于2023年,星期四例:在某省100多万农户抽取1000户调查农户生产性投资情况。第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡第三阶段:从被抽中的20个乡中各抽5个村第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)第七章抽样调查第五节抽样设计(五)多阶段抽样第一百零一页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计首先将总体划分为R组,每组包含Mi个单位。抽样第一阶段从R组中随机抽取r组,第二阶段再从中选的r组中分别从各组Mi单位随机抽取mi个单位,构成一个样本,这种抽样就是两阶段抽样。各组的单位数可以是相等的也可以是不等的。各组抽取的单位数可以是相等的,也可以是不等的。为了简化起见,假定总体R组中每组的单位都等于M,则有N=MR,而且从各组抽取的单位数也相等产,都为m,则有n=mr。两阶段抽样可以看作是整群抽样和类型抽样的结合。即整群样抽第一阶段从总体的全部组中,随机抽取部分的组,和类型抽样第二阶段从中选组中抽选部分单位两个程序的结合。第一百零二页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计从总体R组中随机抽取r组,并从r组中,每组M个单位中抽m个单位构成样本。样本平均数可以这样计算:先计算第i组的样本平均数:再计算样本的平均数:第一百零三页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计第一阶段抽样平均数的方差为:式中是第一阶段抽样群的群间方差。第二阶段抽样平均数的方差为:式中是各抽样群群内方差的平均数,即第一百零四页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计则,以上两阶段抽样样本平均数的抽样方差为:在不重复抽样情况下,两阶段抽样的抽样平均误差为:两阶段抽样的第一阶段抽样一定是不重复抽样,如果第二阶段采用重复抽样,则抽样平均误差为:第一百零五页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计例:对某林区的木材积蓄量进行抽样调查,将总体相等面积的块地段划分为10群,每群包括5个地段,现在用两阶段抽样方法,从10群中抽选50%(5群),并从抽中的群中抽取60%地段(3个地段)组成样本,样本的各项资料如下页表中所示。试以90%的可靠程度推断该林区木材积蓄量。解:样本平均数:样本各群内方差:第一百零六页,共一百六十九页,编辑于2023年,星期四第七章抽样调查群别积蓄量(m3)(xi)样本平均数离差离差平方Ⅰ9295-3995009839Ⅱ119125-63612500131636Ⅲ181190-98119000199981Ⅳ258270-121442700028212144Ⅴ365380-152253800039515225∑1060212————
某林区的木材积蓄量抽样调查表
第一百零七页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计各群内方差平均数:群间方差:抽样平均误差为:第一百零八页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计由,知估计区间上限:估计区间下限:即,该批该林区木材积蓄量在1553~2687立方米之间,置信度为90%。第一百零九页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第五节抽样设计三、抽样方案的检查1、准确性检查是以抽样方案要求的允许误差为标准,用已掌握的资料检查其在一定概率保证程度下,实际的极限误差是否超过了允许误差的要求,即要求极限误差小于或等于允许误差。2、代表性检查是将抽样方案中的样本指标,与过去已掌握的总体相应指标进行对比,视其比率是否合乎要求。第一百一十页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验一、统计假设检验的概念和类型(一)假设检验的概念统计假设检验,就是事先对总体参数或总体分布形式做出一个假设,然后利用样本信息来判断这一假设是否合理,即判断样本统计量的具体数值与原假设是否有显著差异。从而决定拒绝或接受原假设。假设检验的特点:第一,采用反证法。第二,依据“小概率事件在一次试验中不能发生”的原理。第一百一十一页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验(二)假设检验的两类错误1.第一类错误第一类错误,亦称拒真(弃真)错误。是指当原假设为真时,但由于样本的随机性使样本统计量的具体值落入了拒绝区域,这时所作的判断是拒绝原假设。犯第一类错误的概率亦称拒真概率,它实质上就是前面提到的显著性水平,即第一百一十二页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验2.第二类错误第二类错误,亦称取伪错误。当原假设不真时,但由于样本的随机性使样本统计量的具体值落入了接受区域,这时所作的判断是接受原假设。
犯第二类错误的概率亦称取伪概率,用表示,即第一百一十三页,共一百六十九页,编辑于2023年,星期四H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H01-a第二类错误(b)拒绝H0第一类错误(a)功效(1-b)假设检验就好像一场审判过程统计检验过程第一百一十四页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验(三)假设检验与区间估计的关系1.假设检验与区间估计的区别1)目标不同:假设检验要验证原假设在一定显著性水平()下是否成立;区间估计要估计出总体参数的在一定置信度()下的置信区间。2)立足点不同:假设检验立足于小概率,通常是给定很小的显著性水平()作为拒绝原假设可能犯“弃真”错误的风险;区间估计立足于大概率,通常是以较大的置信度()去估计参数的置信区间。3)思路不同:假设检验根据样本统计值与原假设参数值差异的大小来决定拒绝或接受原假设;区间估计则根据样本估计值和给定的置信度来确定总体参数的置信区间。第一百一十五页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验2.假设检验与区间估计的联系1)依据相同:二者都是依据样本信息对总体参数进行推断。2)理论基础相同:二者都是以抽样分布为理论基础,都是建立在概率基础上的推断,推断结果都有一定的置信度和风险。3)研究实际问题时,二者可以相互转换:针对同一问题的参数进行推断,使用同一样本、同一统计量和同一分布,此时假设检验问题可以转换为区间估计,区间估计问题也可以转换为假设检验。第一百一十六页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验(四)统计假设检验的类型1.双侧检验当要检验的是样本统计值与总体参数有没有显著性差异,而不问差异的方向是正差还是负差时,这时的检验称为双侧检验,又称双尾检验。假设的设立:或第一百一十七页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验拒绝区域拒绝区域接受区域双侧检验的决策临界值及接受区域和拒绝区域
第一百一十八页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验由样本信息计算出的检验统计量数值与事先给定的临界值比较,如果,则接受原假设;如果,或则拒绝原假设,接受备择假设。第一百一十九页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验2.单侧检验不仅检验样本统计值与总体参数有没有显著性差异,而且追究是否发生预先指定方向的差异,就应采用单侧检验,分为左侧检验和右侧检验。右侧检验也叫右单尾检验,主要用于检验样本统计值是否出现了增长方向的变动。假设设立为:或:第一百二十页,共一百六十九页,编辑于2023年,星期四第七章抽样调查拒绝区域接受区域右侧检验的决策临界值及接受区域和拒绝区域
由样本信息计算出的检验统计量数值与事先给定的临界值比较,如果,则接受原假设;如果则拒绝原假设,接受备择假设。第一百二十一页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验左侧检验也叫左单尾检验,主要用于检验样本统计值是否出现了减少或降低方向的变动。假设设立为:或:第一百二十二页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验拒绝区域接受区域左侧检验的决策临界值及接受区域和拒绝区域
由样本信息计算出的检验统计量数值与事先给定的临界值比较,如果,则接受原假设;如果则拒绝原假设,接受备择假设。第一百二十三页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验二、统计假设检验的一般步骤2.选择检验用统计量,并确定其分布形式3.选择显著性水平,确定决策临界值4.根据检验统计量的具体数值,做出决策1.提出原假设()和备择假设()第一百二十四页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验三、假设检验的应用一个总体的检验:Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)
2检验(单尾和双尾)均值一个总体比例方差第一百二十五页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验(一)总体平均数的假设检验1.大样本的平均数检验大样本的统计量趋于正态分布。因而可用正态分布理论来检验大样本的平均数与总体平均数是否有显著差异。第一百二十六页,共一百六十九页,编辑于2023年,星期四【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)均值的双侧Z检验第七章抽样调查第六节统计假设检验第一百二十七页,共一百六十九页,编辑于2023年,星期四H0:0=0.081H1:0
0.081=0.05n=200临界值(s):检验统计量:决策:结论:
-2.83<-1.96,所以拒绝H0表明新机床加工的零件的椭圆度与以前有显著差异Z01.96-1.96.025拒绝H0拒绝H0.025第七章抽样调查第一百二十八页,共一百六十九页,编辑于2023年,星期四【例】某橡胶厂生产汽车轮胎,根据历史资料统计结果,平均里程为25000公里,标准差为1900公里。现在从新批量的轮胎中随机抽取400个作试验,求得样本平均里程为25300公里。试按5﹪的显著性水平判断新轮胎的平均耐用里程与通常的耐用里程有没有显著的差异。第七章抽样调查第一百二十九页,共一百六十九页,编辑于2023年,星期四第一步:建立原假设第二步:给定显著性水平,α=0.05由于是双侧检验,两边拒绝域的概率各为0.025,即下临界值为-1.96,上临界值为1.96第七章抽样调查第一百三十页,共一百六十九页,编辑于2023年,星期四第三步:根据样本信息,计算Z统计量的值第四步:检验判断由于实际Z值3.16>上临界值1.96,所以我们有理由拒绝原假设,即推翻新批量轮胎的平均耐用里程和原来没有显著差异的假设。第七章抽样调查第一百三十一页,共一百六十九页,编辑于2023年,星期四【例】某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(=0.05)均值的单侧Z检验第七章抽样调查第一百三十二页,共一百六十九页,编辑于2023年,星期四H0:1000H1:<1000=0.05n=100临界值(s):检验统计量:-2<-1.645,所以在=0.05的水平上拒绝H0表明这批灯泡的使用寿命低于1000小时。决策:结论:-1.645Z0拒绝域第七章抽样调查第一百三十三页,共一百六十九页,编辑于2023年,星期四【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)第七章抽样调查第六节统计假设检验第一百三十四页,共一百六十九页,编辑于2023年,星期四H0:0
1020H1:0>1020=0.05n=16临界值(s):检验统计量:2.4>1.645,所以在=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高。决策:结论:Z0拒绝域0.051.645第七章抽样调查第一百三十五页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验2.小样本的平均数检验在小样本()情形下,检验方法主要取决于总体的分布。如果是正态总体,检验统计量的选择与总体方差是否已知有着密切的联系。1)正态总体,方差已知时的小样本平均数检验
例:根据过去大量资料,某厂生产的产品使用寿命(单位:小时)服从正态分布(1020,1002)。现从最近生产的一批产品中随机抽取25件,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?第一百三十六页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验解:⑴提出假设⑵确定检验统计量及其分布形式⑶根据显著性水平,确定决策临界值
显著性水平;查正态概率表得决策临界值第一百三十七页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验⑷根据检验统计量的具体数值,做出决策所以,接受即这批产品的使用寿命确有显著提高。第一百三十八页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验2)正态总体,方差未知时的小样本平均数检验在方差未知情况下,正态总体的小样本平均数服从自由度为的t分布。所以可用t分布理论来检验方差未知的正态总体小样本平均数离差的显著性。第一百三十九页,共一百六十九页,编辑于2023年,星期四【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?均值的双侧t检验第七章抽样调查第一百四十页,共一百六十九页,编辑于2023年,星期四H0:0=1000H1:0
1000=0.05df=9-1=8临界值(s):检验统计量:
-2.306<-1.75<2.306,在=0.05的水平上接受H0有证据表明这天自动包装机工作正常决策:结论:t02.306-2.306.025拒绝H0拒绝H0.025第七章抽样调查第一百四十一页,共一百六十九页,编辑于2023年,星期四
【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(
=0.05)均值的单侧t检验第七章抽样调查第一百四十二页,共一百六十九页,编辑于2023年,星期四H0:0
40000H1:0<40000=0.05df=20-1=19临界值(s):检验统计量:0.894>-1.7291,
在=0.05的水平上接受H0表明轮胎使用寿命显著地大于40000公里决策:
结论:
-1.7291t0拒绝域.05第七章抽样调查第一百四十三页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验(二)总体比率的假设检验例:我国出口的参茸药酒畅销于某国市场。据以往调查,购买此种酒的顾客中40岁以上的男子占50%。经营该药酒的进出口公司经理关心这个比率是否发生了变化,于是,委托一个咨询机构进行调查,这个咨询机构从众多购买该药酒的顾客中随机抽取了400名进行调查,结果有210名为40岁以上的男子。试问在0.05的显著水平上,能否认为购买此种药酒的顾客中40岁以上男子所占比率变化了?第一百四十四页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验解:假设为真时,检验统计量第一百四十五页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验显著性水平;查正态概率表得决策临界值所以,接受即,购买这种参茸药酒的顾客中40岁以上男子所占比率没有变化。第一百四十六页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验例:某工厂大批量生产某种零件,按照合同规定,如不合格品超过总数的10%,零件将被定货者拒收(即退货)。一次交货时,销售部门与购买方经协商决定,随机抽检200个零件,风险概率取0.02。检查结果是,不合格品占样本容量的11%,问该批零件能否被定货者拒收?解:假设为真(指)时,于是检验统计量
第一百四十七页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验则显著性水平;查正态概率表得决策临界值
所以,接受即,该批零件不能被定货者拒收。第一百四十八页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验(三)两个总体参数之差的假设检验1.大样本的平均数之差假设检验根据抽样分布原理,在大样本条件下,两个总体的样本平均数之差()近似服从正态分布,经过标准化后则服从标准正态分布。即第一百四十九页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验若两个总体的方差未知,可以分别用它们的样本方差替代,此时检验统计量为:例:在某市抽取100名男职工组成一个随机样本,计算他们的平均月工资为2300元,标准差为180元。同时又抽取了120名女职工组成另一个随机样本,其平均月工资为2290元,标准差为150元。试问在0.10的显著水平上,该市男女之间的工资水平是否存在着差异?第一百五十页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验解:假设为真时,显著性水平,查正态概率表得决策临界值
所以接受,即该市男女之间的工资水平无显著差异。第一百五十一页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验2.大样本的比率之差假设检验在原假设()为真时,比率之差的检验统计量第一百五十二页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验例:在一次收视率调查中,北京市居民收看某台新闻节目的收视率为38%,天津市为36%,在北京市调查的样本容量为400人,在天津市调查的样本容量为300人。有人认为北京和天津的收视率不存在差异,你是否同意这种说法?解:提出假设为真时,第一百五十三页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验显著性水平,决策临界值所以接受,即北京和天津的收视率无显著差异。第一百五十四页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验3.小样本的平均数之差假设检验根据抽样分布原理,在小样本条件下,总体的方差未知时,两个正态总体样本平均数之差近似服从自由度为的t分布,即式中为修正的自由度:第一百五十五页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验例:采用两种不同的方法对金属进行热处理,为了检验其效果,分别试验了11次,第一种方法处理后的平均抗压强度为45.76公斤/厘米2,样本方差为13.25;第二种方法处理后的平均抗压强度为39.88公斤/厘米2,样本方差为8.28。假设两个总体均为正态总体,在显著水平条件下,试问第一种热处理方法的抗压强度是否显著超过第二种热处理方法的抗压强度?解:假设为真()时,第一百五十六页,共一百六十九页,编辑于2023年,星期四第七章抽样调查第六节统计假设检验显著性水平查t分布表得决策临界值所以接受,即第一种热处理方法的平均抗压强度显著超过第二种热处理方法的平均抗压强度。第一百五十七页,共一百六十九页,编辑于2023年,星期四第七章抽样调查本章小结抽样调查具有随机取样、推断总体、存在可控性误差的特点及省、准、快、细的优点。因而,抽样调查得以广泛应用抽样调查涉及全及总体、抽样框、样本、抽样单位、重复抽样、不重复抽样、统计量、抽样分布等基本概念。抽样调查的理论基础是大数定律、正态分布和中心极限定理。总体参数估计是根据样本信息对全及总体指标进行估计或推算。参数估计所使用的样本统计量称为估计量,评价优良估计量常用无偏性、有效性和一致性三个标准。参数估计在逻辑上运用归纳推理的方法,其结论的内容大于前提,是一种可能性的推断,结果必然存在误差。参数估计结果存在的抽样误差是可控性误差第一百五十八页,共一百六十九页,编辑于2023年,星期四第七章抽样调查本章小结参数估计从方法上可分为点估计和区间估计两类:点估计也称定值估计,它是以样本指标的计算结果作为总体参数估计的结果,即用样本指标值直接作为全及总体指标的代表值。点估计的优点是简单、具体、明确;其局限性是无法说明抽样误差大小,也无法说明估计结果究竟有多大的把握程度。区间估计是根据样本估计量以一定可靠程度推断总体参数所在的区间范围,实践中应用较广。在区间估计中,大样本情况下,采用正态分布理论推断;小样本情况下,若为正态总体,方差已知时,按正态分布理论推断,方差未知时,按t分布理论推断。第一百五十九页,共一百六十九页,编辑于2023年,星期四第七章抽样调查本章小结设计抽样方案时必须掌握两个基本原则:一是保证实现抽样的随机性原则。二是保证实现最大的抽样效果原则。常用的抽样组织形式有简单随机抽样、分层抽样、等距抽样、整群抽样和多阶段抽样。统计假设检验是事先对总体参数或总体分布形式做出一个假设,然后利用样本信息来判断这一假设是否合理,即判断样本统计量的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 少先锋队申请书
- 全国导游基础知识-导游资格全国导游基础知识2021年真题
- 管理班级申请书
- 企业信息披露结构与透明度提升规范
- 校资助贫困申请书
- 2024-2025学年安徽省合肥市普通高中高二上学期期末总复习测物理试卷(解析版)
- 江苏省盐城市2024-2025学年高二上学期学业水平合格性模拟检测物理试题(解析版)
- 2024-2029年中国氢能承压设备(氢能装备)行业发展前景预测与投资战略规划分析报告
- 2025年江苏南通市中央创新区建设投资有限公司招聘笔试参考题库附带答案详解
- 电梯系统的远程监控与故障诊断技术
- 学校教育中的品牌塑造与校园文化建设培训课件
- 干部人事档案数字化 制度
- 经营开发部工作目标责任书
- 小班绘本教学《藏在哪里了》课件
- 沧州师范学院学士学位论文写作指南2020版
- 手机归属地表格
- 《职业教育》专业知识考试复习题库及答案
- 2023年北京市平谷区中考英语二模试卷
- 2023年新课标全国1卷英语高考真题试卷+答案
- 注塑成型参数条件表
- 变压器更换施工方案
评论
0/150
提交评论