版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 第一节第一节 抽样调查的意义抽样调查的意义 第二节第二节 抽样调查的基本概念及理论依据抽样调查的基本概念及理论依据 第三节第三节 抽样平均误差抽样平均误差 第四节第四节 全及指标的推断全及指标的推断 第五节第五节 假设检验假设检验为什么要抽样为什么要抽样?为了收集必要的资料,对所研究对象(总体)的为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。全部元素逐一进行观测,往往不很现实。抽抽样样原原因因元素多,搜集数据费元素多,搜集数据费时、费用大,不及时而时、费用大,不及时而使所得的数据无意义使所得的数据无意义总体庞大总体庞大, ,难以对难以对总体的全部元素总体的全部
2、元素进行研究进行研究检查具有破坏性检查具有破坏性炮弹、灯管、砖等炮弹、灯管、砖等第一节第一节 抽样调查的意义抽样调查的意义一、抽样调查的概念一、抽样调查的概念广义:凡是抽取一部分单位进行观察,并根据观广义:凡是抽取一部分单位进行观察,并根据观察结果来推断全体的都是抽样调查。察结果来推断全体的都是抽样调查。 可分为可分为非随机抽样非随机抽样和和随机抽样随机抽样两种。两种。狭义狭义:随机抽样。按照随机原则从总体中抽取一:随机抽样。按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对以被抽取的那部分单位的数
3、量特征为代表,对总体作出数量上的推断分析。总体作出数量上的推断分析。我国的抽样调查应用主要有:我国的抽样调查应用主要有: 国家和地方统计部门国家和地方统计部门 一系列抽样调查制度:一系列抽样调查制度:1%1%人口抽样调查、城市人口抽样调查、城市和农村住户调查、农产量抽样调查等。和农村住户调查、农产量抽样调查等。 三支调查队:城市社会经济调查总队、农村社会三支调查队:城市社会经济调查总队、农村社会经济调查总队、企业调查总队。经济调查总队、企业调查总队。 其他政府部门、社会团体和学术团体其他政府部门、社会团体和学术团体 妇女生育力调查(国家计划生育委员会)妇女生育力调查(国家计划生育委员会) 公众
4、科学素养调查(全国科协)公众科学素养调查(全国科协) 语言与文字使用情况调查(教育部与国家语委)语言与文字使用情况调查(教育部与国家语委) 专业调查咨询机构专业调查咨询机构 央视调查咨询中心、北京华通现代信息咨询有限央视调查咨询中心、北京华通现代信息咨询有限公司、北京零点市场调查与分析公司等。公司、北京零点市场调查与分析公司等。二、抽样调查的特点二、抽样调查的特点(一)只抽取总体中的一部分单位进行调查(一)只抽取总体中的一部分单位进行调查(二)用一部分单位的指标数值去推断总体的指标(二)用一部分单位的指标数值去推断总体的指标数值数值(三)抽选部分单位时要遵循随机原则(三)抽选部分单位时要遵循随
5、机原则(四)抽样调查会产生抽样误差,抽样误差可以计(四)抽样调查会产生抽样误差,抽样误差可以计算,并且可以加以控制算,并且可以加以控制三三、抽样调查的抽样调查的范围范围有破坏性、不可能进行全面调查的事物可进行抽有破坏性、不可能进行全面调查的事物可进行抽样调查样调查全面调查实际办不到的事物可进行抽样调查全面调查实际办不到的事物可进行抽样调查节省人力、费用和时间,方式灵活节省人力、费用和时间,方式灵活在有些情况下,抽样调查的结果比全面调查要准在有些情况下,抽样调查的结果比全面调查要准确确5.5.用抽样调查的资料修正和补充全面调查资料用抽样调查的资料修正和补充全面调查资料6.6.抽样调查方法可以用于
6、工业生产过程中的质量控抽样调查方法可以用于工业生产过程中的质量控制制7.7.利用抽样推断的方法,可以对于某种总体的假设利用抽样推断的方法,可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍进行检验,来判断这种假设的真伪,以决定取舍第二节第二节 抽样调查的基本概念及理论依抽样调查的基本概念及理论依据据一、一、全及总体和抽样总体全及总体和抽样总体(1 1)全及总体,简称总体)全及总体,简称总体 全及总体是指所要认识对象的全体,全及总体是指所要认识对象的全体,总体是由具有总体是由具有某种共同性质的许多单位组成,某种共同性质的许多单位组成,是具有同一性质是具有同一性质的许多单位的集合体。
7、的许多单位的集合体。按其各单位标志性质不同,可分为按其各单位标志性质不同,可分为变量总体变量总体和和属性总体属性总体两类。两类。变量总体:各单位可用数量标志计量,变量总体是从研究数量标志的角度而言的;属性总体:各单位用品质标志描述,属性总体是从研究是非品质标志的角度而言的。 对于变量总体可分为对于变量总体可分为无限总体无限总体和和有限总体有限总体两类。两类。 可列的无限变量和不可列的无限变量。可列的无限变量和不可列的无限变量。 全及总体通常用大写字母全及总体通常用大写字母N N来表示。来表示。(2 2)抽样总体,简称样本)抽样总体,简称样本 是指从总体中按照随机原则抽取的一部分是指从总体中按照
8、随机原则抽取的一部分单位所构成的集合体。样本中的各个单位单位所构成的集合体。样本中的各个单位称样本单位。称样本单位。通常用小写字母通常用小写字母n n来表示。来表示。 样本的大小:样本的大小: 根据样本容量的大小,可将样本划分为大样本和根据样本容量的大小,可将样本划分为大样本和小样本。小样本。一般来说,当一般来说,当3030时,称为大样本;当时,称为大样本;当3030时称为小样本。时称为小样本。二、二、全及指标和抽样指标全及指标和抽样指标(1 1)全及指标)全及指标 根据全及总体各个单位的标志值或标志特征计算根据全及总体各个单位的标志值或标志特征计算的、反映总体某种属性的综合指标。唯一确定的、
9、反映总体某种属性的综合指标。唯一确定 变量总体变量总体 总体平均数总体平均数 属性总体属性总体 总体成数总体成数NXXNNP1PNNNNNQ110 总体标准差总体标准差和总体方差和总体方差2 2NXX22)(NXX2)(nxxi22)(nxxi2)(nxxnnp1pnnnnnq110(2 2)抽样指标)抽样指标由抽样总体各个标志值或标志特征计算的综合指标。由抽样总体各个标志值或标志特征计算的综合指标。 抽样平均数抽样平均数 抽样成数抽样成数 样本标准差样本标准差 样本方差样本方差FXFNXX或FFXXNXX22)()(或NNP1)(PPPp1Qffxxnxxs22)()(或fxfnxx或)1
10、(pppqpsnnp1是唯一确定的是唯一确定的是随机变量,它会随着样是随机变量,它会随着样本的不同而有不同的取值本的不同而有不同的取值px,PX,标指样抽算计标指量总断推(3 3)统计抽样过程)统计抽样过程 总体总体N N 样本样本n n (抽样方式方法)(抽样方式方法) (抽样估计)(抽样估计) (计算抽样误差)(计算抽样误差) 三三、抽样方法和样本可能数目、抽样方法和样本可能数目根据取样的方式不同,抽样方式可分为根据取样的方式不同,抽样方式可分为重复抽样重复抽样和和不重复抽样不重复抽样两种。两种。 重复抽样的样本是由重复抽样的样本是由n n次相互独立的连续试验所组次相互独立的连续试验所组成
11、的。每次试验实在完全相同的条件下进行的。成的。每次试验实在完全相同的条件下进行的。每个单位中选或不中选机会在每次都完全一样。每个单位中选或不中选机会在每次都完全一样。可见重置抽样时:可见重置抽样时:总体单位数在抽选过程中始终不变;总体单位数在抽选过程中始终不变;总体中各单位被抽中的可能性前后相同;总体中各单位被抽中的可能性前后相同;总体中各单位有被重复抽中的可能。总体中各单位有被重复抽中的可能。 不重复抽样的样本是由不重复抽样的样本是由n n次连续抽选的结果次连续抽选的结果组成组成, ,实质上等于一次同时从总体中抽实质上等于一次同时从总体中抽n n个个组成抽样样本。连续组成抽样样本。连续n n
12、次抽选的结果不是相次抽选的结果不是相互独立的。每个单位的中选或不中选机会互独立的。每个单位的中选或不中选机会在各次是不同的。在各次是不同的。可见可见,不重置抽样时:不重置抽样时:总体单位数在抽选过程中逐渐减少;总体单位数在抽选过程中逐渐减少;总体中各单位被抽中的可能性前后不断变总体中各单位被抽中的可能性前后不断变化;化;总体中各单位没有被重复抽中的可能。总体中各单位没有被重复抽中的可能。重复抽样:又称有放回抽样。重复抽样:又称有放回抽样。,例例如如:500015000150001 不重复抽样:又称不放回抽样。不重复抽样:又称不放回抽样。,例例如如:499814999150001 根据对样本的要
13、求不同,抽样方式又有根据对样本的要求不同,抽样方式又有考虑顺序考虑顺序抽样抽样和和不考虑顺序抽样不考虑顺序抽样两种。两种。 以上抽样方法两种分类还存在交叉情况,因而有:以上抽样方法两种分类还存在交叉情况,因而有:考虑顺序的不重复抽样、考虑顺序的重复抽样、考虑顺序的不重复抽样、考虑顺序的重复抽样、不考虑顺序的不重复抽样和不考虑顺序的重复抽不考虑顺序的不重复抽样和不考虑顺序的重复抽样等四种。样等四种。)!/(!nNNpnNnNnNC考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样nnNC
14、1四、抽样调查的理论依据四、抽样调查的理论依据 1 1、大数、大数定律定律:随着抽样单位数的增加,抽样平:随着抽样单位数的增加,抽样平均数均数 有接近总体平均数有接近总体平均数 的趋势。的趋势。 2 2、中心极限定理:如果总体变量存在有限的平、中心极限定理:如果总体变量存在有限的平均数和方差,则不论这个总体变量的分布如何,均数和方差,则不论这个总体变量的分布如何,随着抽样单位数随着抽样单位数n n的增加,抽样平均数的分布便的增加,抽样平均数的分布便趋于正态分布。趋于正态分布。xX1 1、大数定律、大数定律(1 1)独立同分布大数定律)独立同分布大数定律 独立的随机变量独立的随机变量x x1 1
15、,x,x2 2,具有相同分布,且存在具有相同分布,且存在有限的数学期望有限的数学期望E(xE(xi i)=X)=X和方差和方差D(xD(xi i)=)=2 2,则对任,则对任意小的正数意小的正数,有,有 该定律表明,当该定律表明,当n n足够大时,独立同分布的一系列足够大时,独立同分布的一系列随机变量的算术平均数接近数学期望,即平均数随机变量的算术平均数接近数学期望,即平均数具有稳定性。具有稳定性。1|1|lim1Xxnpniin(2 2)伯伯努力大数定律努力大数定律 设设m m是是n n次独立随机试验中事件次独立随机试验中事件A A发生的次数,发生的次数,p p是是事件事件A A在每次试验中
16、发生的概率,则对于任意小的在每次试验中发生的概率,则对于任意小的正数正数,有,有 该定律表明,当该定律表明,当n n足够大时,事件足够大时,事件A A发生的频率接发生的频率接近事件近事件A A发生的概率,即频率具有稳定性。发生的概率,即频率具有稳定性。1|limpnmpn2 2、中心极限定理、中心极限定理(1 1)独立同分布中心极限定理)独立同分布中心极限定理 随机变量随机变量x x1 1,x,x2 2,独立且服从同一分布,若存在独立且服从同一分布,若存在有限的数学期望有限的数学期望E(xE(xi i)=X)=X和方差和方差D(xD(xi i)=)=2 2,当,当nn时,随机变量的总和时,随机
17、变量的总和 趋于均值为趋于均值为nxnx、方差为、方差为nn2 2的正态分布。即的正态分布。即nn时时 或或 结论:不论总体服从何种分布,只要它的数学期望结论:不论总体服从何种分布,只要它的数学期望和方差存在,从中抽取容量为和方差存在,从中抽取容量为n n的样本,则这个样的样本,则这个样本的总和或平均数是个随机变量,当本的总和或平均数是个随机变量,当n n充分大时,充分大时,趋于正态分布。趋于正态分布。),(2nnxNxi),(2nXNx),(npqnpNX(2 2)德莫)德莫夫夫- -拉普拉斯中心极限定理拉普拉斯中心极限定理 如果用如果用X X表示表示n n次独立试验中事件次独立试验中事件A
18、 A发生的次数,发生的次数,p p是事件是事件A A在每次试验中发生的概率,则在每次试验中发生的概率,则X X服从二项服从二项分布分布B(n,p)B(n,p),当,当nn时,时,X X趋于均值为趋于均值为npnp、方差、方差为为npqnpq的正态分布,即的正态分布,即 在现实生活中,一个随机变量服从于正态分布未在现实生活中,一个随机变量服从于正态分布未必很多,但多个随机变量和的分布趋近于正态分必很多,但多个随机变量和的分布趋近于正态分布则是普遍存在的。布则是普遍存在的。样本均值的抽样分布 一般的,当总体服从一般的,当总体服从 N N( (, ,2 2 ) )时,来自该总体时,来自该总体的容量为
19、的容量为n n的样本的均值的样本的均值 X X也服从正态分布,也服从正态分布, X X 的的期望为期望为,方差为,方差为2 2/ /n n。即。即 X XN N( (, ,2 2/ /n n) )。总体分布总体分布n = 4抽样分布抽样分布X5x50 xn =165 . 2x第三节第三节 抽样平均误差抽样平均误差一、抽样误差的概念一、抽样误差的概念 抽样误差是指样本指标和总体指标之间数量上抽样误差是指样本指标和总体指标之间数量上的差别。的差别。 以数学符号表示以数学符号表示:| | |、|p-P|p-P|Xx统计调查误差种类统计调查误差种类按产生的原因分,统计调查误差可分为登记性误差和代表性按
20、产生的原因分,统计调查误差可分为登记性误差和代表性误差。误差。 1 1、登记性误差、登记性误差 是指统计调查时,由于主观原因在登记、汇总、计算、是指统计调查时,由于主观原因在登记、汇总、计算、过录中所产生的误差。登记性误差不论全面调查或非全面过录中所产生的误差。登记性误差不论全面调查或非全面调查都可能产生调查都可能产生。 2 2、代表性误差又可分为两种:系统性误差和随机误差。、代表性误差又可分为两种:系统性误差和随机误差。 系统性误差又称偏差,它是由于抽样调查没有遵循随机原系统性误差又称偏差,它是由于抽样调查没有遵循随机原则而产生的误差。只要遵循随机原则就可以避免。则而产生的误差。只要遵循随机
21、原则就可以避免。 随机误差又称偶然的代表性误差,它是指没有登记性误差随机误差又称偶然的代表性误差,它是指没有登记性误差的前提下,又遵循了随机原则所产生的误差。随机误差是的前提下,又遵循了随机原则所产生的误差。随机误差是抽样调查固有的误差。抽样误差是指这种随机误差。抽样调查固有的误差。抽样误差是指这种随机误差。 抽样平均误差抽样实际误差抽样误差偶然的代表性误差随机误差偏差系统性误差代表性误差登记性误差统计调查误差二、影响抽样平均误差的因素二、影响抽样平均误差的因素(一)全及总体标志的变动程度(一)全及总体标志的变动程度 全及总体标志变动程度与抽样平均误差成正比关全及总体标志变动程度与抽样平均误差
22、成正比关系。系。(二)抽样单位数的多少(二)抽样单位数的多少 样本单位数与抽样平均误差的大小成反比关系。样本单位数与抽样平均误差的大小成反比关系。(三)抽样组织的方式(三)抽样组织的方式三、抽样平均误差的意义三、抽样平均误差的意义 抽样平均误差是一系列抽样指标(平均指标或抽样平均误差是一系列抽样指标(平均指标或成数)的标准差。成数)的标准差。 抽样平均误差既是实际可以运用于衡量抽样抽样平均误差既是实际可以运用于衡量抽样指标对于全及指标代表性程度的一个尺度;也是指标对于全及指标代表性程度的一个尺度;也是计算抽样指标与全及指标之间变异范围的一个根计算抽样指标与全及指标之间变异范围的一个根据;同时,
23、在组织抽样调查中,也是确定抽样单据;同时,在组织抽样调查中,也是确定抽样单位数多少的计算依据之一。位数多少的计算依据之一。四、抽样平均误差的计算四、抽样平均误差的计算(一)抽样平均数的抽样平均误差(一)抽样平均数的抽样平均误差 抽样平均误差就是一系列抽样指标的标准差,通抽样平均误差就是一系列抽样指标的标准差,通常用符号常用符号来表示。用来表示。用 表示抽样平均误差。表示抽样平均误差。 - -抽样平均数抽样平均数 - -全及平均数全及平均数 K-K-抽样平均数或抽样成数的个数抽样平均数或抽样成数的个数上述公式一般不用于实际计算。上述公式一般不用于实际计算。KxXx2)(xXx(1 1)重复抽样抽
24、样平均数的抽样平均误差)重复抽样抽样平均数的抽样平均误差 在重复抽样条件下,抽样平均误差与全及总体的在重复抽样条件下,抽样平均误差与全及总体的标准差成正比关系;与抽样总体单位数平方根成标准差成正比关系;与抽样总体单位数平方根成反比关系。反比关系。 上式表明抽样平均数的平均误差仅为全及总体标上式表明抽样平均数的平均误差仅为全及总体标准差的准差的 。 上式还表明抽样平均误差华总体标志变动度的大上式还表明抽样平均误差华总体标志变动度的大小成正比,而和样本单位的平方根成反比。小成正比,而和样本单位的平方根成反比。nnx2n1例:从例:从4040、5050、7070、8080中抽取中抽取3 3个组成样本
25、,个组成样本,在重复抽样下,求抽样平均误差。在重复抽样下,求抽样平均误差。求总体标准差,直接用计算器统计功能键可求总体标准差,直接用计算器统计功能键可以求出以求出:13. 9381.15nx81.152NXX求抽样平均误差(2 2)不重复抽样抽样平均数的抽样平均误差)不重复抽样抽样平均数的抽样平均误差 在不重复抽样的情况下,在不重复抽样的情况下, 在总体单位数在总体单位数N N很大的情况下,可以近似地表示为很大的情况下,可以近似地表示为 即不重复抽样平均方差等于重复抽样平均方差乘即不重复抽样平均方差等于重复抽样平均方差乘以校正因子以校正因子1-n/N1-n/N。实际中,两者很接近。实际中,两者
26、很接近。)1(2NnNnx)1 (2Nnnx例:从从4040、5050、7070、8080中抽取中抽取3 3个组成样本,个组成样本,在不重复抽样下,求抽样平均误差。在不重复抽样下,求抽样平均误差。求总体标准差,直接用计算器统计功能键可求总体标准差,直接用计算器统计功能键可以求出:以求出:27. 514343181.1522NnNnx81.152NXX求抽样平均误差(二)抽样成数的抽样平均误差(二)抽样成数的抽样平均误差 全及成数标准差平方,也称为全及成数标准差平方,也称为“交替标志的方差交替标志的方差”。 为计算交替标志的方差,必须将交替变异的标志过渡为计算交替标志的方差,必须将交替变异的标志
27、过渡到数量标志。用到数量标志。用x=1x=1表示单位具有这一标志,用表示单位具有这一标志,用x=0 x=0表表示单位不具有这一标志。示单位不具有这一标志。具有这一标志的单位数占全及总体的比重具有这一标志的单位数占全及总体的比重不具有这一标志的单位数占全及总体的比重不具有这一标志的单位数占全及总体的比重 这两个成数之和等于这两个成数之和等于1,1,即即 。nnp1nnq0pqnnnnqp1, 101交替标志的平均数和标准差计算表交替标志的平均数和标准差计算表 交替标志交替标志 单位数单位数 变量变量x x成数成数 离差离差 离差平方离差平方 离差平方离差平方 (变量)(成数)(变量)(成数) 乘
28、权数乘权数 x f xf x f xf 合格品合格品 1 1 p p 1-p (1-p)p p 1-p (1-p)2 2 (1-p) (1-p)2 2p p不合格品不合格品 0 q 0 0-p (0-p) 0 q 0 0-p (0-p)2 2 (0-p) (0-p)2 2q q 合计合计 - p+q=1 p - q - p+q=1 p - q2 2p+pp+p2 2q=qpq=qppqpqpfxfx01 交替标志的标准差为交替标志的标准差为因为因为q+p=1 q=1-pq+p=1 q=1-p所以所以 可见,成数的平均数就是成数本身;成数的方差可见,成数的平均数就是成数本身;成数的方差就是就是p
29、(1-p)p(1-p)。qpqpqpppffxxp222)0()1 ()()1 (ppqpp)1 (2ppp 重复抽样抽样成数的平均误差重复抽样抽样成数的平均误差 不重复抽样抽样成数的平均误差不重复抽样抽样成数的平均误差nppp)1 ( )1 ()1 (Nnnppp取得取得的途径有:的途径有: 1. 1. 用过去全面调查或抽样调查的资料,用过去全面调查或抽样调查的资料,若同时有若同时有n n个个的资料,应选用数值较的资料,应选用数值较大的那个;大的那个;2. 2. 用样本标准差用样本标准差S S代替全及标准差代替全及标准差;3. 3. 在大规模调查前,先搞个小规模的试在大规模调查前,先搞个小规
30、模的试验性的调查来确定验性的调查来确定S S,代替,代替;4. 4. 用估计的方法。用估计的方法。使用时间( 小时)抽查灯泡个数(个)组中值900以下2875900950492595010001197510001050711025105011008410751100115018112511501200711751200以上31225合计200灯泡使用寿命资料求样本平均数和样本成数的抽样平均误差求样本平均数和样本成数的抽样平均误差。求灯泡平均使用时间、标准差和灯泡合格率(样本)求灯泡平均使用时间、标准差和灯泡合格率(样本)63.532nxx1057fxfx%5 .91200183p求灯泡使用时间
31、抽样平均误差:求灯泡使用时间抽样平均误差:小时79. 320063.53nx在不重复抽样下抽样平均误差:小时75. 311000020010000200163.5322NnNnx在重复抽样下抽样平均误差:求灯泡合格率的抽样平均误差求灯泡合格率的抽样平均误差:%97. 1200085. 0915. 01nppp在不重复抽样下抽样平均误差:%95. 111000020010000200085. 0915. 011NnNnppx在重复抽样下抽样平均误差:第四节第四节 全及指标的推断全及指标的推断抽样推断要求抽样推断要求 抽样推断是指按已经抽定的样本指标(样本平均抽样推断是指按已经抽定的样本指标(样本
32、平均数或样本成数)来估计总体指标(总体平均数或数或样本成数)来估计总体指标(总体平均数或总体成数),或其所在的区间范围。总体成数),或其所在的区间范围。一、一、抽样极限误差抽样极限误差 抽样误差范围就是指变动的抽样指标与确抽样误差范围就是指变动的抽样指标与确定的全及指标之间离差的可能范围。定的全及指标之间离差的可能范围。 统计上把这个给定的抽样误差范围叫做抽统计上把这个给定的抽样误差范围叫做抽样极限误差,也称置信区间。样极限误差,也称置信区间。 用用 与与 表示抽样平均数与抽样成数的表示抽样平均数与抽样成数的抽样极限误差,则有抽样极限误差,则有xp|Xxx|PppXXxxXxXppPpPxxx
33、XxpppPpxxXppPX 抽样误差范围是以抽样误差范围是以 或或P P为中心的两个为中心的两个的距离,的距离,这抽样误差范围的原意。这抽样误差范围的原意。 但由于全及指标是个未知的数值,而抽样指标通但由于全及指标是个未知的数值,而抽样指标通过实测是可以求得的。过实测是可以求得的。 因此,抽样误差范围的实际意义是要求被估计的因此,抽样误差范围的实际意义是要求被估计的全及指标全及指标 或或P P,落在抽样指标一定范围内。,落在抽样指标一定范围内。 即全及指标即全及指标 、P P的区间估计为的区间估计为X二、二、可信程度可信程度 抽样平均误差抽样平均误差是表明抽样估计的准确度,抽样是表明抽样估计
34、的准确度,抽样极限误差极限误差是表明抽样估计准确程度的范围。是表明抽样估计准确程度的范围。在在给定的准确程度范围内的抽样估计,还要研究其给定的准确程度范围内的抽样估计,还要研究其估计的可靠程度,即可信程度。估计的可靠程度,即可信程度。 是用一定倍数的是用一定倍数的表示的抽样指标与全及指标表示的抽样指标与全及指标之间的绝对离差。这里的倍数用之间的绝对离差。这里的倍数用t t来表示,称概率来表示,称概率度,也称置信度。度,也称置信度。xxtXx|pptPp|nXxtxx| nPPPptpp)1 (| 上述公式的意义在于,在一定上述公式的意义在于,在一定的条件下,的条件下,当概率度当概率度t t越大
35、,则抽样误差范围越大,可越大,则抽样误差范围越大,可能样本落在误差范围内的概率越大,从而能样本落在误差范围内的概率越大,从而抽样估计的可信程度也就越高;反之,当抽样估计的可信程度也就越高;反之,当t t越小,则越小,则越小,可能样本落在误差范围越小,可能样本落在误差范围内的概率越小,从而抽样估计的可信程度内的概率越小,从而抽样估计的可信程度也就越低。也就越低。 概率度和概率之间保持一定的函数关系,即概率概率度和概率之间保持一定的函数关系,即概率是概率度的函数。用是概率度的函数。用P P表示概率以说明抽样估计的表示概率以说明抽样估计的可靠程度,其函数关系可表示为可靠程度,其函数关系可表示为 P=
36、F(t) P=F(t) 在正态分布的情况下,从总体中随机抽取一个样在正态分布的情况下,从总体中随机抽取一个样本加以观察,则该样本抽样指标落在某一范围本加以观察,则该样本抽样指标落在某一范围 内的概率,是用占正态曲线面积内的概率,是用占正态曲线面积的大小表示的。即的大小表示的。即tttxxdtetxXtxPtF2221)()(xxtxtx 例如,样本平均数落在总体平均数左右例如,样本平均数落在总体平均数左右1个个的范围的范围内(内(t t=1=1)的概率是)的概率是68.27%; 2个个的范围内(的范围内(t t=2=2)的)的概率是概率是95.45% 正态分布曲线与横轴围成的面积等于正态分布曲
37、线与横轴围成的面积等于1.置信度置信度F(t)是概是概率度率度t的函数,两者是一一对应的正比例关系。两者常用的的函数,两者是一一对应的正比例关系。两者常用的数值主要有:数值主要有: t=1 F(t)=68.27% t=1.96 F(t)=95% t=2 F(t)=95.45% t=3 F(t)=99.73%68.27%95.45%99.73%抽样极限误差抽样极限误差),(2nXNxXxx2x3x2xx3x第五节 假设检验 一、假设检验的概念 二、假设检验的一般方法 三、正态总体参数的检验 四、总体成数的假设检验例例1 设某厂生产一种灯泡,其寿命服从正态设某厂生产一种灯泡,其寿命服从正态分布,从
38、过去较长一段时间的生产情况看,分布,从过去较长一段时间的生产情况看,灯泡的平均寿命为灯泡的平均寿命为1500小时。标准差为小时。标准差为100小时,现从新批量生产的灯泡中随机抽小时,现从新批量生产的灯泡中随机抽取取100只作试验,测得平均寿命为只作试验,测得平均寿命为1530小小时。时。 问:新批量生产灯泡的平均寿命与以往的问:新批量生产灯泡的平均寿命与以往的灯泡使用寿命是否有显著差异?灯泡使用寿命是否有显著差异? 分析分析:从抽样的结果上看,新批量生产的灯泡中从抽样的结果上看,新批量生产的灯泡中100只灯只灯泡平均寿命为泡平均寿命为1530小时,比以往的灯泡使用的平均寿命小时,比以往的灯泡使
39、用的平均寿命1500小时增加了小时增加了30小时。这小时。这30小时的差异产生有二种情小时的差异产生有二种情况。况。 A.新批量生产灯泡的平均寿命与以往的灯泡使用寿命无新批量生产灯泡的平均寿命与以往的灯泡使用寿命无显著差异,显著差异,30小时的差异是抽样的随机性造成的。小时的差异是抽样的随机性造成的。 B.抽样的随机性不可能造成抽样的随机性不可能造成30小时这么大的差异,新批小时这么大的差异,新批量生产灯泡的平均寿命确实增加了。量生产灯泡的平均寿命确实增加了。 可先假设新批量生产灯泡的平均寿命与以往的灯可先假设新批量生产灯泡的平均寿命与以往的灯泡使用寿命无显著差异。然后利用抽样泡使用寿命无显著
40、差异。然后利用抽样100只灯只灯泡的信息来检验我们的假设是否正确。泡的信息来检验我们的假设是否正确。 如果假设成立,说明新批量生产灯泡的平均寿命如果假设成立,说明新批量生产灯泡的平均寿命与以往的灯泡使用寿命无显著差异。与以往的灯泡使用寿命无显著差异。 如果假设不成立,说明新批量生产灯泡的平均寿如果假设不成立,说明新批量生产灯泡的平均寿命与以往的灯泡使用寿命有否显著的差异。命与以往的灯泡使用寿命有否显著的差异。一、假设检验的概念 1.概念: 根据一定随机样本所提供的信息,用它来判断总体位置参数事先的假设是否可信的统计分析方法。2.基本思想: 为了判断总体的某个特征,先根据决策要求,对总体特征做出
41、一个原假设,然后从总体中抽取一定容量的随机样本,计算和分析样本数据,对总体的原假设做假设检验,进而作出接受或拒绝原假设的决策。假设检验的基本思想假设检验的基本思想. 因此我们因此我们拒绝假设拒绝假设 = 20. 如果这是如果这是总体的真实总体的真实均值均值 = 50H0这个值不像这个值不像我们应该得我们应该得到的样本均到的样本均值值 .二、假设检验的一般方法 小概率原理是假设检验的基本依据,即认为小概率事件在一次试验中几乎是不可能发生的。当进行假设检验时,先假设H0正确,在此假设下,若小概率事件A出现的概率很小,例如P(A)=0.01,经过取样试验后,A出现了,则违反了上述原理,我们认为这是一
42、个不合理的结果。 这时,我们只能怀疑作为小概率事件A的前提假设H0的正确性,于是否定H0。反之,如果试验中A没有出现,我们就没有理由否定假设H0,从而做出接受H0的结论。下面我们通过实例来说明假设检验的基本思想及推理方法。原假设原假设 是关于总体均值而非样本统计量的假设是关于总体均值而非样本统计量的假设 总是假设原假设是正确的总是假设原假设是正确的原假设可能被接受也可能被拒绝原假设可能被接受也可能被拒绝替代替代假设假设 是原假设的对立是原假设的对立替代替代假设可能被接受也可能被拒绝假设可能被接受也可能被拒绝 替代替代假设是试图要建立的检验假设是试图要建立的检验提出原假设和提出原假设和替代替代假
43、设假设 什么是原假设?什么是原假设?(Null Hypothesis)1. 待检验的假设,又称待检验的假设,又称“0假设假设”2. 如果错误地作出决策会导致一系列后果如果错误地作出决策会导致一系列后果3. 总是有等号总是有等号 , 或或 4. 表示为表示为 H0H0: 某一数值某一数值 指定为指定为 = 号,即号,即 或或 例如例如, H0: 3190(克)(克)什么是什么是替代替代假设?假设?(Alternative Hypothesis)1. 与原假设对立的假设与原假设对立的假设2. 总是有不等号总是有不等号: , 或或 3. 表示为表示为 H1H1: 某一数值,或某一数值,或 某一数值某
44、一数值例如例如, H1: 3910(克克),或,或 39103910克克 假设检验分为双侧检验和单侧检验1. 双侧检验 如果提出的原假设是总体的参数等于某一数值。如果提出的原假设是总体的参数等于某一数值。如果样本的统计量明显大于或明显小于总体参数如果样本的统计量明显大于或明显小于总体参数的这一数值,就可以拒绝原假设,则称这种检验的这一数值,就可以拒绝原假设,则称这种检验为双侧检验。为双侧检验。 如原假设为如原假设为H0 : , 那么只要那么只要 或或 二者之一成立,就可二者之一成立,就可以否定原假设以否定原假设H0 ,这种假设检验就是双侧检验。,这种假设检验就是双侧检验。 当我们所关心的问题是
45、要检验样本均值与总体均当我们所关心的问题是要检验样本均值与总体均值或样本比率与总体比率有没有显著性差异性,值或样本比率与总体比率有没有显著性差异性,而不问差异的方向是正差或是负差时,可采用双而不问差异的方向是正差或是负差时,可采用双侧检验。侧检验。 0XX 0XX 0XX 总体均值的双侧检验的原假设和总体均值的双侧检验的原假设和替代替代假设为:假设为: 原假设为:原假设为: H0 : 替代替代假设为:假设为: H1 : 总体比率的双侧检验的原假设和总体比率的双侧检验的原假设和替代替代假设为:假设为: 原假设为:原假设为: H0 : 替代替代假设为:假设为: H1 : 0XX 0XX 0PP 0
46、PP 2. 单侧检验单侧检验 (1)左侧检验)左侧检验 如果提出的原假设是总体的参数不少于某一数如果提出的原假设是总体的参数不少于某一数值。值。 如果样本的统计量明显小于总体参数的这一数值,如果样本的统计量明显小于总体参数的这一数值,就可以拒绝原假设,则称这种检验为左单侧检验。就可以拒绝原假设,则称这种检验为左单侧检验。 例例3 某外贸企业生产茶叶用于出口,其重量服从正态分某外贸企业生产茶叶用于出口,其重量服从正态分布,根据以前的资料已知总体标准差是布,根据以前的资料已知总体标准差是1克,按规定平均克,按规定平均重量不低于重量不低于150克,现从一批即将出口的茶叶从中抽取克,现从一批即将出口的
47、茶叶从中抽取25包进行检验,测得其平均重量包进行检验,测得其平均重量149.35克,现问这一批茶克,现问这一批茶叶是否符合规定?叶是否符合规定? 这是一个左侧检验问题。应建立的原假设和备择假设为:这是一个左侧检验问题。应建立的原假设和备择假设为: 原假设:原假设: H0 :这批茶叶每包平均重量不低于:这批茶叶每包平均重量不低于150克;克; 替代替代假设为假设为H1 :这批茶叶每包平均重量少于:这批茶叶每包平均重量少于150克;克; 原假设:原假设: H0 : 替代替代假设为假设为:H1 : )(150 克X)(150 克X 当我们所关心的问题是要检验总体均值与总体比当我们所关心的问题是要检验
48、总体均值与总体比率是否低于预先的数值,此时应采用左侧检验。率是否低于预先的数值,此时应采用左侧检验。总体均值的左侧检验的原假设和总体均值的左侧检验的原假设和替代替代假设为:假设为: 原假设为:原假设为: H0 : 替代替代假设为:假设为: H1 : 总体比率的总体比率的左侧左侧检验的原假设和检验的原假设和替代替代假设为:假设为: 原假设为:原假设为: H0 : 替代替代假设为:假设为: H1 : 0XX 0XX 0PP 0PP (2)右侧检验)右侧检验 如果提出的原假设是总体的参数不大于某如果提出的原假设是总体的参数不大于某一数值。一数值。 如果样本的统计量明显大于总体参数的这如果样本的统计量
49、明显大于总体参数的这一数值,就可以拒绝原假设,则称这种检一数值,就可以拒绝原假设,则称这种检验为右单侧检验。验为右单侧检验。例例4 某企业大量生产袋装食品,按规定每袋重量不得少于某企业大量生产袋装食品,按规定每袋重量不得少于250克。今从一批该种食品中随机抽取克。今从一批该种食品中随机抽取50袋,发现有袋,发现有5袋袋低于低于250克。若规定不符合标准的比例超过克。若规定不符合标准的比例超过5%就不得出就不得出厂,问这批食品能否出厂?厂,问这批食品能否出厂?这是一个右单侧检验问题。应建立的原假设和备择假设为:这是一个右单侧检验问题。应建立的原假设和备择假设为: 原假设:原假设: H0 :这批食
50、品不符合标准的比例不超过:这批食品不符合标准的比例不超过5% 备择假设为备择假设为H1 :这批食品不符合标准的比例超过:这批食品不符合标准的比例超过5% 即即: H0: H1:%5P%5P 当我们所关心的问题是要检验总体均值与总体比当我们所关心的问题是要检验总体均值与总体比率是否超过预先的数值,此时应采用右单侧检验。率是否超过预先的数值,此时应采用右单侧检验。 总体均值的右侧检验的原假设和总体均值的右侧检验的原假设和替代替代假设为:假设为: 原假设为:原假设为: H0 : 替代替代假设为:假设为: H1 : 总体比率的右侧检验的原假设和总体比率的右侧检验的原假设和替代替代假设为:假设为: 原假
51、设为:原假设为: H0 : 替代替代假设为:假设为: H1 : 0XX 0XX 0PP 0PP 双侧检验与单侧检验双侧检验与单侧检验 (假设的形式)什么检验统计量?什么检验统计量?u 用于假设检验问题的统计量用于假设检验问题的统计量u 选择统计量的方法与参数估计相同,需考虑选择统计量的方法与参数估计相同,需考虑是大样本还是小样本是大样本还是小样本总体方差已知还是未知总体方差已知还是未知检验统计量的基本形式为检验统计量的基本形式为nxz0规定显著性水平规定显著性水平 什么是显著性水平?什么是显著性水平?1. 是一个概率值是一个概率值2. 原假设为真时,拒绝原假设的概率原假设为真时,拒绝原假设的概
52、率 被称为抽样分布的拒绝域被称为抽样分布的拒绝域3. 表示为表示为 (alpha) 常用的常用的 值有值有0.01, 0.05, 0.104. 由研究者事先确定由研究者事先确定作出统计决策作出统计决策计算检验的统计量计算检验的统计量根据给定的显著性水平根据给定的显著性水平 ,查表得出相应,查表得出相应的临界值的临界值Z Z 或或Z Z /2 /2将检验统计量的值与将检验统计量的值与 水平的临界值进水平的临界值进行比较行比较得出接受或拒绝原假设的结论得出接受或拒绝原假设的结论两类错误分析 小概率原理是假设检验的基本依据,然而,对于小概率事件,无论其概率多么小,还是可能发生的,所以,利用小概率原理
53、为基础的假设检验方法进行检验,可能会做出错误的判断,主要有两种形式 (1)原假设H0实际是正确的,但却错误地拒绝了H0,这样就犯了“弃真”的错误,通常称为第一类错误。由于仅当所考虑的小概率事件A发生时才拒绝H0,所以犯第一类错误的概率就是条件概率:(2)原假设H0实际是不正确的,但是却错误地接受了H0,这样就犯了“取伪”的错误,通常称为第二类错误。犯第二类错误的概率记为。)|(00真拒HHP 我们自然希望犯这两类错误的概率越小越好。但当样本容量n确定后,犯这两类错误的概率不可能同时被控制,通常在我们根据历史经验选取恰当的显著性水平后,通过扩大样本容量n的方式来使第二类错误的概率减小。 错误和错
54、误和 错误的关系错误的关系你不能同时减你不能同时减少两类错误少两类错误!三、正态总体参数的检验1)方差已知时对一个正态总体均值的检验 正态总体的方差已知,要检验总体的均值,其原假设为:H1:X=X0。与之相对应的替代假设可能有三种:X X0,X XO, X XO 1双侧检验双侧检验 双侧检验中的决策规则为:双侧检验中的决策规则为: 当当 ,就拒绝原假设,就拒绝原假设H0 ,接受备择假设,接受备择假设H1 ; 当当 ,就不能拒绝原假设,就不能拒绝原假设H0 ,即接受原假设,即接受原假设H0 我们把这种根据计算我们把这种根据计算Z值的大小而作出决策的假设检验,称值的大小而作出决策的假设检验,称为为
55、Z检验法。双侧检验决策如图检验法。双侧检验决策如图81所示。所示。 ) 1 , 0(/0NnXxZ2/|ZZ 2/|ZZ 以下以例以下以例1为例,(假定显著水平为例,(假定显著水平 =0.05)说明)说明假设检验的过程。假设检验的过程。1.建立原假设和备择假设;建立原假设和备择假设; 原假设原假设H0: 备择假设备择假设H1 :2.确定检验统计量为:确定检验统计量为: 3. 规定显著性水平规定显著性水平 =0.05,由于这是双侧检验,由于这是双侧检验,查标准正态分布表可以得临界值;查标准正态分布表可以得临界值; )(1500 小时X)(1500 小时XnXxZ/096. 12/05. 02/
56、ZZ4.根据样本的数据计算检验统计量的实际值为:根据样本的数据计算检验统计量的实际值为: 5.作用统计决策并加以解释。作用统计决策并加以解释。 由于由于 ,所以拒绝原假设,所以拒绝原假设H0 ,选择备择,选择备择假设假设H1 ,即新批量生产灯泡的平均寿命与以往使,即新批量生产灯泡的平均寿命与以往使用灯泡的平均寿命有显著的差异。用灯泡的平均寿命有显著的差异。3100/10015001530/0nXxZ96. 13025. 0ZZ 2左单侧检验左单侧检验 左单侧检验中的决策规则为:左单侧检验中的决策规则为: 当当 ,就拒绝原假设,就拒绝原假设H0 ,接受备择假设,接受备择假设H1 ; 当当 ,就不
57、能拒绝原假设,就不能拒绝原假设H0 ,即接受原假设,即接受原假设H0 ) 1 , 0(/0NnXxZZZZZ 3右侧检验右侧检验 右侧检验中的决策规则为:右侧检验中的决策规则为: 当当 ,就拒绝原假设,就拒绝原假设H0 ,接受备择假设,接受备择假设H1 ; 当当 ,就不能拒绝原假设,就不能拒绝原假设H0 ,即,即接受接受原假设原假设H0 右单侧检验决策如图右单侧检验决策如图93所示。所示。 ) 1 , 0(/0NnXxZZZ ZZ 1. 2已知,关于的检验(z检验) z检验法 在上一节例1中,已讨论过正态总体 , 当2已知时,关于=0的检验问题。在这些问题中,我们都是利用H0为真时服从N(0,
58、1)分布的统计量 来确定拒绝域的,这种检验法常称为z检验法。(利用服从正态分布的统计量z 进行的假设检验称为z检验法) z检验的步骤(同前)),(2Nnxz/0 z检验的决策准则如下(1)双侧检验:当 时,拒绝原假设H0;否则接受原假设H0。 (2)左侧检验:当 时,拒绝原假设H0;否则接受原假设H0。 (3)右侧检验:当 时,拒绝原假设H0;否则接受原假设H0。0100:HH2/zz 0100:HH0100:HHzz zz某机床厂加工一种零件,根据经验知道,该厂加某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值工零件的椭圆度近似服从正态分布,其总体均值为为 0=0.081mm,总体标准差为,总体标准差为 = 0.025 0.025 。今换。今换一种新机床进行加工,抽取一种新机床进行加工,抽取n=200个零件进行检个零件进行检验,得到的椭圆度为验,得到的椭圆度为0.076mm。试问新机床加工。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(零件的椭圆度的均值与以前有无显著差异?( 0.05)均值的双尾均值的双尾 Z 检验检验(计算结果)H0: = 0.081H1: 0.081 = 0.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度草牧场承包经营权租赁与农业保险联动合同3篇
- 二零二五版集装箱租赁及售后服务合同样本3篇
- 2025年度数字经济产业园区建设合同3篇
- 2025年移动办公小程序定制开发与企业管理服务合同2篇
- 2024版成都市存量房屋买卖合同实施条例
- 二零二五版智能家居定制家具采购与售后保障合同3篇
- 2025年度餐饮行业食品安全风险评估合同21篇
- 二零二五河南事业单位100人招聘合同范本解读与使用指南3篇
- 2024起重机械进出口贸易合同规范范本3篇
- 二零二五白酒定制酒生产与销售合作合同3篇
- 春节英语介绍SpringFestival(课件)新思维小学英语5A
- 进度控制流程图
- 2023年江苏省南京市中考化学真题
- 【阅读提升】部编版语文五年级下册第四单元阅读要素解析 类文阅读课外阅读过关(含答案)
- 供电副所长述职报告
- 现在完成时练习(短暂性动词与延续性动词的转换)
- 产品质量监控方案
- 物业总经理述职报告
- 新起点,新发展心得体会
- 深圳大学学校简介课件
- 校园欺凌问题成因及对策分析研究论文
评论
0/150
提交评论