版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、For personal use only in study and research; not for commercialuse薇第七章 抽样设计与推断蒆第一节 抽样设计节一、抽样推断与抽样设计的概念薈(一)抽样推断艿抽样推断 (Sampling inference) 是在抽样调查的基础上, 利用样本的实际资料计算样本指标 (统 计量),并据以推算总体相应特征值(总体参数)的一种统计分析方法。抽样推断具有如下特点:芅第一,抽样推断是建立在随机取样的基础上。按随机原则抽取样本单位,是抽样推断的前提。 所谓随机原则就是在抽选调查单位的过程中,完全排除人为的主观因素的干扰,以保证使现象总体 中的
2、每一个个体都有一定的可能性被选中。换句话讲,哪些单元能够被选作调查单位纯属偶然因素 的影响所致。 这里需说明几点: 随机并非 “随意”。随机是有严格的科学含义的, 可用概率来描述, 而“随便”仍带有人为的或主观的因素,它不是一个科学的概念;随机原则不等于等概率原则; 随机原则一般要求总体中每个单元均有一个非零的概率被抽中;抽样概率对总体参数的估计有 影响。只有坚持抽取的随机原则,才能使被抽中单位的频数分布类型与调查对象相同,从而增强被 抽中单位对总体的代表性,达到推断总体的目的。莂第二,抽样推断是由部分推算整体的种认识方法。即对抽取的调查单位进行调查研究,取得 调查单位的实际资料,计算出调查单
3、位的指标数值,并据以推断和估计总体的指标数值。罿第三,抽样推断以概率论中的大数法则和中心极限定理为理论依据。螇第四,抽样误差可以事先计算和控制。肄抽样调查除具有十分明显的特色之外,还在实际应用过程中发挥着突出的作用。蒂其一,抽样调查能够解决全面调查所无法解决的现象的调查问题。在实际工作中,对某些现象 常常可能一方面需要了解其全面情况,另一方面又由于现象自身的特性决定了无法通过全面调查获 取资料。此时,只有使用抽样调查。该类现象主要有: (1) 产品质量的破坏性检验。如轮胎的里程寿 命试验, 青砖的抗折耐压试验, 炮弹的杀伤力试验, 弹簧的抗拉强度试验等等。 (2) 无限总体的调查。 无限总体所
4、包含的总体单位数目无限多个,无法一一调查。 (3) 包括未来时序的总体,如生产过程稳 定性的检查等。莀其二,抽样调查适用于对理论上可以作全面调查,而实际上又难以组织全面调查的现象进行调 查。有些现象虽属于有限总体,但由于其总体范围过大,单位数目过多且过于分散,事实上不可能 作全面调查,如森林的木材蓄积量调查,大量连续作业的某些产品质量的非破坏性检验,水稻的颗 粒重检验等等。还有些现象由于受时间或其他条件的制约,不能组织全面调查,如战备物资调查, 自然灾害造成损失情况的调查等等。葿其三,抽样调查对于时效性要求较高、同时又可以不作全面调查的现象的调查有着特殊的作用。 如前所述,抽样调查具有费用低、
5、速度快、精度高的特点,这使得它比其它非全面调查能更有效地 满足各有关方面的需要。螃其四,抽样调查的结果可被用来检验和修正全面调查结果。由于全面调查涉及面广、工作量大、 参加人员多、汇总传递环节多、调查结果容易出现差错。但是,其差错到底有多大,全面调查自身 无法回答这一问题。因此,可在全面调查之后再进行一次抽样调查,根据抽样调查结果对全面调查 结果进行检查和修正,从而提高全面调查的质量。薂其五,抽样调查可对工业生产过程的稳定性进行监测,从而实现质量控制。螁其六,利用抽样调查方法还可以对总体的某些假设进行检验,以判断这些假设的真伪,为管理 决策提供依据。例如:一种新药在对某位患者使用后效果不错,这
6、是否意味着这种新药的疗效就一 定显著呢?单凭此还不能做出结论。因为疗效对于每个人常会受到一些随机因素的影响而呈现出一 定的不确定性。因此,最好利用抽样调查结果,对这种药物的疗效是否存在显著性的统计差异进行 检验,以确定其疗效状况,并据此做出是否推广使用该药的决策。袇(二)抽样设计袆抽样设计是为抽样调查的实施提供一个指导性文件,以实现抽样调查的目的和任务。抽样设计 的目的首先要合理安排整个抽样调查各个环节上的费用,使调查费用控制在预算范围内,保证抽样 调查的顺利实施。其次,抽样设计中要通过对抽样方法的选择、样本容量的科学计算等,把抽样误 差控制在要求的范围内,达到抽样的精度要求。最后,抽样设计要
7、为抽样调查提供一个具体的日程 表,指导调查工作按预定的时间要求进行,保证在规定的调查期限内全面完成调查的各项工作。蚂一次抽样设计通常主要包括:抽样方法设计、抽样单位设计、抽样框设计、估计方法设计、辅 助变量设计、样本轮换设计、样本容量设计、问卷设计等基本内容。本节主要研究抽样方法的设计 问题。羈二、统计量与总体参数蚈参数 (Parameter) 就是抽样推断所要推断的总体指标。 常用的总体参数有总体平均数 和总体方差 2( 或总体标准差 )。薅设总体变量 X的取值为: X1,X2, Xn,则有:X或NXFX X 2或( 公式 7.1)莈此外总体参数还有总体成数P。它表示总体中具有某种性质的单位
8、数在总体全部单位数中所占的比重。以 Q 表示总体中不具有某种性质的单位数在总体中所占的比重。肆设总体 N个单位中,有 N1 个单位具有某种性质, N0个单位不具有某种性质, Nl N0 N,则有:莃 P N1,QNN0NN N11P( 公式 7.2)螂由于这是一个是非标志,所以按本书第五章所述,其平均数和方差分别为:蝿PP N1( 公式 7.3)2螈 P2 PQ P 1 P (公式 7.4)莆统计量 (Statistic) 是根据样本各单位标志值或标志属性计算的综合指标。与常用的总体参数相 对应,有样本平均数、样本方差和样本成数等。以小写字母表示。袂设样本变量 x 的取值为: xl , x2,
9、 xn,则有:x x 或 xf nfS2xx或xxff( 公式 7.5)n1xp pn2S2p p 1 p芆 参数估计 (Parameter estimation) 就是利用实际调查计算的样本统计量的值来估计相应的总 体指标的数值。由于总体指标是表明总体数量特征的参数,所以叫参数估计。参数估计方法有点估 计和区间估计两种。膅三、重复抽样与不重复抽样羁抽样的基本方法有重复抽样和不重复抽样两种。重复抽样也称有放回抽样,是从总体中抽取样 本时,随机抽取一个样本单位,记录该单位有关标志表现以后,把它放回到总体中去,然后,再从 总体中随机抽取第二个样本单位,记录它的有关标志表现以后,也把它放回总体中去参
10、加下一次抽 去,照此下去直到抽满 n 个样本单位为止。薁从总体 N个单位中,用重复抽样的方法,随机抽取n 个单位构成一个样本,则共可抽取Nn种样本。羈不重复抽样也称不放回抽样,它是从总体中抽取第一个样本单位,记录该单位有关标志表现后, 这个样本单位不再放回总体中参加下一次抽选,然后,再从总体 N-1 个单位中随机抽取第二个样本 单位,记录了该单位有关标志表现后,该样本单位也不放回总体中去,再从总体 N-2 个单位中抽取 第三个样本单位,照此下去直到抽选出第 n 个样本单位为止。或者是一次就从总体的 N 个单位中抽 取 n 个单位组成样本。羄从总体 N个单位中,用不重复抽样的方法,抽取n个单位的
11、样本,可能出现的样本种数为 CNn 。肁可见,在其他条件相同的情况下,重复抽样的样本种数总是大于不重复抽样的样本种数。蚈四、几种基本的抽样方式蒆(一 )简单随机抽样 (SRS)蚃简单随机抽样 (Simple random sampling) 又称为纯随机抽样,是按随机原则直接从总体 N 个单 位中抽取 n 个单位作为样本。简单随机抽样的具体实施方法主要有抽签法、随机数法和直接抽取法膁简单随机抽样对总体不加任何限制,等概率地从总体中直接抽取样本,是最简单、最单纯的抽 样技术,它具有计算简便的优点,是研究其它复杂抽样技术的基础,也是比较各种抽样技术之间估 计效率的标准,同时,从理论上讲简单随机抽样
12、在各种抽样技术中是贯彻随机原则最好的一种,并 且数学性质很简单,是等概率抽样的特殊类型。聿另一方面, 因为是等概率抽取样本, 所以要求总体在所研究的主要标志上同质性或齐整性( 共性)较好,即总体要比较均匀。但是,在社会经济现象中,这种均匀总体是很少见的。因此,实际工作 中很少单纯使用简单随机抽样方法。膈再者,因为直接从总体中抽取样本,未能充分利用关于总体的各种其它已知信息,以有效地提 高样本的代表性,并进而提高抽样的估计效率。螆此外,简单随机抽样要求在抽样前编制出抽样框,并对每一个总体抽样单位进行编号,而且当 总体抽样单位的分布比较分散时,样本也可能会比较分散,这些都会给简单随机抽样方法的运用
13、造 成许多的不便,甚至在某些情况下干脆无法使用。因此,在此基础上研究其它抽样技术显得更为必 要。膁(二)类型抽样蒀类型抽样 (Stratification sampling)又称分层抽样。它是实际工作中最常用的抽样技术之一。分层抽样是在抽样之前,先将总体 N个抽样单位按某一标志划分为 k 层(类),然后在各层内分别独 立地进行随机抽样。由此所抽得的样本称为分层样本。各层的抽样可以采取同一抽样方法,也可采 取不同的抽样方法。薆设总体由 N 个单位构成,把总体划分为 k 组,使: NN1N2 Nk,然后从每组的 Ni 个单位 中抽取 ni个单位构成样本容量为 n 的样本。这就是类型抽样。蒅同简单随
14、机抽样相比,分层抽样具有以下特点:芁分层抽样能够充分地利用关于总体的各种已知信息进行分层,因此抽样的效果一般比简单随 机抽样要好。但当对总体缺乏较多的了解时,则无法分层或不能保证分层的效果。袁在分层抽样中,总体的方差一般可以分解为层间方差和层内方差两部分。由于分层抽样的误 差只与层内差异有关,而与层间差异无关,因此,分层抽样可以提高估计量的精度。莇由于分层抽样是在每层内独立地进行抽样,因此,使得分层样本能够比简单随机样本更加均 匀地分布于总体之内,所以其代表性也更好些。芄分层抽样的随机性具体体现在层内各单位的抽取过程之中,即在各层内部的每一个单位都有 相同的机会被抽中,而在层与层之间则是相互独
15、立的。莁分层抽样适合于调查标志在各单位的数量分布差异较大的总体。因为对这样的总体进行合理 的分层后可将其差异较多地转化为层间差异,从而使层内差异大大减弱。芁分层抽样中除了可以推断总体参数外,还可以推断各不同层的数量特征,并进一步作对比分 析,从而满足不同方面的需要,也能帮助人们对总体作更全面、更深入的了解。但对各层的估计缺 乏精度保证。螅分层抽样中,由于各层的抽样相互独立,互不影响,且各层间可能有显著的不同,因此,对 不同层可以按照具体情况和条件分别采用不同的抽样和估计方法进行处理, 从而提高估计的精确度。芆分层抽样中在进行分层时,需收集可用于分层的必要的各种资料,因此可能会增加一定的额 外费
16、用。同时,分层抽样中,总体参数的估计以及各层间样本量的分配、总样本量的确定等都更为 复杂化。蒁(三)等距抽样莈等距抽样 (Systematic sampling) 也称机械抽样或系统抽样, 等距抽样也称系统抽样或机械 抽样。它是将总体各抽样单元按一定的标志和顺序排列以后,每隔一定的距离( 间隔) 抽取一个单元组成样本进行调查。其具体方法如下:蒇设总体由 N个单元组成,并按某种顺序编上 1 到 N的号码,要在其中抽取容量为 n 的样本,先 在前 K 个单元中随机抽选出一个单元,以后每隔 K 个单元抽取一个单元,由所有抽中的单元共同所 组成的样本称为等距样本。可见,抽出了第一个单元就等于决定了整个
17、样本。这种抽样方法就是等 距抽样。这里 K 称为抽样间隔。肅作为总体各单位顺序排列的标志,可以是无关标志也可以是有关标志。所谓无关标志是指与调 查标志无关的或不起主要的影响作用的标志。例如工业产品质量抽查按时间顺序取样,农产量抽样 调查按田间的地理顺序取样,居民家计调查按街道的门牌号码抽取调查户等等。薁在等距抽样中,最简单最基本的方法是随机起点等距抽样。但在实际实施等距抽样时,考虑到 排序标志的不同,以及总体单元数是否能被某一数值整除等因素,具体的抽样实施方法又可以有一 系列不同的变化。常见的等距抽样实施方法有:随机起点等距抽样、循环等距抽样、中点等距抽样、 对称等距抽样法等。蝿(四)整群抽样
18、腿整群抽样 (C1uster sampling) 也称集团抽样。它是将总体各单位划分成许多群,然后从其中随 机抽取部分群,对中选群的所有单位进行全面调查的抽样组织形式。确切地说,这种抽样组织形式 应称为单级整群抽样。袄如果总体中的单位可以分成多级,则可以对前几级单位采用多阶抽样,而在最后一阶中对该阶 抽样单位所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。蚀在抽样调查中没有总体单位的原始记录可资利用时,常常采用整群抽样。例如要调查某市去年 底育龄妇女的生育人数,但又没有去年的育龄妇女的档案资料,难以对育龄妇女抽样,可以采用整 群抽样的方式,将全市按户籍派出所的管辖范围分成许多
19、区域,随机抽选其中若干区域,并对抽中 的派出所辖区内按户籍册全面调查育龄妇女的生育人数。膀整群抽样因为是对中选群的全面调查,所以调查单位很集中,大大简便抽样工作,节省经费开 支。蚇整群抽样是对中选群进行全面调查,所以只存在群间抽样误差,不存在群内抽样误差。这一点 和类型抽样只存在组内抽样误差,不存在组间抽样误差恰好相反。因此,整群抽样和类型抽样虽然 都要对总体各单位进行分组,但分组的原则却是完全不同的。类型抽样的分组要求尽量缩小组内的 差异程度,扩大组间方差;而整群抽样的分组则要求扩大群内的差异程度,缩小群间方差。蚃五、抽样优良性的一个准则螀(一)抽样误差的概念薁抽样误差 (Error of
20、sampling)是指由于抽样的随机性所导致的样本指标与被它估计的总体相应指标的差数。抽样误差是进行抽样调查时所固有的误差。由于从总体中按照随机原则抽取的样本, 其结构很难和总体完全一致,因而抽样平均数(或成数 )与总体平均数 (或成数 )之间往往会有误差。显然,抽样误差越小,说明样本指标对总体指标的代表性越高;反之,抽样误差越大,则说明样本 指标对总体指标的代表性低。抽样误差是判断抽样优良性的一个准则。但是,由于总体参数是未知 数,因此抽样实际误差是不可能计算得到的。为了反映抽样误差的一般水平,需要采用抽样平均误 差指标。荿(二)抽样平均误差蚆对于确定的总体来说,总体参数是确定的值。由于样本
21、是按随机原则抽取的,从同一总体抽取 样本容量相同的样本可以有多种不同的抽法。每个样本都有自己的样本统计量,而且大小不等,因 而它们对于总体指标的离差就有大有小。抽样平均误差就是用来反映抽样误差的一般水平的指标。螀为此,我们用所有可能样本的统计量与相应的总体参数的标准差来反映所有可能样本的统计量 与总体参数的平均差距。螈抽样平均误差 (Average error of sampling) 通常用符号 来表示。为便于区别起见,用 x 表示平均数的抽样平均误差;p 表示成数的抽样平均误差。其计算公式为:( 公式 7.6)x2 M p P 2 M蒅式中: M表示可能出现的样本种数。袀实际计算时是不可能
22、直接采用这个公式的。首先,因为在实际工作中一般只抽取一个样本,不 可能取出所有可能的样本, 并计算它们的平均数; 其次,在进行抽样调查的全过程中, 总体平均数 X 是未知的,因而上述抽样平均误差的公式也无从算起。根据数理统计理论,可以推导出抽样平均误差的计算公式。腿1平均数的抽样平均误差蕿在重复抽样的情况下,抽样平均误差为:( 公式 7.7)芄在不重复抽样条件下,抽样平均误差为:薀2NnnN1( 公式 7.8)羆当总体单位数 N很大时,上式中的 N1 可用 N来代替。芇因而实际工作中不重复抽样的抽样平均误差,可改为下式:公式 7.9)羀式中 nN 称为抽样比。螈显然,相同条件下,不重复抽样误差
23、数值一定小于重复抽样的抽样误差。不过,实际工作中, 在没有掌握总体单位数的情况下或者总体单位数 N 很大时,一般用重复抽样平均误差公式来计算不 重复抽样平均误差。羅例 7-1 假设有 4 个工人,其每周工资分别为 70、90、130、150元。现从总体中随机抽取 2 名 工人作样本。则这一总体的平均工资 和工资标准差 为:70 80 130 1504110 元x2N70 110 2 90 110 2 130 110 2 150 110 2 431.62元膆在重复抽样情况下,平均工资抽样平均误差为:31.62x n 222.36元蒄在不重复抽样情况下,平均工资抽样平均误差为:袈2成数的抽样平均误
24、差薃成数的抽样平均误差表明各样本成数和总体成数绝对离差的一般水平。由于总体成数可以表现为总体是非标志的 (0 ,1) 分布的平均数,而且它的标准差也可以从总体成数推算出来,即:薄 xP P P P1 P ( 公式 7.10)衿因此,容易从抽样平均数的抽样平均误差和总体标准差的关系推出抽样成数平均误差的计算公式。莆在重复抽样的条件下,成数的抽样平均误差为:P1 P薆 P ( 公式 7.11)蚃式中: P为总体成数, n 为样本单位数。芀在不重复抽样的条件下,成数的抽样平均误差为:( 公式 7.12)莅在得不到总体成数 P的资料时,也可以用实际样本的抽样成数 p 来代替。螃例 7-2 要估计某地区
25、 10000名适龄儿童的入学率,随机从这一地区抽取 400 名儿童,经调查, 有 320 名儿童入学,求入学率的抽样平均误差。蚁根据已知条件:蒆 p 320 80%400肄 p2 p1 p 80% 20% 16%袃在重复抽样的情况下,入学率的抽样平均误差为:芈在不重复抽样的情况下,入学率的抽样平均误差为:袃P1.96%P1 P 1 n0.16 1 400n 1 N400 1 10000羃(三)抽样误差范围及其可靠程度艿1抽样极限误差蚅应当指出,抽样平均误差只是衡量统计量与总体参数之间可能发生的平均误差的一种尺度,并 不是抽样指标与总体指标间的实际误差。由于未知的总体参数是一个确定的量,而统计量
26、会随样本 的不同而变动,它是围绕着总体参数上下随机出现的变量。这样,统计量与总体参数之间就有个误 差范围问题。抽样误差范围就是变动的抽样指标与确定的总体参数之间的离差的可能范围。它是根 据概率论,以一定的可靠程度保证抽样误差不超过某一给定的范围,统计上把这个给定的抽样误差 范围叫做抽样极限误差 (The limit error of sampling) ,也称为抽样允许误差。袆用 x 、 p 分别表示样本平均数与样本成数的抽样极限误差,则有:xx肃p p P虿将上面等式经过变换,可以得到下列不等式:蚄以上不等式表示,样本平均数x 是以总体平均数为中心,在x,x 之间变动;样本成数 p 是以总体
27、成数 P为中心,在 P p,Pp 范围内变动。肃上面的公式也可以改写为:xx( 公式 7.13)袅上式说明:由于总体参数是未知数,而统计量是可以测算的,因此,抽样误差范围的实际意义是被估计的总体指标 或 P 所落在的由抽样指标所确定的范围,即落在 x,x或xxp p, p p 范围内。蒃2抽样误差范围估计的可靠程度膃既然统计量是一个随机变量,总体参数落在某一个区间内自然不会是肯定的事,它的可靠程度 也不会完全相同,因此需要研究估计的可靠程度问题。t 表示,它是以抽样蒁抽样误差范围 是用一定倍数的抽样平均误差来表示的,这个倍数一般用 平均误差为尺度来衡量的相对误差范围,我们称之为概率度。用公式表
28、示:x t x薇 x x ( 公式 7.14)p t p蒆这个公式表明,在抽样平均误差一定的条件下,概率度t 越大,则抽样误差范围 越大,区间x x ,x x 或 p p, p p 越宽,总体参数落在该区间内的概率 ( 可能性 ) 越大,抽样估计 的可靠程度就越高,反之, t 越小,抽样误差范围 越小,估计区间越窄,总体参数落在区间 x x,x x 或 p p, p p 内的概率 ( 可能性 ) 越低, 抽样估计的可靠程度也就越低。 因此, 概率度 t 与置信概率成正比。两者具有如下的数量关系:节薈(四)影响抽样误差的因素艿从抽样误差的计算公式中可以看出,抽样误差大小主要受以下三个方面因素的影
29、响:芅1抽样单位数 n 的多少。在其他条件不变的情况下,样本容量越大,抽样误差则越小。当样本 容量大到等于总体单位数 N 时,则统计量和总体参数完全重合;反之,样本容量愈小,抽样误差愈 大莂 2总体标志的变异程度2 。总体标志变动程度越大,抽样误差就越大,反之,总体标志变化程度越小,则抽样误差越小。当总体各单位标志值都相等,那么抽样指标就等于总体指标,抽样误 差也就不存在了。罿3抽样的组织方式和抽样方法。在相同条件下,重复抽样的误差大于不重复抽样的误差。螇六、必要抽样单位数的确定肄确定必要抽样单位数也是抽样设计中的一个重要问题。为了避免抽取单位数过大或过小,必须 恰当地确定样本容量。为此需要首
30、先分析影响必要抽样单位数的因素。蒂 1. 用户对抽样推断可靠程度和精确度的要求。如果要求抽样的可靠程度和精确度较高,那么抽 样单位数就要多些;反之则可少些。莀2. 不同的抽样组织方式。一般来说,类型抽样和等距抽样比简单随机抽样需要的抽样单位数少,单个抽样比整群抽样需要的单位数少,不重复抽样比重复抽样需要的抽样单位数少。葿3. 总体变量值的差异程度。总体变量值的差异程度越大,需要抽取的样本单位数就越多。螃 4. 按上述依据确定的抽样单位数,还要结合调查人力、物力和财务的许可情况加以适当调整, 然后做出最后的决定。薂上面影响抽样单位数的四个因素之间的联系,可以由抽样极限误差公式来反映。从抽样极限误
31、 差公式,可以推导出必要抽样单位数的计算公式。螁(一)简单随机抽样的抽样单位数袇重复抽样时:( 公式 7.15)t 2 2蚂 n22xtp p1 pt2 2N蚈n蚈 n N 2x t 2 2羈不重复抽样时:2n Nt22pp1t2pp1Np( 公式 7.16)蒆(二)类型抽样的抽样单位数肃重复抽样时:t 2 2袀 n t 2 或2xt2 p1 p2p( 公式 7.17)膈不重复抽样时:t2 2N薆 n N 2x t 2 222ptN2p1t2pp1Np( 公式 7.18)蒄式中, 和 p(1 p) 分别为各层方差和成数方差的平均数。薂(三)整群抽样的抽取群数膀由于整群抽样是不重复抽样,则蚆nt
32、2 x2R2xR t 2 x2t 2 p2Rnn2pR t 2 2ppp( 公式 7.19)袄t 为概率度, R 为总体群数。肀例 7-3 某批产品的平均重量x 70 千克, 总体标准5千克, 现准备对这批产品采用重复抽样方式进行简单随机抽样检验,要求可靠程度达到 样本单位 ?95,允许误差不超过 0.9 千克,试问需抽多少罿解 : 由题目条件知:螆5,F(t) 95%,t 1.96, x 0.9芅按重复抽样公式得:螂n221.962 522x0.92118.6 119( 件)蚈所以应抽取样本单位数 119 件。螆若上题中该产品的一等品率为 90 ,要求误差范围不超过 5,试问应抽多少样本单位
33、 ?蒂按成数公式计算得:21.9620.9 0.1138.3 139(件)0.0522t2 p1 p 膀n2 或 n2p蒇所以,应抽取 139 件。袅第二节 参数估计袃 参数估计 (Parameter estimation)就是利用实际调查计算的样本统计量的值来估计相应的总体指标的数值。由于总体指标是表明总体数量特征的参数,所以叫参数估计。参数估计方法有点估 计和区间估计两种。袂一、参数的点估计蒀(一 )点估计方法羅参数点估计的基本特点是,根据总体指标的结构形式设计样本指标(称统计量 ) 作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值。芄例 7-4 在某村所有种植小麦的
34、专业户中抽取 50 户,对他们种植的小麦进行实割实测,得到的平均亩产为 350 公斤。如果用这一结果作为全村所有专业户的小麦亩产的估计值,这就是点估计。22莀设 表示总体平均数 的估计量, P表示总体成数 P的估计量, ?2 表示总体方差 2 的估计量, 则点估计的基本公式为:22艿x p P?2 =S2( 公式 7.20)肅(二)点估计量优劣的标准蚅对总体参数作点估计的时候,总是希望估计是合理的或优良的。那么什么是优良估计量呢?肂优良估计量应满足三个方面的条件:肈 1. 无偏性 (Unbiasedness)膅设 ?为未知参数 的估计量,若估计量 ?的期望等于未知参数的真值,即肆E(?)蕿则称
35、 ?为 的无偏估计量。肁无偏性就是要求所有可能样本指标的平均数( 样本指标的数学期望 ) 与被估计的总体参数之间没有偏差。虽然每一次的样本指标值和总体指标值之间都可能有误差,但在多次反复的估计中,各个 抽样指标值的平均数应该等于所估计的总体指标值本身。这说明,无偏估计要求估计量没有系统偏 差。芅不难证明,样本平均数的平均数等于总体平均数,样本成数的平均数等于总体成数,按自由度nXi Xn 1 来计算的样本修正方差 Sn2 1 i 1 即等于总体方差,即n 1 n 1Ex公式 7.21)膃 E p P (E Sn2 12芁这说明以样本平均数、样本成数、按自由度n-1 来计算的样本方差分别为总体平
36、均数、总体成数、总体方差的无偏估计量。衿 2. 有效性 (Availability)莅无偏性只考虑估计值的平均结果是否等于待估计的参数真值,而不考虑每个估计值与待估参数 真值之间偏差的大小和散布程度。我们在解决实际问题时,不仅希望这些估计值是无偏的,更希望 这些估计值的偏差尽可能小。薃设 ?1,?2为 的两个无偏估计量, ?1的方差小于 ?2 的方差,即羃V( ?1)0, 有莇 lim P ? 1蒅对于这种极限,我们称估计量?依概率收敛于 。莅我们知道,样本平均数和样本成数的抽样平均误差和样本单位数的平方根成反比例变化,样本 单位数愈多则平均误差便愈小,当样本单位数接近于总体单位数时,平均误差
37、也就接受于零。也就 是说抽样平均数和抽样成数作为总体平均数和总体成数的估计量是符合一致性原则的。膃二、参数的区间估计蒀如前所述,点估计是用一个点(即一个数)去估计未知参数。顾名思义,区间估计(Intervalestimator) 就是用一个区间去估计未知参数,即把未知参数值估计在某两个界限之间。例如,估计 明年 GDP增长率在 9%-10%之间,比说增长 9%更容易让人相信,因为给出 9%-10%已把可能出现的误 差考虑到了。薄对于待估参数 ,找出样本的两个统计量 1 和2,使被未知参数 落在区间 (1,2)内的概 率为 1- , 0 5,n(1-p) 5,则可把二项分布问题转换成正态分布 问
38、题近似地去求解。因而这时肇 P NP,1nP 1 P1莂即样本比例 p 服从期望值为 P,方差为 1 P 1 P 的正态分布,因此,在 1 a 的置信水平下, n总体比例的置信区间为:肃 p Za罿在对两总体比例之差 P1 P2 进行区间估计时,若两个样本均是大样本,则置信区间为:( 公式 7.26)膇 p1 p2 Za P11n P1P21n P22n1n2螃例 7-8 在一项新家电产品的市场调查中, 品,其中 72.1 的顾客表示喜欢该产品,试在 随机选取 400 位顾客为样本, 询问他们是否喜欢此产95置信水平下,估计顾客喜欢该产品的比率。蒁解: n400 P 0.721 nP 4000
39、.721 288.4 5 n(1-P) 111.75螈当 1 a 1 0.05 0.95时Za 1.962膆所以 p Za p1 p 0.72 1.96 0.721 0.721a2n 400膄 0.721 0.044即 0.677,0.76567.7 76.5 之间。芃说明我们能用 95的概率保证该新家电产品被喜欢的比率大约在薇(三)总体方差的区间估计芆1总体均值 已知时总体方差 2 的区间估计薅设总体 X N , 2 ,从总体中抽取一个简单随机样本x 1, x1, xn,样本均值为 x,样本修正方差为 Sn2 1, 已知,要求出总体方差2 在置信度 1 a 下的置信区间。蚁由随机变量可得x2
40、x122(n)薀对于给定的 a,0 a 1, 可有莆P( 12 (n)2) 1蚂取 p x2 n 1 p x2 n 2 a2莃查 2分布表,可得出 1 x2 a n , 2 x2a n 的值,从而有 122荿 p x2 a n x2 nxa2 n1 a122蒆即有肃P2xi 2x2a n22xi22x12 a n21a袀区间xi2x 2a n2xi22 i 就为待估参数 x2 a n1 a222在置信度 1 a 下的双侧置信区间。膈2总体均值未知时总体方差 2 的区间估计薆在实际应用中,总体均值往往是不知道的,只能根据抽取的样本来对总体方差 2 进行区间估计。此时就必须利用随机变量xin 1
41、Sn 1x2 n 1 进行估计。类似地可得:蒄 P ( 1( n 1) 2 ) 1薂取 P( 2(n 1)1) P( 2(n 1) 2 ) a2膀查 2分布表,可求得 1 x2 a n 1 , 2 x2a n 1 的值,从而有 122蚆 p x 2 a n 1 x2 n 1 x2a n 1 1 a1 a2a2袄即有 p n2 1Sn 1 22n 1Sn 1 1 ax2 /2 n 1x12 /2 n 1n 1 S2 n 1 S2肀区间 2 n 1,2 n 1 就为待估参数 2在总体均值 未知且置信度为 1 a下的双侧置 x2/2 n 1 x12 / 2 n 1信区间。罿例 7-9 设某种产品的直
42、径近似服从正态分布 N , 2 ,从一批产品中任取 20 个,测得样本均值 x 31.76 厘米,样本修正标准差 Sn 1 0.9830厘米,试求产品直径的均值和方差 2 的置信区间。 ( a 0.05 )螆解:因为 n30, 且总体方差未知,所以对总体均值作区间估计所使用的统计量为xu 芅 T t(20-1)Sn 1n螂查 t 分布表求得:ta n 1 t0.025 19 2.0932蚈根据样本值计算可得产品直径的均值的置信度为 0.95 的置信区间为Sn 1nx ta n 1 Sn 1 ,x ta n 10.98331.76 2.09,31.76 2.09蒂200.983202 n 231
43、.30,32.222蒇xxi x膀对总体方差作区间估计时,使用的统计量为:20 12Sn1 2(19) ,=0.052袅查 分布表,得221x2 a n 1x02.975 19 8.90712袃 2 22 x 2a n 1x02.025 19 32.85222袂所以总体方差在置信度为 0.95 下的置信区间为:22n 1 Sn 1 ,n 1 Sn 1xa2 n 1 x2 a n 1 1 222220 1 0.9832 ,20 1 0.9832 羅 32.852 8.9070.5589,2.0612芄第三节 假设检验莀一、假设检验的基本原理艿(一 )假设检验的涵义肅假设检验 (Hypothesi
44、s testing)也是统计推断的一项重要组成部分,它是先对研究总体的参数做出某种假设,然后通过样本的观察来决定假设是否成立。蚅例 7-10 库房要验收大批同类商品。按规定这批商品平均每件的重量应为 100 千克。今随机抽 测 10 件,测得重量分别为: 97、98、98、98、99、99、101、 101、102、103 千克,问能否接收这 批商品 ?肂在本例中,要确定能否接收这批商品,即需要检验这批商品重量是否符合规定的100 千克。假设这批商品的平均重量等于 100 千克(原假设 ) ,然后根据抽取的 10 件样品平均重量, 运用假设检验 的方法,能够很容易地判断原假设是否正确,并由此得
45、出能否接收这批商品的结论。肈(二)原假设和备择假设膅假设检验是从对总体参数所做的一个假设开始的。假设一般包括两部分:原假设H0 和备择假设肆1. 原假设 H0蕿原假设又称虚无假设或零假设,般用H0 表示。在统计学中,把需要通过样本资料去推断其正确与否的命题称为原假设。例 7-8 中,我们可以事先提出一个命题(假设) :“这批商品的平均重量 与标准重量( 100kg)没有什么差别” 。于是可以表示为:肁H0: =100kg芅这里, 表示这批商品的平均重量。膃假设检验的基本目的,就在于做出决策:接受原假设还是拒绝原假设。芁2. 备择假设 H1衿备择假设又称择一假设,即原假设被否定之后应选择的、与原
46、假设逻辑对立的假设。在检验过 程中,如果抽样调查分析的结果表明有充分的理由否定原假设 Ho 的真实性,而拒绝接受原假设,就 应选择其逻辑对立的假设,即备择假设。以上面对商品重量的检验为例,当原假设HO: =100kg 被否定后,可能被采用的备择假设有H1: 100kg。意思是“这批商品的平均重量不等于100kg”。莅当我们所关心的问题,不是总体参数是否等于假定参数,而是总体参数与假设参数是否发生指 定方面的差异,这时原假设和备择假设就要用不等号来表示。如:薃H0 :M M0:H1:M M0羃或 H0 :M M0 :H1:M M0薈(三)假设检验中的两类错误莅根据检验统计量的计算结果,如果不能否
47、定原假设,仅仅意味着我们由于没有足够的证据否定 它,才接受了原假设,并不意味着它的确是正确的。羄当根据计算结果,做出决策时,可能会出现有如下四种情况,如表7-1 所示蒁表 7-1假设检验中各种可能结果的概率莇蒅接受 H0,拒绝 H1莅拒绝 H0,接受 H1膃 H0 为真薄 1- (正确决策)薁 (弃真错误)蒀 H0 为伪蒂 (取伪错误)腿1- (正确决策)蚄由此可以得出,犯错误的可能性的大小是以统计规律为依据的。可能犯的错误,亦即误判的情 况有两类。袃1. 弃真的错误芃当 H0为真时,不否定原假设当然是正确的。但是当原假设H0 本来是真实的时候却也有可能被错误地否定掉,这种否定真实原假设的错误
48、称为第一类错误。犯第一类错误的概率的大小就是显著性 水平 。羈 2. 取伪的错误羈当原假设 H0非真时做出接受 H0 的选择,这种错误称为第二类错误,用表示犯第二类错误的概率。由于 H0 非真的状态不是唯一的,因此取伪的概率其数值也是不确定的。芄人们总是希望犯此两类错误的概率都尽可能小,但在一定样本容量下,减少 会引起 的增大; 减小 又会引起 的增大。因为当显著性水平 减少时,由于拒绝域的减小,弃真的错误会减小, 但由此而来的接收域就增大了,因而取伪的概率 也会增大。反之亦然。因此,在样本容量 n 固定 的情况下,要同时减少两类错误,也是不可能的。一般的原则就是事先规定允许犯第一类错误的概
49、率 ,然后尽量减少犯第二类错误的概率 。螁(四)显著性水平羁在假设检验中运用的是概率反证法原理,其理论依据是“小概率原理”,即小概率事件在一次实验中几乎是不可能发生的推断原理。因为,如果一个事件的概率甚小,则它在一次试验中出现的可 能性就很小,因此依据原假设的条件计算出某一事件发生的概率很小,理应在一次试验中不发生, 然而在一次试验中事实上这一小概率事件又发生了,那么就可以认为原假设不正确,拒绝接受。肈因此,在进行假设检验时事先确定一个可允许的作为判断界限的小概率标准非常重要。这个小 概率标准就是假设检验中的显著性水平(Level of significance)a 。假设给定小概率标准 0.
50、1 ,凡概率小于 10的我们都称之为小概率事件,都属于拒绝区间,如图7-1 中两端的阴影部分。而1 a 90 ,如图 7-1 中央部分所示,属于接受区间。事件落在接受区间,原假设成立;事件落在 拒绝区间,则拒绝原假设。显著水平对应的概率度T 称为临界值。记为 T/2,例如 =0.05 时,临界值 T/2=1.96 。蚅需要注意的是,显著水平并不是一个固定不变的数字。它的大小依据拒绝区间所承担的风险来 决定。一般而言,显著性水平多采用0.01 、0.05 、0.10 等数值。蒃螀图 7-1 双侧检验示意图膈(五)双尾检验与单尾检验膆一般地,我们可以将假设检验分为双侧检验和单侧检验。具体地说,对总
51、体参数的检验形式常 见的有:羀( 1)双侧检验 H0:=0,H1: 0薈( 2)左侧检验 H0: 0,H1: 0节其中 (2) 和(3) 又合称为单侧检验。图 7-1 、7-2 分别是双侧检验和单侧检验拒绝域的示意图,从 该图可以看出这三种形式假设检验名称的含义。在实际问题中到底使用哪种形式的假设检验要根据 实际问题的性质和要求来确定。芇图 7-2 单侧检验示意图莈(六)假设检验的一般步骤蚃根据以上分析,可以归纳出假设检验的基本步骤: 肀1根据具体问题的要求,提出原假设HO和备择假设 Hl ;莀 2给定显著性水平以及样本容量 n;蒈3确定检验统计量,由样本观察值计算检验统计量的值; 肄4按 P
52、拒绝 H0= , 求出拒绝域;袂 5按检验规则作出接受还是拒绝H0的判断。聿二、总体均值的假设检验薇这里假设总体 X N(, 2) 。由于假设检验与区间估计一样都是利用样本信息来推断总体的某些 特性,所以构造检验统计量和构造估计区间有密切的关系。蒅这里仅介绍单个正态总体的假设检验。U 检验芀(一)大样本或总体方差已知时,总体平均数的假设检验袈在大样本情况下,或总体方差已知的正态总体中,当H0 :0 成立时,统计量薇U x 0 N(0,1)/n公式 7.27 )薂当假设 H0 :0 为真时,给定显著水平。则有羂 P(U U ) 或 P(|U | U ) 122蚇其中 U 为临界值,可由正态分布表
53、直接查出。2蚇即拒绝域为: U U2羃例 7-11 某新产品的使用寿命服从正态分布,它的标准差 为 150 小时。今从一批新产品中随 机抽取了 26 个,测得平均寿命为 1637 小时。问在 0.05 显著水平下,能否认为这批产品平均寿命为 1600 小时?蒀解: 1设原假设 H0 :1600; H1 :1600蚀 2选择检验统计量螇Ux0/n莄3根据给定的显著水平 a 0.05 ,查正态分布表,得临界值 U a U0.025 1.96 。查表关系式 2为:膂P U a U U a 1 a 22葿在显著水平 a 下,每个尾部的面积为a ,故临界值分别为2Ua和Ua ,只要 U值大于等于 Ua
54、或2 2 2小于等于 U a ,就否定原假设 (见图 7-3) 。2螅Ua/ n1637 1600150/ 26袇 4 计算统计量的值虿5作出结论膇因为 U Ua ,所以接受原假设 H0,即认为这批产品的平均使用寿命与1600 小时没有显著差别。2膅图 7-3 假设检验决策示意图莁(二)小样本总体方差未知时,总体平均数的假设检验T 检验芀上述 U 检验是在大样本或者总体方差已知的情况下进行的,但是在许多实际问题中,抽样单位 数不够多,而且方差往往未知,这时我们怎样检验有关总体均值的问题呢?这就要用到T 检验法。肇设总体服从正态分布 N , 2 ,但是 、 2都未知, Xl , X2, Xn为取
55、自该总体的一个随机样本,给定显著性水平 a,检验 H0 : 0。莂当总体方差未知时,用样本标准差 Sn 1 ,来代替总体标准差 ,则有:x肃 T t(n-1) ( 公式 7.28)Sn 1 / n罿与 U检验法一样, 若代入样本观察值得到的统计量, 其结果大于临界值 ( 有负号时比较其绝对值 ) 即落入拒绝域内,则否定原假设;反之,则不否定原假设。这种检验方法叫做 T 检验法。给定显著 性水平 a ,检验如下三个问题的规则分别为:膇(1)检验H0 :0时,如果 T tan 1,拒绝 H0;如果T tan 1,接受 H0;22螃(2)检验H0 :0时,如果T tan 1 ,拒绝H0;如果T tan 1,接受 H0;蒁(3)检验H0 :0时,如果 Ttan 1 ,拒绝H0;如果 Ttan 1 ,接受H0。螈例 7-12 抽测某高校 25位大学生的身高,由抽测的数据计算出这25 名学生的平均身高为 1.67米,方差 Sn2 1 0.082 。问能否认为该校学生的平均身高不低于1.70 米。 a 0.05膆解:假设检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 部门年度总结报告范文
- 宾馆厨师述职报告范文
- 2024年度知识产权许可合同模板
- 《巴塞尔协议的发展》课件
- 《建筑概论》课件
- 借贷居间合同2篇
- 2024年度租赁合同模板:办公自动化设备长期租赁服务2篇
- 空城计课件下载
- 油料购销合同范本
- 清包装修合同范本
- 衣物自己叠 (教学设计)-一年级上册劳动浙教版
- 内镜中心核心工作规章规章制度
- 人教版新起点二年级英语上册全册教案
- 第六单元名著导读《西游记》孙悟空的成长之路课件(共43张)统编版语文七年级上册
- 小学数学六年级下册思维导图:图形的运动
- DB32/T 4443-2023 罐区内在役危险化学品(常低压)储罐管理规范
- 5 国家机构有哪些 第一课时(说课稿)部编版道德与法治六年级上册
- 小学儿童心理学全套教学课件
- 工业气体充装站建站项目建设申请建设可研报告
- 东莞市数据中心中央空调施工方案
- 道路运输企业两类人员安全考核题库题库(1020道)
评论
0/150
提交评论