




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2022-6-101第五章参数估计与假设检验2022-6-102学习目标l掌握估计量的优良标准l参数区间估计的思想与方法l参数假设检验的临界值法与P值法l一定条件下,样本容量确定的方法2022-6-103重点与难点l参数区间估计的统计思想l估计的可靠程度、平均误差及极限误差的关系l临界值检验法的统计思想lP值的计算方法及其含义的理解l参数抽样检验中的两类错误及其关系2022-6-104 第一节 总体参数估计一、点估计l点估计的定义l点估计量的优良标准二、区间估计l区间估计的定义l总体均值的区间估计三、样本容量的确定2022-6-105一、点估计参数估计按是否考虑估计误差的大小及发生的概率,估计
2、方参数估计按是否考虑估计误差的大小及发生的概率,估计方法分为法分为点估计点估计和和区间估计区间估计两大类。两大类。 (一)点估计的定义 2022-6-106l 点估计就是根据总体参数点估计就是根据总体参数 与样本统计量与样本统计量 之间的内在联之间的内在联系,直接用系,直接用 作为总体相应参数作为总体相应参数 的估计量,用样本统的估计量,用样本统 计计量量 的某个取值作为总体参数的某个取值作为总体参数 的估计值的估计值 。l 点估计不考虑估计误差的大小,故不需确定估计量的概率点估计不考虑估计误差的大小,故不需确定估计量的概率分布。点估计的主要作用是寻找参数的估计量。分布。点估计的主要作用是寻找
3、参数的估计量。l 点估计有很多具体方法,其中矩估计法、最大似然估计法点估计有很多具体方法,其中矩估计法、最大似然估计法是最经典的方法是最经典的方法。2022-6-107(二)估计量的评价标准无偏性 EP( )对于参数对于参数 ,若有估计量,若有估计量 满足:满足: ,则称则称 为为的无偏估计量。的无偏估计量。2022-6-108 (二)估计量的评价标准有效性若有若有 ,且,且 ,则,则 相对相对 来来说,是说,是 的有效估计量。的有效估计量。 12,EE 12DD21的抽样分布的抽样分布12P( )2022-6-109 (二)估计量的评价标准一致性l 当任意给定当任意给定 时,有时,有l 即当
4、即当 时,时, 依概率收敛于依概率收敛于 ,则称则称 为为 的一致的一致估计量,估计量, 具有一致性。具有一致性。l 对经常使用的点估计量对经常使用的点估计量 来说,可以证明,它们来说,可以证明,它们分别是总体分别是总体 的无偏、有效且满足一致性要求的的无偏、有效且满足一致性要求的优良估计量。优良估计量。0lim1nP n 2,XP S2, (一)区间估计的含义(二)总体均值的区间估计(三)总体成数的区间估计(四)总体方差的区间估计二、区间估计2022-6-1011(一)区间估计的含义 l 在概率意义下计算参数的变化范围,即在概率意义下计算参数的变化范围,即l 区间估计中的两个基本要求区间估计
5、中的两个基本要求::表明估计结果的可靠性,我们自然希望随机区间包含被估:表明估计结果的可靠性,我们自然希望随机区间包含被估参数参数 的概率的概率 越大越好,即随机区间越大越好,即随机区间 的平均长度越长越好的平均长度越长越好。:表明估计结果的误差大小。我们自然希望包含被估计参数:表明估计结果的误差大小。我们自然希望包含被估计参数 的随机区间的随机区间 的平均长度越短越好。的平均长度越短越好。12P12,121P12,(一)区间估计的含义 2022-6-1012l Neyman原则原则l 即在保证置信度的前提下,尽可能提高估计的精确度。即在保证置信度的前提下,尽可能提高估计的精确度。 l 区间估
6、计中的一些概念(对于区间估计中的一些概念(对于 )l 置信区间:置信区间:l 置信限:置信限:l 显著性水平:显著性水平:l 置信水平:置信水平:l 区间估计时应考虑的一些具体问题区间估计时应考虑的一些具体问题,在对总体均值进行区间估在对总体均值进行区间估计时,常常需要考虑总体是否为正态总体、总体方差是否已计时,常常需要考虑总体是否为正态总体、总体方差是否已知、用于构造估计量的样本是大样本知、用于构造估计量的样本是大样本(n30)还是小样本还是小样本(n30)等几种情况。等几种情况。 21,1121P12,l正态总体、总体方差已知;或非正态总体、正态总体、总体方差已知;或非正态总体、大样本条件
7、大样本条件 l正态总体、总体方差未知、小样本条件正态总体、总体方差未知、小样本条件 (二)总体均值的区间估计2022-6-10141.正态总体、总体方差已知;或非正态总体、大样正态总体、总体方差已知;或非正态总体、大样本条件本条件 l 当总体服从正态分布当总体服从正态分布 时时( 已知已知),来自该总体,来自该总体的所有容量为的所有容量为n的样本的均值的样本的均值 也服从正态分布,也服从正态分布, 的数学的数学期望为期望为 ,方差为,方差为 ,即,即 l 使用正态分布统计量使用正态分布统计量z标准化标准化2(,)N 2XX2/n(0,1)xzNn2( ,/ )XNn 2022-6-1015总体
8、均值总体均值 在在 置信水平下的置信水平下的置信区间为置信区间为 总体标准差未知时,可用样本标准差代替总体标准差未知时,可用样本标准差代替2xxzxn1xNnNn1.正态总体、总体方差已知;或非正态总体、大样本条件正态总体、总体方差已知;或非正态总体、大样本条件 1抽抽样样平平均均误误差差抽抽样样极极限限误误差差/2zn/21NnzNn2022-6-1016临界值临界值-z值值 /2统计量统计量1 - 置信水平置信水平1.正态总体、总体方差已知;或非正态总体、大样本条件正态总体、总体方差已知;或非正态总体、大样本条件 2022-6-101790%的样本的样本 -1.65 +1.652xxz99
9、% 的样本的样本 - 2.58 + 2.58 95% 的样本的样本 -1.96 x +1.96xx1.正态总体、总体方差已知;或非正态总体、大样本条件正态总体、总体方差已知;或非正态总体、大样本条件 xxxx2022-6-1018【例例】某审计人员对一家货运公司某审计人员对一家货运公司8042张收款账单进行抽样,张收款账单进行抽样,从而估计这批账单的平均账面金额,该审计人员随机抽取从而估计这批账单的平均账面金额,该审计人员随机抽取100份账单,得样本平均账面金额为份账单,得样本平均账面金额为500元,方差为元,方差为100,给定显著,给定显著性水平性水平 ,检验这批账单的账面金额均值的置信区间
10、。,检验这批账单的账面金额均值的置信区间。【解解】已知已知 , 置信度置信度 ,查标准正态分布表,得查标准正态分布表,得即有即有95%的把握认为区间(的把握认为区间(498.04,501.96)包含总体均值。)包含总体均值。0.052500,100,100 xsn195%0.0251.96z/2100500 1.96(498.04,501.96)100 xzn1.正态总体、总体方差已知;或非正态总体、大样本条件正态总体、总体方差已知;或非正态总体、大样本条件 2.正态总体、总体方差未知、小样本2022-6-1019l 使用使用 t t 分布统计量估计总体均值分布统计量估计总体均值 l 总体均值
11、总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为l重复抽样重复抽样 l不重复抽样不重复抽样 (1)Xtt nsn2sXtn21sNnXtNn2022-6-1020【例例】某时装专卖店的管理人员想估计其顾客的平某时装专卖店的管理人员想估计其顾客的平均年龄,随机抽取了均年龄,随机抽取了1616位顾客进行调查,得到样本位顾客进行调查,得到样本均值均值 岁,样本标准差岁,样本标准差S=8S=8岁。假定顾客的年岁。假定顾客的年龄近似服从正态分布,试求该店全部顾客平均年龄龄近似服从正态分布,试求该店全部顾客平均年龄置信度为置信度为95%95%的置信区间。的置信区间。32X 2.正态总体
12、、总体方差未知、小样本2022-6-1021【解解】因为总体因为总体X X近似服从正态分布,未知且近似服从正态分布,未知且n=16n=16,为小样,为小样本,对本,对 进行区间估计须构造进行区间估计须构造t t统计量。根据统计量。根据 ,查,查t t分布表得分布表得 , 故总体均值的故总体均值的95%95%的置信区间为:的置信区间为:即有即有95%95%的把握估计顾客的平均年龄在(的把握估计顾客的平均年龄在(2828,3737)之中。)之中。0.0250.025816 1322.131527.73716816 1322.131536.26316SXtnSXtn20.0251152.1315tn
13、t0.052.正态总体、总体方差未知、小样本2022-6-1022(三)总体成数的区间估计在大样本条件下(在大样本条件下( 或或 大于等于大于等于5),), 有:有: 则可利用正态统计量则可利用正态统计量 估计总体成数的置信区间。估计总体成数的置信区间。 (1)npnp(1)(,)pNn(1)(,)1NnpNnN(0,1)(1)pzNn版权所有 BY 统计学课程组(重复抽样)(重复抽样)(不重复抽样)(不重复抽样)(重复抽样)(重复抽样)2022-6-1023(三)总体成数的区间估计l 总体比例总体比例 在在1-1- 置信水平下置信水平下的置信区间为:的置信区间为:l 重复抽样时:重复抽样时:
14、l 不重复抽样时:不重复抽样时:2ppz(1)(1)pppnn或(1)(1)()()11pNnppNnnNnN或版权所有 BY 统计学课程组2022-6-1024(三)总体成数的区间估计【例例】一所大学的保健医生想了解学生戴眼睛的成数,随机一所大学的保健医生想了解学生戴眼睛的成数,随机抽选抽选100100名学生,调查发现其中名学生,调查发现其中3131名戴眼睛,试求全校学生戴名戴眼睛,试求全校学生戴眼镜成数的置信度为眼镜成数的置信度为90%90%的置信区间。的置信区间。【解解】已知已知 ,为大样本,由中,为大样本,由中心极限定理知:心极限定理知:31100,100315100nnp1,PNn(
15、三)总体成数的区间估计2022-6-1025l 总体成数总体成数 未知,样本方差未知,样本方差P P代替,根据代替,根据 ,查标准,查标准正态概率分布表,得正态概率分布表,得 ,则有,则有l 即有即有90%90%的把握估计全校学生戴眼镜的成数在的把握估计全校学生戴眼镜的成数在 (23.4%23.4%,38.6%38.6%)之间。)之间。0.100.051.65Z0.050.0510.31 1 0.310.31 1.650.31 0.076 0.23410010.31 0.076 0.386PPP Znppp Zn 2022-6-1026(四)总体方差的区间估计l 估计一个总体的方差或标准差估计
16、一个总体的方差或标准差l 假设总体服从正态分布假设总体服从正态分布l 总体方差总体方差 的点估计量为的点估计量为 ,且,且l 总体方差在总体方差在1- 置信水平下的置信区间为置信水平下的置信区间为22211nsn2222221211nsns22s版权所有 BY 统计学课程组2022-6-1027总体方差的区间估计(图示) 2 211 2 2总体方差总体方差1- 的置信区间的置信区间自由度为自由度为n-1的的 2 22022-6-1028【例例】假定假定A品牌品牌25公斤袋装大米的重量服从正态公斤袋装大米的重量服从正态分布。现随机抽取分布。现随机抽取13袋大米,测得重量分别为袋大米,测得重量分别
17、为24.0、24.2、24.4、24.6、24.7、24.8、25.0、25.1、25.1、25.2、25.3、25.4、25.6公斤,试以公斤,试以95%的的置信度估计该品牌袋装大米重量的标准差。置信度估计该品牌袋装大米重量的标准差。版权所有 BY 统计学课程组总体方差的区间估计(例题)2022-6-102022-6-102929l 【解解】由于由于n-1=12,查自由度为,查自由度为12的的 分布表得:分布表得: 则有:则有:l 由原始数据可计算得到由原始数据可计算得到 ,代入上式便有:,代入上式便有: l 即以即以95%的置信度估计该品牌袋装大米重量的标准差的置信度估计该品牌袋装大米重量
18、的标准差 在在0.34-0.79公斤之间。公斤之间。222121223.3374.404SS20.23S 20.1180.630.340.792221/2/24.40423.337,或或总体方差的区间估计(例题)2022-6-1030(五)单侧置信区间l 在某些实际问题中,人们可能仅仅关心参数的下限或上限,就在某些实际问题中,人们可能仅仅关心参数的下限或上限,就提出了单侧置信区间的问题。提出了单侧置信区间的问题。l 单侧置信区间就均值而言,有两种表示,即:单侧置信区间就均值而言,有两种表示,即: ;l 单侧置信区间就成数而言,有两种表示,即:单侧置信区间就成数而言,有两种表示,即: ;l 单侧
19、置信区间就方差而言,有两种表示,即:单侧置信区间就方差而言,有两种表示,即: ;l 将双侧置信区间的上限与下限对应的分位值按将双侧置信区间的上限与下限对应的分位值按 或或 确定后,计算出下限或上限,即可获得单侧置信区间的估计。确定后,计算出下限或上限,即可获得单侧置信区间的估计。(-,)上限(,+)下限(0,)上限(,100%)下限(0,)上限(,+)下限12022-6-1031 (六)区间估计的基本步骤?根据上述例子,区间估计的步骤可归纳为:根据上述例子,区间估计的步骤可归纳为:l 依题意确定待估参数;依题意确定待估参数;l 依题设条件构造与待估参数相对应的估计量;依题设条件构造与待估参数相
20、对应的估计量;l 确定估计量的抽样分布;确定估计量的抽样分布;l 依估计量的抽样分布,由给定的置信度计算待估参数置依估计量的抽样分布,由给定的置信度计算待估参数置信区间的上、下限。信区间的上、下限。2022-6-1032三、样本容量的确定(一)问题的提出(二)处理问题的原则(三)样本容量确定的方法l 从推断来看,要达到估计所要求的精确程度,自然要求样从推断来看,要达到估计所要求的精确程度,自然要求样本容量越大越好;本容量越大越好;l 从抽样来看,增大样本容量,势必增加人力、物力,从而从抽样来看,增大样本容量,势必增加人力、物力,从而导致调查成本增大,这无疑是不经济的做法。导致调查成本增大,这无
21、疑是不经济的做法。l 在抽样推断中,势必要在统计推断的精确度与调查成本这在抽样推断中,势必要在统计推断的精确度与调查成本这一对矛盾间进行权衡一对矛盾间进行权衡。 (一)问题的提出2022-6-1034(二)处理问题的原则 从抽样角度来看,处理推断目标实现的精确度与调查成从抽样角度来看,处理推断目标实现的精确度与调查成本间矛盾的原则是:在保证达到推断目标的要求下,尽本间矛盾的原则是:在保证达到推断目标的要求下,尽量使调查成本最低。量使调查成本最低。 从推断角度来看,处理统计推断精确度与调查成本间矛从推断角度来看,处理统计推断精确度与调查成本间矛盾的原则是:在调查成本一定的情况下,尽量使推断目盾的
22、原则是:在调查成本一定的情况下,尽量使推断目标实现的效果好,即估计的精度更高。标实现的效果好,即估计的精度更高。版权所有 BY 统计学课程组2022-6-1035(三)样本容量的确定(简单随机抽样)l 在费用既定的条件下,从精度要求出发,考虑样本容量的大小。l 总体要求是,抽样极限误差不能超过给定的允许误差。l 样本容量的确定,根据抽样推断的目的不同,有估计总体均值与估计总体成数时的不同的估计公式。2022-6-10361、估计总体均值时,样本容量的确定l 抽样极限误差不能超过给定的允许误差的要求,在置信水平抽样极限误差不能超过给定的允许误差的要求,在置信水平 的条件下,有:的条件下,有:l
23、由于由于 或或 ,将其代入上式有:将其代入上式有: (重复抽样重复抽样) (不重复抽样)(不重复抽样)1/2xxz xn1xNnNn22/22zn22/2222/2(1)zNnzN【例例】一家塑料公司想估计其产品的平均抗拉强度,要求以一家塑料公司想估计其产品的平均抗拉强度,要求以95%的置信度使估计值在真值附近的置信度使估计值在真值附近1公斤公斤/平方厘米的范围内。问该公平方厘米的范围内。问该公司应抽多少个样品?经验表明,司应抽多少个样品?经验表明, 的估计值可取的估计值可取12.25。1、估计总体均值时,样本容量的确定22022-6-1037【解解】已知已知 根据估计式有:根据估计式有: 则
24、该公司至少应抽取则该公司至少应抽取48个样品作试验。个样品作试验。222221.9612.2547.061Zn2/212.25, =1, z=1.96 2022-6-1038版权所有 BY 统计学课程组2022-6-10382、估计总体成数时,样本容量的确定l 抽样极限误差不能超过给定的允许误差的要求,在置信水平抽样极限误差不能超过给定的允许误差的要求,在置信水平 的条件下,有:的条件下,有:l 由于由于 或或 ,将其代入上式有:,将其代入上式有: 1/2ppz (1)pn(1)1N nnN2/22(1)zn2/222/2(1)(1)(1)zNnzN (不重复抽样不重复抽样)(重复抽样重复抽样
25、) 2、估计总体成数时,样本容量的确定【例例】一家市场调查公司欲估计某地区有小汽车的家庭所占一家市场调查公司欲估计某地区有小汽车的家庭所占的比重。要求估计误差不超过的比重。要求估计误差不超过0.05,置信度取,置信度取95%,问应抽,问应抽取多大容量的样本?公司调查人员认为实际的比重不可能大取多大容量的样本?公司调查人员认为实际的比重不可能大于于20%。2022-6-1039【解解】由于由于 ,故有,故有,即该市场调查公司应至少抽取即该市场调查公司应至少抽取246户。户。0.2222211.960.2 0.8245.90.05Zn2022-6-1040 第二节 总体参数检验一、假设检验的一般性
26、问题二、几种常用、具体的参数检验方法版权所有 BY 统计学课程组2022-6-1041一、假设检验的一般性问题l问题的提出 l解决问题的统计思想l单、双侧检验问题l统计结论的两类错误l如何确定原假设与备择假设lP值检验法 l统计检验的显著性l假设检验的步骤2022-6-1042 1、问题的提出l 在许多情况下,总体的分布形式可能是已知的,总体在许多情况下,总体的分布形式可能是已知的,总体参数却是未知的,如果欲知道总体参数的取值状态,参数却是未知的,如果欲知道总体参数的取值状态,可对其进行参数估计;可对其进行参数估计;l 如果欲知道总体参数是否大于或小于某个假定或给定如果欲知道总体参数是否大于或
27、小于某个假定或给定的值,如食品中农药残留物是否超过标准等类似问题,的值,如食品中农药残留物是否超过标准等类似问题,可运用假设检验的方法进行推断。可运用假设检验的方法进行推断。l 实际上,假设检验是从另外一个角度对总体参数进行实际上,假设检验是从另外一个角度对总体参数进行估计。估计。2022-6-10432.假设的建立l 所谓所谓假设假设,就是对总体参数的具体数值所作的陈述。假设就是对总体参数的具体数值所作的陈述。假设检验就是运用样本信息判断假设是否成立的过程。检验就是运用样本信息判断假设是否成立的过程。l 假设检验中需要建立原假设和备择假设。假设检验中需要建立原假设和备择假设。l 原假设原假设
28、通常是研究者想搜集证据予以反对的假设,也称零通常是研究者想搜集证据予以反对的假设,也称零假设,用假设,用 表示。表示。l 备择假设备择假设通常是研究者想搜集证据予以支持的假设,也称通常是研究者想搜集证据予以支持的假设,也称研究假设或替换假设、对立假设,用研究假设或替换假设、对立假设,用 表示。表示。0H1H2022-6-10442.假设的建立l 原假设与备择假设是对立的。在假设的命题中,需要使原假设与备择假设是对立的。在假设的命题中,需要使用数学关系符号用数学关系符号“,”。l 规定:规定: l ,或或用在原假设上;用在原假设上;l ,或用在备择假设上。,或用在备择假设上。l 示例:示例:1:
29、3 0Hcm0:30Hcm1:30Hcm2022-6-10452.假设的建立【例例】一种零件的生产标准是直径应为一种零件的生产标准是直径应为10cm,为对生产过程,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于大于或小于10cm,则表明生产过程不正常,必须进行调整。,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设。试陈述用来检验生产过程是否正常的原假设和被择假设。【解】:研究
30、者想收集证据予以证明的假设应该是研究者想收集证据予以证明的假设应该是“生产过生产过 程不正常程不正常”。建立的原假设和备择假设为。建立的原假设和备择假设为2022-6-10462.假设的建立【例例】某品牌洗涤剂在它的产品说明书中声称:平均净含量某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于不少于500克。从消费者的利益出发,有关研究人员要通过抽克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。陈述用于检验的原假设与备择假设。【】研究者抽检的意图是倾向于证实这种
31、洗涤剂的平均研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述净含量并不符合说明书中的陈述 。建立的原假设和备择假设。建立的原假设和备择假设为为 H0 : 500 H1 : 2022-6-10483.假设检验的基本思想l根据样本信息对参数进行检验,采用的是一种判断的方法。根据样本信息对参数进行检验,采用的是一种判断的方法。l以正态总体的参数以正态总体的参数 为例,若要判断其是否等于某个给定的为例,若要判断其是否等于某个给定的值值 ,直观的想法就是:首先依样本构造出一个能反映总体参,直观的想法就是:首先依样本构造出一个能反映总体参数数 的统计量。通过第四章有关内容的论述,我
32、们知道,合适的的统计量。通过第四章有关内容的论述,我们知道,合适的统计量为样本均值统计量为样本均值 。l由于我们对总体的情况并不了解,所以由于我们对总体的情况并不了解,所以 实际上可能是下列三实际上可能是下列三种情况之一:种情况之一:l显然,在每一种情况下,样本均值显然,在每一种情况下,样本均值 的分布都不同,现把的分布都不同,现把 的的分布分别记为分布分别记为 ,如图如图5.5所示:所示:0X10020(1)(2)(3)XX102HHH、2022-6-1049如此一来,对如此一来,对的检验问题就转化为:要根据样本信息来判断的检验问题就转化为:要根据样本信息来判断样本均值样本均值 究竟来自图究
33、竟来自图5.5中的哪一个分布进而才能确定中的哪一个分布进而才能确定是是多少。多少。X3.假设检验的基本思想图图5.5 样本均值分布示意图样本均值分布示意图3.假设检验的基本思想2022-6-1050版权所有 BY 统计学课程组l样本均值样本均值 为一随机变量,取值于整个横轴,故它来自图为一随机变量,取值于整个横轴,故它来自图5.5中任一分中任一分 布的可能性都是存在的。布的可能性都是存在的。l不难理解,可能性大小需用概率来描述,即要计算不难理解,可能性大小需用概率来描述,即要计算 来自某分布的概率。来自某分布的概率。 问题是:问题是: 来自于哪一个分布的概率必须在确定的分布下才能计算。如来自于
34、哪一个分布的概率必须在确定的分布下才能计算。如 此,既然是问:此,既然是问: 是否等于某个给定值是否等于某个给定值 ,那么,不妨就假设,那么,不妨就假设 等于等于 该给定值该给定值 ,当这一假设成立时,用参数区间估计法,易计算出样本均,当这一假设成立时,用参数区间估计法,易计算出样本均 值值 在一定概率下的可能范围,即有在一定概率下的可能范围,即有21XXPZ XX0X02022-6-1051版权所有 BY 统计学课程组l从而:从而: ,如图,如图5.5中的区间中的区间l如果样本均值如果样本均值 落在这个区间,则承认原来的假设是可以接受的,即落在这个区间,则承认原来的假设是可以接受的,即 等于
35、给定值等于给定值 ;反之,样本均值;反之,样本均值 落在区间落在区间 之外,则否定之外,则否定 这个假设,即认为这个假设,即认为 大于大于 或小于或小于 。l此例中,我们之所以接受原假设,是因为样本均值此例中,我们之所以接受原假设,是因为样本均值 落在区间落在区间 内的概率为(内的概率为(1-),有充分地把握;),有充分地把握;l如果样本均值如果样本均值 落在区间落在区间 外,则拒绝原假设,这是因为样本外,则拒绝原假设,这是因为样本 均值均值 落在区间落在区间 外的概率外的概率小,无充分的理由接受原假设。小,无充分的理由接受原假设。00X012()xx,X0XX3.假设检验的基本思想10/22
36、0/2xxxzxz,12()xx,12()xx,X12()xx,12()xx,2022-6-1052l 我们将我们将 以很大的概率落在的区间以很大的概率落在的区间 称为原假设称为原假设 显著性水平为显著性水平为 的接受域;的接受域;l 将将 以很小的概率落在的区间以很小的概率落在的区间 称为原称为原假设假设 显著性水平为显著性水平为 的拒绝域;的拒绝域;l 拒绝域与接受域之间临界点根据估计量的分布特征、给定的拒绝域与接受域之间临界点根据估计量的分布特征、给定的显著性水平、检验的类型查表获得。显著性水平、检验的类型查表获得。l 通过比较检验统计量的值与原假设临界值之间的大小,进而通过比较检验统计
37、量的值与原假设临界值之间的大小,进而对原假设对原假设H0作决策的假设检验方法称为临界值检验法。作决策的假设检验方法称为临界值检验法。X0H12( ,)x xX12()(+)xx,及0H3.假设检验的基本思想2022-6-102022-6-105353a/2 3.假设检验的基本思想1 - 临界值检验法示意图临界值检验法示意图 (以双侧检验为例以双侧检验为例)2022-6-1054l 上述的判断实际上体现着反证法的思想。判断的基础是样本上述的判断实际上体现着反证法的思想。判断的基础是样本信息,判断的理论依据是小概率原理,即小概率事件在一次信息,判断的理论依据是小概率原理,即小概率事件在一次试验(或
38、抽样)中几乎不发生。试验(或抽样)中几乎不发生。l 直观来想,在所做假设是正确的情况下,那么一次试验(或直观来想,在所做假设是正确的情况下,那么一次试验(或抽样)中人们期望的结果出现的概率应该较大。然而现在的抽样)中人们期望的结果出现的概率应该较大。然而现在的事实却不是这样的,期望的结果出现的概率不仅不大,反而事实却不是这样的,期望的结果出现的概率不仅不大,反而很小,即所谓的小概率事件居然发生了,这就很不正常了,很小,即所谓的小概率事件居然发生了,这就很不正常了,意味着一次试验(或抽样)中出现了出人意料的结果,也意意味着一次试验(或抽样)中出现了出人意料的结果,也意味着给了我们做出否定原假设的
39、充分证据。可见假设检验的味着给了我们做出否定原假设的充分证据。可见假设检验的思想是从不利于原假设的角度来对原假设做决策的。思想是从不利于原假设的角度来对原假设做决策的。3.假设检验的基本思想2022-6-1055因此,当我们拒绝原假设时,并不意味着原假设一定是错误因此,当我们拒绝原假设时,并不意味着原假设一定是错误的,只是说概率意义下接受原假设的理由很不充分,而否定的,只是说概率意义下接受原假设的理由很不充分,而否定原假设的证据却非常强。这与数学家原假设的证据却非常强。这与数学家“证明证明”某个结论的方某个结论的方式不同,而有点儿类似于法院里法官的判案方式。并且只要式不同,而有点儿类似于法院里
40、法官的判案方式。并且只要小概率小概率不等于零,对原假设做决策就可能错判,存在做出错不等于零,对原假设做决策就可能错判,存在做出错误选择的风险。误选择的风险。3.假设检验的基本思想2022-6-10564.单、双侧检验问题l备择假设没有备择假设没有特定的方向性特定的方向性,并含有符号,并含有符号“ ”的假设检的假设检验,称为双侧检验或双尾检验验,称为双侧检验或双尾检验(two-tailed test) l备择假设具有特定的方向性,并含有符号备择假设具有特定的方向性,并含有符号“”或或“”的假的假设检验,称为单侧检验或单尾检验设检验,称为单侧检验或单尾检验(one-tailed test)l备择假
41、设的方向为备择假设的方向为“”,称为,称为右侧检验右侧检验 2022-6-1057双侧检验与单侧检验的假设形式假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : = 0H0 : 0H0 : 0备择假设备择假设H1 : 0H1 : 0注:注:研究者感兴趣的是备择假设,单侧假设的方向是按备择假设的研究者感兴趣的是备择假设,单侧假设的方向是按备择假设的方向来说的。方向来说的。2022-6-10585. 统计结论的两类错误l 第第类错误类错误(弃真错误弃真错误)l原假设为真时拒绝原假设为真时拒绝原假设原假设l第第类错误的概率类错误的概率记为记为 ,被称为显被称
42、为显著性水平著性水平l 第第类错误类错误(纳伪错误纳伪错误)l原假设为假时未拒原假设为假时未拒绝原假设绝原假设l第第类错误的概率类错误的概率记为记为 2022-6-1059假设检验中的两类错误的决策结果陪审团审判陪审团审判H H0 0 检验检验裁决裁决实际情况实际情况决策决策实际情况实际情况无罪无罪有罪有罪H0为真为真H0为假为假无罪无罪正确正确错误错误未拒未拒绝绝H0正确决策正确决策第第类错误类错误( )有罪有罪错误错误正确正确拒绝拒绝H0第第类错类错误误()正确决策正确决策2022-6-1060 错误和 错误的关系同时减少两类错误惟一办法增加样本容量! 和和 的关系就像翘的关系就像翘翘板,
43、翘板, 小小 就大,就大, 大大 就小就小2022-6-1061 5. 统计结论的两类错误l 两类错误的关系两类错误的关系当其他条件不变时,当其他条件不变时,大则大则小;反之,小;反之,小必导致小必导致大。换句大。换句话说,在其他条件不变的情况下,要同时减小犯两类错误的话说,在其他条件不变的情况下,要同时减小犯两类错误的概率是不可能的。概率是不可能的。在规定的显著性在规定的显著性下,单侧检验犯第二类错误的可能性小于双下,单侧检验犯第二类错误的可能性小于双侧检验。故统计检验中,凡能进行单侧检验时就不做双侧检侧检验。故统计检验中,凡能进行单侧检验时就不做双侧检验,以便控制验,以便控制。其他情况不变
44、时,增加样本容量其他情况不变时,增加样本容量n,值将有效地的减小。值将有效地的减小。其他情况不变,假设下的其他情况不变,假设下的0与与1之间的距离将直接影响之间的距离将直接影响值。值。版权所有 BY 统计学课程组2022-6-1062 5. 统计结论的两类错误l 两类错误的控制原则两类错误的控制原则 通过以上分析,我们应该在合适的通过以上分析,我们应该在合适的及及的要求下进行统计的要求下进行统计 检验。通常检验。通常值控制在值控制在1%-5%之间,之间,值多控制在值多控制在10%-30%之间。统计学家之间。统计学家Neyman和和Pearson提出的原则是:提出的原则是:版权所有 BY 统计学
45、课程组2022-6-10635. 统计结论的两类错误 在控制犯第一类错误的概率在控制犯第一类错误的概率的条件下,使犯第二类错的条件下,使犯第二类错误的概率误的概率尽量减小,其含义是:原假设要受到维护,使尽量减小,其含义是:原假设要受到维护,使它不至于轻易被否定(因为假设检验时从不利于原假设的它不至于轻易被否定(因为假设检验时从不利于原假设的角度来对原假设作决策的);若检验结果否定了原假设,角度来对原假设作决策的);若检验结果否定了原假设,则说明否定的理由是充分的;同时,犯第一类错误的概率则说明否定的理由是充分的;同时,犯第一类错误的概率受到控制,亦即作出否定判断的可靠程度(受到控制,亦即作出否
46、定判断的可靠程度(1- )得到了)得到了保证。保证。版权所有 BY 统计学课程组2022-6-10645. 统计结论的两类错误版权所有 BY 统计学课程组本书中的假设检验问题只对犯第一类错误的概率本书中的假设检验问题只对犯第一类错误的概率加以限制,加以限制,而不考虑犯第二类错误的概率而不考虑犯第二类错误的概率,这种方式的假设检验又称,这种方式的假设检验又称为显著性检验,犯第一类错误的概率为显著性检验,犯第一类错误的概率称为显著性水平,其称为显著性水平,其取值通常需考虑:对原假设的信心,以及对原假设作出决策取值通常需考虑:对原假设的信心,以及对原假设作出决策后可能造成的损失,实际运用中,后可能造
47、成的损失,实际运用中,通常取一些标准化的值,通常取一些标准化的值,如:如:0.01、0.05、0.10等。等。2022-6-1065 6.P值检验法(概率值检验法)l 在原假设为真的条件下,检验统计量的观察值大于或等在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率于其计算值的概率l 双侧检验为分布中两侧面积的总和双侧检验为分布中两侧面积的总和l 反映实际观测到的数据与原假设反映实际观测到的数据与原假设 之间不一致的程度之间不一致的程度被称为观察到的被称为观察到的(或实测的或实测的)显著性水平显著性水平l 决策规则:决策规则:l 若若p值值,则接受则接受H0,拒绝,拒绝H1。 版
48、权所有 BY 统计学课程组2022-6-1071 7. 统计检验的显著性“显著显著”一词的一般意思不是一词的一般意思不是“重要的重要的”,而,而是是“非偶然非偶然”;但在同级检验中,该词的意;但在同级检验中,该词的意思是思是“只靠抽样的随机性不容易出现这样的只靠抽样的随机性不容易出现这样的结果结果”,其中的,其中的“不容易不容易”用显著性水平来用显著性水平来具体描述,可见显著性水平是用来评估检验具体描述,可见显著性水平是用来评估检验结果的显著性的,结果的显著性的,版权所有 BY 统计学课程组2022-6-1072显著性水平和拒绝域(双侧检验) /2 拒绝拒绝拒绝拒绝置信水平置信水平H0 : =
49、 0, H1 : 02022-6-1073显著性水平和拒绝域(左侧检验 )临界值临界值样本统计量样本统计量拒绝拒绝置信水平置信水平H H0 0 : : 0 0, H H1 1 : : 0 02022-6-1074显著性水平和拒绝域(右侧检验)H0 : 0, H1 : 02022-6-1075 8. 假设检验的步骤根据实际情况,建立原假设根据实际情况,建立原假设H0和备择假设和备择假设H1;根据备择假设根据备择假设H1的设定情况,确定检验时单侧检验还是双的设定情况,确定检验时单侧检验还是双侧检验;侧检验;确定样本量和显著性水平的大小;确定样本量和显著性水平的大小;选择一个合适的统计量做检验量,要
50、求有两个:一是与原选择一个合适的统计量做检验量,要求有两个:一是与原假设假设H0有关;二是能确定其抽样分布;有关;二是能确定其抽样分布;根据给定的显著性水平根据给定的显著性水平,在原假设,在原假设H0成立时,通过查表成立时,通过查表得到得到H0的临界值,给出的临界值,给出H0的拒绝域;的拒绝域;8. 假设检验的步骤抽取样本,收集数据,并依样本观察值计算检验量抽取样本,收集数据,并依样本观察值计算检验量w的的值(用值(用w表示);表示);根据根据w计算原假设计算原假设H0的的P值;值;作出是否拒绝作出是否拒绝H0的决策。的决策。 如果是用临界值法进行检验,则不需要做第(如果是用临界值法进行检验,
51、则不需要做第(7)步)步的工作,接受或拒绝原假设的规则是:若的工作,接受或拒绝原假设的规则是:若w落入落入H0的拒的拒绝域内,则拒绝绝域内,则拒绝H0。如果用。如果用P值法,则不需要做第(值法,则不需要做第(5)步的工作,接受或拒绝原假设的规则是:若步的工作,接受或拒绝原假设的规则是:若P值小于认定值小于认定的显著性水平,则拒绝原假设。的显著性水平,则拒绝原假设。762022-6-102022-6-1077 二、几种常用的参数检验方法版权所有 BY 统计学课程组l 统计上假设检验的方法很多,若按检验量服从的分布来划统计上假设检验的方法很多,若按检验量服从的分布来划分,最基本的检验方法有四种,即
52、分,最基本的检验方法有四种,即Z检验(或检验(或U检验)、检验)、t检验法、检验法、 检验法和检验法和F检验法。检验法。l 考虑到手工计算考虑到手工计算P值的麻烦,以及绝大部分统计软件在输值的麻烦,以及绝大部分统计软件在输出检验结果时都有出检验结果时都有P值,故这里主要介绍临界值检验法。值,故这里主要介绍临界值检验法。22022-6-1078(一)Z 检验法l Z检验法是指以服从正态分布的统计量构造检验统计量的检验法是指以服从正态分布的统计量构造检验统计量的检验方法。检验方法。l 主要应用场合:主要应用场合:l 已知总体分布的方差时,对一个正态总体的均值或两个正态总体已知总体分布的方差时,对一
53、个正态总体的均值或两个正态总体均值的关系(均值之差)进行检验。均值的关系(均值之差)进行检验。l 大样本下(大样本下(n50) )只有轻微偏斜的非正态总体均值和成数检验只有轻微偏斜的非正态总体均值和成数检验。 l 大样本下未知总体方差时的均值和成数检验大样本下未知总体方差时的均值和成数检验。版权所有 BY 统计学课程组2022-6-1079假设形式假设形式:所构造的检验量为:所构造的检验量为:0XZn001000100010:;:;:HHHHHH:1一个正态总体均值的检验 应用条件:正态总体,方差已知;或大样本下的非正态总体;应用条件:正态总体,方差已知;或大样本下的非正态总体;或大样本下方差
54、未知的正态总体或大样本下方差未知的正态总体2022-6-1080版权所有 BY 统计学课程组【例例5.7】完成生产线上某件工作的平均时间不少于完成生产线上某件工作的平均时间不少于15.5分分钟,标准差为钟,标准差为3分钟。随机抽选的分钟。随机抽选的9名职工讲授一中心方法,名职工讲授一中心方法,训练期结束后这训练期结束后这9名职工完成此项工作的平均时间为名职工完成此项工作的平均时间为13.5分分钟。这个结果是否说明用新方法所需时间比用老方法所需时钟。这个结果是否说明用新方法所需时间比用老方法所需时间短?设间短?设=0.05,并假定完成这项工作的时间服从正态分,并假定完成这项工作的时间服从正态分布
55、。布。1一个正态总体均值的检验 1一个正态总体均值的检验 2022-6-1081【解解】根题意,要检验的假设为:根题意,要检验的假设为:H0:15.5,H1: 15.5由于总体服从正态分布且总体方差已知,所以选取检验统计量由于总体服从正态分布且总体方差已知,所以选取检验统计量检验统计量的值为:检验统计量的值为: 查表得查表得Z0.05=1.65, 由于由于ZZ0.025,所以拒绝原假设所以拒绝原假设H0,即认为这两种,即认为这两种方法不能生产出抗拉强度相同的产品。方法不能生产出抗拉强度相同的产品。122222121220 172.13410 14xxZnn12221212xxZnn2022-6
56、-1085假设形式假设形式构造的检验统计量:构造的检验统计量:001000100010:,:;:,;:,:HHHHHH:0000,11nPZN3大样本下总体成数的检验 应用条件:总体服从二项分布,大样本应用条件:总体服从二项分布,大样本3大样本下总体成数的检验 【例例5.9】某公司负责人发现开出去的发票有大量笔误,而且某公司负责人发现开出去的发票有大量笔误,而且断定这些发票中,错误的发票占断定这些发票中,错误的发票占20%以上。随机抽取以上。随机抽取400张张检查,发现错误的发票有检查,发现错误的发票有100张,即占张,即占25%,这是否可以证,这是否可以证明负责人的判断正确(明负责人的判断正
57、确(=0.05)?)? 3大样本下总体成数的检验 2022-6-1087l 【解解】按题意建立假设:按题意建立假设:l 选取检验统计量为:选取检验统计量为:l 其观测值为:其观测值为:l 查表得查表得Z0.05=1.65,由于由于ZZ0.05,所以拒绝,所以拒绝H0,也即认为这些数据可以,也即认为这些数据可以证明负责人的判断是正确的。证明负责人的判断是正确的。01:0.2,:0.2HH0001PZn0001000.24002.50.20.81400PZn2022-6-1088(二)t 检验法t 检验法是在未知总体方差而且小样本时,对一个正态总体检验法是在未知总体方差而且小样本时,对一个正态总体
58、的均值或两个正态总体均值的关系(均值之差)进行检验的的均值或两个正态总体均值的关系(均值之差)进行检验的方法。方法。 2022-6-1089假设形式假设形式: :所构造的检验量所构造的检验量01/xtt nSn1一个正态总体均值的检验应用条件:正态总体,方差未知,小样本应用条件:正态总体,方差未知,小样本001000100010:;:;:HHHHHH:2022-6-1090【例例5.10】某汽车轮胎厂声称,该厂一等品轮胎的平均寿命某汽车轮胎厂声称,该厂一等品轮胎的平均寿命在一定的重量和正常行驶条件下,高于在一定的重量和正常行驶条件下,高于25000公里的国家标公里的国家标准。厂家对一个由准。厂
59、家对一个由15个轮胎组成的随机样本进行试验,得到个轮胎组成的随机样本进行试验,得到的平均值和标准差分别为的平均值和标准差分别为27000公里和公里和5000公里。假定轮胎公里。假定轮胎寿命近似服从正态分布,试问可否相信产品质量同厂家所说寿命近似服从正态分布,试问可否相信产品质量同厂家所说的情况相符?(的情况相符?(=0.05)1一个正态总体均值的检验1一个正态总体均值的检验l 【解解】依题意,建立假设依题意,建立假设 H0: 25000, H1: 25000l 由于总体近似服从正态分布,总体方差未知,且为小样本;由于总体近似服从正态分布,总体方差未知,且为小样本;所以选取检验统计量:所以选取检
60、验统计量:l 其观测值为:其观测值为:l 查自由度为(查自由度为(n-1)=14的的t分布表得分布表得t0.05(14)=1.7613,由于,由于tt0.05(14),所以只能接受,所以只能接受H0。01/xtt nSn027000250001.55/5000/ 15xtSn2两个正态总体均值之差的检验应用条件:两个总体均为正态总体,方差未知但相等,两个应用条件:两个总体均为正态总体,方差未知但相等,两个小样本小样本2022-6-1092假设形式假设形式 所构造的检验量所构造的检验量()()()()()()121 212122212122211XYXYnn nntt nnnnnSnSmm-+-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 市政工程师培训课件视频
- 市场开发与管理课件
- 工程防火课件
- 工程给排水课件
- 疫情健康教育教学课件
- 菏泽二年级期中数学试卷
- 河南年文科数学试卷
- 沪科版七升八数学试卷
- 湖南省小学升学数学试卷
- 瀚林2024数学试卷
- 食品安全与日常饮食智慧树知到期末考试答案章节答案2024年中国农业大学
- 广西保险销售从业人员销售资质分级测试题库(含答案)
- 西安交通大学大学2024硕士研究生招生考试初试试题703马克思主义哲学
- 监理业务手册范本
- 精神活性物质所致精神障碍病人的护理查房
- 消防工程消防器材供应方案
- 园艺产品营销和管理及控制
- 颅脑外伤影像诊断课件
- 人教版(新起点)小学六年级上册英语教案(全册)
- 医院职业暴露医务人员锐器伤登记表
- 小儿荨麻疹护理查房
评论
0/150
提交评论