第三章统计检验_第1页
第三章统计检验_第2页
第三章统计检验_第3页
第三章统计检验_第4页
第三章统计检验_第5页
已阅读5页,还剩130页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章 统计检验统计检验 统计推断包括两方面的内容统计推断包括两方面的内容参数估计:参数估计:随机变量的分布函数已知,由样本值估随机变量的分布函数已知,由样本值估计其分布参数计其分布参数假设检验(统计检验)假设检验(统计检验):随机变量的分布函数是未随机变量的分布函数是未知的,假设样本值服从某一分布,利用样本值根据知的,假设样本值服从某一分布,利用样本值根据概率统计原理,用参数估计的方法进行计算,以判概率统计原理,用参数估计的方法进行计算,以判断假设是否成立,即对假设进行检验,断假设是否成立,即对假设进行检验,若检验后证若检验后证明假设是正确的,就接受假设;若检验后证明假设明假设是正确的

2、,就接受假设;若检验后证明假设是错误的,就拒绝假设。是错误的,就拒绝假设。分析测试使得测定值之存在着差异,引起差异的可能因分析测试使得测定值之存在着差异,引起差异的可能因素素: 测试过程中受到不可避免的测试过程中受到不可避免的偶然因素偶然因素影响(即随机误影响(即随机误差引起的差异和波动),这只能影响精密度;差引起的差异和波动),这只能影响精密度;生产或生产或测试条件的改变测试条件的改变引起差异,意味着条件对分析引起差异,意味着条件对分析结果有影响,影响分析结果的准确度。结果有影响,影响分析结果的准确度。 统计检验统计检验正是科学地处理和分辨这两种不同性质正是科学地处理和分辨这两种不同性质差异

3、的方法。差异的方法。第一节第一节 统计检验的原理和基本思想统计检验的原理和基本思想 一一 、统计检验、统计检验1. 问题的提出问题的提出 试验过程存在误差试验过程存在误差分析数据参差不齐分析数据参差不齐(甚至出现较大的离群值)(甚至出现较大的离群值)对试验数据本身的对试验数据本身的可靠性作出评价,判断测定中是否存在误差(有可靠性作出评价,判断测定中是否存在误差(有系系统误差统误差、随机误差或过失误差,主要判断是否存在、随机误差或过失误差,主要判断是否存在系统误差)系统误差)可表明能否作为可表明能否作为的无偏估计量?的无偏估计量?能否作为能否作为的无偏估计量?的无偏估计量?这就需要进行统计这就需

4、要进行统计检验。检验。 2. 统计检验的内容统计检验的内容可疑数据的取舍可疑数据的取舍 p16异常值(坏值):异常值(坏值): 由于分析过程中存在的错误或系由于分析过程中存在的错误或系统误差所造成的,统误差所造成的,常表现为巨差,通过统计方法确认常表现为巨差,通过统计方法确认有此误差存在,该异常值应舍去。有此误差存在,该异常值应舍去。离群值离群值( (可疑值可疑值) ):是指在一组测定值中某个别值明显是指在一组测定值中某个别值明显高于其余测定值。高于其余测定值。虽然明显偏离其余测定值,但仍然虽然明显偏离其余测定值,但仍然处于统计上所允许的合理误差范围之内,与其余测定处于统计上所允许的合理误差范

5、围之内,与其余测定值属于同一总体值属于同一总体 ,因此,考察和评价测定数据本身,因此,考察和评价测定数据本身的可靠性时,要正确区分异常值和离群值,不容混淆。的可靠性时,要正确区分异常值和离群值,不容混淆。判断不同分析人员、不同实验室对同一样品分析结判断不同分析人员、不同实验室对同一样品分析结果的一致性,包括果的一致性,包括检验异常值、检验平均值、即准检验异常值、检验平均值、即准确度的检验。确度的检验。判断不同分析人员、不同实验室对同一样品测定结判断不同分析人员、不同实验室对同一样品测定结果是否具有相同的精密度,包括果是否具有相同的精密度,包括:判断因素效应与系统误差判断因素效应与系统误差检验方

6、差的一致性检验方差的一致性判断测试方法与测试结果的精度判断测试方法与测试结果的精度检验测定值的分布类型等。检验测定值的分布类型等。 即测定是否达到一定的标准(精密度),即测定是否达到一定的标准(精密度),s是否能作是否能作为为的估计量。的估计量。 分析结果好坏取决于分析结果好坏取决于5个个因素:因素:人、方法、原材料、人、方法、原材料、仪器、环境,仪器、环境,分析数据的波动或分布是由这些可变动分析数据的波动或分布是由这些可变动的因素造成,按其影响程度和消除的可能性分为:的因素造成,按其影响程度和消除的可能性分为:经常作用的因素经常作用的因素:随机误差随机误差正态分布正态分布正常现象正常现象分析

7、过程是稳定的分析过程是稳定的影响精密度。影响精密度。可避免的因素可避免的因素:系统误差,偏倚:系统误差,偏倚不遵循正态分布不遵循正态分布不正常原因(波动不正常)不正常原因(波动不正常)分析过程不正常,分析过程不正常,需采取措施,检验不稳定性。需采取措施,检验不稳定性。 3. 统计检验统计检验 p39 在对测量数据进行统计分析时,需要对在对测量数据进行统计分析时,需要对测量数据的某些性质作出统计推断,这时就测量数据的某些性质作出统计推断,这时就要对总体的某些性质作出假设,然后根据样要对总体的某些性质作出假设,然后根据样本值,通过一定的数学方法来检验所作假设本值,通过一定的数学方法来检验所作假设的

8、正确性。如果是正确的,就接受这一假设;的正确性。如果是正确的,就接受这一假设;如果不正确,就拒绝所作出的统计假设。如果不正确,就拒绝所作出的统计假设。 (1) 假设:假设:关于总体的假设,称为统计假设。关于总体的假设,称为统计假设。(2) 表示方法表示方法: H0: (由样本估计出来的真值与实际真值一致,不存在(由样本估计出来的真值与实际真值一致,不存在系统误差)系统误差) H0: (由样本估计出来的精密度与已知的精密度一致)由样本估计出来的精密度与已知的精密度一致) (3) 统计检验:统计检验:检验统计假设的方法称为假设检检验统计假设的方法称为假设检验或统计检验,被检验的假设称为原假设验或统

9、计检验,被检验的假设称为原假设(如(如H0)。)。 假设检验是根据样本信息来检验关于总体参数的假假设检验是根据样本信息来检验关于总体参数的假设,以判断总体分布是否具有指定的特征,假设检设,以判断总体分布是否具有指定的特征,假设检验的过程如下:验的过程如下:用样本值进行检验用样本值进行检验 原来的假设与样本之间不存在原来的假设与样本之间不存在显著性矛盾显著性矛盾 接受原假设接受原假设 统计假设成立统计假设成立H0用样本值进行检验,原来的假设与样本值之间存在用样本值进行检验,原来的假设与样本值之间存在显著性矛盾显著性矛盾 拒绝原假设拒绝原假设 接接受另一备择假设受另一备择假设H1假设检验又称为显著

10、性检验。假设检验又称为显著性检验。 例如例如: 已知样本来自正态总体,检验它是否来自均值为已知样本来自正态总体,检验它是否来自均值为的正态总体,先根据样本值计算平均值的正态总体,先根据样本值计算平均值 ,将它作,将它作为总体均值为总体均值的估计值,如果样本是来自均值为的估计值,如果样本是来自均值为的的正态总体,则正态总体,则 是是的一致而有效的估计值。虽然的一致而有效的估计值。虽然不一定正好等于不一定正好等于,但根据估计值好坏的评选标准,但根据估计值好坏的评选标准, 与与之间不会有显著性差异,反之,如果之间不会有显著性差异,反之,如果 与与之之间有显著性差异,则不能认为样本间有显著性差异,则不

11、能认为样本 来自均值为来自均值为的的正态总体正态总体 。(p39 例例2.12)xxxxx例例3-1 某钢厂化验员,接班时为了检查仪器、试剂、某钢厂化验员,接班时为了检查仪器、试剂、操作及环境等实验条件是否正常,先取钢样分析,操作及环境等实验条件是否正常,先取钢样分析,若所得结果若所得结果P()为:()为:0.073,0.077,问条件是否,问条件是否正常?(即不存在系统误差)已知正常?(即不存在系统误差)已知 0.079,0.002 。 解解 H0: 置信区间置信区间 当当 时时 075. 02077. 0073. 0 xnua%95a96. 1u1)(295. 0uN975. 02195.

12、 0)(uN查查164附表附表1,得,得u1.96或或:0.05,双边检验查单边表,双边检验查单边表,/2=0.025,即,即a0.975,故得之。),故得之。) 置信区间为置信区间为 即在(即在(0.076,0.082)范围内。而)范围内。而 0.075,落在置,落在置信区间以外,即这种事件的概率为信区间以外,即这种事件的概率为5,20次才出现一次才出现一次,我们可以认为该样本平均值来自正态总体次,我们可以认为该样本平均值来自正态总体N(, )的可能性太小,不能接受原假设,应否定)的可能性太小,不能接受原假设,应否定原假设,说明交接班时实验条件不正常。原假设,说明交接班时实验条件不正常。00

13、3. 0079. 02002. 096. 1079. 0nuaxn2如上例中,我们选如上例中,我们选0.01,那么,那么99(/20.005,a=0.995 查查164附表附表1, u=2.58),置信区间应该是:置信区间应该是:即(即(0.075,0.083),这时,平均值),这时,平均值0.075就正好落在这就正好落在这个区间内,于是推断说:有个区间内,于是推断说:有99的把握认为的把握认为 没没有显著性区别,认为这一班的各种实验条件正常,不有显著性区别,认为这一班的各种实验条件正常,不再作任何检查和更换。这两个结论虽然不同,但并不再作任何检查和更换。这两个结论虽然不同,但并不矛盾,这是因

14、为它们是在不同的显著性水平矛盾,这是因为它们是在不同的显著性水平下作出下作出的,由此可见,显著性水平的,由此可见,显著性水平的大小时很重要的。的大小时很重要的。 004. 0079. 02002. 058. 2079. 0nua与二、几个术语(统计检验的理论依据和基本方法)二、几个术语(统计检验的理论依据和基本方法) 1. 小概率事件小概率事件 : : 概率很小的事件。概率很小的事件。 一般情况下,把概率在一般情况下,把概率在0.05以下的事件(即落在置以下的事件(即落在置信区间范围以外的事件),称为小概率事件。信区间范围以外的事件),称为小概率事件。2. 2. 小概率事件原则小概率事件原则

15、小概率事件在一次测量中实际上是不可能发生小概率事件在一次测量中实际上是不可能发生的,如果在一次试验中竟然发生了,那么就认为是一的,如果在一次试验中竟然发生了,那么就认为是一种反常现象。(非常事件)种反常现象。(非常事件) 反常现象:实验中条件反常现象:实验中条件不正常,存在系统误差。不正常,存在系统误差。3. 拒绝域拒绝域 在一定的显著性水平下,检验在一定的显著性水平下,检验统计量落在某一范围内就拒绝接受原假统计量落在某一范围内就拒绝接受原假设,则此范围就叫做该显著性水平的拒绝设,则此范围就叫做该显著性水平的拒绝域,以域,以表示。表示。设检验统计量为设检验统计量为T=T( ) ,T是样本值和被

16、估参数的函数,不包是样本值和被估参数的函数,不包括未知值。在原假设成立时,检验统计量括未知值。在原假设成立时,检验统计量T的概率密度函数的概率密度函数(T)已知,)已知,(T)落在某个区域)落在某个区域的概率的概率 : TdTTTP)()(x表示在原假设表示在原假设 H0 成立时,检验统计量落在拒绝域成立时,检验统计量落在拒绝域以内的概率,称为显著性水平。以内的概率,称为显著性水平。0.05,1.96,取值通常很小,取值通常很小,0.05,0.01等。等。当原假设为真时,当原假设为真时,T落入落入区域内是一个小概率事件,区域内是一个小概率事件,根据小概率事件原则,在一次抽样中几乎不可能发根据小

17、概率事件原则,在一次抽样中几乎不可能发生的,如果竟然发生了,则有理由认为原假设不正生的,如果竟然发生了,则有理由认为原假设不正确,或者说原假设与样本值有显著的矛盾,此假设确,或者说原假设与样本值有显著的矛盾,此假设越无意义,这时,应在显著性水平越无意义,这时,应在显著性水平下拒绝原假设。下拒绝原假设。拒绝域拒绝域的边界值称为临界值,的边界值称为临界值,越小统计量越小统计量T落入落入内的概率越小,如果内的概率越小,如果T真落到真落到内,表明原假设内,表明原假设H0与样本值之间矛盾显著,这也是将与样本值之间矛盾显著,这也是将称为显著性水称为显著性水平的原因平的原因。当当 而落入而落入 内,就有理由

18、拒绝原假设内,就有理由拒绝原假设H0,反之如果,反之如果T落在拒落在拒绝域绝域之外(之外( ),将表示样本值同原假设),将表示样本值同原假设H0没有显著性矛没有显著性矛盾,认为原假设为真,在盾,认为原假设为真,在下接受原假设。而落在下接受原假设。而落在以外的概率(以外的概率(1-)为原假设为真的条件。为原假设为真的条件。临界值T临界值T4. 第一类错误和第二类错误第一类错误和第二类错误 第一类错误第一类错误 把好的结果当成坏的结果而加以把好的结果当成坏的结果而加以否定,从而舍弃了正确的原假设的错误否定,从而舍弃了正确的原假设的错误(即(即H0 正确,而样本点落入拒绝域正确,而样本点落入拒绝域而

19、拒绝而拒绝H0 ,从而,从而接受备择假设接受备择假设H1,即判断有差异而实际无差,即判断有差异而实际无差异),此类错误称为异),此类错误称为拒真(弃真)错误拒真(弃真)错误。拒真错误的概率为拒真错误的概率为,也称也称风险度风险度。表示原假。表示原假设为真时统计量落入拒绝域内的概率。设为真时统计量落入拒绝域内的概率。上述判断正确的概率为上述判断正确的概率为1,错误的概率为,错误的概率为。因此,从统计意义上讲,显著性水平因此,从统计意义上讲,显著性水平是限制是限制发生第一类错误的保证,又称为检验的损失。发生第一类错误的保证,又称为检验的损失。 例例3-1中若选取中若选取0.05, 置信区间为置信区

20、间为 即在(即在(0.076,0.082)范围内。而)范围内。而 0.075,落在置,落在置信区间以外,应否定原假设,说明交接班时实验条件信区间以外,应否定原假设,说明交接班时实验条件不正常。也许平均值不正常。也许平均值0.075的确是个好结果,你为了减的确是个好结果,你为了减少犯第二类错误的危险率而缩小了置信区间,从而把少犯第二类错误的危险率而缩小了置信区间,从而把它错判成坏结果而拒绝了,这就犯了第一类错误,由它错判成坏结果而拒绝了,这就犯了第一类错误,由于工作条件正常而错判成不正常,这样进行全面的检于工作条件正常而错判成不正常,这样进行全面的检查和更换,花费了人力物力和财力。查和更换,花费

21、了人力物力和财力。003. 0079. 02002. 096. 1079. 0nuax第二类错误第二类错误 把坏的结果当成好的结果而加以把坏的结果当成好的结果而加以肯定,从而犯了接受错误的原假设的错误,也肯定,从而犯了接受错误的原假设的错误,也叫受伪叫受伪( (纳伪纳伪) )错误错误。(即(即H0 为不真,而样本为不真,而样本点碰巧落入点碰巧落入H0 的接受域置信区间,从而接的接受域置信区间,从而接受了受了H0,即判断无差异实际有差异。),即判断无差异实际有差异。) 式中式中w为统计量为统计量T全部可能取值的区域。全部可能取值的区域。TPwTP1 例例3-1中,若选取中,若选取为为0.01,则

22、接受原假设。然,则接受原假设。然而,也许平均值而,也许平均值0.075的确是由于实验条件不的确是由于实验条件不正常而引起的异常结果,的确是个坏结果,你正常而引起的异常结果,的确是个坏结果,你为了减少犯第一类错误的危险率而扩大了置信为了减少犯第一类错误的危险率而扩大了置信区间,从而把它错判成正常的好结果,接受了区间,从而把它错判成正常的好结果,接受了下来,这就犯第二类错误,这样,也许在这一下来,这就犯第二类错误,这样,也许在这一工作日中报出的一系列分析结果,因为当天的工作日中报出的一系列分析结果,因为当天的实验条件有异常而出了差错。实验条件有异常而出了差错。 假设检验的损失假设检验的损失()和污

23、染(和污染()的关系如下图。)的关系如下图。图图3-2 假设检验的损失和污染示意图假设检验的损失和污染示意图和和的关系的关系 减小,减小了犯第一类错误的概率,但与此同减小,减小了犯第一类错误的概率,但与此同时却增大了时却增大了,增加了犯第二类错误的概率,反之,增加了犯第二类错误的概率,反之亦然。亦然。用平均值用平均值 表示分析结果可以减小犯第一类表示分析结果可以减小犯第一类错误和第二类错误的风险错误和第二类错误的风险 即在容量(即在容量( )固定的条件下,要想同时减小)固定的条件下,要想同时减小与与是不可能的。只有增加测定次数是不可能的。只有增加测定次数 ,使,使 减小减小 ,这时在同一,这时

24、在同一下,下,减小减小。xnssxn选择原则选择原则 统计检验中作出判断总要承担犯错误的风险,犯统计检验中作出判断总要承担犯错误的风险,犯第一、二类错误的可能性此长彼消(第一、二类错误的可能性此长彼消(大,大,小;小;小,小,大),无论犯哪一种错误。均会造成一定的损失,大),无论犯哪一种错误。均会造成一定的损失,在统计学上,以风险损失最小作为确定在统计学上,以风险损失最小作为确定的原的原则则(即把犯(即把犯错误和错误和错误的可能性综合考虑总风错误的可能性综合考虑总风险损失率)。险损失率)。 只要用有限次测量对样品真值估计,总会犯错只要用有限次测量对样品真值估计,总会犯错误,即肯定判断犯第二类错

25、误,否定判断犯第一类误,即肯定判断犯第二类错误,否定判断犯第一类错误,错误,一种好的检验方法,就是能保证一种好的检验方法,就是能保证和和都比较都比较小的方法,即使犯错误所承担的风险最小的原则。小的方法,即使犯错误所承担的风险最小的原则。一般,犯第二类错误的危害性大,而第一类错误一般,犯第二类错误的危害性大,而第一类错误易易控制。因此,通常在一定的控制。因此,通常在一定的下使下使尽量小。而尽量小。而的的选取将依据具体情况而有所不同。选取将依据具体情况而有所不同。 在分析测试中,通常选取在分析测试中,通常选取显著性水平显著性水平0.05作为风作为风险损失小的检验标准(宁可犯第一类错误)。险损失小的

26、检验标准(宁可犯第一类错误)。5. 双尾检验(双边检验)双尾检验(双边检验)p42 正态分布两侧的检验,叫双尾检验正态分布两侧的检验,叫双尾检验。如如H0 : ,H1: 。即只要。即只要 与与有显著性有显著性差异。无论高于或低于标准值,都应判为异常,否差异。无论高于或低于标准值,都应判为异常,否定原假设。定原假设。如果给定显著性水平如果给定显著性水平,那么两侧拒绝域的显著,那么两侧拒绝域的显著 性性水平为水平为 ,检验时查双尾检验的临界值表(,检验时查双尾检验的临界值表(p166,附表附表2)。)。2若查单尾表,给定若查单尾表,给定,查,查 ,如前例题查标准正态分布,如前例题查标准正态分布表表

27、-z分布表;分布表;查双尾表,给定查双尾表,给定查查,如查如查t分布表)。分布表)。6. 单尾检验(单边检验)单尾检验(单边检验)(1)右边检验(图)右边检验(图a):): 如如H0: ,备择假,备择假设,设,H1: (2)左边检验(图)左边检验(图b):): 如如H0: , 备择假设备择假设 H1: 检验时查单尾表。若给定显著性水平检验时查单尾表。若给定显著性水平,查双尾表(,查双尾表(t t表)时表)时 显著性水平应为显著性水平应为2)2)。2三、统计检验的步骤三、统计检验的步骤1. 提出统计假设提出统计假设 H0: 即分析条件正常,样本值是从该总体中随即分析条件正常,样本值是从该总体中随

28、机取出来的。机取出来的。2. 由原假设由原假设 H0 确定一个检验统计量,并由抽样值计算确定一个检验统计量,并由抽样值计算统计量的值统计量的值3. 给定给定显著性水平显著性水平,由,由查出该统计量的临界值查出该统计量的临界值(根据题意确定是双尾检验还是单尾检验,以便确定(根据题意确定是双尾检验还是单尾检验,以便确定拒绝域拒绝域)4. 作出作出统计推断统计推断(由小概率原则,使用反证法进行统(由小概率原则,使用反证法进行统计推断)。计推断)。对于双边检验对于双边检验 :若检验统计量落在拒绝域若检验统计量落在拒绝域内,则否定原假设内,则否定原假设 , 若检验统计量落在拒绝域若检验统计量落在拒绝域外

29、,则肯定原假设,外,则肯定原假设, 若检验统计量落在拒绝域与非拒绝域的边界,则若检验统计量落在拒绝域与非拒绝域的边界,则怀怀疑疑H0 ,最好继续进行试验,获得更多的信息,以利于,最好继续进行试验,获得更多的信息,以利于作出正确的统计推断。作出正确的统计推断。临界值统计量 临界值统计量 对于单边检验:对于单边检验:H0: (右边检验),若检验统计量临(右边检验),若检验统计量临界值,接受原假设;若检验统计量临界值,界值,接受原假设;若检验统计量临界值,否定原假设。否定原假设。H0: (左边检验),当检验统计量临(左边检验),当检验统计量临界值,接受原假设;当检验统计量临界值,界值,接受原假设;当

30、检验统计量临界值,否定原假设。否定原假设。第二节第二节 关于总体均值关于总体均值的检验的检验 正态分布中两个重要参数正态分布中两个重要参数、确定之后,一个确定之后,一个正态分布正态分布N(,2)就完全确定了,因此,检验正态就完全确定了,因此,检验正态分布问题,也就是检验总体参数分布问题,也就是检验总体参数和和的问题。的问题。总体均值总体均值检验的基本思想检验的基本思想: 分析测试中,测定值分析测试中,测定值 是一个以概率取值的随机是一个以概率取值的随机变量,若变量,若 遵从正态分布遵从正态分布 ,则,则 次测定次测定的平均值的平均值 遵从正态分布遵从正态分布 。若不同样本。若不同样本取自同一总

31、体,则不同样本的均值均为该总体均值取自同一总体,则不同样本的均值均为该总体均值的无偏估计量,都是在的无偏估计量,都是在附近波动。附近波动。 x),(2nNnxx),(2N 在随机误差范围内,则二者均值是一致的在随机误差范围内,则二者均值是一致的 取自同一样本取自同一样本; 在随机误差范围外,则二者均值是不一致在随机误差范围外,则二者均值是不一致的的取自不同样本(说明除了随机误差外,各平均取自不同样本(说明除了随机误差外,各平均值之间存在系统误差,使得出现了显著性矛盾)。值之间存在系统误差,使得出现了显著性矛盾)。 因此,当根据样本测定值计算的统计量值落在所允因此,当根据样本测定值计算的统计量值

32、落在所允许的合理误差范围之内,则接受各平均值一致的假许的合理误差范围之内,则接受各平均值一致的假设;反之,若落在误差范围之外,则拒绝原假设,说设;反之,若落在误差范围之外,则拒绝原假设,说明各平均值之间有显著性差异。明各平均值之间有显著性差异。 xx21xx21当当是已知的并稳定不变,用是已知的并稳定不变,用 检验,检验统计量检验,检验统计量 (3-1) 当当是未知的,是未知的, 用用 检验检验 ,检验统计量,检验统计量 (3-2) nxunsxtut一、一、 检验检验 p42-441. 对原假设对原假设 的检验的检验 前例前例3-1,0.079 0.002,所得结果,所得结果0.073,0.

33、077 解解: (1) H0: 条件正常,条件正常, 与与一致一致 (2) 确定统计量确定统计量 (3) 给定给定0.05,查表,查表u83. 22002. 0079. 02)077. 0073. 0 (0 nxu96. 12/05. 0u(4) 比较比较 和和 ,作出统计推断,作出统计推断 (2.831.96) 落在拒绝域,落在拒绝域, 否定原假设,实验条件不正常否定原假设,实验条件不正常 ,即我们有即我们有95把握认为接班时实验条件有问题,存在条件误差,把握认为接班时实验条件有问题,存在条件误差,使测定值显著偏使测定值显著偏 低,低, 落在区间(落在区间(0.076,0.082)以外,平均

34、值)以外,平均值 来自正态分布来自正态分布 的可能性太小,应仔细检查仪器设备,试剂及工作的可能性太小,应仔细检查仪器设备,试剂及工作环境等。环境等。 2/uu 075. 0 xxuu2/),(2nN2. 当当已知时,两个样本均值的检验已知时,两个样本均值的检验 用用 检验,可比较两个均值检验,可比较两个均值 和和 有无显著有无显著性差别(即两组样本是否取自同一总体)。性差别(即两组样本是否取自同一总体)。用两种不同的方法(用两种不同的方法(1,2)分别测定两份试样)分别测定两份试样中某组分的含量,结果为中某组分的含量,结果为 和和 ,假设,假设s1、s2及及无显著性差别,即无显著性差别,即1(

35、=s1)=2(s2)=,试判断,试判断 两份样品是否同一样品。两份样品是否同一样品。 (若判断(若判断 与与 一致,可以确定两份样品一致)一致,可以确定两份样品一致)1x2x)(11nx)(22nx1x2xuu分析:第一种方法分析:第一种方法 1 ; 第二种方法第二种方法 2 假设假设1x2x),(12111nN),(22222nN21xx ),(22212121nnN2121xx ), 0(222121nnN解解 :(1)假设两份样品属于同一样品)假设两份样品属于同一样品 H0: (2)统计量)统计量 (3-3)此式的来历:此式的来历: 令令 (新变量),相应的(新变量),相应的在在 中:中

36、: 实际为实际为 xxx2121nxusxxunnssx21unnnnxxxxu222121212221212121 对于新变量对于新变量 ,转化为求转化为求 的问题,根据误差传递公式:的问题,根据误差传递公式: 则则 xsxxusx21xxxnnnsxnsxsssxxx22212122122222121nnxxnnxxu222121212221212121(3)给定显著性水平)给定显著性水平,查表得,查表得 ( 附表附表1,双尾,双尾检验)检验)(4)统计推断)统计推断 A 否定原假设否定原假设 B 肯定原假设(肯定原假设(p44例例2.15) 如果用同一方法对两份样品进行不同次数的测定如果

37、用同一方法对两份样品进行不同次数的测定( ),则,则 (3-4) (4-4)uuuuunnxxu21211121如果用同一方法对两份样品进行相同次数的测定,如果用同一方法对两份样品进行相同次数的测定,则则 (3-5) nxxu221二、二、t 检验检验 p44-47 在处理小样本试验数据时,为了避免用在处理小样本试验数据时,为了避免用s代替代替而引入误差,需用类似于正态分布的而引入误差,需用类似于正态分布的 分布分布。 当总体差当总体差未知,且为小样本测定时,测定平未知,且为小样本测定时,测定平均值均值 遵从遵从 分布分布,其检验统计量为,其检验统计量为 (3-6)根据自由度根据自由度 和和,

38、应用应用 t 分布分布表确定拒绝表确定拒绝域域,对平均值进行检验。,对平均值进行检验。 nsxsxtx1 nftxt1. 对对原假设原假设 H0: 的检验的检验(平均值与真值是否(平均值与真值是否一致的检验)步骤同一致的检验)步骤同u 检验:检验:(1)H0:(2)计算统计量)计算统计量(3)由)由 f,,查,查 分布表得分布表得 值(值(p166,附表,附表2)(4)比较判断)比较判断: ,否定原假设;,否定原假设; ,接受原假设,接受原假设nsxxtsxnstxf ,tf ,ttft,tft, 例例3-2 某钢厂从以往的生产数据中知道,在生产正某钢厂从以往的生产数据中知道,在生产正常的情况

39、下,钢水中平均含碳量为常的情况下,钢水中平均含碳量为4.55,某一工作,某一工作日抽查了日抽查了5炉钢水,测定含碳量分别为炉钢水,测定含碳量分别为4.28,4.40,4.42,4.35,4.37,问钢水中平均含碳量有无变化?,问钢水中平均含碳量有无变化? 分析:这是一个双尾检验,即不管这一工作日的平分析:这是一个双尾检验,即不管这一工作日的平均含均含 C 量是否高于或低于正常情况,均认为有系统量是否高于或低于正常情况,均认为有系统误差存在误差存在。 解解: (1) H0: ( ) (2) 55. 4nsxt 364. 451xx054. 015)(5122xxsii68. 75054. 055

40、. 4364. 4nsxt(3) 选取显著性水平选取显著性水平0.05,f 4,查附表,查附表2 (p166)得)得 (4)统计推断)统计推断 否定原假设否定原假设,说明这一天生说明这一天生产的钢水平均含碳量与正常生产的钢水平均含碳量产的钢水平均含碳量与正常生产的钢水平均含碳量有显著性差异,从而提醒管理人员,这一天生产有显著性差异,从而提醒管理人员,这一天生产出出现了异常情况,应进一步查明原因,采取措施,改现了异常情况,应进一步查明原因,采取措施,改进生产。进生产。 p45-46 例例2.1678. 24 ,05. 0ttt4 ,05. 0例例3-3 某铁矿砂某铁矿砂Fe2O3含量的给定值为含

41、量的给定值为38.91,一批,一批铁矿砂实验室验收的结果是铁矿砂实验室验收的结果是38.71,38.90,38.62,38.74,试判断此矿砂是否合格?,试判断此矿砂是否合格?解解 :分析:分析:设以设以 来说明送来矿砂的合格性,即来说明送来矿砂的合格性,即 38.91才是合格的,属单尾检验。才是合格的,属单尾检验。(1) H0: (38.91) 当当 时否定原假设,当时否定原假设,当 时接受时接受原假设。原假设。p43xxftt,ftt,(2) 选定统计量选定统计量 nsxt%74.3841xxi12. 014)(4122xxsii91. 2412. 091.3874.38t (3) 选定显

42、著性水平选定显著性水平0.05,f 4-1,属单尾检验,属单尾检验查双尾表查双尾表2,得,得 ,拒绝域在小于或,拒绝域在小于或等于等于 的区域的区域(4) (2.912.35) 否定原假设否定原假设H0,即此批矿砂不合格,拒收,即此批矿砂不合格,拒收或杀价。或杀价。 35. 23 ,10. 0ttf,tt3 ,10. 0tf ,例例3-4 某化工厂生产一种无机物产品,在生产工艺某化工厂生产一种无机物产品,在生产工艺改进前,产品中杂质含铁量为改进前,产品中杂质含铁量为0.15,经过生产工艺,经过生产工艺改进后,抽查产品,测得含铁量为改进后,抽查产品,测得含铁量为0.12,0.14,0.13,0.

43、13,0.14。问经过工艺改进后,产品中的杂质含。问经过工艺改进后,产品中的杂质含铁量是否有明显降低?铁量是否有明显降低?解解: 分析:分析: 本题要求工艺改进后,杂质含铁量应明显本题要求工艺改进后,杂质含铁量应明显低于改进前,即样本的平均值低于改进前,即样本的平均值 ,属单尾检验。,属单尾检验。 %15. 0 x H0 : (0.15),当),当 时否定原时否定原假设假设,当,当 接受原假设接受原假设p43 检验统计量检验统计量nsxtftt,ftt,tf , 当当0.05, f 5-1,属单尾检验,查双尾表,属单尾检验,查双尾表2,得,得 ,拒绝域在大于,拒绝域在大于 的区域的区域 (4.

44、82.13) 肯定原假设,即经过工艺改进后,杂质含铁量有明肯定原假设,即经过工艺改进后,杂质含铁量有明显降低。显降低。 132. 051xxi0084. 015)(5122xxsii8 . 450084. 015. 0132. 0t13. 24,10. 0t4,10. 0tt tf ,2. 两个样本均值的比较两个样本均值的比较 不同分析人员,不同实验室用同一种方法测定从同不同分析人员,不同实验室用同一种方法测定从同一总体中抽出的样本的平均值,或同一分析人员用不一总体中抽出的样本的平均值,或同一分析人员用不同的方法测定从同一总体中抽出的样本的平均值一般同的方法测定从同一总体中抽出的样本的平均值一

45、般是不相等的,造成不相等的原因可能是:是不相等的,造成不相等的原因可能是:两个平均值之间实际上无显著差异,只是有限次测两个平均值之间实际上无显著差异,只是有限次测定中由于随机误差的影响,使其平均值有些波动(无定中由于随机误差的影响,使其平均值有些波动(无显著性差异)。显著性差异)。各测定平均值之间确有显著性差异。(试验条件的各测定平均值之间确有显著性差异。(试验条件的变化显著大于随机因素的影响)变化显著大于随机因素的影响) 上述两种情况可能在直观上不易判别,要通过检上述两种情况可能在直观上不易判别,要通过检验确定。这涉及到两个平均值之间的比较问题,用检验确定。这涉及到两个平均值之间的比较问题,

46、用检验可以较好地解决这个问题。验可以较好地解决这个问题。 从统计检验的角度上看,检验从统计检验的角度上看,检验 和和 是否同属于是否同属于一总体,这两个平均值的任一个都不能视为真值,进行一总体,这两个平均值的任一个都不能视为真值,进行统计检验时,二者的误差均要考虑,要用到并和方差。统计检验时,二者的误差均要考虑,要用到并和方差。样品均值样品均值 和和 之间之间 t 的检验:的检验:p45分析:分析:当当 和和 的的是未知,但由样本值可得是未知,但由样本值可得 和和 ,首先检验,首先检验 和和 有无显著性差异(经有无显著性差异(经F检检验以后讲到),若无显著性差异,则用并和方差验以后讲到),若无

47、显著性差异,则用并和方差 (用加权平均法求出一个共同的平均标准差用加权平均法求出一个共同的平均标准差p45) 1x2xx1x2s21s21s22s22s21x2x (3-7) 上式中,上式中, 权重权重ffsfsffffSSnnxxsxxii21222211121212122, 221, 12) 1() 1()()(2) 1() 1(2122221121222211nnsnsnffsfsfsfff21f步骤:步骤:提出统计假设提出统计假设 H0:检验统计量检验统计量 (3-8) 计算计算 、 、 、 、 ,将,将 代入上式,计算统计代入上式,计算统计量量 (3-9)1xs212xs22stsn

48、nnnsxxnsnsxxnsnsxxt212121221221222121212122212121nsnsxxt根据显著性水平根据显著性水平和自由度和自由度 ,查双尾表得,查双尾表得统计推断统计推断 若若 肯定原假设肯定原假设 若若 否定原假设否定原假设22121nnffftf ,ftt,ftt,例例3-5 有甲、乙两分析人员用同一分析方法测定某试有甲、乙两分析人员用同一分析方法测定某试样中样中CO2的含量(),结果如下:的含量(),结果如下: 甲甲 14.71,14.81,15.59,15.15 s1=0.48 乙乙 14.62,15.03,15.16 s2=0.29 试确定两人的测定结果是

49、否一致?试确定两人的测定结果是否一致? 解:解: (1) H0: 由样本值得到由样本值得到 s1=0.48 s2=0.29 假设经过假设经过F检验:检验:12,即用,即用s1、s2估计的估计的1和和2无显著性差异,可用并合标准差无显著性差异,可用并合标准差 。04.151x94.142xs42. 02329. 0248. 032221222211ffsfsfs39. 0343442. 094.1404.15212121nnnnsxxt(3)由)由0.05, ,查表(,查表(p166,附表附表2)得)得(4)统计推断统计推断 接受原假设,两人的分析结果是一致的。接受原假设,两人的分析结果是一致的

50、。 既既然二人结果一致,可用加权平均值然二人结果一致,可用加权平均值 和和并合标准差并合标准差表示测定结果,即表示测定结果,即52321fff57. 25 ,05. 0ttt5 ,05. 0 xws00.153494.14304.154nxnxiiiw42. 0s在式中,在式中, 若若 , 两个样本容量相同,则上两个样本容量相同,则上式变为式变为 (3-10)nnn21nnnnsxxnsnsxxnsnsxxt21212122122122212121221nsxxt如果如果 , ,则,则 ,上式变为,上式变为 (3-11) 可见,对于原假设可见,对于原假设 的检验(即平均值与标准的检验(即平均值

51、与标准值比较)是两平均值比较的一个特例。值比较)是两平均值比较的一个特例。 若将所拟定的分析方法的结果与某一标准方法的结若将所拟定的分析方法的结果与某一标准方法的结果对照,就成为方法可行性检验。果对照,就成为方法可行性检验。n22xnsxnsxt1nn13. 检验对比性试验结果对子分析(配对试检验对比性试验结果对子分析(配对试验设计法)验设计法)p47 是平均值比较的一种特例。如:是平均值比较的一种特例。如:两种分析方法两种分析方法 两个分析人员两个分析人员分析同一来源的样品分析同一来源的样品比比较方法,人员、仪器之间是否存在系统误较方法,人员、仪器之间是否存在系统误差。差。两种分析仪器两种分

52、析仪器 把一定比例的试样送上一级分析室进行把一定比例的试样送上一级分析室进行外检,于是送检的每个试样都有两个数据,外检,于是送检的每个试样都有两个数据,一个是送检单位测得的,一个是外检测得的,一个是送检单位测得的,一个是外检测得的,这样,若这样,若“对子对子”之间差别很小,可认为送之间差别很小,可认为送检单位的分析结果质量是合格的。检单位的分析结果质量是合格的。新建方法与标准方法的比较,用对子分新建方法与标准方法的比较,用对子分析进行检验析进行检验成对样品不是相互独立的,成对测定的特点是:成对样品不是相互独立的,成对测定的特点是:除了被比较的因素以外,所有其它方面的条件除了被比较的因素以外,所

53、有其它方面的条件是相同的,不存在显著性差异。是相同的,不存在显著性差异。 进行对子分析时,若两者之间不存在系统误进行对子分析时,若两者之间不存在系统误差,差,对子之间差值的期望值对子之间差值的期望值 ,所以,所以,如果分析中不存在系统误差,各对结果之差如果分析中不存在系统误差,各对结果之差( ( , , )则为随机变量,当测定对子数)则为随机变量,当测定对子数 时,时, (表示与(表示与0 0一致);若一致);若 有有限,则限,则 应与应与0 0无显著性差异。无显著性差异。xx11xx22xxnnn00n步骤:步骤:(1) H0: (各组实验结果差别不大,则(各组实验结果差别不大,则与与0无显

54、著性差异)无显著性差异)(2) 计算统计量计算统计量 (3-12) 0ntsin11)(2nis0 (3-13)上式中:上式中: 两个试验结果之差值;两个试验结果之差值; 配对数值配对数值的差值之平均值;配对数值的差值之期望的差值之平均值;配对数值的差值之期望值;值; 配对数值的差值的标准差。配对数值的差值的标准差。is)1()(02nnntii(3)由显著性水平)由显著性水平和自由度和自由度 ( n对子数),查对子数),查 t 值表得值表得(4)统计推断)统计推断 若若 ,肯定(接受)原假设,肯定(接受)原假设 若若 ,否定(拒绝)原假设,否定(拒绝)原假设1 nftf ,tft,ttf ,

55、例例3-6 某实验室建立了一个在过氧化氢存在下水杨醛肟某实验室建立了一个在过氧化氢存在下水杨醛肟显色测定锰的新方法,为了检验新方法的可靠性,用此方显色测定锰的新方法,为了检验新方法的可靠性,用此方法与原用的法与原用的KIO4法对若干试样进行了对比性测定,结果如下:法对若干试样进行了对比性测定,结果如下:样号样号 KIO4法()法() 水杨醛肟法()水杨醛肟法() 差值差值 ( %)1 0.03 0.04 +0.012 0.08 0.07 -0.013 0.08 0.08 0.004 0.05 0.07 +0.025 0.10 0.08 -0.026 0.15 0.15 0.007 0.04 0

56、.04 0.008 0.08 0.10 +0.02试从以上测定结果评价新方法的可靠性。试从以上测定结果评价新方法的可靠性。分析:分析:本例除本例除不同的分析方法不同的分析方法外外,还有还有不同试样组成不同试样组成的影响。的影响。若仍用若仍用分组试验法分组试验法处理数据处理数据,则则分析分析方法和试样组成两个因素混杂在一起,难以区方法和试样组成两个因素混杂在一起,难以区分分。若采用配对试验法处理数据,由于每一对若采用配对试验法处理数据,由于每一对试验所用的是同一组成的试样,则测定结果的试验所用的是同一组成的试样,则测定结果的差异只反映了两分析方法间的差异。差异只反映了两分析方法间的差异。显然,如

57、果两分析方法无系统误差,当显然,如果两分析方法无系统误差,当n无限多无限多时,则两方法测定值之间差值的平均值时,则两方法测定值之间差值的平均值应为应为0。若在有限次测定中,两方法测定值之间。若在有限次测定中,两方法测定值之间差值的平均值差值的平均值 虽不一定为虽不一定为0,但与,但与0应无显应无显著著差异。差异。(1) H0: ( )(2) 51. 08014. 00025. 0tnts000000025. 0811iin014. 018100 . 5104 . 11)(15322nniis(3)本例为双尾检验。)本例为双尾检验。 由由0.05, 查表得查表得 (4)比较)比较 接受原假设,两

58、分析方法测定结果一致,接受原假设,两分析方法测定结果一致,该方法可靠。该方法可靠。 例例3-7 见见p47例例2.18 7181nf37. 27,05. 0ttt7 ,05. 0 第三节第三节 关于总体方差关于总体方差2 2的检验的检验 在上节中,对于总体均值的统计检验,都是在在上节中,对于总体均值的统计检验,都是在总体方差基本稳定一致的情况下进行的,即检验平总体方差基本稳定一致的情况下进行的,即检验平均值与总体均值是否一致的问题。但是,有些情况均值与总体均值是否一致的问题。但是,有些情况首先需要检验方差是否稳定的问题,方差的大小反首先需要检验方差是否稳定的问题,方差的大小反映了测定结果的精密

59、度,是衡量试验条件稳定性的映了测定结果的精密度,是衡量试验条件稳定性的一个重要标志,这就涉及到总体方差的检验。方差一个重要标志,这就涉及到总体方差的检验。方差检验对于指导生产和科研有着重要的意义检验对于指导生产和科研有着重要的意义。 一、样本方差与一已知值(标准方差)的检验一、样本方差与一已知值(标准方差)的检验 - - 检验检验1. 分布分布 若若 为遵从正态分布为遵从正态分布 的的随机变量随机变量 的样本值(样本容量为的样本值(样本容量为 ),其样本方差),其样本方差为为 ,则,则 为按为按 分布的变量:分布的变量: (3-14) 22s222) 1(sn22122)() 1(niixxs

60、n) 12n(nxxx21,),(2Nxn 卡方分布是由正态分布派生出来的一个分布,它的概卡方分布是由正态分布派生出来的一个分布,它的概率密度函数:率密度函数: (3-15) 为咖玛函数为咖玛函数, 分布概率密度曲线如下图。分布概率密度曲线如下图。 )(21122)2(222)(21)(efff2f2)0(2 分布的特点:分布的特点: 0 ;不对称(无对称轴);不对称(无对称轴);分布与自由度有关分布与自由度有关 ,自由度越大,图形,自由度越大,图形越对称。越对称。 分布在不同显著性水平分布在不同显著性水平与不同自由度与不同自由度 时的时的 值由附表值由附表4(p449)给出,)给出, 分布表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论