版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学1数理统计数理统计(sh l tn j)与随机过程与随机过程ch8第一页,共96页。8.1 基本概念基本概念 下面下面(xi mian),我们讨论不同于参数估,我们讨论不同于参数估计问题的另一类统计推断问题计问题的另一类统计推断问题根据样本根据样本提供的信息,检验总体的某个假设是否成立提供的信息,检验总体的某个假设是否成立的问题。的问题。这类问题这类问题(wnt)称为假设称为假设检验。检验。第1页/共96页第二页,共96页。假设检验假设检验参数检验参数检验非参数检验非参数检验总体分布总体分布(fnb)已知情已知情形下,检验未知形下,检验未知参数的某个假设参数的某个假设总体分布总体分布(f
2、nb)未知情形未知情形下的假设检验问题下的假设检验问题先看一个先看一个(y )例子例子。第2页/共96页第三页,共96页。例例1:某车间:某车间(chjin)用一台包装机包装葡萄糖用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量包得的袋装糖重是一个随机变量, 它服从正态分它服从正态分布。当机器正常时布。当机器正常时, 其均值为其均值为0.5kg, 标准差为标准差为0.015 kg。某日开工后为检验包装机是否正常。某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖随机地抽取它所包装的糖9袋袋, 称得净重量称得净重量 (kg)为:为:0.497, 0.506, 0.518, 0.524
3、, 0.498, 0.511, 0.520, 0.515, 0.512。问。问: 从样本看机器是否正常从样本看机器是否正常? 以以和和分别表示这一天袋装葡萄糖重量总分别表示这一天袋装葡萄糖重量总体的均值和标准差。由于长期实践表明体的均值和标准差。由于长期实践表明(biomng)标准差标准差比较稳定,我们就设比较稳定,我们就设 =0.015。 检验检验“机器是否正常机器是否正常(zhngchng)”等价于检验等价于检验“X是否服从正态分布是否服从正态分布N(, 0.0152)”。第3页/共96页第四页,共96页。 确定总体:记确定总体:记 X 为该车间包装机包装的袋装为该车间包装机包装的袋装 葡
4、萄糖的重量,则葡萄糖的重量,则 X N(, 0.0152); 明确任务:通过样本推断明确任务:通过样本推断(tudun)“是否等于是否等于0.5”; 建立假设:上面的任务是要通过样本检验建立假设:上面的任务是要通过样本检验 “ =0.5”的假设是否成立。的假设是否成立。I. 如何建立如何建立(jinl)检验模检验模型型第4页/共96页第五页,共96页。 原假设的对立面是原假设的对立面是 “ “ 0.5” 0.5”,称为,称为(chn wi) “(chn wi) “对立假设对立假设” ” 或或 “ “备择假设备择假设”,”,记成记成 “ H1: “ H1: 0.5” 0.5”。把原假设和对立假。
5、把原假设和对立假设合写在一起,就是设合写在一起,就是: :H0: =0.5; H1: 0.5. 在数理统计中,把在数理统计中,把 “ =0.5” 这样一个这样一个(y )待检验的假设记为待检验的假设记为 “原假设原假设” 或或 “零假设零假设”, 记成记成 “ H0: =0.5”。第5页/共96页第六页,共96页。II. 解决问题的思路解决问题的思路(sl) 因样本均值是因样本均值是 的一个很好的估计的一个很好的估计(gj)(gj)。所以,当。所以,当 =0.5 =0.5,即原假设,即原假设 H0 H0 成成立时立时, ,应比较小;应比较小; 如果如果(rgu)(rgu)该值过大该值过大, ,
6、 想必想必 H0 H0 不成立。不成立。于是,我们就用于是,我们就用 的大小来判定的大小来判定 H0 0 是否成立是否成立。 |5 . 0|X |5 . 0|X 合理的做法应该是:找出一个界限合理的做法应该是:找出一个界限 c,. |5 . 0| |5 . 0| 00HcXHcX拒绝原假设拒绝原假设时,时,当当;接受原假设接受原假设时,时,当当第6页/共96页第七页,共96页。 这里这里(zhl)(zhl)的问题是:如何确定常数的问题是:如何确定常数 c c 呢?呢?细致细致(xzh)(xzh)地地分析分析: :根据根据(gnj)(gnj)定理定理 ,有有. 1 0(9/0.015 )9/01
7、5. 0 ,(2),或,或NXNX于是,当原假设于是,当原假设 H0 0: :=0.5 成立时,有成立时,有. ) 1 , 0(9/015. 05 . 0NX 第7页/共96页第八页,共96页。为确定常数为确定常数 c c,我们考虑,我们考虑(kol)(kol)一个很小的正一个很小的正数数, 如如 = 0.05 = 0.05。当原假设。当原假设 H0:=0.5 H0:=0.5成立成立时,有时,有, 9/015. 0|5 . 0|2/zXP. )9/015. 0(|5. 0| 2/zXP即即. )9/015. 0( 2/z c 取取故故,第8页/共96页第九页,共96页。于是,我们就得到于是,我
8、们就得到(d do)(d do)如下检如下检验准则验准则: :. |5 . 0| |5 . 0| 00HcXHcX拒绝原假设拒绝原假设时,时,当当;接受原假设接受原假设时,时,当当. )9/015. 0( 2/zc 其其中中 9/015. 05 . 0 | 5 . 0| 为检验统计量;为检验统计量;或或称称XUX或或,称称 )9/015. 0( |5 . 0| 2/zX2/9/015. 0|5 . 0|zXU为为H0 0 的拒绝域的拒绝域。第9页/共96页第十页,共96页。用以上检验准则处理用以上检验准则处理(chl)(chl)我们的问我们的问题,题,所以,拒绝所以,拒绝(jju) H0:=0
9、.5(jju) H0:=0.5,认为机器,认为机器异常。异常。 , 511. 0 X得得经计算,经计算,.0098. 0 1.96 )9/015. 0( )9/015. 0(2/zc.011.0|5.0| cX故,故,第10页/共96页第十一页,共96页。 因为因为(yn wi)(yn wi),当,当 H0: =0.5 H0: =0.5 成立成立时,时,所以,当所以,当 很小时,若很小时,若 H0 H0 为真为真( (正确正确), ), 则检则检验统计量落入拒绝域是一小概率事件验统计量落入拒绝域是一小概率事件 ( (概率很小概率很小, ,为为 ) )。前面曾提到过:。前面曾提到过:“通常认为小
10、概率事件通常认为小概率事件在一次试验在一次试验(shyn)(shyn)中基本上不会发生中基本上不会发生”。III. 方法方法(fngf)原理原理 . )9/015. 0(|5. 0| 2/zXP那么,一旦小概率事件发生,即那么,一旦小概率事件发生,即: : 发生发生, , 就认为就认为 H0 0不正确。不正确。2/)9/015. 0(|5. 0| zX第11页/共96页第十二页,共96页。IV. IV. 两类错误两类错误(cuw)(cuw)与显著性水平与显著性水平 当我们当我们(w men)检验一个假设检验一个假设 H0 时,有时,有可能犯以下两类错误之一:可能犯以下两类错误之一:H0 正确,
11、但我们正确,但我们(w men)认为其不正确,这就犯了认为其不正确,这就犯了“弃真弃真”的错的错误,即抛弃了正确的假设;误,即抛弃了正确的假设;H0 不正确,但被不正确,但被却误认为正确,这就犯了却误认为正确,这就犯了“取伪取伪”的错误,即采的错误,即采用了伪假设。用了伪假设。 因为检验因为检验(jinyn)统计量总是随机的,统计量总是随机的,所以,我们总是以一定的概率犯以上两类错所以,我们总是以一定的概率犯以上两类错误。误。第12页/共96页第十三页,共96页。 通常通常(tngchng)分别用分别用 和和 记犯第一记犯第一、第二类错误的概率,即、第二类错误的概率,即. | | 0000为假
12、为假接受接受,为真为真拒绝拒绝HHPHHP 在检验问题中,犯“弃真”和“取伪”两类错误都总是不可避免(b k b min)的,并且减少犯第一类错误的概率,就会增大犯第二类错误的概率;反之亦然。 所以,犯两类错误的概率不能同所以,犯两类错误的概率不能同时时(tngsh)得到控制。得到控制。第13页/共96页第十四页,共96页。 在统计学中,通常在统计学中,通常(tngchng)(tngchng)控制犯控制犯第一类错误的概概率。一般事先选定一个数第一类错误的概概率。一般事先选定一个数 (0(01)0 而现在要处理的对立假设为而现在要处理的对立假设为H1: 0, 称为称为(chn wi)右边对立假设
13、。右边对立假设。 类似地类似地, H0: =0; H1: 0 中中的对立假设的对立假设H1: 0 . 0znXP由此,可推出由此,可推出. 00znXH的拒绝域为的拒绝域为所以,所以,第24页/共96页第二十五页,共96页。在在 2 2未知情况未知情况(qngkung)(qngkung)下,当原假下,当原假设设 成立时,成立时,. )( 100n-tnSXH的拒绝域为的拒绝域为所以,所以, . / 10ntnSX. )( 10n tnSXP由此,可推出由此,可推出第25页/共96页第二十六页,共96页。例例 2:某厂生产一种工业用绳:某厂生产一种工业用绳,其质量指标是其质量指标是绳子所承受的最
14、大拉力,假定该指标服从正绳子所承受的最大拉力,假定该指标服从正态分布,且该厂原来生产的绳子指标均值态分布,且该厂原来生产的绳子指标均值(jn zh)0 =15公斤,采用一种新原材料后公斤,采用一种新原材料后,厂厂方称这种原材料提高了绳子的质量,也就是方称这种原材料提高了绳子的质量,也就是说绳子所承受的最大拉力说绳子所承受的最大拉力 比比15公斤增大了公斤增大了。 为检验该厂的结论是否真实,从其新产品为检验该厂的结论是否真实,从其新产品中随机抽取中随机抽取50件,测得它们所承受的最大拉件,测得它们所承受的最大拉力的平均值力的平均值(jn zh)为为15.8公斤,样本标准差公斤,样本标准差S=0.
15、5公斤。取显著性水平公斤。取显著性水平 =0.01。问从这。问从这些样本看:能否接受厂方的结论。些样本看:能否接受厂方的结论。第26页/共96页第二十七页,共96页。解:问题归结为检验如下解:问题归结为检验如下(rxi)假设假设 H0: =15; H1: 15 (2未知未知),17. 04049. 2505 . 0)01. 0(505 . 0 )( , 8 . 0158 .15 491 -n0ttnSX. 0.01 0.5 8 .15 15 50 0,此此处处,SXn于是于是(ysh),. )( 1 -n0tnSX所以,所以,从而,拒绝原假设,即认为新的原材料确实提从而,拒绝原假设,即认为新的
16、原材料确实提高了绳子所能承受高了绳子所能承受(chngshu)(chngshu)的最大拉力。的最大拉力。第27页/共96页第二十八页,共96页。两个正态总体两个正态总体 N(1, 12) 和和 N(2, 22) 均值均值(jn zh)的比较的比较 在应用上,经常会遇到两个正态总体均值在应用上,经常会遇到两个正态总体均值(jn zh)的比较问题。的比较问题。 例如:比较甲、乙两厂生产的某种产品例如:比较甲、乙两厂生产的某种产品的质量。将两厂生产的产品的质量指标分别的质量。将两厂生产的产品的质量指标分别看成正态总体看成正态总体 N( N(1, 1, 12) 12) 和和 N( N(2, 2, 22
17、)22)。比较它们的产品质量指标的问题。比较它们的产品质量指标的问题(wnt)(wnt),就变为比较这两个正态总体的均值,就变为比较这两个正态总体的均值 1 1和和 2 2的的问题的的问题(wnt)(wnt)。第28页/共96页第二十九页,共96页。 又如:考察一项新技术对提高产品质量是又如:考察一项新技术对提高产品质量是否有效。将新技术实施前后生产的产品质量指否有效。将新技术实施前后生产的产品质量指标分别看成正态总体标分别看成正态总体 N( N(1, 1, 12)12)和和 N( N(2, 2, 22)22)。这时,所考察的问题就归结为检验这两。这时,所考察的问题就归结为检验这两个个(lin
18、 )(lin )正态总体的均值正态总体的均值 1 1和和 2 2是否是否相等的问题。相等的问题。 设设X1, X2, , Xm与与Y1, Y2, , Yn 分别分别(fnbi)为抽自正态总体为抽自正态总体 N(1, 12)和和 N(2, 22)的样本,记的样本,记的均值和方差。的均值和方差。分别为分别为和和的均值和方差;的均值和方差;分别为分别为和和 , , 21222121nmYYYSYXXXSX考查如下检验考查如下检验(jinyn)(jinyn)假设假设: :第29页/共96页第三十页,共96页。1. H0: 1= 2 ; H1: 1 2 当当 12 12 和和 22 22 已知时,根据已
19、知时,根据(gnj)(gnj)定理,有定理,有. 1 , 0 )(222121NnmYX当当 H0: 1 = 2为真时,为真时, , 1 , 0 2221NnmYX第30页/共96页第三十一页,共96页。故,拒绝故,拒绝域域为为 . |2/2221znmYXP. | | 22212/2/2221nmzYXznmYX或或第31页/共96页第三十二页,共96页。 在在12=22 =2,2未知情况未知情况(qngkung)下,根据定理,有下,根据定理,有当当 H0: 1= 2 为真时,有为真时,有, )()(21121nmtnmSYX. 2) 1() 1( 2221nmSnSmS其中其中. )(21
20、1nmtnmSYX第32页/共96页第三十三页,共96页。拒绝拒绝域域为为 . /2)(|211nmtnmSYXP从而从而(cng (cng r) r) . /2)( | /2)(| 112211nmStYXtnmSYXnmnm或或第33页/共96页第三十四页,共96页。 上面,我们假定上面,我们假定(jidng) 12=22。当然。当然,这是个不得已而强加上去的条件,因为如果,这是个不得已而强加上去的条件,因为如果不加此条件,就无法使用简单易行的不加此条件,就无法使用简单易行的 t 检验。检验。 在实用中,只要我们有理由认为在实用中,只要我们有理由认为12和和22相差不是太大,往往就可使用上
21、述方法。相差不是太大,往往就可使用上述方法。通常是:如果方差比检验未被拒绝通常是:如果方差比检验未被拒绝(见下节见下节), 就就认为认为12和和22相差不是太大。相差不是太大。说明说明(shumng):第34页/共96页第三十五页,共96页。例例3:假设有:假设有A和和B两种药,欲比较它们在服用两种药,欲比较它们在服用2小时后在血液中的含量是否一样。对药品小时后在血液中的含量是否一样。对药品A,随,随机抽取机抽取8个病人服药,服药个病人服药,服药2小时后,测得小时后,测得8个病个病人血液中药物浓度人血液中药物浓度(用适当的单位用适当的单位)分别为分别为: 1.23, 1.42, 1.41, 1
22、.62, 1.55, 1.51, 1.60, 1.76.对药品对药品B,随机抽取,随机抽取6个病人服药,服药个病人服药,服药2小时后小时后,测得血液中药的浓度分别为,测得血液中药的浓度分别为: 1.76, 1.41, 1.87, 1.49, 1.67, 1.81.假定这两组观测值抽自具有共同方差的两个正假定这两组观测值抽自具有共同方差的两个正态总体态总体(zngt),在显著性水,在显著性水=0.10下,检验病下,检验病人血液中这两种药的浓度是否有显著不同人血液中这两种药的浓度是否有显著不同?第35页/共96页第三十六页,共96页。故,接受原假设。即, 认为病人血液中这两种药浓度(nngd)无显
23、著差异。解:问题就是从总体解:问题就是从总体 N(1, 2)和和N(2, 2)中分别抽取样本中分别抽取样本(yngbn)X1, X2, X8 和和Y1, Y2, Y6,样本,样本(yngbn)均值和样本均值和样本(yngbn)方差分别为:方差分别为:.33. 02) 1() 1( 6 81 . 0,210 ,661 ,030 ,51122212221nmSnSmSnm.S.Y.S.X,. 0.31 /2)( | 15. 0112nmStYXnm第36页/共96页第三十七页,共96页。与与1.1.的分析完全类似的分析完全类似(li s)(li s),可以得,可以得到到: :2. 单边检验单边检验
24、(jinyn) H0: 12; H1: 12 12和和 22已知情况已知情况(qngkung)下,下,H0的拒绝域为的拒绝域为. 2221nmzYX 1 12 2与与 2 22 2未知未知,但二者相等情况下但二者相等情况下,H0 0的的 拒绝拒绝域域为为. )(112nmStYXnm第37页/共96页第三十八页,共96页。与与1.1.的分析完全类似的分析完全类似(li s)(li s),可以得,可以得到到: :3. 单边检验单边检验(jinyn) H0: 12; H1: 12 12和和 22已知情况已知情况(qngkung)下,下,H0的拒绝域为的拒绝域为. nmzYX2221 1 12 2与
25、与 2 22 2未知未知,但二者相等情况下但二者相等情况下,H0 0的的 拒绝拒绝域域为为. )(112nmStYXnm第38页/共96页第三十九页,共96页。 两个正态总体与成对数据的区别两个正态总体与成对数据的区别两个正态总体两个正态总体假定来自这两个正态总体假定来自这两个正态总体 的两组样本,是相互独立的。的两组样本,是相互独立的。成对数据成对数据两组样本可以是来自对同一个两组样本可以是来自对同一个 总体上的重复测量,它们总体上的重复测量,它们(t men)(t men)是成对出是成对出现的,可现的,可 以是相关的。以是相关的。成对数据成对数据(shj)的的 t 检验检验第39页/共96
26、页第四十页,共96页。例如例如: 为了考察一种为了考察一种(y zhn)降血压药的效果,测降血压药的效果,测试了试了n 个高血压病人服药前、后的血压分别为个高血压病人服药前、后的血压分别为X1, X2, Xn 和和Y1,Y2,Yn。这里。这里(Xi ,Yi)是第是第 i个病人个病人服药前和服药后的血压,它们是相关的。服药前和服药后的血压,它们是相关的。 处理成对数据处理成对数据(shj)的思路的思路 因因(Xi , Yi)是在同一人身上观测到的血压是在同一人身上观测到的血压。所以,。所以,Xi-Yi 就消除了人的体质等诸方面的就消除了人的体质等诸方面的条件差异,仅剩下降血压药的效果。条件差异,
27、仅剩下降血压药的效果。 所以,我们可以所以,我们可以(ky)把把 di=Xi-Yi,i=1, 2, n.看成抽自正态总体看成抽自正态总体 N( , 2)的样本。的样本。其中其中 就是降血压药的平均效果。就是降血压药的平均效果。第40页/共96页第四十一页,共96页。 一般一般(ybn)的成对数据同样也是这样转变的的成对数据同样也是这样转变的。从前面所学内容可以看出:其实就是作。从前面所学内容可以看出:其实就是作 H0: = 0; H1: 0; H0: 0; H1: 0 方差方差(fn ch)(fn ch)2 2未知情况下未知情况下的检验。的检验。niidniiddnSYXdnd1221.)(1
28、1 1 ,记记上述三种上述三种(sn zhn)检验的拒绝域分别为:检验的拒绝域分别为:).()/( )()/( )2/()/(|111ndndndtnSdtnSdtnSd和和,第41页/共96页第四十二页,共96页。例例4:为了检验:为了检验A, B两种测定铁矿石含铁量的方法两种测定铁矿石含铁量的方法是否有明显是否有明显(mngxin)差异差异, 现用这两种方法测定现用这两种方法测定了取自了取自12个不同铁矿的矿石标本的含铁量个不同铁矿的矿石标本的含铁量(%),结,结果列于表果列于表 中。取中。取=0.05, 问这两种测定方法是否问这两种测定方法是否有显著差异有显著差异? 第42页/共96页第
29、四十三页,共96页。解解: 将方法将方法(fngf)A和方法和方法(fngf)B的测定的测定值分别记为值分别记为X1, X2, X12 和和 Y1, Y2, Y12 .第43页/共96页第四十四页,共96页。因这因这12个标本来自不同铁矿,所以个标本来自不同铁矿,所以, X1, X2, X12 不能看成来自同一个总体不能看成来自同一个总体(zngt)的样本。同的样本。同理理, Y1, Y2, Y12也不能看成来自同一个总体也不能看成来自同一个总体(zngt)的样本。故的样本。故, 用成对用成对 t 检验。记检验。记 di=Xi-Yi, i=1, 2, , 12.所以,接受原假设所以,接受原假设
30、(jish),即认为两种测定方法无,即认为两种测定方法无显著性差异。显著性差异。.0007. 0 0.0167 2dSd,容易算出容易算出.0168. 0)2/()(0.0167 201. 2)2/( 0.05 12 11ndntn/S|d|tn得得,再由再由第44页/共96页第四十五页,共96页。 利用利用(lyng)(lyng)样本方差样本方差 S 2 S 2是是2 2的一的一个无偏估计,且个无偏估计,且 (n-1)S2/ (n-1)S2/ 2 2n-1 2 2n-1 的的结论。结论。单个正态总体方差单个正态总体方差(fn ch)的的2 检验检验 设 X1, X2, , Xn 为来自总体
31、N( , 2) 的样本, 和 2未知,求下列假设的显著性水平(shupng)为 的检验。思路分析思路分析: 1. H0: 2 = 02;H1: 2 02 8.3 正态总体方差的检验正态总体方差的检验第45页/共96页第四十六页,共96页。 当原假设当原假设 H0: H0: 2 = 2 = 0202成立时,成立时,S2S2和和0202应应该比较接近,即比值该比较接近,即比值 S 2/ S 2/0202应接近于应接近于1 1。所以。所以(suy),(suy),这个比值过大或过小这个比值过大或过小 时,应拒绝原假设。时,应拒绝原假设。 合理的做法是合理的做法是: : 找两个合适的界限找两个合适的界限
32、 c1 c1 和和 c2 c2 , , 当当 c1(n-1)S2/ c1(n-1)S2/02 c2 02 02 同理,当同理,当 H0: H0: 2 = 2 = 0202成立成立(chngl)(chngl)时,有,时,有, . ) 1( 212020nSnH 的拒绝域为的拒绝域为所以,所以,. )() 1(21202nSnP此检验法也称此检验法也称 2 2 检验法检验法。3*. H0: 2 02;H1: 2 02 (同同2.)第48页/共96页第四十九页,共96页。例例1:某公司生产的发动机部件的直径:某公司生产的发动机部件的直径 (单位单位: cm) 服服从正态分布,并称其标准差从正态分布,
33、并称其标准差 0=0.048 。现随机抽取。现随机抽取5个部件,测得它们的直径为个部件,测得它们的直径为 1.32, 1.55, 1.36, 1.40, 1.44.取取=0.05,问,问:(1). 能否能否(nn fu)认为该公司生产的发动机部件的直认为该公司生产的发动机部件的直径径 的标准差确实为的标准差确实为= 0?(2). 能否能否(nn fu)认为认为 0?解解: (1). 的问题的问题(wnt)就是检验就是检验 H0: 2 = 02; H1: 2 02.其中,其中,n=5, =0.05,0=0.048.第49页/共96页第五十页,共96页。故,拒绝故,拒绝(jju)原假设原假设 H0
34、 ,即认为部件直,即认为部件直径标准差不是径标准差不是 0.048 cm。 经计算经计算(j sun),得,得 S2=0.00778,. 0.484)0.975()2/1 ( 11.143)0.025()2/( 242124212nn,分布表,得分布表,得查查. 11.14351.13048. 000778. 0) 1(51)( 2202Sn算得算得第50页/共96页第五十一页,共96页。故,拒绝原假设故,拒绝原假设 H0,即认为部件,即认为部件(bjin)的直径标的直径标准差超过了准差超过了 0.048 cm。 (2). 的问题的问题(wnt)是检验是检验 H0: 2 02 ; H1: 2
35、02.,分布表,得分布表,得查查 488. 9)0.05()( 24212n. 9.48851.131)( 202Sn而而第51页/共96页第五十二页,共96页。 该检验主要该检验主要(zhyo)(zhyo)用于上节中实施两用于上节中实施两样本样本 t t 检验之前,讨论检验之前,讨论 12 =12 =22 22 的假的假设是否合理。设是否合理。两正态总体两正态总体(zngt)方差比的方差比的 F 检验检验1. H0: 12 = 22;H1: 12 22. 设X1, X2, , Xm和Y1, Y2, , Yn 分别为抽自正态总体 N(1, 12)和 N(2, 22)的样本(yngbn), 欲检
36、验第52页/共96页第五十三页,共96页。 当当 H0: 12=22 成立时成立时, 12/22=1, 作作为其估计,为其估计,S12/S22也应与也应与 1 相差不大。当该值过相差不大。当该值过分地大或过分地小时,都应拒绝原假设成立。分地大或过分地小时,都应拒绝原假设成立。 合理的思路是:找两个合理的思路是:找两个(lin )界限界限c1和和c2, 当当 c1 S12/S22 22 同理,当同理,当 H0: H0: 12 =12 =2222成立成立(chngl)(chngl)时,有时,有 S12/S22 S12/S22 Fm-1, n-1Fm-1, n-1, . )(1 1,2221nmFS
37、SP . 1, 122210nmFSSH 的拒绝域为的拒绝域为所以,所以,第56页/共96页第五十七页,共96页。例例2:甲乙两厂生产同一种电阻,现从甲乙两:甲乙两厂生产同一种电阻,现从甲乙两厂的产品中分别厂的产品中分别(fnbi)随机地抽取随机地抽取12个和个和10个样品个样品,测得它们的电阻值后,计算出样本方测得它们的电阻值后,计算出样本方差分别差分别(fnbi)为为S12=1.40,S22=4.38。3. H0: 12 22;H1: 12 22结论结论(jiln)(jiln)同同 2 2。 以上以上(yshng)(yshng)检验都用到了检验都用到了F F分布,因分布,因此称上述检验为此
38、称上述检验为 F F 检验。检验。 假设两厂生产的电阻的电假设两厂生产的电阻的电阻的阻值分别服从正态分布阻的阻值分别服从正态分布 N( 1, 12)和和 N( 2, 22)。第57页/共96页第五十八页,共96页。在显著性水平在显著性水平(shupng) (shupng) = 0.10 = 0.10下下, , 是否可接受:是否可接受: (l).(l).12 =12 =2222;(2).(2).121222. 22. 解:解:(1). (1). 的问题的问题(wnt)(wnt)是检验是检验 H0: H0: 12 =12 =2222;H1: H1: 12 12 22.22.其中,其中,m=12,
39、n=10, =0.10, S12=1.40, m=12, n=10, =0.10, S12=1.40, S22=4.38, S12/S22 =0.32S22=4.38, S12/S22 =0.32。利用利用(lyng)(lyng)第六章第六章学过的学过的 )2/(1)2/1 (1 1,1 1,mnnmFF第58页/共96页第五十九页,共96页。及及P237的附表的附表5,有,有 Fm-1, n-1(1- /2) = F11, 9(0.95) = 1/F9, 11(0.05) = 1/(2.90) = 0.34.因因 S12/S22 = 0.32 0.34,所以,无须再考虑,所以,无须再考虑Fm
40、-1, n-1(/2)的值,就可得到的值,就可得到(d do)拒绝拒绝12 =22的结论。的结论。第59页/共96页第六十页,共96页。 查查P237 附表附表5,因查不到,因查不到 F11, 9(0.10),改,改用用F10, 9(0.10)和和F12, 9(0.10)的平均值近似的平均值近似(jn s)之,得之,得 F11, 9(0.10)=F10, 9(0.10)+F12, 9(0.10)/2 2.42+2.38/2 = 2.40.因因 S12/S22 = 0.32 22. . 110 1122221,检验的拒绝域为检验的拒绝域为FSS第60页/共96页第六十一页,共96页。 在前面的讨
41、论中,我们总假定总体的分布形式在前面的讨论中,我们总假定总体的分布形式(xngsh)(xngsh)是已知的。例如,假设总体分布为正态是已知的。例如,假设总体分布为正态分布分布 N( N(, , 2), 2), 总体分布为区间总体分布为区间 (a, b) (a, b) 上的上的均匀分布,等等。均匀分布,等等。 然而,在实际问题中,我们所遇到的总体服然而,在实际问题中,我们所遇到的总体服从何种分布往往并不知道。需要我们先对总体的从何种分布往往并不知道。需要我们先对总体的分布形式提出假设,如:总体分布是正态分布分布形式提出假设,如:总体分布是正态分布N( , 2),总体分布是区间,总体分布是区间(a
42、, b)上均匀分布等上均匀分布等,然后利用数据,然后利用数据 (样本样本) 对这一假设进行检验对这一假设进行检验(jinyn),看能否获得通过。,看能否获得通过。8.4 分布分布(fnb)拟拟合检验合检验第61页/共96页第六十二页,共96页。 这是一项非常这是一项非常(fichng)重要的重要的工作工作,许多学者视它为近代统计学的许多学者视它为近代统计学的开端。开端。 解决这类问题解决这类问题(wnt)的方法最早由英国的方法最早由英国统计学家统计学家 K. Pearson (皮尔逊皮尔逊) 于于1900年在他年在他发表的一篇文章中给出发表的一篇文章中给出, 该方法后被称为该方法后被称为 Pe
43、arson 2检验法,简称检验法,简称 2检验。检验。第62页/共96页第六十三页,共96页。 设设F(x)为一已知的分布函数,现有样本为一已知的分布函数,现有样本X1, X2, , Xn,但我们,但我们(w men)并不知道样本的总体并不知道样本的总体 分布分布是什么。现在试图检验是什么。现在试图检验 H0:总体 X 的分布(fnb)函数为F(x) ; (1) 对立假设为对立假设为 H1:总体:总体 X 的分布函数非的分布函数非F(x)。如果。如果 F(x) 形式已知,但含有未知参数形式已知,但含有未知参数 或或参参数向量数向量 =(1, 2, r) ,记为,记为F(x, )。这。这种检验通
44、常种检验通常(tngchng)称为分布的拟合优度称为分布的拟合优度检验。检验。 2检验检验第63页/共96页第六十四页,共96页。 不妨设总体不妨设总体 X 是连续型分布。检验思想是连续型分布。检验思想与步骤与步骤(bzhu)如下如下:(1). 将总体将总体(zngt) X 的取值范围分成的取值范围分成 k 个互不个互不重叠的重叠的 小区间小区间 I1, I2, , Ik,. ( ( (12101212101kkkkkaaaaaaaIaaIaaI,(2). 计算各子区间计算各子区间 Ii 上的理论上的理论(lln)频数频数。如果总体的分布函数为如果总体的分布函数为F(x, ),那么,各点落,那
45、么,各点落在区间在区间 Ii 上的概率均为上的概率均为,k.,iaFaFpiii21 ),(),()(1第64页/共96页第六十五页,共96页。)(inpn 个点中个点中(din zhn),理论上有,理论上有n pi ( )个点落个点落在在 Ii 上上, (称为理论频数称为理论频数)。当分布函数中含有未。当分布函数中含有未知参数知参数 时,理论频数也未知,要用时,理论频数也未知,要用来估计来估计 n pi (), 为为 的极大似然估计。的极大似然估计。(3). 计算各子区间计算各子区间 Ii 上的实际上的实际(shj)频数频数 fi 。 fi = X1, X2, , Xn Ii , i=1,
46、2, , k . 计数符号计数符号(fho),取集,取集合中元素的个数合中元素的个数第65页/共96页第六十六页,共96页。22211( )= (2)( )( )kkiiiiiiifnpfnnpnp,(4). 计算理论频数计算理论频数(pn sh)与实际频数与实际频数(pn sh)的偏差平方和。的偏差平方和。可以证明可以证明(zhngmng):在:在 H0 成立,且成立,且 n时时, 和式中的影响力。和式中的影响力。频数比较大的那些项在频数比较大的那些项在理论理论去除的其目的是:缩小去除的其目的是:缩小每一项用每一项用 )( inp)3( 212,k-r- 1 22是参数个数。是参数个数。是子
47、区间数,是子区间数,分布,分布,的的由度为由度为统计量的分布收敛到自统计量的分布收敛到自即即rkrk第66页/共96页第六十七页,共96页。(5). H0 的显著性水平的显著性水平(shupng)为为 的检验的拒的检验的拒绝域为绝域为221 () (4)kr , 注意:该检验方法是在注意:该检验方法是在 n 充分大时使用充分大时使用的,因而,使用时要注意的,因而,使用时要注意 n 必须足够地大必须足够地大, 以以及及 npi 不能太小这两个不能太小这两个(lin )条件。条件。 在实用上,一般要求在实用上,一般要求 n 50,以及所有,以及所有npi 5。如果初始子区间划分不满足。如果初始子区
48、间划分不满足(mnz)后一个条件后一个条件, 则适当地将某些子区间合并,可使则适当地将某些子区间合并,可使 npi 满足满足(mnz)上述要求。上述要求。第67页/共96页第六十八页,共96页。例例1: 在一实验中在一实验中, 每隔一定时间观察一次由某种铀每隔一定时间观察一次由某种铀所放射到计数器上的所放射到计数器上的 粒子数粒子数X, 共观察了共观察了100次次, 得得到结果如下到结果如下(rxi)表表8.1所示。给定所示。给定 = 0.05, 检验假检验假设设 H0:X 服从(fcng)泊松分布 P() .其中其中 fi 是观测到有是观测到有 i 个个 粒子粒子(lz)的次数。的次数。注:
49、注:XP()表示表示, 0,1,2,.!ieP Xiii第68页/共96页第六十九页,共96页。解解: 因因H0中含有未知参数中含有未知参数 ,所以应先估计所以应先估计(gj)该该参数。由极大似然估计参数。由极大似然估计(gj)法,得法,得 在在H0成立前提下,成立前提下,X 可能的取值为可能的取值为0,1,2, ,将该集合将该集合(jh)分成分成A0=0,A1=1,, A11=11,A12=12,13,,则,则 PX=i=pi 的估计为的估计为4.2.x4.2111214.2,0,1,2,11;!1210.002.iiiiepP XiiipP Xp 将检验将检验(jinyn)统计量计算用数据
50、填入下表,得统计量计算用数据填入下表,得 第69页/共96页第七十页,共96页。 55iinpnp其其中中一一些些,将将这这些些组组进进行行适适当当合合并并,使使得得每每组组的的,如如上上表表的的第第4 4列列的的花花括括号号所所示示。第70页/共96页第七十一页,共96页。2226=1, 1 6 106.281 100=(0.05)12.529, krkr 并并组组后后 8 8。而而此此处处 故故分分布布自自由由度度为为= = 。而而所以,在所以,在 = 0.05下下, 接受原假设,可以认为数接受原假设,可以认为数据服从据服从(fcng)泊松分布。泊松分布。第71页/共96页第七十二页,共9
51、6页。例例2: 自自1965年年1月月1日至日至1971年年2月月9日共日共2231天中天中, 全世界记录全世界记录(jl)到里氏到里氏4级或级或4级以上地震共计级以上地震共计162次次,相继两次地震间隔天数,相继两次地震间隔天数X统计如下统计如下:给定给定(i dn) = 0.05, 检验假设检验假设X服从指数分布服从指数分布。解解: 根据题意根据题意(t y),检验假设:,检验假设:H0 :X服从服从指数分布,即指数分布,即X有概率密度函数有概率密度函数 1/,0,( ) 0,0.xexf xx第72页/共96页第七十三页,共96页。 在这里,在这里,H0中含有未知参数中含有未知参数(cn
52、sh),应应先估计。由极大似然估计法,得先估计。由极大似然估计法,得 在在H0成立成立(chngl)前提下,前提下,X 可能的取值为可能的取值为0, ), 将其分成将其分成 A1=0, 4.5),A2=4.5, 9.5), , A9=39.5, ),则则 P(Ai)=pi 的估计为的估计为223113.77.162x11/(), 1,2,9.iiaxiiapP Aedxi其中其中(qzhng)Ai=ai, ai+1),i=1,2 ,9。第73页/共96页第七十四页,共96页。 55iinpnp将将的的第第8 8组组合合并并到到第第9 9组组中中,使使得得每每组组的的,如如上上表表的的第第4 4
53、列列的的花花括括号号所所示示。得得226 163.5536 162=(0.05)12.529, 故,在故,在 = 0.05下下, 接受原假设接受原假设(jish),即认为数,即认为数据服从指数分布。据服从指数分布。第74页/共96页第七十五页,共96页。例例3: 为检验棉纱的拉力强度为检验棉纱的拉力强度(qingd) X (单位单位: kg) 服从正态分布,从一批棉纱中随机抽取服从正态分布,从一批棉纱中随机抽取300条进行拉条进行拉力试验,结果列在表力试验,结果列在表8.2中。给定中。给定 = 0.01,检验假设检验假设 H0:拉力(ll)强度 X N(, 2) .第75页/共96页第七十六页
54、,共96页。解:本例中,并未给出各观测值解:本例中,并未给出各观测值 Xi 的具体的具体(jt)值值,只给出了各观测值的取值范围,这样只给出了各观测值的取值范围,这样的数据称为区间数据。样本均值与样本方差的数据称为区间数据。样本均值与样本方差可通过下列式计算:可通过下列式计算:. 211 21 1221211kiiiikiiiiXnaannSaannX,.26. 01 41. 1 ),( 22222SnnXN,为为极大似然估计极大似然估计的的和和,对正态总体对正态总体第76页/共96页第七十七页,共96页。 (1). 先将数据先将数据(shj) Xi 分成分成13组,每组落入一组,每组落入一个
55、区个区 间,区间的端点为:间,区间的端点为: . 18. 2 78. 0 64. 0 1312210aaaaa,(2). 计算数据计算数据(shj)落入各子区间的理论频落入各子区间的理论频数。数。因分布中含有两个未知参数,所以,理论频因分布中含有两个未知参数,所以,理论频数只能数只能(zh nn)近似地估计。落入第近似地估计。落入第 i 个子个子区间区间Ii 的理论频数的估计为的理论频数的估计为 , 其中其中 .13 2 1 26. 041. 126. 041. 1) ( 12 ,iaappiiiiipn第77页/共96页第七十八页,共96页。,因因0.46 1.85 1.85 0.46 13
56、1221pnpnpnpn。见表见表最后两组合并成一组最后两组合并成一组我们将前两组和我们将前两组和所以,所以,均大于均大于,而而8.3)( 5 113pnpn第78页/共96页第七十九页,共96页。(3). 计算数据计算数据(shj)落入各子区间上的实际频数落入各子区间上的实际频数 fi 。 fi = X1, X2, , Xn Ii , i=1, 2, , 10 . .15.22 122kiiiipnpnf(4). 计算检验计算检验(jinyn)统计量的值统计量的值因为因为 k =10,r =2,所以上述,所以上述(shngsh) 2分布的自由度为分布的自由度为 k-r-1=7。由。由.48.
57、18)(15.2221rk2(5). H0 的显著性水平为的显著性水平为 的检验的检验 于是,拒绝原假设,即认为棉纱拉力强于是,拒绝原假设,即认为棉纱拉力强度不服从正态分布。度不服从正态分布。第79页/共96页第八十页,共96页。 孟德尔在关于遗传问题的研究中孟德尔在关于遗传问题的研究中,用豌豆做实验。豌豆有黄和绿两种,用豌豆做实验。豌豆有黄和绿两种颜色,在对它们进行两代杂交之后,颜色,在对它们进行两代杂交之后,发现一部分杂交豌豆呈黄色,另一部发现一部分杂交豌豆呈黄色,另一部分呈绿色分呈绿色(l s)。其数目的比例大致。其数目的比例大致是是 3:1。 2检验的一个著名应用例子是孟德尔豌豆检验的
58、一个著名应用例子是孟德尔豌豆实验。奥地利生物学家孟德尔在实验。奥地利生物学家孟德尔在1865年发表的年发表的论文,事实上提出了基因学说,奠定了现代遗论文,事实上提出了基因学说,奠定了现代遗传学的基础。他的这项伟大发现的过程有力地传学的基础。他的这项伟大发现的过程有力地证明了统计方法在科学研究中的作用。因此,证明了统计方法在科学研究中的作用。因此,我们有必要在这里将这一情况介绍我们有必要在这里将这一情况介绍(jisho)给给大家。大家。 第80页/共96页第八十一页,共96页。 这只是一个表面上的统计规律。但它启发这只是一个表面上的统计规律。但它启发(qf)孟德尔去发展一种理论,以解释这种现象孟
59、德尔去发展一种理论,以解释这种现象。他大胆地假定存在一种实体,即现在我们称。他大胆地假定存在一种实体,即现在我们称为为“基因基因”的东西,决定了豌豆的颜色。这基因的东西,决定了豌豆的颜色。这基因有黄绿两个状态,一共有四种组合:有黄绿两个状态,一共有四种组合: 孟德尔把他的实验重复了多次,每次都得到孟德尔把他的实验重复了多次,每次都得到(d do)类似结果。类似结果。(黄黄, 黄黄),(黄黄, 绿绿),(绿绿, 黄黄),(绿绿, 绿绿). 第81页/共96页第八十二页,共96页。(黄黄, 黄黄),(黄黄, 绿绿),(绿绿, 黄黄),(绿绿, 绿绿). 孟德尔认为孟德尔认为, 前三种配合使豆子呈黄
60、色前三种配合使豆子呈黄色,而而第四种配合使豆子呈绿色。从古典概率的观点看第四种配合使豆子呈绿色。从古典概率的观点看,黄色豆子出现的概率为,黄色豆子出现的概率为3/4,绿色豆子出现的,绿色豆子出现的概率为概率为1/4。这就解释了黄绿颜色豆子之比为什。这就解释了黄绿颜色豆子之比为什么总是么总是(zn sh)接近接近 3:1 这个观察结果。这个观察结果。 孟德尔这个发现的深远意义是他开辟孟德尔这个发现的深远意义是他开辟(kip)了遗传学研究的新纪元。下面的例子就是用了遗传学研究的新纪元。下面的例子就是用 2检验来检验孟德尔提出黄绿颜色豌豆数目之比检验来检验孟德尔提出黄绿颜色豌豆数目之比为为 3:1的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024企业主要负责人安全培训考试题研优卷
- 物联网创业投资基金绩效评估-洞察分析
- 语义网络与-class融合-洞察分析
- 网络信息化教学研修心得体会
- 徐吾学校学习宣传新《安全生产法》活动计划
- 绿化施工防尘治理措施
- 施工机械设备投入计划及保证措施
- 肺结核感染控制管理制度
- 施工节水措施
- 空调清洗施工方案及流程
- 北京联合大学《数据挖掘B》2023-2024学年第一学期期末试卷
- 2024年中国大数据企业排行榜V9.0(大数据产业白皮书)-中国民营科技促进会
- 2025年统编版高考政治一轮复习:选择性必修1、2、3共3册必背考点知识点汇编
- 货物交接单和交接合同
- 《灭火应急疏散预案》课件
- 【高分复习笔记】孙广仁《中医基础理论》(第9版)笔记与考研真题详解
- 开题报告:高质量数字教材建设机制及政策研究
- PE工程师工作总结
- 以案促改心得体会
- 华东师范大学《法学导论(Ⅰ)》2023-2024学年第一学期期末试卷
- 期末复习试题 (试卷)-2024-2025学年四年级上册数学人教版
评论
0/150
提交评论