[理学]概率论第七章ppt课件_第1页
[理学]概率论第七章ppt课件_第2页
[理学]概率论第七章ppt课件_第3页
[理学]概率论第七章ppt课件_第4页
[理学]概率论第七章ppt课件_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概率论与数理统计概率论与数理统计假设检验假设检验正态总体均值的假设检验正态总体均值的假设检验1 假设检验是指施加于一个或多个总体的概率假设检验是指施加于一个或多个总体的概率分布或参数的假设分布或参数的假设. . 所作的假设可以是正确的所作的假设可以是正确的, , 也可以是错误的也可以是错误的. . 为判别所作的假设能否正确为判别所作的假设能否正确, , 从总体从总体中抽取样本中抽取样本, , 根据样本的取值根据样本的取值, , 按一定的按一定的原那么进展检验原那么进展检验, , 然后然后, , 作出接受或回绝作出接受或回绝所作假设的决议所作假设的决议. .一、假设检验的根本概念一、假设检验的根

2、本概念 假设检验所以可行假设检验所以可行, ,其实际背景为其实际背景为实践推断原理实践推断原理, ,即即“小概率原理小概率原理假设检验的内容假设检验的内容参数检验参数检验非参数检验非参数检验总体均值总体均值, 均值差的检验均值差的检验总体方差总体方差, 方差比的检验方差比的检验分布拟合检验分布拟合检验符号检验符号检验秩和检验秩和检验假设检验的实际根据假设检验的实际根据总体分布知,总体分布知,检验关于未知检验关于未知参数的某个假设参数的某个假设总体分布未知时的总体分布未知时的假设检验问题假设检验问题 消费流水线上罐装可消费流水线上罐装可乐不断地封装,然后装箱乐不断地封装,然后装箱外运外运. 怎样

3、知道这批罐装怎样知道这批罐装可乐的容量能否合格呢?可乐的容量能否合格呢? 把每一罐都翻开倒入量把每一罐都翻开倒入量杯杯, 看看容量能否合于规范?看看容量能否合于规范? 这样做这样做显然不行!显然不行!罐装可乐的容量按规范应在罐装可乐的容量按规范应在350毫升和毫升和360毫升之间毫升之间. 每隔一定时间,抽查假设干罐每隔一定时间,抽查假设干罐 . 如每隔如每隔1小时,小时,抽查抽查5罐,得罐,得5个容量的值个容量的值X1,X5,根,根据这些值来判别消费能否正常据这些值来判别消费能否正常. 如发现不正常,就应停产,找出缘由,如发现不正常,就应停产,找出缘由,排除缺点,然后再消费;如没有问题,就排

4、除缺点,然后再消费;如没有问题,就继续按规定时间再抽样,以此监视消费,继续按规定时间再抽样,以此监视消费,保证质量保证质量.通常的方法是进展抽样检查通常的方法是进展抽样检查. 不能由不能由5罐容量的数据,在把握不大的情罐容量的数据,在把握不大的情况下就判别消费不正常而要求停产况下就判别消费不正常而要求停产. 也不能总以为正常,有了问题不能及时发也不能总以为正常,有了问题不能及时发现,这也要呵斥损失现,这也要呵斥损失.假设检验面对的就是这种矛盾假设检验面对的就是这种矛盾. 在正常消费条件下,由于种种随机要素的在正常消费条件下,由于种种随机要素的影响,每罐可乐的容量应在影响,每罐可乐的容量应在35

5、5毫升上下动摇毫升上下动摇. 这些要素中没有哪一个占有特殊重要的位置这些要素中没有哪一个占有特殊重要的位置. 因此,根据中心极限定理,假定每罐容量服从因此,根据中心极限定理,假定每罐容量服从正态分布是合理的正态分布是合理的.它的对立假设是:它的对立假设是:称称H0为原假设或零假设,解消假设;为原假设或零假设,解消假设;称称H1为备选假设或对立假设为备选假设或对立假设.在实践任务中,往在实践任务中,往往把不随便否认的往把不随便否认的命题作为原假设命题作为原假设. 0 H0: = 3550 H1:0 这样,我们可以以为这样,我们可以以为X1,X5是取自正是取自正态总体态总体 的样本,的样本,),(

6、2 N是一个常数是一个常数. 2 当消费比较稳定时,当消费比较稳定时,如今要检验的假设是:如今要检验的假设是: 如何判别原假设如何判别原假设H0 能否成立呢?能否成立呢? 较大、较小是一个相对的概念,合理较大、较小是一个相对的概念,合理的界限在何处?应由什么原那么来确定?的界限在何处?应由什么原那么来确定?由于由于 是正态分布的期望值,它的估计量是是正态分布的期望值,它的估计量是样本均值样本均值 ,因此可以根据,因此可以根据 与与 的差距的差距XX 0 来判别来判别H0 能否成立能否成立.X- |0 较小时,可以以为较小时,可以以为H0是成立的;是成立的;当当X- |0 消费已不正常消费已不正

7、常.当当较大时,应以为较大时,应以为H0不成立,即不成立,即- |X|0 问题归结为对差别作定量的分析,以问题归结为对差别作定量的分析,以确定其性质确定其性质.差别能够是由抽样的随机性引起的,称为差别能够是由抽样的随机性引起的,称为“抽样误差或抽样误差或 随机误差随机误差差别也能够是由事物的本质差别引起的,称为差别也能够是由事物的本质差别引起的,称为“系统误差系统误差 问题是,根据所察看到的差别,如何问题是,根据所察看到的差别,如何判别它终究是由于偶尔性在起作用,还是判别它终究是由于偶尔性在起作用,还是消费确实不正常?消费确实不正常?小概率事件在一次实验中根本上不会发生小概率事件在一次实验中根

8、本上不会发生.这里有两个盒子,各装有这里有两个盒子,各装有100个球个球.一盒中的白球和红球数一盒中的白球和红球数99个红球个红球一个白球一个白球99个个另一盒中的白球和红球数另一盒中的白球和红球数99个白球个白球一个红球一个红球99个个如何给出这个量的界限?如何给出这个量的界限? 统计假设判别题统计假设判别题 现从两盒中随机取出一个盒子,问这个现从两盒中随机取出一个盒子,问这个盒子里是盒子里是99个白球还是个白球还是99个红球?个红球?我们无妨先假设:这个盒子里有我们无妨先假设:这个盒子里有99个白球个白球.如今我们从中随机摸出一个球,发现是如今我们从中随机摸出一个球,发现是此时他如何判别这

9、个假设能否成立呢?此时他如何判别这个假设能否成立呢? 假设其中真有假设其中真有99个白球,摸出红球的概个白球,摸出红球的概率只需率只需1/100,这是小概率事件,这是小概率事件.小概率事件在一次实验中竟然发生了,不能不小概率事件在一次实验中竟然发生了,不能不使人疑心所作的假设使人疑心所作的假设.带概率性质的反证法带概率性质的反证法无妨称为概率反证法无妨称为概率反证法. 普通的反证法完全绝对地否认原假设普通的反证法完全绝对地否认原假设.概率反证法以很大的把握否认原假设概率反证法以很大的把握否认原假设.红楼梦中的掷骰子红楼梦中的掷骰子 在提出原假设在提出原假设H0后,如何作出接受和回绝后,如何作出

10、接受和回绝H0的结论呢?的结论呢? 在假设检验中,我们称这个小概率为显在假设检验中,我们称这个小概率为显著性程度,用著性程度,用 表示表示. 常取常取.05. 0,01. 0, 1 . 0 罐装可乐的容量按规范应在罐装可乐的容量按规范应在350毫升和毫升和360毫升之间毫升之间. 一批可乐出厂前应进展抽样检查,一批可乐出厂前应进展抽样检查,现抽查了现抽查了n 罐,测得容量为罐,测得容量为X1,X2,Xn,问这,问这一批可乐的容量能否合格?一批可乐的容量能否合格?提出假设提出假设选检验统计量选检验统计量nXU0 N(0,1) |2zUPH0: = 355 H1: 355由于由于 知,知, 它能衡

11、量差别它能衡量差别大小且分布知大小且分布知 .|0 X对给定的显著性程度对给定的显著性程度 ,可以在,可以在N(0,1)表表中查到分位点的值中查到分位点的值 ,使,使2 z 故我们可以取回绝域为:故我们可以取回绝域为:也就是说也就是说,“2| zU是一个小概率事件是一个小概率事件.W:2| zU 假设由样本值算得该统计量的实测值落假设由样本值算得该统计量的实测值落入区域入区域W,那么回绝,那么回绝H0 ;否那么,不能回绝;否那么,不能回绝H0 . |2zUP只好接受只好接受“显著性检验显著性检验 假设显著性程度假设显著性程度 获得很小,那么回获得很小,那么回绝域也会比较小绝域也会比较小. 其产

12、生的后果是:其产生的后果是:H0难于被回绝难于被回绝. 假设在假设在 很小的情况下很小的情况下H0仍被回绝了,仍被回绝了,那么阐明实践情况很能够与之有显著差别那么阐明实践情况很能够与之有显著差别.01. 0 基于这个理由,人们常把基于这个理由,人们常把 时回时回绝绝H0称为是显著的,而把在称为是显著的,而把在 时回时回绝绝H0称为是高度显著的称为是高度显著的.05. 0 例1 某工厂消费的一种螺钉,规范要求长度是32.5毫米. 实践消费的产品,其长度X假定服从正态分布 未知,现从该厂消费的一批产品中抽取6件, 得尺寸数据如下:),(2 N2 32.56, 29.66, 31.64, 30.00

13、, 31.87, 31.03问这批产品能否合格问这批产品能否合格?分析:这批产品分析:这批产品(螺钉长度螺钉长度)的全体组成问题的总体的全体组成问题的总体X. 如今要检验如今要检验E(X)能否为能否为32.5.提出原假设和备择假设提出原假设和备择假设 5 .32:5 .32:10 HH第一步:第一步:知知 X),(2 N2 未知未知.第二步:第二步:能衡量差能衡量差异大小且异大小且分布知分布知取一检验统计量,在取一检验统计量,在H0H0成立下成立下求出它的分布求出它的分布)5(65 .32tSXt第三步:第三步:即即“ 是一个小概率事件是一个小概率事件 . )5(|2 tt 小概率事件在小概率

14、事件在一次实验中基一次实验中基本上不会发生本上不会发生 . 对给定的显著性程度对给定的显著性程度 =0.01=0.01,查表确,查表确定临界值定临界值0322. 4)5()5(005. 02 tt , ,使使 )5(|2ttP得否认域得否认域 W: |t |4.0322 W: |t |4.0322得否认域得否认域 W: |t |4.0322W: |t |4.0322故不能回绝故不能回绝H0 .H0 .第四步:第四步:将样本值代入算出统计量将样本值代入算出统计量 t t 的实测值的实测值, ,| t |=2.9972.33故回绝原假设故回绝原假设H0 .落入否认域落入否认域解解: :提出假设提出

15、假设: : 21:21:10 HH) 1 , 0(21NnXU 取统计量取统计量否认域为否认域为 W :W :01. 0zU =2.33 此时能够犯第一类错误,犯错误的概率此时能够犯第一类错误,犯错误的概率不超越不超越0.01. 例例3 某产品出厂检验规定某产品出厂检验规定: 次品率次品率p不超越不超越4%才干出厂才干出厂. 现从一万件产品中恣意抽查现从一万件产品中恣意抽查12件发现件发现3件次品件次品, 问该批产品能否出厂?问该批产品能否出厂?假设抽查结果发现假设抽查结果发现1件次品件次品, 问能否出厂?问能否出厂?01. 00097. 0)1 () 3(9331212ppCP解解 假设假设

16、0.04,p04. 0p 这是小概率事件这是小概率事件 , 普通在一次实验中普通在一次实验中是不会发生的是不会发生的,现一次实验竟然发生现一次实验竟然发生, 故认故认为原假设不成立为原假设不成立, 即该批产品次品率即该批产品次品率 , 那么该批产品不能出厂那么该批产品不能出厂. 这不是小概率事件这不是小概率事件,没理由回绝原假设没理由回绝原假设,从而接受原假设从而接受原假设, 即该批产品可以出厂即该批产品可以出厂.3 . 0306. 0)1 () 1 (11111212ppCP假设不采用假设检验假设不采用假设检验, 按理不可以出厂按理不可以出厂.注注04. 0083. 0121直接算直接算 某

17、厂消费的螺钉某厂消费的螺钉,按规范强度为按规范强度为68/mm2, 而实践消费的强度而实践消费的强度X 服服N(,3.62 ).假设假设E(X) =68,那么以为这批螺钉符合要求那么以为这批螺钉符合要求,否那么否那么以为不符合要求以为不符合要求. 现从消费的螺钉中抽取容量现从消费的螺钉中抽取容量为为3636的样本的样本, ,其均值为其均值为 , ,问原假设问原假设能否正确能否正确? ?5 .68x 例例4 H0 : = 68 H1 : 68 解解 假设假设假设原假设正确假设原假设正确, , 那么那么)366 .3,68(2NX故故66.368X 取较大值是小概率事件取较大值是小概率事件.因此因

18、此 68)(XE,即即X偏离偏离6868不应该太远不应该太远, ,偏离较远是小概率事件偏离较远是小概率事件,由于由于 68(0,1)3.6/6XN规定规定为小概率事件的概率大小为小概率事件的概率大小, ,通常取通常取 = 0.05, 0.01, = 0.05, 0.01,683.6/6XPc例如例如, ,取取 = 0.05, = 0.05,那么那么96. 1025. 02zzc因此因此, ,可以确定一个常数可以确定一个常数c ,c ,使得使得681.963.6/6X 由由为检验的接受域为检验的接受域 (实践上没理由回绝实践上没理由回绝),现现5 .68x落入接受域落入接受域, ,那么接受原假设

19、那么接受原假设824.6618.69XX或而区间而区间( ,66.824 ) 与与 ( 69.18 , + )为检验的回绝域为检验的回绝域称称 的取值区间的取值区间X( 66.824 , 69.18 )( 66.824 , 69.18 )H0:H0: = 68 = 68概率论与数理统计概率论与数理统计正态总体方差的假设检验正态总体方差的假设检验2置信区间与假设检验之间的关系置信区间与假设检验之间的关系样本容量的选取样本容量的选取 提出提出假设假设 根据统计调查的目的根据统计调查的目的, 提出提出原假设原假设H0 和备选假设和备选假设H1作出作出决策决策抽取抽取样本样本检验检验假设假设 对差别进

20、展定量的分析,对差别进展定量的分析,确定其性质确定其性质(是随机误差是随机误差还是系统误差还是系统误差. 为给出两为给出两者界限,找一检验统计量者界限,找一检验统计量T,在在H0成立下其分布知成立下其分布知.回绝还是不能回绝还是不能回绝回绝H0显著性显著性程度程度P(T W)= -犯第一犯第一类错误的概率,类错误的概率,W为回绝域为回绝域假假设设检检验验步步骤骤 在大样本的条件下,假设能求得检验统计在大样本的条件下,假设能求得检验统计量的极限分布,根据它去决议临界值量的极限分布,根据它去决议临界值C.F 检验检验 用用 F分布分布普通说来,按照检验所用的统计量的分布普通说来,按照检验所用的统计

21、量的分布, 分为分为ZU 检验检验 用正态分布用正态分布t 检验检验 用用 t 分布分布2 检验检验2 用用分布分布的检验的检验)均值)均值,(一)单个总体(一)单个总体 2N一、正态总体均值的假设检验一、正态总体均值的假设检验检检验验)的的检检验验(已已知知,关关于于Z 2. 1nXZ/0 选取统计量选取统计量00 :原原假假设设H zz 拒绝域:拒绝域:00 :原假设原假设H00 :原原假假设设H zz 拒绝域:拒绝域:2/| zz 拒拒绝绝域域:) 1 , 0( NnX 检验)检验)的检验(的检验(未知,关于未知,关于t 2. 2nSXt/0 选取检验统计量选取检验统计量00 :原原假假

22、设设H)1( ntt 拒拒绝绝域域:00 :原假设原假设H00 :原原假假设设H)(拒绝域:拒绝域:1 ntt )(拒拒绝绝域域:1|2/ ntt 分布分布的的服从自由度为服从自由度为tn1 ) 1(ntnSX 例例1 1 某厂消费小型马达某厂消费小型马达, ,阐明书上写着阐明书上写着: : 这这种小型马达在正常负载下平均耗费电流不会种小型马达在正常负载下平均耗费电流不会超越超越0.8 0.8 安培安培. . 解解 根据题意待检假设可设为根据题意待检假设可设为 现随机抽取现随机抽取1616台马达实验台马达实验, ,求得平均耗求得平均耗费电流为费电流为0.920.92安培安培, ,耗费电流的规范

23、差为耗费电流的规范差为0.320.32安培安培. . 假设马达所耗费的电流服从正态分布假设马达所耗费的电流服从正态分布, , 取显著性程度为取显著性程度为 = 0.05, = 0.05,问根据这个样本问根据这个样本, , 能否否认厂方的断言能否否认厂方的断言? ? H0 : H0 : 0.8 0.8 ; H1 : H1 : 0.8 0.8 未知未知, , 应选检验统计量应选检验统计量: :(15)/ 16XTTS查表得回绝域为查表得回绝域为t t0.05(15) = 1.753, t t0.05(15) = 1.753, 5 . 116/32. 08 . 092. 0/8 . 0 nsxt而而

24、753. 1 故接受原假设故接受原假设, , 即不能否认厂方断言即不能否认厂方断言. .解二解二 H0 : H0 : 0.8 0.8 ; H1 : H1 : 0.8 0.8 选用统计量选用统计量: : (15)/ 16XTTS故接受原假设故接受原假设, , 即否认厂方断言即否认厂方断言. .查表得回绝域为查表得回绝域为t -t0.05(15) = -1.753, t 0.00040. 此时可采用效果一样的单边假设检验 H0 : 2 =0.00040 ;H1 : 2 0.00040. (二)两个总体的情况(二)两个总体的情况,设设),(),(222211 NYNXYX和分别是这两个样本的分别是这

25、两个样本的且且X与与Y独立独立,X1,X2,1nX是取自是取自X的样本的样本,取自取自Y的样本的样本,均值均值,Y1,Y2,2nY是是样本样本2221SS 和分别是这两个样本的样本方差分别是这两个样本的样本方差,,:原假设原假设22210 H22222121/ SS取取检检验验统统计计量量)1, 1(21 nnF)1, 1(2122212221 nnFSS 22210 :原原假假设设H)(拒拒绝绝域域:1, 121 nnFF ),(或或),(拒拒绝绝域域:1111212/1212/ nnFFnnFF 22210 :原原假假设设H)(拒绝域:拒绝域:1, 1211 nnFF 例例4 为比较两台自

26、动机床的精度,分别取为比较两台自动机床的精度,分别取容量为容量为10和和8的两个样本,丈量某个目的的的两个样本,丈量某个目的的尺寸尺寸(假定服从正态分布假定服从正态分布),得到以下结果:,得到以下结果:在在 =0.1时,时, 问这两台机床能否有同样问这两台机床能否有同样的精度的精度? 车床甲:车床甲:1.08, 1.10, 1.12, 1.14, 1.15, 1.25, 1.36, 1.38,1.40,1.42车床乙:车床乙:1.11, 1.12, 1.18, 1.22, 1.33, 1.35, 1.36, 1.382221122210: HH解解: :设两台自动机床的方差分别为设两台自动机床

27、的方差分别为在在 =0.1=0.1下检验假设下检验假设: : ,2221 )7 , 9(/22212221FSSF 取统计量取统计量其中其中 为两样本的样本方差为两样本的样本方差2221,SS)7 , 9(21 FF回绝域为回绝域为 W:W:或或)7 , 9(2 FF 由样本值可计算得由样本值可计算得F F的实测值为的实测值为: :68. 3)7 , 9()7 , 9(05. 02 FF 查表得查表得)7 , 9()7 , 9(95. 021FF 304. 029. 3/1)9 , 7(/105. 0F由于由于 0.3041.513.68, 故接受故接受H0 .)7 , 9(21 FF回绝域为

28、回绝域为 W:W:或或)7 , 9(2 FF F=1.51接受域置信区间1假设检验区间估计统计量 枢轴量对偶关系同一函数二、置信区间与假设检验之间的关系二、置信区间与假设检验之间的关系假设检验和区间估计假设检验和区间估计, 1 1.假设假设 是是 的的100( )的置信区间,的置信区间, 0100 HH :的的双双边边检检验验:对对显显著著性性水水平平为为,)时,则接受)时,则接受,(当当00 .00 )时,则拒绝)时,则拒绝,(当当 10)(即即P0100. 2 HH :的的双双边边检检验验:对对显显著著性性水水平平为为. ),若它的接受域为(若它的接受域为( 任意,任意,由由0 1)(得得

29、P, 1 所以所以 是是 的的100( )的置信区间的置信区间. 单侧置信区间与单边假设检验关系类似单侧置信区间与单边假设检验关系类似. 假设检验与置信区间对照假设检验与置信区间对照),(22nzxnzx20znx接受域置信区间检验统计量及其在H0为真时的分布枢轴量及其分布 0 0 2 知) 1 , 0 (0NnXU 2 知) 1 , 0 (0NnXU原假设 H0备择假设 H1待估参数接受域置信区间检验统计量及其在H0为真时的分布枢轴量及其分布原假设 H0备择假设 H1待估参数 0 0 2未知) 1(0nTnSXT 2未知) 1(0nTnSXT)2nstx20tnsx,(2nstx接受域置信区

30、间) 1() 1(,) 1() 1(2122222nsnnsn22202221) 1(Sn检验统计量及其在H0为真时的分布枢轴量及其分布原假设 H0备择假设 H1待估参数 2 02 2= 02 2(未知) 1() 1(22022nSn(未知) 1() 1(22022nSn三、样本容量的选取三、样本容量的选取验法,验法,的某检验问题的一个检的某检验问题的一个检是参数是参数若若定义定义 C)(接受(接受)(0HP 函数,函数,的施性特征函数或的施性特征函数或称为检验法称为检验法OCC.曲线曲线其图型称为其图型称为OC函函数数检检验验法法的的OCZ. 1函函数数检检验验法法的的OCt . 2 样样本

31、本容容量量的的确确定定方方法法单单侧侧检检验验和和双双侧侧检检验验概率论与数理统计概率论与数理统计分布拟合检验分布拟合检验检验的检验的 p 值值 例如,从例如,从1500到到1931年的年的432年间,每年年间,每年迸发战争的次数可以看作一个随机变量,椐统迸发战争的次数可以看作一个随机变量,椐统计,这计,这432年间共迸发了年间共迸发了299次战争,详细数据次战争,详细数据如下如下:战争次数战争次数X01234 22314248154 发生发生 X次战争的年数次战争的年数 总体服从何种实际分布并不知道,要求总体服从何种实际分布并不知道,要求我们直接对总体分布提出一个假设我们直接对总体分布提出一

32、个假设 .一、分布拟合检验一、分布拟合检验 根据泊松分布产生的普通条件,每年迸根据泊松分布产生的普通条件,每年迸发战争的次数,可以用一个泊松随机变量来发战争的次数,可以用一个泊松随机变量来近似描画近似描画 . 即我们可以假设每年迸发战争次即我们可以假设每年迸发战争次数数X近似泊松分布近似泊松分布. 上面的数据能否证明上面的数据能否证明X 具有泊松分布具有泊松分布的假设是正确的?的假设是正确的?问题:问题: 又如,某钟表厂对消费的钟进展准确又如,某钟表厂对消费的钟进展准确性检查,抽取性检查,抽取100个钟作实验,拨准后隔个钟作实验,拨准后隔24小时以后进展检查,将每个钟的误差快小时以后进展检查,

33、将每个钟的误差快或慢按秒记录下来或慢按秒记录下来.问该厂消费的钟的误差能否服从正态分布?问该厂消费的钟的误差能否服从正态分布? 再如,某工厂制造一批再如,某工厂制造一批骰子,声称它是均匀的骰子,声称它是均匀的. 为检验骰子能否均匀,要把骰子实地投为检验骰子能否均匀,要把骰子实地投掷假设干次,统计各点出现的频率与掷假设干次,统计各点出现的频率与1/6的差的差距距. 也就是说,在投掷中,也就是说,在投掷中,出现出现1点,点,2点,点,6点的点的概率都应是概率都应是1/6. 得到的数据能否阐明得到的数据能否阐明“骰子均匀的假骰子均匀的假设是可信的?设是可信的?问题是:问题是:K.皮尔逊皮尔逊人们把它

34、视为近代统计学的开端人们把它视为近代统计学的开端. 处理这类问题的工具是英国统计学家处理这类问题的工具是英国统计学家K.皮尔逊在皮尔逊在1900年发表的一篇文章中引进年发表的一篇文章中引进的所谓的所谓 检验法检验法.2 检验法是在总体检验法是在总体X 的分布未知时,的分布未知时,根据来自总体的样本,检验关于总体分根据来自总体的样本,检验关于总体分布的假设的一种检验方法布的假设的一种检验方法. 2 H0:总体:总体X的分布函数为的分布函数为F(x) 在在F(x)不含未知参数时,可根据样本的不含未知参数时,可根据样本的阅历分布与所假设的实际分布之间的吻合程阅历分布与所假设的实际分布之间的吻合程度来

35、决议能否接受原假设度来决议能否接受原假设. 我们先提出原假设我们先提出原假设:运用运用 对总体分布进展检验时,对总体分布进展检验时,2检验法检验法 在检验假设在检验假设H0时,假设在时,假设在H0下分布类型下分布类型知,但含参数未知,这时需求先用极大似然知,但含参数未知,这时需求先用极大似然估计法估计参数,然后作检验估计法估计参数,然后作检验. 分布律、密度函数分布律、密度函数3.根据所假设的实际分布根据所假设的实际分布,当假设当假设H0为真时,为真时,可以算出总体可以算出总体X的值落入每个的值落入每个Ai的概率的概率pi = P(Ai)1. 将总体将总体X的取值范围分成的取值范围分成k个互不

36、重迭的小个互不重迭的小区间区间,记作记作A1, A2, , Ak .2.把落入第把落入第i个小区间个小区间Ai的样本察看值的个数的样本察看值的个数记作记作fi , f i /n 为为n次实验中次实验中Ai 发生的频率发生的频率. 而而 f 1+ f 2+ + f k 等于样本容量等于样本容量 n. 在在F(x)不含未知参数时,不含未知参数时, 的根本步骤如下的根本步骤如下:2检验法检验法 kiiiinpnpf122)( iipnf 标志着阅历分布与实际分布之间的差别的大小标志着阅历分布与实际分布之间的差别的大小.统计量统计量 的分布是什么的分布是什么?2 在实际分布在实际分布知的条件下知的条件

37、下,npi是常量是常量实测频率实测频率实际概率实际概率为为调调节节系系数数)不不应应太太大大(ikiiiihpnfh 12)( 皮尔逊取皮尔逊取 引进如下检验引进如下检验统计量统计量:iipnh/ 皮尔逊证明了如下定理皮尔逊证明了如下定理:近似服从自在度为近似服从自在度为k-1的的 分布分布.2 2 假设实际分布假设实际分布F(x)中有中有 r 个未知参数,个未知参数,需用相应的估计量来替代,那么当需用相应的估计量来替代,那么当 时,统计量时,统计量 的分布渐近自在度为的分布渐近自在度为k-r-1的的 分布分布.n2 kiiiinpnpf122)( 假设假设n充分大充分大 ,那么当,那么当F(

38、x)不不含参数,含参数,H0为真时,统计量为真时,统计量50 n是是k个近似正态的变量的平方和个近似正态的变量的平方和.kiiiinpnpf122)( 这些变量之间存在着一个制约关系:这些变量之间存在着一个制约关系: kiiiiinpnpfp10)(故统计量故统计量 渐近渐近(k-1)个自在度的个自在度的 分布分布.2 2 在实际分布在实际分布F(x)完全给定的情况下,每个完全给定的情况下,每个pi 都是确定的常数都是确定的常数. 由棣莫佛拉普拉斯中心由棣莫佛拉普拉斯中心极限定理,当极限定理,当n充分大时,充分大时, fi 渐近正态,渐近正态,因此因此 在在F(x)尚未完全给定的情况下尚未完全

39、给定的情况下 每个未知参数用相应的估计量替代,就相每个未知参数用相应的估计量替代,就相当于添加一个制约条件,因此,自在度也随之当于添加一个制约条件,因此,自在度也随之减少一个减少一个. 假设有假设有 r 个未知参数需用相应的估计量个未知参数需用相应的估计量来替代,自在度就减少来替代,自在度就减少r个个.此时统计量此时统计量 渐近渐近(k-r-1)个自在度的个自在度的 分布分布.2 2 假设根据所给的样本值假设根据所给的样本值 X1,X2, ,Xn算得算得统计量统计量 的实测值落入回绝域,那么回绝原的实测值落入回绝域,那么回绝原假设,否那么就以为差别不显著而接受原假设假设,否那么就以为差别不显著

40、而接受原假设.2 得回绝域得回绝域:)1(22 k )1(22 rk (不需估计参数不需估计参数)(估计估计r 个参数个参数) )(22P查查 分布表可得临界值分布表可得临界值2 2 ,使得,使得 根据这个定理,对给定的显著性程度根据这个定理,对给定的显著性程度 , 拟拟合合检检验验法法2 皮尔逊定理是在皮尔逊定理是在n无限增大时推导出来无限增大时推导出来的,因此在运用时要留意的,因此在运用时要留意n要足够大,以及要足够大,以及npi 不太小这两个条件不太小这两个条件. 根据计算实际,要求根据计算实际,要求n不小于不小于50,以,以及一切及一切npi 都不小于都不小于 5. 否那么应适当合并区

41、间,使否那么应适当合并区间,使npi满足满足这个要求这个要求 . 下面检验每年迸发战争次数分布能否下面检验每年迸发战争次数分布能否服从泊松分布服从泊松分布.提出假设,提出假设,H0: X服从参数为服从参数为 的泊松分布的泊松分布 按参数为按参数为0.69的泊松分布,计算事件的泊松分布,计算事件X=i 的的概率概率pi ,=0.69X 将有关计算结果列表如下将有关计算结果列表如下:pi的估计是的估计是,i=0,1,2,3,4!69. 069. 0iepii根据察看结果,得参数根据察看结果,得参数 的极大似然估计为的极大似然估计为 因因H0所假设的实际分布中有一个未知所假设的实际分布中有一个未知参

42、数,故自在度为参数,故自在度为 4-1-1 = 2.iiinpnpf2)(0.1830.376 0.251 1.623x 0 1 2 3 4fi 223 142 48 15 4 0.58 0.31 0.18 0.01 0.02n 216.7 149.5 51.6 12.0 2.16 战争次数战争次数ip ip 14.162.43将将n 5的组予以合并,即将发生的组予以合并,即将发生3次及次及4次次战争的组归并为一组战争的组归并为一组.ip 故以为每年发生战争的次数故以为每年发生战争的次数X服从参数服从参数为为0.69的泊松分布的泊松分布.按按 =0.05,自在度为,自在度为4-1-1=2查查

43、分布表得分布表得2 =5.991)2(205. 0 2 =2.435.991,由于统计量由于统计量2 的实测值的实测值未落入否认域未落入否认域. 奥地利生物学家孟德尔进展了长奥地利生物学家孟德尔进展了长达八年之久的豌豆杂交实验达八年之久的豌豆杂交实验, 并根据并根据实验结果实验结果,运用他的数理知识运用他的数理知识, 发现了发现了遗传的根本规律遗传的根本规律. 下面以遗传学上的一项伟大发现为例,阐下面以遗传学上的一项伟大发现为例,阐明统计方法在研讨自然界和人类社会的规律性明统计方法在研讨自然界和人类社会的规律性时,是起着积极的、自动的作用时,是起着积极的、自动的作用.孟德尔孟德尔子二代子二代子

44、一代子一代黄色纯系黄色纯系绿色纯系绿色纯系他的一组察看结果为:他的一组察看结果为:黄黄70,绿,绿27近似为近似为2.59:1,与实际值相近,与实际值相近. 根据他的实际,子二代中根据他的实际,子二代中, 黄、绿之比黄、绿之比 近似为近似为3:1, 由于随机性,察看结果与由于随机性,察看结果与3:1总有些差总有些差距,因此有必要去调查某一大小的差别能否距,因此有必要去调查某一大小的差别能否已构成否认已构成否认3:1实际的充分根据,这就是如实际的充分根据,这就是如下的检验问题下的检验问题.这里这里 n=70+27=97, k=2,检验孟德尔的检验孟德尔的3:1实际实际:提出假设提出假设 H0: p1=3/4, p2=1/4实际频数为:实际频数为: np1=72.75, np2=24.25实测频数为实测频数为70,27.2 由于统计量由于统计量的实测值的实测值2122)(iiiinpnpf 统计量统计量) 1 (2 自在度为自在度为k-1=12 =0.41581.96要检验假设要检验假设H0: 0; H1: 0取检验统计量为取检验统计量为nXU 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论