概率统计-假设检验_第1页
概率统计-假设检验_第2页
概率统计-假设检验_第3页
概率统计-假设检验_第4页
概率统计-假设检验_第5页
已阅读5页,还剩132页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一节 假设检验问题 第二节 正态总体均值的假设检验 第三节 正态总体方差的检验 第四节 大样本检验法 第五节 假设检验的两类错误 第六节 非参数假设检验 第八章第八章 假设检验假设检验第一节 假设检验问题 前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题假设检验.在参数估计中我们按照参数的点估计方法建立了参数 的估计公式,并利用样本值确定了一个估计值 ,认为参数真值 。由于参数 是未知的, 只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、

2、 统计假设 某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( )。某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?2,请看以下几个问题:问题问题1 引号内的命题可能是真,也可能是假,只有通过验证才能确定。如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题。10101010若用H0表示“ ”,用H1表示其对立面,即“ ”,则问题等价于检验H0: 是否成立,若H0不成立

3、,则H1: 成立。 一架天平标定的误差方差为10-4(克2),重量为的物体用它称得的重量X服从N( )。某人怀疑天平的精度,拿一物体称n次,得n个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(克2)”这个命题是否成立? 2,问题224210记H0: =10-4,其H1: 。则问题等价于检验H0成立,还是H1成立。 某种电子元件的使用寿命X服从参数为 的指数分布,现从一批元件中任取n个测得其寿命值(样本)如何判定“元件的平均寿命不小于5000小时”这个命题是否成立? 记500010H50001:1H问题3则问题等价于检验H0成立,还是H1成立。 某种疾病,不用药时其康复率为 ,现发

4、明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?0记00:H01:H问题4则问题等价于检验H0成立,还是H1成立。 自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5XH :0XH :1记 服从指数分布, 不服从指数分布。则问题也等价于检验H0成立,还是H1成立。在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问

5、题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。在总体的概率分布已知情形下,对分布中的未知参数作假设并进行检验,称为参数假设检验若总体的分布未知,对总体的分布形式或参数作假设并进行检验,称为非参数假设检验。如上述问题14为参数假设检验问题,问题5为非参数假设检验问题.值得注意的是,当给定原假设后,其对立假设的形式可能有多个,如H0: 其对立形式有 010:H02:H03:H 在假设检验问题中,常把一个被检验的假设称为原假设原假设或零假设零假设,而其对立面就称为对立假设对立假设。上述各问题中,H0为原假设,H1为对立假设。当H0不成立时,就拒绝接受H0而接受其对立假设H1。

6、选择哪一种需根据实际问题确定,因而对立假设往往也称为备选假设备选假设,即在拒绝原假设后可供选择的假设.在假设检验问题中,必须同时给出原假设和对立假设.在参数假设中,不论是原假设还是对立假设,若其中只含有一个参数值,则称为简单假设简单假设,否则称为复合假设复合假设,如H0: , H1: 为简单假设;而H0: , H1: 为复合假设。0000二、假设检验的思想方法 如何利用从总体中抽取的样本来检验一个关于总体的假设是否成立呢?由于样本与总体同分布,样本包含了总体分布的信息,因而也包含了假设H0是否成立的信息,如何来获取并利用样本信息是解决问题的关键.统计学中常用“概率反证法”和“小概率原理”来解决

7、这个问题。小概率原理概率很小的事件在一次试验中不会发生.如果小概率事件在一次试验中竟然发生了,则事属反常,定有导致反常的特别原因,有理由怀疑试验的原定条件不成立。概率反证法欲判断假设H0的真假,先假定H0真,在此前提下构造一个能说明问题的小概率事件A。试验取样,由样本信息确定A是否发生,若A发生,这与小概率原理相违背,说明试验的前定条件H0不成立,拒绝H0,接受H1;若小概率事件A没有发生,没有理由拒绝H0,只好接受H0。 反证法的关键是通过推理,得到一个与常理(定理、公式、原理)相违背的结论。“概率反证法”依据的是“小概率原理”。那么多小的概率才算小概率呢?这要由实际问题的不同需要来决定。以

8、后用符号 记小概率,一般取 等。在假设检验中,若小概率事件的概率不超过 ,则称 为检验水平检验水平或显著性水平显著性水平。1 . 0 ,05. 0 ,01. 0 已知某炼铁厂的铁水含碳量XN(4.55,0.06),现改变了工艺条件,又测得10炉铁水的平均含碳量 ,假设方差无变化,问总体的均值 是否有明显改变?(取 =0.05) 57. 4x下面举例说明以上检验的思想与方法。例1则 与4.55应很接近事件 较大,待定)不太可能发生0(|55. 4:|ddXA解55. 455. 4由问题提出假设H0: ,H1:若H0成立由于 未知X用其无偏估计 来代替|55. 4|X用 来衡量 与4.55之间的差

9、异|55. 4|X如果 较大55. 4则可认为所以在H0成立的前提下即P(A)很小令P(A)=,确定d是解决问题的关键由此确定了小概率事件2|:|uUA),(2nNX) 1 , 0(/NnX由 可知) 1 , 0(/55. 4NnXU因此在H0成立的前提下,统计量ndUdX/|55. 4|显然ndUPndUPdXP/2/|)|55. 4(|因此2/ndUP即2/und由标准正态分布上分位点的定义可知054.110/06.055.457.4/55.4nxu96. 1025. 02uu由 =0.05,得 2|uu 由于说明小概率事件A未发生,因此接受假设H0即认为总体均值 等于4.55在随机试验中

10、,小概率事件有许多,关键是要找一个能说明问题的小概率事件。由P(A)= 同样可确定ddXA|55. 4:|本例中,若取最后的检验将出现这样一种倾向0:4.55H越与4.55接近,越要拒绝这样的判别方法显然不合理,错误在于:在H0成立的前提下,这样取小概率事件A不合理。1102(,)|Dxxuu在本例中,若设D则A:( X1,X2,X10)D是使小概率事件A发生的所有10维样本值(x1,x10)构成的集合10RD则拒绝接受H0等价于0H一般,若拒绝接受其中D是n维空间Rn中的区域,则称D为假设H0的拒绝域或否定域、临界域DRDn称D的补集 为H0的接受域检验中所用的统计量称为检验统计量D样本观测

11、值(x1,x2,x10) D样本观测值(x1,x2,xn)执行统计判决:求统计量的值,并查表求出有关数据,判断小概率事件是否发生,由此作出判决提出假设:根据问题的要求,提出原假设H0与对立假设H1,给定显著水平 及样本容量n。总结例8.1处理问题的思想与方法,可得处理参数假设检验问题的步骤如下:(1)(2)(3)确定拒绝域:用参数的一个好的估计量 (通常取为 的无偏估计)来代替 ,分析拒绝域D的形式,构造检验统计量g( ),在H0成立的前提下确定g( )的概率分布,通过等式 确定D ),(1DXXPn其中确定拒绝域是关键.拒绝域的形式一般由原假设与对立假设共同确定,对同一原假设H0,不同的对立

12、假设,所得到的H0的拒绝域可能不同。请看下例。例2数据同例8.1,问总体的均值 是否明显大于4.55?在统计学中,只有当 与4.55的偏差大到一定程度时才可认为X55. 4在本例中,拒绝H0时接受的是 ,因而H0的拒绝取为 较合理55. 4:1HdX55. 401:4.55,:4.55HH此问题的合理假设为解X的无偏估计 是 的一个很好的近似值X用代替55. 4在例8.1中,拒绝H0时接受的是H1:两个数的偏差用其差的绝对值来衡量dX|55. 4|因而其拒绝域设为较合理与例8.1中的拒绝域 不同2|uu ndUPdXP/)55. 4(und/054. 1/06. 055. 457. 4/55.

13、 4nnxu645.105.0 u:4.55A Xd在H0成立的条件下,事件发生的概率应很小).1 , 0(/55. 4NnXU设P(A)= ,统计量由得uu 所以拒绝域为所以判决结果为:接受H0三、 参数假设检验与区间估计的关系 nRD 参数的区间估计则是找一个随机区间I,使I包含待估参数 是个大概率事件参数假设检验的关键是要找一个确定性的区域(拒绝域),使得当H0成立时,事件DXXn ),(1是一个小概率事件一旦抽样结果使小概率事件发生,就否定原假设H0对此两类问题,都是利用样本对参数作判断:一个是由小概率事件否定参数 属于某范围,另一个则是依大概率事件确信某区域包含参数 的真值.两者本质

14、上殊途同归,一类问题的解决,导致解决另一类问题类比方案的形成。2unx20|unx20|unx为 的置信区间1),(2NX如设总体已知,给定容量n的样本则参数 的置信度为x1样本均值为的置信区间为0100:,:HH假设检验问题的拒绝域为接受域为时,接受20unx00:H也就是说,当2unx即 在区间内,此区间正是 的置信度习题811何谓统计假设、复合假设?2试述普通反证法与概率反证法的异同点。3试述检验统计假设的步骤。4设总体 , 为未知参数, 为其一个样本,对下述假设检验问题 取拒绝域为: 试求常数c,使得该检验的显著水平为0.05。 )9 ,(NX),.,(2521XXX0100:,:HH

15、.: ),.(0252, 1cxxxxC第二节 正态总体均值的假设检验 本节讨论有关正态总体的均值与方差的假设检验问题构造合适的检验统计量并确定其概率分布是解决检验问题的关键2若检验统计量服从标准正态分布( 分布,F分布)则所得到的相应检验法称为2U检验法( 检验法,F检验法)一、 U检验法(方差已知) 001:H011:H002:H012:H003:H013:H在方差已知的条件下,对一个正态总体的均值或两个正态总体均值差的假设检验常用U检验法。若X1,X2,Xn为取自总体X的样本),(2NX2设总体已知,给定显著水平 检验以下不同形式的假设问题:下面我们来求H03的拒绝域前两个为简单假设检验

16、问题,我们已在例8.1及例8.2中求出其拒绝域分别为2|uu uu 和nxu/0其中(1))1 ,0(/NnxknnXPknXP/00knXP/10kxH03的拒绝域形式为knx/0等价形式为 (k待定)00若H03成立,则knXP/要控制knXP/只需令uk 由此得nxu/0此处uu 所以H03的拒绝域为(2)012002:,:HH013003:,:HH比较两种假设检验问题:可以看出尽管两 者原假设形式不同,实际意义也不一样,但对于相同的显著水平,它们的拒绝域是相同的。因此,遇到H03与H13的检验问题,可归结为H02与H12来讨论。对于后面将要讨论的有关正态总体的参数假设检验问题也有类似结

17、果下面求两个正态总体均值差检验的拒绝域。),(211NX),(222NY设总体2122X与Y相互独立 已知从两总体中分别取容量为n1、n2的样本XY用 、 分别表示样本均值给定显著水平210:H211:H检验假设12XY的无偏估计分别为kyx|显然,H0的拒绝形式应为 (k待定)) 1 , 0()()(22212121NnnYX由于)1 ,0(222121NnnYXU若H0真,则统计量由222121/|)|(|nnkUPkYXP得2221212nnuk拒绝域为2222121/|unnyxu(3)例例1 一种燃料的辛烷等级服从正态分布 ,其平均等级 ,标准差 。现抽取25桶新油,测试其等级,算得

18、平均等级为97.7。假定标准差与原来一样,问新油的辛烷平均等级是否比原燃料的辛烷平均等级偏低?( )),(2N0 .988 . 005. 00 .98:00H01:H解解 按题意需检验假设) 1 , 0(/0NnXU检验统计量uU拒绝域(参阅表81)645. 105. 0uu查正态分布表得875. 125/8 . 00 .987 .97/0nxu计算统计值uu645. 1875. 1执行统计判决故拒绝H0,即认为新油的辛烷平均等级比原燃料辛烷的平均等级确定偏低。00:H01:H二、 T检验法(方差未知) 22),(NX设总体未知对显著水平 检验假设拒绝域形式kx|0(k待定)注意到S2是 的无

19、偏估计,用S代替22nX0由于 未知,现在不能用 来作为检验统计量nSXT/0采用作为检验统计量) 1(ntT当H0真时,nSkTPkXP/|)|(|0由)1(2/ntnsk得)1(/|2/0ntnsxt所以拒绝域为(4)0100:,:HH类似可给出假设)1(/0ntnsxt的拒绝域为(5)),(2N对正态总体关于 的各种形式的假设检验的拒绝域列于表81。 例例2一手机生产厂家在其宣传广告中声称他们生产的某种品牌的手机的待机时间的平均值至少为71.5小时,一质检部门检查了该厂生产的这种品牌的手机6部,得到的待机时间为 69,68,72,70,66,75 设手机的待机时间 ,由这些数据能否说明其

20、广告有欺骗消费者之嫌疑?( )),(2NX05.05 .71:0H5 .71:1H解解 问题可归结为检验假设2由于方差 未知,用T检验。)1(/0ntnSXT检验统计量) 1(/0ntnsxt拒绝域70 x102s162. 1t计算统计值015. 2) 5() 1(05. 0tnt查t分布表,得) 1(015. 2162. 1ntt统计判决故接受H0,即不能认为该厂广告有欺骗消费者之嫌疑下面求两个正态总体均值相等性检验的拒绝域。),(),(222211NYNX设总体22221独立 未知YX,X1,Xn1取自总体XX21S样本方差为其样本均值为Y1,Yn2取自总体YY22S其样本均值为 ,样本方

21、差为210:H211:H给定显著水平,检验假设) 2(11)()(212121nntnnSYXw2) 1() 1(212222112nnSnSnSwkyx|拒绝域形式为(k待定)由第六章第四节例2的结果知:) 2(112121nntnnSYXTw当H0成立时,统计量2111nnSkTPkYXPaw由) 2(1121221nntnnSkaw得例例3 对用两种不同热处理方法加工的金属材料做抗拉强度试验,得到的试验数据如下: 方法:31,34,29,26,32,35,38,34,30,29,32,31 方法:26,24,28,29,30,29,32,26,31,29,32,28 设两种热处理加工的金

22、属材料的抗拉强度都服从正态分布,且方差相等。比较两种方法所得金属材料的平均抗拉强度有无显著差异。( ) 05. 0),(),(2221NN解解 记两总体的正态分布为211210:,:HH本题是要检验假设2111nnSYXTw检验统计量为) 2(11|21221nntnnSyxtw拒绝域为1221nn75.31x67.28y25.112) 1(211Sn64.66) 1(222 Sn85. 2wS647. 26185. 2|67.2875.31|11|21nnSyxtw计算统计值074. 2)22() 2(025. 0212tnnt查t分布表,得) 2(|212nntt统计判决:由于故拒绝H0即

23、认为两种热处理方法加工的金属材料的平均抗拉强度有显著差异。第三节 正态总体方差的检验 2S),(2NX2,设总体未知,样本方差为给定显著性水平 ,检验假设20212020:HH2的无偏估计为 ,2S0H202S若 成立,则比值 一般来说应在1附近摆动。若 与1的偏差较大,则拒绝 202S0H所以可取拒绝域形式为:1202kS2202kS或) 1() 1(22022nSn0H当 成立时,统计量22021202kSkSP或设 2212) 1() 1(knPknP为计算方便,将 偏大或偏小的概率看作相等202S令2) 1() 1(2212knPknP由此得1) 1(2/121nnk1) 1(2/22

24、nnk拒绝域为:) 1() 1(2/122022nSn) 1(2/22n或习题821已知某炼铁厂的铁水含量在正常情况下服从正态分布N(4.55,10.82),现在测了5炉铁水,其含碳量为 4.28, 4.40, 4,42, 4.35, 4.37 若方差没有变,问总体均值是否有显著变化?( ) 05. 02有一种新安眠剂,据说在一定剂量下能比某种旧安眠剂平均增加睡眠时间3小时.为了检验新安眠剂的这种说法是否正确,收集到一组使用新安眠剂的睡眠时间(单位:小时): 26.7, 22.0, 24.1, 21.0, 27.2, 25.0, 23.4 根据资料用某种旧安眠剂时平均睡眠时间为20.8小时,假

25、设用案眠剂后睡眠时间服从正态分布,试问这组数据能否说明新安眠剂已达到的疗效?( ) 05. 03某单位上年度排出的污水中,某种有害物质的平均含量为0.009%,污水经处理后,本年度抽测16次,得这种有害物质的含量(百分比)为 设有害物质含量服从正态分布,问是否可认为污水经处理后,这种有害物质的含量有显著降低?( )0.008,0.007,0.006,0.008,0.009,0.007,0.004,0.007,0.003,0.009,0.010,0.005,0.007,0.009,0.011,0.008,1 .04某弹壳直径 ,规定标准为 (毫米), (毫米)。某车间新生产一批这种弹壳,已知这批

26、弹壳直径的方差为标准值,但其均值未知,为了检验这批弹壳是否符合要求,抽测9枚弹壳,得直径数据为(单位:毫米): 试在水平 之下,检验这批弹壳是否合格。),(2NX809. 07.947.917.937.927.927.937.907.947.9205. 05如果一个矩形的宽与长之比等于0.618,称这样的矩形为黄金比矩形,这种矩形给人良好的感觉,现代的建筑物构件(如窗架)、工艺品(如图片镜框),甚至司机的驾驶执照、商品的信用卡等都常常采用黄金比矩形.下面列出某工艺品工厂随机抽取的20个矩形的宽与长之比: 设这一工厂生产的矩形的宽与长的比值总体服从正态分布 ,试检验 H0:=0.618, 0.9

27、33,0.576,0.844,0.570,0.553,0.609,0.601,0.668,0.606,0.611,0.628,0.690,0.606,0.615,0.672,0.662,0.670,0.654,0.749,0.693,),(2NX)05. 0.(618. 0:1H6对某种物品在处理前与处理后取样分析其含脂率如下: 假定处理前后含脂率都服从正态分布,且它们的方差相等,问处理后平均含脂率有无显著降低?( ) 0.120.200.080.040.190.240.240.070.000.130.15处理后处理后0.270.300.120.080.420.660.300.210.180.

28、19处理前处理前05. 07从两处煤矿各取一样本,测得其含灰率分别为 设矿中含灰率服从正态分布,问甲、乙两矿煤的含灰率有无显著差异?( )16.720.216.918.2乙矿乙矿17.421.323.720.824.3甲矿甲矿05. 08为了鉴定两种工艺方法对产品某性能指标影响是否有差异,对9批材料分别用两种工艺进行生产,得到该指标的9对数据如下: 假定两种工艺方法生产的产品的性能指标致差服从正态分布.根据这些数据能否判定不同工艺对产品的该性能指标影响有显著差异?( )0.890.770.680.590.780.320.520.210.101.000.900.800.700.600.500.4

29、00.300.2005. 09甲、乙两种稻种,为比较其产量,分别种在10块试验田中,每块田甲、乙稻种各种一半。假定两稻种产量之差服从正态分布,最后获得产量如下(单位:公斤): 问两种稻种产量是否有显著差异?( )125133115130131128140115118135乙种乙种141144135140148145140136137140甲种甲种10987654321编号编号05. 010某食品厂生产袋装食品中含有致癌物质亚硝基二甲胺(NDMA),该厂开发了一种新生产工艺,下面给出了新老工艺下NDMA的含量(以10万份中的份数计):设新老工艺下NDMA的含量服从正态分布试检验假设3101230

30、12212新工艺新工艺476465565546老工艺老工艺)05. 0(),(21N),(22N2:120H2:121H第四节 大样本检验法 在前面讨论的所有假设检验问题中,我们都已知有关统计量的分布,并由此确定拒绝域。但在许多问题中,很难求得检验统计量的分布,有时即使能求出,使用上也很不方便(如二项分布参数p的检验问题)实际应用中往往求助于统计量的极限分布.若抽取大量样本(大样本),并用检验统计量的极限分布来近似作为其分布,由此得到的检验方法称为大样本检验法。现从每一总体中各取一样本,其样本容量、样本均值、样本方差分别记为一、两总体均值差的大样本检验 210:H212:H设有两个独立总体X,

31、Y,其均值和方差分别为122122并且n1、 n2很大。给显著水平检验假设X21S1nY22S2n若两总体均为正态分布,由6.2.1的讨论知2221,当 已知时,可用U检验法来检验;22212221,当 未知但 时,可用T检验法来检验此处总体分布未知,即使总体为正态分布,因而也不能用T检验。下面我们用大样本方法给出此假设的近似检验法。未知且 与 不一定相等21222221,由于)1 , 0(11NnX近似2222,nNY近似当n1很大时,由中心极限定理知1211,nNX近似即同理,当n2很大时用 代替 ,用 代替21S2122S22YX ,) 1 , 0(/)()(22212121NnnYX近

32、似由于 独立所以2221,SS2221,分别是 的很好近似值仍有2222121/|unSnSyxu由此可得拒绝域为) 1 , 0(/)()(22212121NnSnSYXU近似(n1,n2很大) (89) 设P(A)=p,在n次独立试验中事件A发生的次数为X则 XB(n, p)给定显著水平检验假设H0:p = p0 H1:p p0 (0p01,p0已知)否则发生次试验中第, 0, 1AiXi设则X1,X2,Xn独立,且都服从参数p的(0-1)分布,X=X1+X2+Xn由中心极限定理,当 时,n) 1 , 0()1 (NpnpnpXDXEXX当H0真,且n很大时,upnpnpxu)1 (000由

33、此可得拒绝为) 1 , 0()1 (000NpnpnpXU近似(810)1从一大批产品中任取100个,得一级品60个,记p为这一大批产品的一级品率,试在水平 下检验假设05. 06 .0:,6 .0:10pHpH习题8-42为了比较两种子弹A、B的速度(单位:米/秒),在相同条件下进行速度测定。算得样本平均值及标准差为 试用大样本方法检验这两子弹的平均速度有无显著差异。 ( )S2=105.00n2=110子弹子弹BS1=120.41n1=110子弹子弹A05. 0第五节 假设检验的两类错误 用概率反证法检验一个假设的推理依据是小概率原理在一次抽样中,若小概率事件发生了,则拒绝原假设;若小概率

34、事件没有发生,拒绝原假设的理由不充分,因而只好接受原假设。这样的检验结果可能出现以下两种类型的错误。一、犯两类错误的概率P(拒绝H0|H0真)=P(小概率事件) (8-12)第第类错误类错误(弃真)当原假设H0真时,抽样结果表明小概率事件发生了,按检验法将拒绝H0,这样就犯了所谓“弃真”的错误。给定显著水平 ,由于所以弃真概率不超过显著水平弃真概率为P(拒绝H0 | H0真) (8-11)第第类错误类错误(取伪)当H0假时,抽样结果表明小概率事件没有发生,按检验法将接受H0,这样就犯了所谓“取伪”的错误。取伪概率为P(接受H0 | H1真) (8-13)例例1 设总体 , 未知,求关于假设的U

35、检验法的两类错误概率。),(2NX200:H01:HnXU/0解解 检验统计量20|unxu拒绝域2u弃真概率P(拒绝H0|H0真)=P(|U| )= 20unnXP) 0(022unXuP)()(22uu2u取伪概率P(拒绝H0|H0真)=P(|U| |H1真),0n0其中的真值二、两类错误概率的控制 前面我们处理参数假设检验问题时,实际上只考虑了控制第I类(弃真)错误概率不超过显著水平 。在一些实际问题中,如果错误地接受了某个假设可能造成重大损失或由此带来灾难性的结果,因而在接受这类假设时要特别慎重,也就是要控制第类(取伪)错误概率。自然希望选择一个优良的检验方法,使得出现两类错误的概率都

36、很小。定义定义 若 是 参数的某检验问题的一个检验法,当H0假时,1- 表示取伪的概率)(将两类错误概率用统一的函数表示出来:P)(拒绝H0 (814))(称 为检验法 的功效函数)(当H0真时, 表示弃真的概率一个优良的检验法 ,应使 在H0真时尽可能小,在H0假时尽可能大。)(这两方面的要求是矛盾的,正如在区间估计问题中,“置信度高”与“估计精确”是矛盾的。那里,我们采用在保证一定的置信度下使区间长度尽可能小的原则。选择一种优良检验的策略思想与此类似,即先保证弃真的概率不超过指定值 ,再设法控制取伪概率。)|(|2uUP)|(|12UUP)()(122uu为便于说明,继续例8.9的讨论。检

37、验的功效函数P)(拒绝H0)(0n其中取伪概率(记为 ))(h)(弃真概率)()()()(122huu(8-15)22222)(exp2)(exp21)(uuh由于1)()(22maxuuh00)(h当 时00)(h当 时0)(h当 时取最大值当 与 的偏差越大,取伪的概率越小;0此时, 越小, 越大,见图81 当 与 非常接受时,取伪的概率几乎等于10其含义为:由此可知,当 与n都给定时不可能同时控制两类错误概率都很小下面先控制弃真的概率为再来考虑如何减小取伪概率0)(limh由于)()(1h要控制取为伪概率( 很小)|0n只要使足够大|有两种方法可使 增大(1)减小试验误差;(2)取样本数

38、目n很大。在实际中,试验误差不可能无限小,因而一般采用加大样本容量n的方法来控制取伪概率,但这是以消耗大量人力、物力、财力为代价的。在实际应用中,要根据“弃真”或“取伪”所造成的有害程度来确定 、 的值。习题851设总体服从 ,给定显著水平 ,用U检验法来检验假设 ,若 ,参数 的真值为1.3。试求: 当样本容量n=25时,此U检验法犯第二类错误的概率; 若要求犯第二类错误的概率不超过0.1,样本容量应至少取为多大?)1 ,(N05. 00100:,:HH9 . 002设总体服从参数为 的泊松分布,参数未知,(X1,X2,X20)为其一个样本,对下述假设检验问题 取拒绝域为:C=(x1,x2,

39、x20):x1+x2+x20=0)求犯第一类错误与第二类错误的概率。1 . 0:, 2 . 0:10HH第六节 非参数假设检验 前面我们讨论了参数假设检验问题,所检验的对象是总体分布中的未知参数,而总体分布函数的函数形式是已知的.若总体分布未知,对总体分布或有关参数所作的检验称为非参数假设检验本节将讨论几种重要的非参数检验问题一、分布拟合检验 问题问题对某对象(产品、元件,农作物等)的某特性指标进行测试,获得一大批实验数据,如何利用这些数据(样本)确定此指标(总体)的概率分布要解决此问题,一般需要做以下两方面的工作用极大似然估计法求出 的估计值k,1 k,1 第一步拟合总体分布形式如果事先没有

40、任何关于总体分布的经验或依据,对连续型总体,一般先把抽样所获得的数据进行整理,然后作出样本分组频数分布直方图.),(10kxF 由此确定总体分布函数形式k,1 其中是未知参数),(210kxF 从而猜测总体的分布函数为),()(:100kxFxFH ),()(:101kxFxFH 第二步 拟合好坏的检验设总体的真实分布为F(x),给定显著水平及样本观测值x1,x2,xn,检验假设1样本频率分布直方图第六章已经介绍了直方图及其作法,为这里的讨论方便起见,对此再作一些介绍设总体X为连续型,下面利用样本数值来拟合总体分布密度函数f(x)根据样本值的情况,将其分为l组,各组范围为,),),12110l

41、laaaaaa laaaa210其中),1iiiaaXA记nmfiiiiaaidxxfp1)(li,2, 1 lllmmmaaaaaa,),),),2112110mi=落在ai-1,ai)内的样本数,则事件Ai发生的频率为Ai发生的概率为作表此表称为样本分组频数分布表1iiiaaf在每个区间ai-1,ai)上,以此区间为底,以为高作一矩形(i=1,2,l),这样的图形称为样本组频率分布直力图,见图8.2iiaaiidxxfpf1)(因而每个小区间上的小矩形的面积接近于概率密度曲线之下该区间之上的曲边梯形的面积一般来说,n越大且分组越细,则直方图的外廓曲线越接近于总体的概率密度曲线对离散型总体,

42、虽然不能画样本分组频率直方图,但仍可给出样本分组频数分布表第i个小区上矩形的面积为 ,由大数定律可知,当n很大时,频率接近于概率if2拟合优度检验要检验假设H0,必须利用样本建立用以衡量F(x)与F0(x)差异的统计量这种统计量有多种选择,下面介绍皮尔逊(Person)2检验法在H0为真的前提下,事件Ai的概率为),(),(10110kikiixFxFp npi称为事件Ai的理论频数,作表 lllnpnpnpaaaaaa,),),),2112110此表称为分组理论频数分布表它与样本分组频数分布表的差异反映了F(x)与F0(x)的差异用统计量liiiinpnpm122)((8-16)来衡量 皮尔

43、逊证明了以下定理显然,H0的拒绝域形式为k2(k待定)若n很大( ),则当H0成立时,50n) 1(22 kl近似定理定理于是得到H0的拒绝域为2皮尔逊 检验法是基于上述定理得到的)1(22kl(8-17)5inp在使用时必须注意n要足够大,以及每个否则应适当合并组,以满足这一要求。例例1 自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,统计如下: 试检验相继两次地震间隔的天数服从指数分布。( ) 86681017263150出现的频数震间隔天地403539303425292024151910145904相继两次地05. 00, 00,)(

44、)(:00 xxexfxfHr)()(:01xfxfH0726.02231162/1X由于总体为连续型,我们将X的可能取值的区间 分为9个互不重叠的小区间),09,.,2,1),1iaaii解解 按题意需检验假设由于 未知,先用极大似然估计求得 的估计为0, 00,1),(0726. 00 xxexFx)(1iiiaXaA取9, 2 , 1)()()(100iaFaFAPpiiii若H0真,则计算结果列于表8.25inp有些组的5inp应适当合并组,使每组均有 如第四列花括号所示。并组后的组数l=8。 0.56330.04610.78080.05688A9:39.5x 0.2486A8:34.

45、5x39.50.00690.20045.79960.03586A7:29.5x34.50.0126-0.32688.32680.05148A6:24.5x29.50.3248-1.971811.97180.073910A5:19.5x24.50.0024-0.204417.20440.106217A4:14.5x19.50.06441.262624.73740.152726A3:9.5x14.50.5884-4.575235.57520.219631A2:4.5x9.50.51754.834445.16560.278850A1:0 xyi时,取“+”号;当xi S0.05(9) 故接受H0即认

46、为播放音乐对生产率没有显著影响 2秩和检验)()(:210yFxFH)()(:211yFxFH从两总体X,Y中分别取容量为n1,n2的样本检验假设将两总体的n1+n2观测值放在一起,按从小到大的顺序排列。若H0成立,则总体X,Y同分布,两总体的观测值应较均匀地分布在此排列中。若分布不均匀,则认为H0不成立如何构造统计量来描述这种均匀性呢?)1)(21212121nnnnRR每个观测值在此排列中的序号称为这个观测值的秩秩若有几个观测值相同,则每个观测值的秩取为这几个数的序号的平均值.求出每个观测值的秩.将属于总体X的样本观测值的秩相加,其和记为R1,称为总体X的样本秩和.同理,将其余观测值的秩相

47、加得总体Y的样本秩和R2.显然,R1,R2为离散型随机变量,且有21nn 设取T=R1为统计量若H0成立,秩和R1一般来说不应取太靠近上述不等式两端的值.因而,当R1的观测值过大或过小时,我们就拒绝H0拒绝域为其中T1,T2可由附表7查得1TT 2TT 或2.363.147.523.482.765.436.547.414.384.256.543.287.216.54试问两总体是否同分布?( )05. 0例例4 设由实验获得,两组样本值,列表如下:解解 采用秩和检验法检验假设)()(:210yFxFH)()(:211yFxFH其中F1(x),F2(y)分别为总体,的分布函数将两组样本观测值混在一

48、起,按从小到大排序,并计算相应的秩,列表如下:编号12345678910111213142.362.763.143.485.436.547.417.523.284.254.386.546.547.21秩1234567891011121314其中观测值6.54出现3次,序号分别为9,10,11因而其秩应为1031110981n62n 统计量491210107642RT12) 1(,2) 1(2121211nnnnnnnNT近似05. 0查秩和检验表(附表7),得由T1=32 T2=5821TTT由于 ,故接受H0 。即认为两组样本对应的总体同分布。10,21nn注意:秩和检验表只列到 的情形当其大于10时,统计量于是可用U检验法求拒绝域。三、独立性检验 在研究随机量的概率性质时,我们常假设两个随机变量独立;在对两个正态总体的参数作有关假设检验时,我们也常假定它们独立.独立性有时从直观上容易判断,但有时很难从直观上判断.如地下水位的变化是否与地震的发生独立,某种疾病是否与性别有关等,需要根据实际观测结果来检验独立性是否成立。这种假设是否合理呢?), 1;, 1(sjrimij 设有两个总体X,Y,给定显著水平检验非参数假设H0:X,Y相互独立将X的所有可能取值分为r个不同组A1,A2,Ar将Y的所有可能取值分为s个不同组B1,B2,Bs对(X,Y)进行n次独立观测jiBYAX,分别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论