第六章) 统计学_第1页
第六章) 统计学_第2页
第六章) 统计学_第3页
第六章) 统计学_第4页
第六章) 统计学_第5页
已阅读5页,还剩104页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第 六六 章章假假 设设 检检 验验 假设检验就是事先对总体参假设检验就是事先对总体参数或总体分布形式作出一个假设,数或总体分布形式作出一个假设,然后利用样本信息来判断假设是然后利用样本信息来判断假设是否合理,即判断样本信息与假设否合理,即判断样本信息与假设是否有显著差异,从而决定应接是否有显著差异,从而决定应接受或否定假设。受或否定假设。假设检验(显著性检验):假设检验(显著性检验): 假设检验包括参数假设检验假设检验包括参数假设检验和非参数假设检验和非参数假设检验 1、参数假设检验:、参数假设检验: 2、非参数假设检验:、非参数假设检验:第一节第一节 假设检验假设检验 的一般问题的一般问

2、题 一、假设检验的基本思想一、假设检验的基本思想是带有概率性质的反证法是带有概率性质的反证法 1、假设检验所采用的逻、假设检验所采用的逻辑推理方法是反证法。辑推理方法是反证法。 2、假设检验的反证法是、假设检验的反证法是带有概率性质的反证法并非严带有概率性质的反证法并非严格的逻辑证明。格的逻辑证明。 二、假设检验的步骤二、假设检验的步骤0H1H1、提出原假设和备择假设、提出原假设和备择假设原假设原假设 :研究者想收集证据予以反研究者想收集证据予以反对的假设对的假设备择假设备择假设 :研究者想收集证据予研究者想收集证据予以支持的假设以支持的假设原假设和备择假设是一个完备事件组,而且相互对立n在一

3、项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)1)提出假设的原则(1)“不轻易拒绝原假设”(3)原假设总是与等号连在一起。(双侧)(2)把所希望证明的假设放在备择假设上。(单侧)【例】【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设【例】【例】

4、某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设【例】【例】一家研究机构估计,某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设假设的三种形式:假设的三种形式:0100:,:HH 1、双侧检验:、双侧检验:00H1H1H左侧检验左侧检验0100:,:HH0H1H0右侧检验右侧检验0100:,:HH0H1H0双侧检验与单侧检验 (假设的形式)假设假设双侧检验双侧检验单侧检验单侧检验

5、左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : : = 0 0H0 : : 0 0H0 : : 0 0备择假设备择假设H1 : : 0 0H1 : : 0 0 2、选择适当的统计量,并确定、选择适当的统计量,并确定其分布形式其分布形式 nsxt03nxZ01nsxZ02 3、选择显著性水平、选择显著性水平 ,确定临,确定临界值界值0H0H1H 显著性水平显著性水平 表示表示 为真时拒绝为真时拒绝 的概率,即拒绝原假设的风险。(的概率,即拒绝原假设的风险。( 总总是与是与 相对应)相对应) 4、作出统计结论、作出统计结论(比较统计量与比较统计量与临界值的大小)临界值的大小) 5、作出经营管

6、理决策结论、作出经营管理决策结论三、假设检验的两类错三、假设检验的两类错误误(一)第一类错误(拒真、弃真错误)(一)第一类错误(拒真、弃真错误) 当原假设当原假设 为真,但由于样本的为真,但由于样本的随机性使样本统计量落入了拒绝区域,随机性使样本统计量落入了拒绝区域,这时所作的判断是拒绝原假设。这类这时所作的判断是拒绝原假设。这类错误称为第一类错误。(错误称为第一类错误。( - 错误)错误)(卖方风险)(卖方风险)0H 原假设原假设 为不真,但由于样本为不真,但由于样本的随机性使样本统计量落入了接受的随机性使样本统计量落入了接受区域,这时所作的判断是接受原假区域,这时所作的判断是接受原假设。这

7、类错误称为第二类错误。设。这类错误称为第二类错误。( )(买方风险)(买方风险)0H错误(二)第二类错误(二)第二类错误接受拒绝正确正确真0H假0H0H0H错误错误两类错误的概率两类错误的概率 的关系的关系和为真为真10HZZPHZZPZ 1、二者互为消长。、二者互为消长。 2、在检验中,对、在检验中,对 的选的选择取决于犯两类错误所要付出的择取决于犯两类错误所要付出的代价。通常的做法是先确定代价。通常的做法是先确定 。和和 3、若要同时减少、若要同时减少 ,或,或给定给定而使而使减少,就必须增大样减少,就必须增大样本容量本容量n。 4、 的大小不仅与临界值有关,的大小不仅与临界值有关,而且还

8、与原假设的参数值而且还与原假设的参数值 与总体参与总体参数的真实值数的真实值 之间的差异大小有关。之间的差异大小有关。此差异越大,此差异越大, 就越小。就越小。0 5、统计学中把、统计学中把(1-) 称为检验称为检验功效。功效。(1-) 较高,意味着检验做较高,意味着检验做得较好。给定得较好。给定的情况下,使的情况下,使最小最小或或 (1-) 最大的检验叫做最佳检验。最大的检验叫做最佳检验。第二节第二节总体均值、比例和方差的总体均值、比例和方差的假设检验假设检验 (一)正态总体、方差已知检验ZNnxZ1 , 00【例】【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml

9、。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?H0 : = 255H1 : 255 = 0.05n = 40临界值临界值96. 101. 14052558 .2550nxz96. 12z 例题例题1: 根据过去大量资料,某根据过去大量资料,某厂生产的产品的使用寿命服从正态分厂生产的产品的使用寿命服从正态分布布 现从最近生产的一现从最近生产的一批产品中随机抽取批产品中随机抽取16件,测得样本平件,测得样本平均寿命为均寿命为1080小时。试在小时。试在0.05的显

10、的显著性水平下判断这批产品的使用寿命著性水平下判断这批产品的使用寿命是否有显著提高是否有显著提高?2100,1020N05. 0645. 1Z0H1H右側检验求小样本方差已知正态总体已知1020:,05.0,1080,16,100,1020:?0 xn 0102010,HH接受拒绝原假设4 . 216100102010800nxZ645. 105. 0Z知由1020:,1020:10HH解645. 1可以认为下即在现有的显著性水平,.显著提高这批产品的使用寿命有 习题习题1: 某工厂对废水进行处理,某工厂对废水进行处理,要求处理后的水中某种有毒物质的浓要求处理后的水中某种有毒物质的浓度不超过度

11、不超过19毫克毫克/立升。现抽取立升。现抽取n=10的样本,得到平均浓度为的样本,得到平均浓度为17.1毫克毫克/立升,假设有毒物质的含量服立升,假设有毒物质的含量服从正态分布,且已知总体方差为从正态分布,且已知总体方差为8.5(毫克毫克/立升立升) ,问在,问在 显著显著性水平下,处理后的水是否合格性水平下,处理后的水是否合格?2005. 019:005. 0, 1 .17,105 . 8,19:?20求已知xnNX0H1H.处理后的废水是合格的58. 2005. 01Z知由19:,19:10HH解06. 2105 . 8191 .170nxZ而58. 2尚不能认为下即在现有的显著性水平,0

12、H不拒绝 Z - 检验1 ,01 ,000NnxZNnsxZ二、大样本【例】【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床 相 比 是 否 有 显 著 降 低 ? (=0.01) 50个零件尺寸的误差数据个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.9

13、51.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86H0 : 1.35H1 : 1.35 = 0.01n = 50临界值临界值58. 26061. 250365749. 035. 13152. 1z58. 21z 例题例题2: 一个生产宇航飞行器的工一个生产宇航飞行器的工厂需要经常购买一种耐高温的零件,厂需要经常购买一种耐高温的零件,要求抗热的平均温度是要求抗热的平均温度是 ,在,在过去,供

14、货商提供的产品都符合要求,过去,供货商提供的产品都符合要求,并从大量的数据获知零件抗热的标准并从大量的数据获知零件抗热的标准差为差为 ,在最近的一批进货中随,在最近的一批进货中随机测试了机测试了100个零件,其平均的抗热个零件,其平均的抗热为为 能否接能否接 受这批产品受这批产品?工厂工厂希望对实际产品符合要求而错误地加希望对实际产品符合要求而错误地加以拒绝的风险为以拒绝的风险为0.05。Co1250C0150C012001250:05. 0,1200,30100,150,1250:?0证明已知xn05. 0645.1)0(120033. 31H0H.,645.110拒收产品不合格接受拒绝HH

15、33.3100150125012000nxZ而645.105.01Z知由1250:,1250:10HH解 习题习题2: 某种导线要求其平均拉力某种导线要求其平均拉力强度为强度为1200公斤,一批产品在出厂公斤,一批产品在出厂时抽取了时抽取了100个作样本,测试结果平个作样本,测试结果平均拉力强度为均拉力强度为1150公斤,标准差为公斤,标准差为230公斤,若以公斤,若以 能否认为这批能否认为这批产品的平均拉力强度低于产品的平均拉力强度低于1200公斤?公斤?005. 01200:005. 0,230,1150,30100,1200:?0求已知sxn0H.58. 20H不拒绝17. 210023

16、012001150:0nsxZ而58. 2005. 01Z知由1200,1200: 10HH解: 习题习题3: 一个食品加工者关心一个食品加工者关心500克的切片菠萝罐头是否装得太克的切片菠萝罐头是否装得太满。质量部门随机抽取了一个容量满。质量部门随机抽取了一个容量为为50的随机样本,发现平均重量是的随机样本,发现平均重量是510克,样本标准差是克,样本标准差是8克。试根据克。试根据5%的显著性水平的显著性水平 检验切片菠萝罐检验切片菠萝罐头是否装得太满?头是否装得太满?500:%5, 8,5103050,500:?0求已知sxn.,可以认为装得太满下即在现有的显著性水平01,HH 拒绝接受6

17、45. 175. 85085005100nsxZ而645. 105. 0Z知由500:,500:10HH解 三、正态总体、方差未知、小样本10ntnsxtt-检验【例】【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求? 10个零件尺寸的长度个零件尺寸的长度 (cm)12.210.812.011.811.912.411.3

18、12.212.012.3H0 : = 12H1 : 12 = 0.05df = 10 - 1 = 9临界值临界值t=2.26222622. 27035. 0104932. 01289.11t 例题例题3: 某厂采用自动包装机分装某厂采用自动包装机分装产品,假定每包产品的重量服从正态产品,假定每包产品的重量服从正态分布,每包标准重量为分布,每包标准重量为1000克。某克。某日随机抽查日随机抽查9包,测得样本平均重量包,测得样本平均重量为为986克,样本标准差为克,样本标准差为24克。试问克。试问在在0.05的检验水平上,的检验水平上, 能否认为这天能否认为这天自动包装机工作正常自动包装机工作正常

19、?1000:;05.0,24,986,3091000,?,1000:?0求已知sxnNX0H1H1H025.02025.022t2t 0986常这天自动包装机工作正拒绝接受.,306. 275. 110HHt 75. 19241000986306. 205. 008025. 012nsxtttn而知由1000:,1000:10HH解 习题习题4:一个:一个 轮胎制造厂声称它轮胎制造厂声称它的轮胎在正常行驶的条件下平均行驶的轮胎在正常行驶的条件下平均行驶里程至少在里程至少在40000公里以上,通常已公里以上,通常已知轮胎在正常行驶的条件下,其行驶知轮胎在正常行驶的条件下,其行驶里程数服从正态分布

20、。某一推销商要里程数服从正态分布。某一推销商要随机抽取随机抽取15个轮胎作试验,经过测试个轮胎作试验,经过测试得到平均行驶里程为得到平均行驶里程为42000公里,标公里,标准差为准差为5000公里,若显著性水公里,若显著性水平平 , 能否从这些样本数据使能否从这些样本数据使该轮胎制造厂的声称得到证实。该轮胎制造厂的声称得到证实。05. 04000040000:05. 0,5000,4200040000,3015,:?0或求已知sxnNX0H0H1H1H.,0证明该制造厂的声称得不到在现有的显著性水平下不拒绝H7613. 1549. 115500040000420007613. 105. 001

21、405. 01nsxtttn而知由 40000:,40000:110HH .,7613. 1549. 115500040000420007613. 105. 040000:,40000:21001495. 01110明该制造厂的声称得到证在现有的显著性水平下拒绝接受而知由HHnsxtttHHn 习题习题5:某乡统计员报告,其乡:某乡统计员报告,其乡平均每个农户的家庭年收入为平均每个农户的家庭年收入为5000元,为核实其说法,县统计局从该元,为核实其说法,县统计局从该乡随机抽取乡随机抽取25户,得到平均年收入户,得到平均年收入为为4650元,标准差为元,标准差为150元,假定元,假定农户的家庭年

22、收入服从正态分布。农户的家庭年收入服从正态分布。试在试在5%的显著性水平的显著性水平 下检验乡统下检验乡统计员报告是否正确。计员报告是否正确。5000:%5,150,4650,3025,5000:?0求已知NXsxn法不正确检验结果乡统计员的说拒绝接受而知由解0112024025. 012107 .112515050004650:064. 2%55000:,5000:HHttnsxtttHHnn 习题习题6: 某厂生产的一种金属线,某厂生产的一种金属线,其抗拉强度的均值为其抗拉强度的均值为10620千克。据千克。据说经过工艺改进后其抗拉强度有所提说经过工艺改进后其抗拉强度有所提高。为检验,从新

23、生产的产品中随机高。为检验,从新生产的产品中随机抽取了抽取了10根,测得平均抗拉强度为根,测得平均抗拉强度为10631千克,标准差为千克,标准差为81千克,设抗千克,设抗拉强度服从正态分布,问:在拉强度服从正态分布,问:在 的显著性水平的显著性水平 下,可否认为抗拉强度下,可否认为抗拉强度比过去提高了?比过去提高了?05. 010620:05. 0,81,10631,10,10620:?0求已知sxNXn.,833. 1429. 010811062010631:833. 105. 010620:,10620:100110有显著提高即可以认为抗拉强度没拒绝接受而知由解HHnsxttHHn 三、总

24、体比例的假设检验 对总体比例的假设检验通常是对总体比例的假设检验通常是在大样本的条件下进行的,根据正在大样本的条件下进行的,根据正态分布来确定临界值,即采用态分布来确定临界值,即采用Z-检检验验法。法。npqpZnpZ0000,1【例】【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平 =0.05和 =0.01 ,检验该杂志读者群中女性的比率是否为80%?它们的值各是多少?H0 : = 80%H1 : 80% = 0.05n = 200临界值临界值(c):96

25、. 1475. 2200)80. 01 (80. 080. 073. 0z96. 12Z 例题例题4: 某研究者估计本市某研究者估计本市居民家庭的电脑拥有率为居民家庭的电脑拥有率为80%。现随机抽查了现随机抽查了200个家庭,其个家庭,其中中168个家庭拥有电脑。试问个家庭拥有电脑。试问该研究者的估计是否可信该研究者的估计是否可信( )?)?%10%80:%10,84. 020016830200%,80:?0求已知pn.:.645. 142. 12002 . 08 . 08 . 084. 01645. 1:%10%80:%,80:0000210的该研究者的估计是可信即不拒绝而知由解HnpZZH

26、H 习题习题7: 某机构声称某机构声称5年来各年来各种新发行债券的承销价高于面值种新发行债券的承销价高于面值的比例没有超过的比例没有超过50%。为检验此。为检验此说法,随机抽选了说法,随机抽选了60只新发行债只新发行债券,其中有券,其中有24只的承销价高于面只的承销价高于面值,试以值,试以 的显著性水平的显著性水平 进进行检验。行检验。10. 0%50:4.060243060%,50:?0求已知pn.,28. 157. 1606 . 04 . 05 . 04 . 0:28. 11 . 0%50:%,50:100110的估计即没有理由怀疑该机构接受拒绝而知由解HHnpqpZZHH 习题习题8:某

27、西红柿酱生产厂向供应:某西红柿酱生产厂向供应商购买一批西红柿,规定若优质西红商购买一批西红柿,规定若优质西红柿的比例在柿的比例在40%以上按一般市场价格以上按一般市场价格收购,若达不到此标准,应低于市场收购,若达不到此标准,应低于市场价格收购,现随机抽取了价格收购,现随机抽取了100个西红个西红柿作检验,只有柿作检验,只有34个优质西红柿,样个优质西红柿,样本比例本比例 因而欲按低于市场价因而欲按低于市场价格收购,但供应商认为样本比例格收购,但供应商认为样本比例 不到不到40%是随机原因引起的,试以是随机原因引起的,试以 的显著性水平的显著性水平 进行检验。进行检验。%34p05. 0%40:

28、34. 030100%,40:?0求已知pn.,645. 124. 110066. 034. 040. 034. 0:645. 105. 0%40:%,40:100110应按市场价格收购拒绝接受而知:由解HHnpqpZZHH 习题习题9:某公司收购一塑料厂生产的:某公司收购一塑料厂生产的防水手套,为了保证质量,允许次品率为防水手套,为了保证质量,允许次品率为10%,双方协议如下:每次收购时,抽样,双方协议如下:每次收购时,抽样检验检验100副手套,规定犯第一类错误的概副手套,规定犯第一类错误的概率为率为9%,当次品率超过临界值时,就要,当次品率超过临界值时,就要拒收。按此协议:拒收。按此协议:

29、 1、假设检验中如何建立原假设和备择、假设检验中如何建立原假设和备择假设假设 2、次品比例拒收的临界值是多少、次品比例拒收的临界值是多少? 3、若有、若有6批产品,它们的次品比批产品,它们的次品比例分别为例分别为12%,25%,8%,16%,24%和和21%,哪些批应该拒收?,哪些批应该拒收? 4、在这样的检验中,什么情况、在这样的检验中,什么情况属于犯第二类错误?属于犯第二类错误? 5、若检验的规则改为检验、若检验的规则改为检验10副副手套,发现次品在两副或两副以上时手套,发现次品在两副或两副以上时拒收,这时犯第一类错误的概率是多拒收,这时犯第一类错误的概率是多少少?%10:%,10:1.,

30、:10HH、所以为右侧检验拒收的次品手套过多时才能包含收购公司只有当样本中解14.0:34.11009.01.01.0,34.109.01009.01.01.012000ppZZZpnpZ得即时拒收当知由、3、12%14% 8%14% 16%14%24%14% 21%14%拒收拒收 4、当、当 10%,而接收时,属于,而接收时,属于犯第二类错误。犯第二类错误。 5、设、设10副手套中次品数为副手套中次品数为X,则,则犯第一类错误的概率是:当犯第一类错误的概率是:当P=0.1时时:2639. 03874. 03487. 01111101291110100010PPCPPCXPXPXP四、正态总体

31、方差的假设检验202120202021202020212020:,:,:,:HHHHHH右侧左侧双侧假设的三种形式: 检验统计量及其分布:检验统计量及其分布:检验22120221nSn 例题:例题:P1206.5 习题习题:某电工器材厂生产一种某电工器材厂生产一种保险丝,保险丝的熔化时间服从保险丝,保险丝的熔化时间服从正态分布,按规定,熔化时间的正态分布,按规定,熔化时间的方差不得超过方差不得超过400。今从一批产。今从一批产品中随机抽取品中随机抽取25个样品,测得熔个样品,测得熔化时间的方差为化时间的方差为410。问在显著。问在显著性水平性水平 0.05条件下,能认为这批条件下,能认为这批产品的方差显著偏大吗产品的方差显著偏大吗?400:05. 0,410,25,400:?2220求已知sn.,415.366 .244004101251:415.3605. 0400:,400:102022212505. 0212120的方差显著偏大没有理由认为这批产品拒绝接受而知由解HHsnHHn第三节第三节 假设检验中的其它问题假设检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论