第5讲假设检验1北京大学医学部,统计学基础,统计学课件_第1页
第5讲假设检验1北京大学医学部,统计学基础,统计学课件_第2页
第5讲假设检验1北京大学医学部,统计学基础,统计学课件_第3页
第5讲假设检验1北京大学医学部,统计学基础,统计学课件_第4页
第5讲假设检验1北京大学医学部,统计学基础,统计学课件_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第 5 5 讲讲 参数参数假设检验假设检验 假设检验是统计推断的另一种方式,它与区间假设检验是统计推断的另一种方式,它与区间 估计的差别主要在于:区间估计是用给定的大估计的差别主要在于:区间估计是用给定的大 概率推断出总体参数的范围,而假设检验是以概率推断出总体参数的范围,而假设检验是以 小概率为标准,对总体的状况所做出的假设进小概率为标准,对总体的状况所做出的假设进 行判断。假设检验与区间估计结合起来,构成行判断。假设检验与区间估计结合起来,构成 完整的统计推断内容。假设检验分为两类:一完整的统计推断内容。假设检验分为两类:一 类是参数假设检验,另一类是非参数假设检验。类是参数假设检验,另

2、一类是非参数假设检验。 本章讨论参数检验方法。本章讨论参数检验方法。 第五讲第五讲 参数假设检验参数假设检验第一节第一节 假设检验的基本思想假设检验的基本思想 一、小概率原理一、小概率原理 二、假设检验的一些基本概念二、假设检验的一些基本概念问题讨论问题讨论某种药物有强烈作用,按规定每片有效成分含某种药物有强烈作用,按规定每片有效成分含量均值为量均值为0.50.5mgmg,标准差为标准差为0.010.01mgmg。假定药片。假定药片有效成分含量服从正态分布。问怎样判断这个有效成分含量服从正态分布。问怎样判断这个厂家的产品是否符合要求?厂家的产品是否符合要求?要解决的问题:是否合格?要解决的问题

3、:是否合格??0.5 ?0.01 有效成分含量为随机变量有效成分含量为随机变量问题问题3 3: 时,能否说明产品不合格?时,能否说明产品不合格?讨论讨论判断方法:抽样判断方法:抽样问题问题1 1 抽样方法?抽样方法?问题问题2 2 样本容量?样本容量?估计估计x s 0.5x 随机抽样模拟随机抽样模拟1 1假设假设: :药品符合要求药品符合要求= =0 0=0.5;=0.5;data a1; n=12;sigma=0.01;mu=0.5;seed=1325; k=20; do j=1 to k; do i=1 to n; x=sigma*rannor(seed)+mu;/*xN(mu,sigm

4、a2)*/ output; end;end;proc means mean; var x; class j; output out=b1 mean=xmean;run;随机抽样模拟随机抽样模拟1 1随机抽样模拟随机抽样模拟2 2假设假设: :药品不符合要求药品不符合要求0 0=0.5;=0.5;8data a2; n=12;sigma=0.01;mu=0.49; seed=1325; k=20; do j=1 to k; do i=1 to n; x=sigma*rannor(seed)+mu;/*xN(mu,sigma2)*/ output; end;end;proc means mean;

5、 var x; class j; output out=b2 mean=xmean;run;随机抽样模拟随机抽样模拟2 2例例5.1 5.1 某种药物有强烈作用,按规定有效成某种药物有强烈作用,按规定有效成分含量为分含量为0.50.5mg/mg/片。今随机抽取某厂生产的这片。今随机抽取某厂生产的这种药品种药品1212片,测得平均有效含量为片,测得平均有效含量为0.49380.4938mgmg。假定药片有效成分含量服从标准差为假定药片有效成分含量服从标准差为0.010.01mgmg的的正态分布正态分布。问这个厂家的产品是否符合要求?。问这个厂家的产品是否符合要求?例例5.15.1解解 该药厂此药

6、品的有效成分含量为该药厂此药品的有效成分含量为X. .考虑两个假设考虑两个假设: :( (a) )该药厂的此药品符合要求该药厂的此药品符合要求= =0 0=0.5;=0.5;( (b) )该药厂的此药品不符合要求该药厂的此药品不符合要求0 0=0.5.=0.5.例例5.15.1样本均值样本均值 与与0.50.5有差异有差异, ,差异产差异产生的两种情形生的两种情形: :0.4938x (1 1)抽样误差抽样误差(2 2) 抽样误差抽样误差0.5 0.5 2(,0.01)0.5/12XN0.450.500.550.60204060801001201400.500.550.602040608010

7、0120140讨论讨论样本均值样本均值 与与0.50.5有差异有差异, ,差异产生的原因差异产生的原因: :x(1 1)标准差为标准差为0.010.01mgmg 随机误差随机误差(2 2)随机抽取随机抽取 抽样误差抽样误差(3 3)0.5 讨论讨论=0.50.5 |0.5|X 小小大大寻找界值寻找界值c0.50.5大大|Xcm m-|Xcm m-(|)cPXmama-常-常一、小概率原理一、小概率原理例例5.1 5.1 某种药物有强烈作用,按规定有效成某种药物有强烈作用,按规定有效成分含量为分含量为0.50.5mg/mg/片。今随机抽取某厂生产的这片。今随机抽取某厂生产的这种药品种药品1212

8、片,测得平均有效含量为片,测得平均有效含量为0.49380.4938mgmg。假定药片有效成分含量服从标准差为假定药片有效成分含量服从标准差为0.010.01mgmg的的正态分布正态分布。问这个厂家的产品是否符合要求?。问这个厂家的产品是否符合要求?(1 1)假设假设=0.50.5(2 2)确定不利于假设)确定不利于假设=0.5 的范围的范围|0.5|Xc- - =0.50.5 |0.5|X 小小大大0.50.5大大(3 3)定义小概率事件)定义小概率事件概率小于概率小于=0.05的事件为小概率事件。的事件为小概率事件。(|)PXca am m-常-常确定确定“界界”的规则:的规则:2XPun

9、 (4)计算)计算“界界c”|0.5|0.050.01120.0112XcP- - = =20.01(,)20.51XN|0.5|0.05P Xc- - = =(0,1)N0.05 21.960.0112cu= = =1.960.01120.0057c= =椿椿(5)根据当前样本数据作推断)根据当前样本数据作推断判定判定=0.50.5不成立不成立, ,即认为即认为0.5.0.5.|0.5| |0.49380.5|0.00620.0057xc- -= =- -= = = =0.0520.50.49380.5| |2.14771.960.010.0112xun-=“反证法反证法” ” + +小概率

10、原理小概率原理矛盾!矛盾!假设假设=0.50.5不成立,不成立,0.50.5。结论结论:理论上:理论上:若假设若假设=0.50.5成立成立事实上事实上:|0.5| |0.49380.5|0.00620.0057xc-=-=事件事件 为小概率事件为小概率事件 0.50.0057Xc- - = =事件事件 不是小概率事件不是小概率事件0.50.0057Xc- - = =二、二、假设检验的一些基本概念假设检验的一些基本概念总体的均数是否等于一个特定的值:总体的均数是否等于一个特定的值:两个总体分布的均数是否相等:两个总体分布的均数是否相等:随机变量随机变量X是否服从二项分布:是否服从二项分布:( ,

11、 )XB n p12m mm m= =0m mm m= =关于总体的种种假设称为关于总体的种种假设称为统计假设统计假设(statistical hypothesis)(statistical hypothesis)1.1.统计假设统计假设 例例12mmmm= =测得测得140140例例3030岁以上的冠心病病人血清胆固醇为岁以上的冠心病病人血清胆固醇为220.7220.742.242.2,另有,另有487487名同龄非冠心病者血清名同龄非冠心病者血清胆固醇为胆固醇为175.4175.430.630.6,想了解冠心病病人的血,想了解冠心病病人的血清胆固醇是否较高?清胆固醇是否较高?12mmmm

12、统计假设统计假设 例例12pp= =某医师研究洛赛克治疗消化性溃疡的疗效,以某医师研究洛赛克治疗消化性溃疡的疗效,以泰胃美作为对照,观察结果如下:泰胃美作为对照,观察结果如下:药物药物有效病例有效病例无效病例无效病例总总病例数病例数泰胃美泰胃美363624246060(60%60%)洛赛克洛赛克54546 66060(90%90%)121212 ( or )pppppp统计假设统计假设 例例在冠心病普查中,研究冠心病与眼底动脉硬化在冠心病普查中,研究冠心病与眼底动脉硬化两者之间是否存在一定的关系?两者之间是否存在一定的关系?眼底动脉眼底动脉硬化级别硬化级别诊断结果诊断结果合计合计正常正常可疑可

13、疑冠心病冠心病0 034034011116 6357357I I737313136 69292IIII及以上及以上10010020201919139139合计合计513513444431315885882.2.假设检验假设检验利用样本提供的信息判断假设是否成立的利用样本提供的信息判断假设是否成立的统计方法,称为统计方法,称为假设检验假设检验( (hypothesis testing).hypothesis testing).总体的均数是否等于一个特定的值:总体的均数是否等于一个特定的值:两个总体分布的均数是否相等:两个总体分布的均数是否相等:随机变量随机变量X是否服从二项分布:是否服从二项分布

14、:( , )XB n p12m mm m= =0m mm m= =3.3.原假设与备择假设原假设与备择假设原假设原假设( (null hypothesis,null hypothesis,零假设零假设):):H0 0 : :=0.50.5备择假设备择假设( (alternative hypothesis):alternative hypothesis): H1 1 : :0.50.53.3.原假设与备择假设原假设与备择假设假设假设=0.5=0.5成立成立2( , )XN (0,1)XNn /2XPuna am ma as s禳禳镲镲- -镲镲 = =睚睚镲镲镲镲铪铪0.51.960.050.0

15、1 12XP禳禳镲镲- -镲镲 = =睚睚镲镲镲镲铪铪概率小于概率小于=0.05的事件为小概率事件。的事件为小概率事件。? 事件事件 为小概率事件为小概率事件0.5|1.960.01 12XU 3.3.原假设与备择假设原假设与备择假设0.49380.5x 0 0H0:=0.5, H1:0.5.H0:0.5, H1:=0.5.不能用一个例子去证明一个结论,因此用一个样不能用一个例子去证明一个结论,因此用一个样本(例子)本(例子)不能证明不能证明一个命题(假设)。但是可一个命题(假设)。但是可以用一个例子(样本)以用一个例子(样本)推翻推翻一个命题。一个命题。由由 确定确定c c时时 4. 4.

16、检验统计量检验统计量|0.5|0.05PXc-=-=0.05/20.50.050.0112XPu禳禳镲镲- -镲镲 = =睚睚镲镲镲镲铪铪0.50.0112XU 检验统计量检验统计量5.5.显著性水平显著性水平统计学上的结论统计学上的结论:在在=0.05=0.05的水平上的水平上, ,拒绝假设拒绝假设=0.50.5, ,认为认为0.50.5. .即认为该厂的此药的有效成分含量与规定的水即认为该厂的此药的有效成分含量与规定的水平平0.50.5的差异有差异有统计学意义统计学意义( (statistical statistical significance)significance). .显著性水平

17、显著性水平( (significance level)significance level)检验水平检验水平( (level of test)level of test) 给定检验水平给定检验水平,检验统计量,检验统计量( (即即 ) )的可的可能取值范围被分成两部分:小概率区域与大概能取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过率区域。小概率区域就是概率不超过的区域的区域,是零假设的拒绝区域;大概率区域是概率为,是零假设的拒绝区域;大概率区域是概率为 1-1-的区域,是零假设的接受区域。的区域,是零假设的接受区域。 X拒绝域:拒绝域:22(,)uu 或或2200(,

18、)uunn。 o2u2u-22nu222nu200002u2u 20un 20un 0问题:问题:1. 1. 假设检验要解决的是什么样的问题?假设检验要解决的是什么样的问题?2.2.在例在例5.15.1中给的条件中给的条件“正态分布正态分布”起的什么作起的什么作用?如果没有这个条件能否解决例用?如果没有这个条件能否解决例5.15.1的问题?的问题?3.3.为什么在例为什么在例5.15.1中样本均值不等于规定的值时中样本均值不等于规定的值时还不能说生产不合格?在解决例还不能说生产不合格?在解决例5.15.1问题的过程问题的过程中哪里反映了对产生差异来源的考虑?中哪里反映了对产生差异来源的考虑?4

19、.4.这里的这里的“反证法反证法”是严格的逻辑上的反证?是严格的逻辑上的反证?5.5.例例5.15.1中取不同的检验水平中取不同的检验水平, ,结论会有什么变结论会有什么变化么?如果有变化,那么这样的检验方法还有化么?如果有变化,那么这样的检验方法还有意义么?意义么?问题问题1 11. 1. 假设检验(假设检验(hypothesis testhypothesis test)要解决的是要解决的是什么样的问题?什么样的问题?利用样本的信息判断一些关于总体的假设是否利用样本的信息判断一些关于总体的假设是否成立成立( , )XB n p12m mm m= =0m mm m= =问题问题2 22.2.在

20、例在例5.15.1中给的条件中给的条件“正态分布正态分布”起的什么作起的什么作用?如果没有这个条件能否解决例用?如果没有这个条件能否解决例5.15.1的问题的问题例例5.1 5.1 某种药物有强烈作用,按规定有效成某种药物有强烈作用,按规定有效成分含量为分含量为0.50.5mg/mg/片。今随机抽取某厂生产的这片。今随机抽取某厂生产的这种药品种药品1212片,测得平均有效含量为片,测得平均有效含量为0.49380.4938mgmg。假定药片有效成分含量服从标准差为假定药片有效成分含量服从标准差为0.010.01mgmg的的正态分布正态分布。问这个厂家的产品是否符合要求?。问这个厂家的产品是否符

21、合要求?(3)定义小概率事件:)定义小概率事件:=0.05例例5.15.1(1 1)假设)假设=0.50.5:0. | 5|Xc- 0.50.05PXc- - = =0.011.9612c= =(2)确定不利的范围:)确定不利的范围:(4)计算)计算“界界”值。值。2(, 0.)0.501XN20.01(, 20.5)1XN问题问题3 33.3.为什么在例为什么在例5.15.1中样本均值不等于规定的值时中样本均值不等于规定的值时还不能说生产不合格?在解决例还不能说生产不合格?在解决例5.15.1问题的过程问题的过程中哪里反映了对产生差异来源的考虑?中哪里反映了对产生差异来源的考虑?样本均值样本

22、均值 与与0.50.5有差异有差异, ,差异产生的原因差异产生的原因: :x(1 1)标准差为标准差为0.010.01mgmg 随机误差随机误差(2 2)随机抽取随机抽取 抽样误差抽样误差(3 3)0.5 例例5.15.1样本均值样本均值 与与0.50.5有差异有差异, ,差异产生的差异产生的两种情形两种情形: :0.4938x (1 1) 抽样误差抽样误差(2 2) 抽样误差抽样误差0.5 0.5 2(,0.01)0.5/12XN0.05/20.50.050.01 12XPu禳禳镲镲- -镲镲 = =睚睚镲镲镲镲铪铪绝对差值抽样误差问题问题4 4矛盾!矛盾!假设假设=0.50.5不成立,不成

23、立,0.50.5。结论结论:理论上:理论上:假设假设=0.50.5事实上事实上:|0.5| |0.49380.5|0.00620.0057xc-=-=事件事件 为小概率事件为小概率事件0.50.0057Xc- - = =事件事件 不是小概率事件不是小概率事件0.50.0057Xc- - = =4.4.这里的这里的“反证法反证法”是严格的逻辑上的反证?是严格的逻辑上的反证?0.050.05水平上拒绝原假设水平上拒绝原假设H0 : =0.50.51.960.0112X- - 0.4943 0.5057Xor XH0:=0.50.5 H1:0.50.50.50.5H1:0.50.5随机抽样模拟随机抽

24、样模拟1 1药品符合要求药品符合要求= =0 0=0.5;=0.5;0.4943 0.5057XorX在在=0.010.01的水平上的水平上, ,不拒绝假设不拒绝假设=0.50.5. .问题问题5 50.0122.580.010.50.0112XPu禳禳镲镲- -镲镲 = = =睚睚镲镲镲镲铪铪0.01 0.4938x 0.0120.49380.52.14772.580.0112u- -= = = =0.5 问题问题5 5在在=0.050.05的水平上的水平上, ,拒绝假设拒绝假设=0.50.5. .在在=0.01=0.01的水平上的水平上, ,不拒绝假设不拒绝假设=0.5=0.5. .的大小

25、决定检验结论的性质的大小决定检验结论的性质440.05/20.01/ 26. 6. 检验的检验的-p-p值值样本当前值样本当前值 0.52.1477u0.0112XP骣骣- -琪琪琪琪 = =琪琪琪琪桫桫0.4938x 检验统计量当前值检验统计量当前值 0.52.14770.0112xu- -= -= -概率概率 检验的检验的-p-p值值p-p-值就是拒绝原假设所需的最低显著性水平值就是拒绝原假设所需的最低显著性水平p-p-值判断的原则是:如果值判断的原则是:如果p-p-值小于给定的显值小于给定的显著性水平著性水平,则拒绝原假设;否则,接受原,则拒绝原假设;否则,接受原假设。或者,更直观来说就

26、是:如果假设。或者,更直观来说就是:如果p-p-值很值很小,拒绝原假设,小,拒绝原假设,p-p-值很大,接受原假设。值很大,接受原假设。0.05/20.01/ 2/ 2p0.050.05水平上拒绝原假设水平上拒绝原假设H0 : =0.50.51.960.0112X- - 0.4943 0.5057Xor X拒绝原假设时可能犯的错误拒绝原假设时可能犯的错误7.7.两类错误两类错误第第类错误类错误48随机抽样模拟随机抽样模拟1 1药品符合要求药品符合要求= =0 0=0.5;=0.5;0.4943 0.5057XorX 第第类错误类错误不拒绝原假设不拒绝原假设拒绝原假设拒绝原假设原假设原假设H0成

27、立成立正确正确 第第I I类错误类错误第第I I类错误类错误:拒绝了正确的原假设:拒绝了正确的原假设弃真错误弃真错误PP拒绝拒绝H0| |H0真真 第第类错误的概率类错误的概率7.7.两类错误两类错误犯第犯第类错误的概率类错误的概率00|PHH拒拒真真拒绝原假设拒绝原假设H0 : =0.5/20.50.01 12Xua a- - /20.50.50.0112XPua am m- -= = = =a a= =在在=0.050.05的水平上的水平上, ,拒绝域:拒绝域:在在=0.01=0.01的水平上的水平上, ,拒绝域:拒绝域:检验水平检验水平0.4926 0.5074XorX 拒绝域0.494

28、3 0.5057XorX =拒绝原假设的时犯第一类错误的拒绝原假设的时犯第一类错误的 概率的上限概率的上限1-1-的大小反映拒绝原假设时的大小反映拒绝原假设时的把握的把握 性、可靠性性、可靠性接受原假设时可能犯的错误接受原假设时可能犯的错误不拒绝原假设不拒绝原假设H0 : =0.50.05/20.51.960.0112Xu- - = =0.49430.5057X 第第类错误类错误随机抽样模拟随机抽样模拟2 2药品不符合要求药品不符合要求=0.490.49430.5057X 健健康康人人)(7.0P Xb b= = 00类错误类错误 把实际上有减轻疼痛作用的新药判把实际上有减轻疼痛作用的新药判定为没有减轻疼痛的作用定为没有减轻疼痛的作用. .检验的功效检验的功效 新药实际上对新药实际上对OAOA病人的疼痛有病人的疼痛有减轻的作用而我们也判定新药是有效的概率减轻的作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论