总体均数的估计与假设检验二_第1页
总体均数的估计与假设检验二_第2页
总体均数的估计与假设检验二_第3页
总体均数的估计与假设检验二_第4页
总体均数的估计与假设检验二_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

总体均数的估计与假设检验二1第一页,共八十页,编辑于2023年,星期六假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。

第四节假设检验基本思想及步骤2第二页,共八十页,编辑于2023年,星期六例3-5某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?130.83g/L≠140g/L原因:1.可能是总体均数不同

2.是抽样造成的3第三页,共八十页,编辑于2023年,星期六4第四页,共八十页,编辑于2023年,星期六③

H1的内容直接反映了检验单双侧。若H1中只是

0或

<0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。④

单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。5第五页,共八十页,编辑于2023年,星期六

(3)检验水准,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取=0.05。可根据不同研究目的给予不同设置。6第六页,共八十页,编辑于2023年,星期六

根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量。

2.计算检验统计量7第七页,共八十页,编辑于2023年,星期六

P的含义是指从H0规定的总体随机抽样,抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量(如t、u等)值的概率。例3-5的P值可用图3-5说明,P为在=0=140g/L的前提条件下随机抽样,其t小于及等于-2.138和大于及等于2.138的概率。

3.确定P值8第八页,共八十页,编辑于2023年,星期六图3-5例3-5中P值示意图9第九页,共八十页,编辑于2023年,星期六10第十页,共八十页,编辑于2023年,星期六若,是否也能下“无差别”或“相等”的结论?

11第十一页,共八十页,编辑于2023年,星期六第五节

t检验12第十二页,共八十页,编辑于2023年,星期六1、样本均数与已知某总体均数比较的t检验

目的:推断一个未知总体均数与已知总体均数是否有差别,用单样本设计。2、两个样本均数与比较的t检验

目的:推断两个未知总体均数与是否有差别,用成组设计。3、配对设计资料均数比较的t检验

目的:推断两个未知总体均数与是否有差别用配对设计。t检验,亦称studentt检验,有下述情况:13第十三页,共八十页,编辑于2023年,星期六对于大样本,也可以近似用u检验。14第十四页,共八十页,编辑于2023年,星期六t检验和u检验的应用条件:1.t检验应用条件:样本含量n较小时(如n<60)(1)正态分布(2)方差齐性(homogeneityofvariance)2.u

检验应用条件:样本含量n较大,或n虽小但总体标准差已知

(1)正态分布

(2)方差齐性(homogeneityofvariance)15第十五页,共八十页,编辑于2023年,星期六一、单样本t

检验

(onesample/groupt-test)

即样本均数(代表未知总体均数)与已知总体均数0(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。其检验统计量按下式计算16第十六页,共八十页,编辑于2023年,星期六

例3-5某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?

(1)建立检验假设,确定检验水准H0:=0=140g/L,即铅作业男性工人平均血红蛋白含量与正常成年男性平均值相等H1:≠0=140g/L,即铅作业男性工人平均血红蛋白含量与正常成年男性平均值不等=0.0517第十七页,共八十页,编辑于2023年,星期六

(2)计算检验统计量

18第十八页,共八十页,编辑于2023年,星期六(3)确定P值,作出推断结论

19第十九页,共八十页,编辑于2023年,星期六配对t检验适用于配对设计的计量资料。配对设计类型:①两同质受试对象分别接受两种不同的处理;②同一受试对象分别接受两种不同处理;③同一受试对象(一种)处理前后。

二、配对t检验(paired/matchedt-test)20第二十页,共八十页,编辑于2023年,星期六

例3-6为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表3-3第(1)~(3)栏。问两法测定结果是否不同?21第二十一页,共八十页,编辑于2023年,星期六表3-3两种方法对乳酸饮料中脂肪含量的测定结果(%)

22第二十二页,共八十页,编辑于2023年,星期六

(1)建立检验假设,确定检验水准H0:d=0,即两种方法的测定结果相同H1:d≠0,即两种方法的测定结果不同=0.05

(2)计算检验统计量本例n=10,d=2.724,d2=0.8483,

23第二十三页,共八十页,编辑于2023年,星期六按公式(3-16)

(3)确定P值,作出推断结论查附表2的t界值表得P<0.001。按=0.05水准,拒绝H0,接受H1,有统计学意义。可认为两种方法对脂肪含量的测定结果不同,哥特里-罗紫法测定结果较高。24第二十四页,共八十页,编辑于2023年,星期六三、两样本t检验

(two-sample/groupt-test)又称成组t检验,适用于完全随机设计两样本均数的比较,此时人们关心的是两样本均数所代表的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两个不同处理组。25第二十五页,共八十页,编辑于2023年,星期六适用范围:完全随机设计两样本均数的比较检验方法:依两总体方差是否齐性而定。26第二十六页,共八十页,编辑于2023年,星期六27第二十七页,共八十页,编辑于2023年,星期六

例3-7

为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见表3-4,能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?28第二十八页,共八十页,编辑于2023年,星期六29第二十九页,共八十页,编辑于2023年,星期六

(2)计算检验统计量

30第三十页,共八十页,编辑于2023年,星期六(3)确定P值,作出推断结论

31第三十一页,共八十页,编辑于2023年,星期六

若变量变换后总体方差齐性

可采用t检验(如两样本几何均数的t检验,就是将原始数据取对数后进行t检验);

若变量变换后总体方差仍然不齐

可采用t

检验或Wilcoxon秩和检验。若两总体方差不等(),?32第三十二页,共八十页,编辑于2023年,星期六

2.Cochran&Cox近似t检验(t‘

检验)

——调整t界值33第三十三页,共八十页,编辑于2023年,星期六34第三十四页,共八十页,编辑于2023年,星期六

例3-8

在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜唐苹胶囊的对照组20例病人和用阿卡波糖胶囊的试验组20例病人,其8周时糖化血红蛋白HbA1c(%)下降值如表3-5。问用两种不同药物的病人其HbA1c下降值是否不同?35第三十五页,共八十页,编辑于2023年,星期六表3-5对照组和试验组HbA1c下降值(%)

对照组方差是试验组方差的3.77倍,经方差齐性检验,认为两组的总体方差不等,故采用近似t检验。36第三十六页,共八十页,编辑于2023年,星期六

(1)建立检验假设,确定检验水准(略)(2)计算检验统计量

37第三十七页,共八十页,编辑于2023年,星期六(3)确定P值,作出推断结论。查t界值表t0.05/2,19=2.093。

由t=0.965<t0.05/2=2.093得P>0.05。按=0.05水准,不拒绝H0,无统计学意义。还不能认为用两种不同药物的病人其HbA1c下降值不同。38第三十八页,共八十页,编辑于2023年,星期六

3.Satterthwaite近似t检验

:

Cochran&Cox法是对临界值校正而Satterthwaite法则是对自由度校正。

39第三十九页,共八十页,编辑于2023年,星期六以=28.428、t=0.965查附表2的t界值表得0.20<P<0.40。结论同前。按Satterthwaite法对例3-8做检验,得40第四十页,共八十页,编辑于2023年,星期六

3.Welch法近似t检验Welch法也是对自由度进行校正。校正公式为41第四十一页,共八十页,编辑于2023年,星期六对例3-8,如按Welch法,则

以=29.429、t=0.965查附表2的t界值表得0.20<P<0.40。结论同前。42第四十二页,共八十页,编辑于2023年,星期六

第六节假设检验注意事项43第四十三页,共八十页,编辑于2023年,星期六一、I型错误和II型错误

假设检验是利用小概率反证法思想,根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。见表3-8。44第四十四页,共八十页,编辑于2023年,星期六表3-8可能发生的两类错误45第四十五页,共八十页,编辑于2023年,星期六

I型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准)

II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是(其值未知)

但n

一定时,

增大,则减少。1-

:检验效能(power):当两总体确有差别,按检验水准所能发现这种差别的能力。46第四十六页,共八十页,编辑于2023年,星期六图3-6I型错误与II型错误示意图(以单侧u检验为例)

47第四十七页,共八十页,编辑于2023年,星期六减少I型错误的主要方法:假设检验时设定

值。减少II型错误的主要方法:提高检验效能。提高检验效能的最有效方法:增加样本量。如何选择合适的样本量:实验设计。48第四十八页,共八十页,编辑于2023年,星期六二、假设检验应注意的问题1.要有严密的研究设计这是假设检验的前提。组间应均衡,具有可比性,也就是除对比的主要因素(如临床试验用新药和对照药)外,其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近。保证均衡性的方法主要是从同质总体中随机抽取样本,或随机分配样本。49第四十九页,共八十页,编辑于2023年,星期六2.不同的资料应选用不同检验方法

应根据分析目的、资料类型以及分布、设计方案的种类、样本含量大小等选用适当的检验方法。如:配对设计的计量资料采用配对t检验。而完全随机设计的两样本计量资料,若为小样本(即任一ni60)且方差齐,则选用两样本t检验;若方差不齐,则选用近似t检验(Cochran&Cox法或Satterthwaite法)。若为大样本(所有ni>60),则可选用大样本u检验。50第五十页,共八十页,编辑于2023年,星期六3.正确理解“显著性”一词的含义

差别有或无统计学意义,过去称差别有或无“显著性”,是对样本统计量与总体参数或样本统计量之间的比较而言,相应推断为:可以认为或还不能认为两个或多个总体参数有差别。51第五十一页,共八十页,编辑于2023年,星期六4.结论不能绝对化因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围,如写成P=0.040或0.02<P<0.05,而不简单写成P<0.05,以便读者与同类研究进行比较或进行循证医学时采用Meta分析。52第五十二页,共八十页,编辑于2023年,星期六5.假设检验是为专业服务的,统计结论必须和专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。若统计结论和专业结论一致,则最终结论就和这两者均一致(即均有或均无意义);若统计结论和专业结论不一致,则最终结论需根据实际情况加以考虑。若统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在问题,那么最终结论就没有意义。53第五十三页,共八十页,编辑于2023年,星期六

6.可信区间与假设检验各自不同的作用,要结合使用。

一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1。

54第五十四页,共八十页,编辑于2023年,星期六

另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。

55第五十五页,共八十页,编辑于2023年,星期六图3-7可信区间在统计推断上提供的信息

56第五十六页,共八十页,编辑于2023年,星期六

虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率

检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。

57第五十七页,共八十页,编辑于2023年,星期六第七节正态性检验和两样本方差比较的F检验58第五十八页,共八十页,编辑于2023年,星期六

t检验的应用条件是正态总体且方差齐性;配对t检验则要求每对数据差值的总体为正态总体。进行两小样本t检验时,一般应对资料进行方差齐性检验,尤其两样本方差悬殊时。若方差齐,采用一般的t检验;若方差不齐,则采用t’检验。59第五十九页,共八十页,编辑于2023年,星期六一、正态性检验(normalitytest)

1.图示法:P-Pplot,Q-Qplot2.矩法偏度系数(skewness),峰度系数(kurtosis)。

3.

W检验法

4.

D检验法60第六十页,共八十页,编辑于2023年,星期六图3-8例3-1中100个样本均数的P-P图61第六十一页,共八十页,编辑于2023年,星期六图3-9例3-1中100个样本均数的Q-Q图62第六十二页,共八十页,编辑于2023年,星期六63第六十三页,共八十页,编辑于2023年,星期六64第六十四页,共八十页,编辑于2023年,星期六

例3-9试用矩法对表3-1中计算机模拟抽样所得100个样本均数进行正态性检验。65第六十五页,共八十页,编辑于2023年,星期六

(2)计算检验统计量66第六十六页,共八十页,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论