第4章t检验和Z检验_第1页
第4章t检验和Z检验_第2页
第4章t检验和Z检验_第3页
第4章t检验和Z检验_第4页
第4章t检验和Z检验_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章第四章 t检验和检验和z检验检验第一节第一节 t检验检验 以以 t分布为基础的检验为分布为基础的检验为t检验。检验。 在医学统计学中,在医学统计学中,t检验是非常活跃的检验是非常活跃的一类假设检验方法。一类假设检验方法。 医疗卫生实践中最常见的是计量资料两医疗卫生实践中最常见的是计量资料两组比较的问题组比较的问题x2525例糖尿病患者例糖尿病患者随机分成两组,随机分成两组,甲组单纯用药物甲组单纯用药物治疗,乙组采用治疗,乙组采用药物治疗合并饮药物治疗合并饮食疗法,二个月食疗法,二个月后测空腹血糖后测空腹血糖(mmol/l) (mmol/l) 问两种问两种疗法治疗后患者疗法治疗后患者血糖值

2、是否相同血糖值是否相同? 药物治疗药物治疗药物治疗合药物治疗合并饮食疗法并饮食疗法 1 2n1=12 1x=15.21 2x=10.85 n2=13 甲组甲组乙组乙组总体总体样本样本 ?推断t 检验检验问题提出问题提出 根据研究设计根据研究设计,t,t检验有三种形式:检验有三种形式:单个样本的单个样本的t t检验检验配对样本均数配对样本均数t t检验检验( (非独立两样本均数非独立两样本均数t t检验检验) )两个独立样本均数两个独立样本均数t t检验检验第一节单个样本第一节单个样本t t检验检验 又称单样本均数又称单样本均数t t检验检验(one sample (one sample t t

3、 test), test),适适用于样本均数与已知总体均数用于样本均数与已知总体均数0 0的比较的比较, ,目的是目的是检验样本均数所代表的总体均数检验样本均数所代表的总体均数是否与已知总是否与已知总体均数体均数0 0有差别。有差别。 已知总体均数已知总体均数0 0一般为标准值、理论值或经大量一般为标准值、理论值或经大量观察得到的较稳定的指标值。观察得到的较稳定的指标值。 应用条件应用条件总体标准总体标准 未知的小样本资料未知的小样本资料( ( 如如n n50), t t0.05/2,110.05/2,11, p p 0.0550)50)时时 样本均数与总体均数比较、配对设计样本均数比样本均数

4、与总体均数比较、配对设计样本均数比较和两独立样本均数比较的假设检验较和两独立样本均数比较的假设检验, ,可以计算可以计算检验统计量值检验统计量值 标准正态变换后的界值标准正态变换后的界值双侧:双侧:单侧:单侧:0.05/20.01/21.96,2.58zz0.050.011.645,2.33zz检验原理检验原理 成组设计的两样本均数比较的统计量值成组设计的两样本均数比较的统计量值计算中计算中, ,两均数差的标准误为两均数差的标准误为 统计量值的计算公式为统计量值的计算公式为 12221122/x xss n s n121212221122/xxxxxxzssnsn 检验检验实例分析实例分析例例

5、5-4 5-4 研究正常人与高血压患者胆固醇含量研究正常人与高血压患者胆固醇含量(mg%)(mg%)的资的资料如下料如下, ,试比较两组血清胆固醇含量有无差别。试比较两组血清胆固醇含量有无差别。 正常人组正常人组 高血压组高血压组 111506,180.6,34.2nxs222142,223.6,45.8nxs 检验检验实例分析步骤实例分析步骤 建立检验假设建立检验假设, , 确定检验水平确定检验水平 =0.05=0.05 计算统计量值计算统计量值将已知数据代入公式将已知数据代入公式, ,得得012:h112:h22|180.6223.6|10.4034.2 /50645.8 /142z 检验

6、检验实例分析步骤实例分析步骤 确定确定p p值值, , 作出推断结论作出推断结论本例本例=10.401.96=10.401.96,故,故p p 0.050.05,按,按 =0.05=0.05水准拒绝水准拒绝h h0 0,接受,接受h h1 1,可以认为,可以认为正常人与高血压患者的血清胆固醇含量正常人与高血压患者的血清胆固醇含量有差别,高血压患者高于正常人。有差别,高血压患者高于正常人。第六节第六节 假设检验中两类错误假设检验中两类错误 (1 b b )即)即把握度把握度(power of a test),也称,也称检检验效能验效能:两总体确有差别,被检出有差别的能力两总体确有差别,被检出有差

7、别的能力 (1 )即)即可信度可信度(confidence level):重复重复抽样时,样本区间包含总体参数(抽样时,样本区间包含总体参数(m)的百分数)的百分数 由样本推断的结果 真实结果 h0成立 型错误 推断正确(1 ) h0不成立 推断正确(1b) 型错误b 拒绝h0 不拒绝h0 当当h h0 0为真时,检验结论拒绝为真时,检验结论拒绝h h0 0接受接受h h1 1,这类错误称,这类错误称为第一类错误或为第一类错误或型错误(型错误(type errortype error),亦),亦称假阳性错误称假阳性错误 检验水准,就是预先规定的允许犯检验水准,就是预先规定的允许犯型错误概率型错

8、误概率的最大值,用的最大值,用 表示表示 当真实情况为当真实情况为h h0 0不成立而不成立而h h1 1成立时,检验结论不拒成立时,检验结论不拒绝绝h h0 0反而拒绝反而拒绝h h1 1,这类错误称为第二类错误或,这类错误称为第二类错误或型型错误(错误(type errortype error),亦称假阴性错误),亦称假阴性错误。大小大小用用表示,只取单侧,一般未知。表示,只取单侧,一般未知。 当样本容量一定时,当样本容量一定时, 越小越小 越大,越大, 越大越大 越小。在实际越小。在实际应用中,往往通过应用中,往往通过 去控制去控制 。在样本量确定时,如果要。在样本量确定时,如果要减小减

9、小 ,就把,就把 取大一些。取大一些。 同时减小同时减小 和和b b,唯一的方法就是增加样本含量,唯一的方法就是增加样本含量n n bbbb第七节第七节 假设检验中的注意事项假设检验中的注意事项 1. 1. 假设检验结论正确的前提假设检验结论正确的前提 作假设检验用的样本资料,必须能代表相应作假设检验用的样本资料,必须能代表相应的总体,同时各对比组具有良好的组间均衡性的总体,同时各对比组具有良好的组间均衡性, ,才能得出有意义的统计结论和有价值的专业结论。才能得出有意义的统计结论和有价值的专业结论。这要求有严密的实验设计和抽样设计这要求有严密的实验设计和抽样设计, ,如样本是如样本是从同质总体

10、中抽取的一个随机样本从同质总体中抽取的一个随机样本, ,试验单位在试验单位在干预前随机分组干预前随机分组, ,有足够的样本量等。有足够的样本量等。 2. 2. 检验方法的选用及其适用条件检验方法的选用及其适用条件, ,应根据分析应根据分析目的、研究设计、资料类型、样本量大小等选用目的、研究设计、资料类型、样本量大小等选用适当的检验方法。适当的检验方法。 t t 检验是以正态分布为基础的,资料的正态检验是以正态分布为基础的,资料的正态性可用正态性检验方法检验予以判断。若资料为性可用正态性检验方法检验予以判断。若资料为非正态分布,可采用数据变换的方法,尝试将资非正态分布,可采用数据变换的方法,尝试

11、将资料变换成正态分布资料后进行分析。料变换成正态分布资料后进行分析。 3.3.双侧检验与单侧检验的选择双侧检验与单侧检验的选择 需根据研究目的和专业知识予以选择。单侧需根据研究目的和专业知识予以选择。单侧检验和双侧检验中的检验和双侧检验中的t t值计算过程相同,只是值计算过程相同,只是t t界值不同,对同一资料作单侧检验更容易获得界值不同,对同一资料作单侧检验更容易获得显著的结果。单双侧检验的选择,应在统计分显著的结果。单双侧检验的选择,应在统计分析工作开始之前就决定,若缺乏这方面的依据,析工作开始之前就决定,若缺乏这方面的依据,一般应选用双侧检验。一般应选用双侧检验。 4.4.假设检验的结论

12、不能绝对化假设检验的结论不能绝对化 假设检验统计结论的正确性是以概率作保证假设检验统计结论的正确性是以概率作保证的,作统计结论时不能绝对化。在报告结论时,的,作统计结论时不能绝对化。在报告结论时,最好列出概率最好列出概率p p 的确切数值或给出的确切数值或给出p p 值的范围,值的范围,当当 p p 接近临界值时,下结论应慎重。接近临界值时,下结论应慎重。 5.5.正确理解正确理解p p值的统计意义值的统计意义 p p 是指在无效假设是指在无效假设 h h0 0 的总体中进行随机抽的总体中进行随机抽样样, ,所观察到的等于或大于现有统计量值的概所观察到的等于或大于现有统计量值的概率。其推断的基

13、础是小概率事件的原理率。其推断的基础是小概率事件的原理, ,即概即概率很小的事件在一次抽样研究中几乎是不可能率很小的事件在一次抽样研究中几乎是不可能发生的,如发生则拒绝发生的,如发生则拒绝h h0 0。因此,只能说明统。因此,只能说明统计学意义的计学意义的“显著显著” ” 。 6.6.假设检验和可信区间的关系假设检验和可信区间的关系 假设检验用以推断总体均数间是否相同,假设检验用以推断总体均数间是否相同,而可信区间则用于估计总体均数所在的范围,而可信区间则用于估计总体均数所在的范围,两者既有联系又有区别。两者既有联系又有区别。 (1 1)置信区间具有假设检验的主要功能。)置信区间具有假设检验的

14、主要功能。(2 2)置信区间可提供假设检验没有提供的信息)置信区间可提供假设检验没有提供的信息 置信区间在回答差别有无统计学意义的同时,还可以提示置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义差别是否具有实际意义 (例如,降血压药至少要使血压(例如,降血压药至少要使血压平均降低平均降低10mmhg以上才认为具有临床治疗意义。则说以上才认为具有临床治疗意义。则说10mmhg是具有实际意义的值)。是具有实际意义的值)。 在在图图62中,置信区间(中,置信区间(l)-(3)均不包含原假设)均不包含原假设 h0,意味着相应的差异具有统计学意义。(意味着相应的差异具有统计学意义。

15、(1)还提示差异具)还提示差异具有实际意义;(有实际意义;(2)提示可能具有实际意义;()提示可能具有实际意义;(3)提示实)提示实际意义不大。图中的(际意义不大。图中的(4)与()与(5)均无统计学意义,但)均无统计学意义,但(4)提示样本量不足。()提示样本量不足。(5)属于可以接受原假设的情况。)属于可以接受原假设的情况。 返回 (3)假设检验提供,而置信区间不提供的信息假设检验提供,而置信区间不提供的信息 在统计推断结论为拒绝在统计推断结论为拒绝 h0时,假设检验可以报告确切时,假设检验可以报告确切的的p值,从而较为精确地说明检验结论的概率保证。置值,从而较为精确地说明检验结论的概率保

16、证。置信区间只能在预先确定的置信度信区间只能在预先确定的置信度l 水平上进行推断。水平上进行推断。 在不能拒绝在不能拒绝h0的场合,假设检验可以对检验的功效做的场合,假设检验可以对检验的功效做出估计,从而可以评价是否在识别差异能力较强的情出估计,从而可以评价是否在识别差异能力较强的情形下不拒绝形下不拒绝h0的。而置信区间并不提供这方面的信息。的。而置信区间并不提供这方面的信息。 根据以上的讨论,置信区间与相应的假设检验既根据以上的讨论,置信区间与相应的假设检验既能提供相互等价的信息,又有各自不同的功能。能提供相互等价的信息,又有各自不同的功能。把置信区间与假设检验结合起来,可以提供更为把置信区间与假设检验结合起来,可以提供更为全面、完整的信息。全面、完整的信息。 因此国际上规定,在报告假设检验结论的同时,因此国际上规定,在报告假设检验结论的同时,必须报告相应区间估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论