




已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学 李国春医学博士 e mail liguochuncn Cell phone第5讲 上 t检验和u检验 Medicalstatistics SingaporeCollegeofTCM 2009 9 1 ttest 单样本均数t检验配对样本均数的t检验两个独立样本均数的t检验正态性检验两样本的方差齐性检验两总体方差不等时均数比较的检验案例练习和思考小结 主要内容 contents 2 t检验是假设检验中最见的一种方法 它是以t分布为基础 由于t分布的发现使得小样本统计推断成为可能 因而 它被认为是统计学发展史中的里程碑之一 在医学统计学中 t检验是非常活跃的一类假设检验方法 什么是t检验 3 单样本t检验 配对样本t检验 两个独立样本t检验 同源配对 异源配对 t检验的分类 4 t假设检验的应用条件 1 未知且n较小 2 样本来自正态分布总体 3 两样本均数比较时还要求所对应的两总体方差相等 12 22 即方差齐性 HomogeneityofVariance 4 独立性 在实际应用中 与上述条件略有偏离 但对结果影响不大 问题 已知 或n较大时 用什么检验 5 z检验 t检验是根据t分布判断样本概率而进行的假设检验 而当样本量n很大时 t分布就接近标准正态分布 标准正态分布也称为u分布 而国外教科书则称为Z分布 这时候根据u分布判断概率所进行的假设检验称为u检验 应用条件 已知或者 未知且n足够大 如n 100 复习 6 1 样本均数与总体均数的比较 目的 推断该样本是否来自某已知总体 样本均数代表的总体均数 与 0是否相等 总体均数 0一般为理论值 标准值或经大量观察所得并为人们接受的公认值 习惯值 未知总体 已知总体 0 7 t检验 例3 16根据大量调查 已知健康成年男子听到最高声音频率的平均数为18000Hz 某医生随机抽查25名接触噪声作业的男性工人 测得可以听到的最高声音频率的均数为17200Hz 标准差为650Hz 试问能否认为接触噪声作业工人的听力水平与正常成年男性的听力水平不同 0 18000Hz总体 健康成年男子 样本 接触噪声作业工人 总体 未知总体 8 1 建立假设 确定检验水准 H 接触噪声作业工人的听力水平与正常成年男性的听力水平相同 H1 接触噪声作业工人的听力水平与正常成年男性的听力水平不同 0 05 针对总体 2 选定检验方法 计算检验统计量t值 n 25 X 17200Hz s 650Hz 18000Hz 统计量t表示 在标准误的尺度下 样本均数与总体均数的偏离 这种偏离称为标准t离差 standardtdeviation 假设检验步骤 9 3 确定P值 作出推断结论 查t界值表双侧 0 t 6 154 现有统计量t 6 154 2 797 P 0 01 按 0 05水准 拒绝H 接受H1 差异有统计学意义 结合本题有理由认为接触噪声作业的男性工人平均听力水平低于正常成年男性 10 11 2 064 2 064 0 24 0 025 0 025 t0 05 24 2 064P P t 2 064 0 05 P P t 5 4545 0 05 12 思路解析 0 18000Hz总体 健康成年男子 样本 总体 未知总体 0 13 0 18000Hz总体 样本 假设该样本来自已知总体 0 18000Hz总体 样本 这些样本是什么分布规律 14 这些样本是什么分布规律 1 这些样本的均数服从正态分布 这里 0 18000Hz 未知 因此这种正态分布往往是未知的 这样就没办法求目前手头这个样本 在样本抽样分布中出现的概率就无法确认 即无法获得等于及大于 或等于及小于 现有样本均数的概率 也就无法判断是否是小概率 只知道它服从正态分布 至于是什么样的正态分布 不清楚 15 这些样本的均数服从正态分布 但至于是什么样的正态分布 往往未知 这时我们不去追究 而是回避这个问题 采用t分布来解决 16 2 由这些样本的均数和标准差导出的新的统计量t服从的不是正态分布 而是t分布 都是已知的 服从自由度为n 1的t分布 即v 25 1 24的t分布 t仅分布与自由度有关 17 不同自由度下t界值对应的概率有差异 18 t仅分布与自由度有关 19 P 0 01 20 对这个样本是否来自这个总体产生了怀疑 因此从已知总体中抽样 获得这样的样本的概率太少了P 0 01 从而认为这个样本很有可能来自于与已知总体有本质差别的另一总体 总体 21 u检验 t检验是根据t分布所进行的假设检验 而当样本量n很大时 t分布就接近标准正态分布 标准正态分布也称为u分布 而国外教科书则称为Z分析 这时候根据u分布所进行的假设检验称为u检验 应用条件 已知或者 未知且n足够大 如n 100 n较大时 已知时 22 这些样本是什么分布规律 这些样本的均数服从正态分布 它服从正态分布 至于是什么样的正态分布 是清楚的 已知时 23 n较大时 u分布 24 例3 18为了解医学院学生的心理健康状况 随机抽查某医科大学在校大学生210名 用SCL90症状自评量表进行测定 得出因子总分的均数为142 6 标准差为31 25 已知全国SCL90因子总分的均数 常模 为130 试问该医科大学在校学生的SCL90因子总分是否与全国水平相同 0 130总体 全国水平 样本 某医学大学在校学生 总体 未知总体 25 n较大时 u分布 26 1 建立假设 确定检验水准 H 该医科大学在校学生的SCL90因子总分与全国水平相同 H1 医科大学在校学生的SCL90因子总分与全国水平不同 0 05 针对总体 2 选定检验方法 计算检验统计量u值 n 210 100 X 142 6 s 31 25 130 假设检验步骤 27 3 确定P值 作出推断结论 查u界值表双侧 即t界值表中v为 时的一行 双侧 0 u 5 843 现有统计量u 5 843 2 58 P 0 01 按 0 05水准 拒绝H 接受H1 差异有统计学意义 结合本题有理由认为医科大学在校学生的SCL90因子总分与全国水平不同 28 2 配对t检验 配对设计是研究者为了控制可能存在的主要的非处理因素而采用的一种实验设计方法 配对设计的形式 自身配对同一对象接受两种处理 如同一标本用两种方法进行检验 同一患者接受两种处理方法 异体配对将条件相近的实验对象配对 并分别给予两种处理 29 一般配对条件 异体配对 动物实验 同种 同品系 同性别 同体重 同窝别 临床实验 病种 病期 病情 病程 年龄与性别相同 配对设计注意事项 配对时应做到每个对子条件的齐同 齐同性要求为P 0 20 在慢性实验中 应保持配对因素的可比性 即实验全程配对因素应保持齐同 在实际资料处理时 配对可能是成功的 属配对设计 也可能是不成功的 是完全随机设计 30 设计模式 研究对象N 合格对象Ne 组 组 D0 D1 C因素 T1因素 统计分析 分组 施加因素 效应 配对P 随机R 31 若两处理因素的效应无差别 差值d的总体均数 d应该为0 故可将该检验理解为样本均数与总体均数 d 0的比较差值均数的大小及其抽样误差反应因素的效应 32 配对设计t检验的思路 例3 19为研究某心理干预措施对抑郁症患者的疗效 对10名抑郁症患者于干预前 干预后分别进行生活满意度指数B LSIB 的心理测试 结果如表3 7所示 问该干预措施是否有效 33 12345678910 编号干预前干预后差值 d d2 129106581311109 1512161012919181511 3364716752 9936164913649254 合计 d 44 d2 234 表3 710抑郁症患者干预前后心理指标LSIB测试结果 34 d 0总体 总体 35 1 建立假设 确定检验水准 H d 0 干预措施实施前后无差别H1 d 0 干预措施实施前后有差别 0 05 针对总体 2 选定检验方法 计算检验统计量t值 n 10 d d n 44 10 4 4 假设检验步骤 36 3 确定P值 作出推断结论 查t界值表双侧 0 t 6 563 现有统计量t 6 563 3 250 P 0 01 按 0 05水准 拒绝H 接受H1 差异有统计学意义 结合本题有理由认为该项心理干预措施对抑郁症患者有效 37 3 两组独立样本的t检验 有些研究的设计既不能自身配对 也不便异体配对 而只能把独立的两组相互比较 例如手术组与非手术组 新药组与对照组 两个样本均数比较的目的在于推断两个样本所代表的两总体均数 1和 2是否相等 38 设计模式 研究对象N 合格对象Ne 组 组 D0 D1 C因素 T1因素 统计分析 分组 施加因素 效应 亦称为成组比较 值得注意的是 两组必须具有可比性 即除了施加因素外 原则上要求其它方面两组间要齐同 否则两组间比较将失去意义 39 总体 2总体 1总体 样本1 样本2 40 两个大样本均数比较 当样本含量较大 n 50时 自由度足够大 可用u检验 两个样本均数差值的标准误 41 例3 21为评价交通污染对交通警察心理健康状况的影响 某医生随机抽取某市交警大队外勤警察212名 男性 作为暴露组 进行SCL90评定 测得均数为152 51 标准差为35 27 已知全国 男性 n 724 常模的均数为129 96 标准差为38 76 试问该市交警心理状况SCL90评分是否高于全国常模 暴露组 对照组或常模组 42 假设检验步骤 1 建立假设 确定检验水准 H 1 2 该市交警心理状况SCL90评分与全国常模相同H1 1 2 该市交警心理状况SCL90评分高于全国常模 0 05 针对总体 2 选定检验方法 计算检验统计量u值 n1 212 X 152 51 s1 35 27 n2 724 X 129 96 s2 38 76 43 3 确定P值 作出推断结论 查u界值表双侧 即t界值表中v为 时的一行 双侧 0 u 8 001 现有统计量u 8 001 2 58 P 0 01 按 0 05水准 拒绝H 接受H1 差异有统计学意义 结合本题有理由认为该市交警心理状况SCL90评分高于全国常模 44 两样本所属总体方差相等 如果两总体为正态分布 分别记为N 1 2 和 2 2 检验假设为 H0 1 2 H1 1 2 t n1 n2 2 分布 45 两样本之差标准误 两样本合并方差 时 当 46 例6 4某口腔科测得长春市13 16岁居民男性20人的恒牙初期腭弓深度均值为17 15mm 标准差为1 59mm 女性34人的均值为16 92mm 标准差为1 42mm 根据这份数据可否认为该市13 16岁居民腭弓深度有性别差异 H0 1 2 男女腭弓深度相同 H1 1 2 男女腭弓深度不相同 双侧 0 05 n1 n2 2 20 34 2 52按自由度52查附表2 t界值表得t0 5 52 0 679 P 0 5 0 05 差别无统计学意义 可以还不能认为13 16岁居民腭弓深度有性别差异 47 正态性检验 1 未知且n较小 2 样本来自正态分布总体 3 两样本均数比较时还要求所对应的两总体方差相等 12 22 即方差齐性 HomogeneityofVariance 4 独立性 48 方差齐性检验 1 未知且n较小 2 样本来自正态分布总体 3 两样本均数比较时还要求所对应的两总体方差相等 12 22 即方差齐性 HomogeneityofVariance 4 独立性 49 两样本所属总体方差不等 Satterthwaite近似法 如果 12 22 两样本所属总体方差不相等 如果两总体为正态分布 分别记为N 1 2 和 2 2 检验假设为 H0 1 2 H1 1 2 t t v 分布 50 例6 5为探讨硫酸氧钒对糖尿病性白内障的防治作用 研究人员将已诱导糖尿病模型的20只大鼠随机分成为两组 一组用硫酸氧钒治疗 DV组 另一组作对照观察 D组 12周后测大鼠血糖含量 mmol L 结果为 DV组12只 样本均数为6 5mmol L 标准差为1 34mmol L D组8只 样本均数为13 7mmol L 标准差为4 21mmol L 试问两组动物血糖含量的总体均数是否相同 H0 1 2 H1 1 2 双侧 0 05 检验假设 51 DV组 D组 提示方差不齐 0 4 6817 52 配对设计与完全随机设计比较 由于配对设计的抽样误差较小 它的实验效率往往优于完全随机设计 在实际工作中多数情况也如此 但也有特殊情况 主要有两个方面原因 1 标准误的大小 若采用两组的标准差计算配对设计的标准误 r为两列数据相关系数 当样本量相等时 完全随机设计的两组差值均数的标准误为 因此 当r 0配对成功 当r 0或接近于0时 配对欠佳 53 2 自由度 配对设计的由自度要小于完全随机设计 而自由度和t 成反向变化 自由度大 则t 小 容易出现差别 否则相反 54 u检验总结 u检验 utest 亦称为z检验 ztest 根据研究设计 可分为大样本均数 率 与总体均数 率 比较的u检验 两大样本均数 率 比较的u检验 u检验 utest 大样本均数比较的u检验 大样本率比较的u检验 样本均数与总体均数比较 两样本均数比较的u检验 样本率与总体率比较 两样本率比较的u检验 这里不作介绍 55 u检验 t检验是根据t分布判断样本概率而进行的假设检验 而当样本量n很大时 t分布就接近标准正态分布 标准正态分布也称为u分布 而国外教科书则称为Z分布 这时候根据u分布判断概率所进行的假设检验称为u检验 应用条件 已知或者 未知且n足够大 如n 100 56 大样本均数比较的u检验 1 样本均数与总体均数比较的u检验 假定样本数据X1 X2 Xn服从正态分布 当检验假设H 0成立时 样本均数服从正态分布 这里的总体均数 0一般是指已知的理论值 标准值或经过大量观察所得到的稳定值 为总体方差 检验统计量为 当总体标准差未知 n 60时 可用样本标准差S作为的估计值 即 57 例7 1根据1983年大量调查结果 已知某地成年男子的脉搏均数为72次 分钟 某医生2003年在该地随机调查了75名成年男子 求得其脉搏均数为74 2次 分钟 标准差为6 5次 分钟 能否据此认为该地成年男子的脉搏数不同于1983年 0 72次 分钟总体 1983年大量调查结果 样本 2003年调查 总体 未知总体 58 假设检验的步骤 步骤一 建立检验假设 确定检验水准 H 72 即该地成年男子的平均脉搏没有变化 H1 72 即该地成年男子的平均脉搏与1983年不同 0 05 认为这个事件不可能发生 步骤二 计算检验统计量 u值 步骤三 确定P值 作出推断结论 因此P 0 01 对于H 为真时 这是一个小概率 根据反证法思想 按预先设定 0 05的检验水准 拒绝H 接受H1 统计结论为差别有统计学意义 可认为该地成年男子的脉搏与1983年不同 59 2 两样本均数比较的u检验 该方法适用于完全随机设计中两组计量资料差别的比较 60 例7 2为研究孕妇
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 九年级物理上册 第二章 改变世界的热机 第3节 热机效率教学设计 教科版
- 人教部编版7 溜索公开课教案
- 非销话术培训
- 买鲜花、租船问题(教学设计)-2024-2025学年二年级下册数学冀教版
- 三位数的连续退位减法(教学设计)-2023-2024学年数学二年级下册冀教版
- 高校新闻稿培训:提升宣传能力与专业素养
- 2024内蒙古北奔重型汽车集团有限公司招聘2人笔试参考题库附带答案详解
- 云南省昆明市官渡区艺卓中学七年级美术下册教学设计:第4课 扮靓生活的花卉纹样
- 粉末静电喷涂安全培训
- 三年级语文下册 第八单元 25 慢性子裁缝和急性子顾客第2课时教学设计 新人教版
- 315消费者日宣讲教育教学模板内容完整
- 2022年新高考山东政治高考真题(含答案)
- Rubicon科室讲课幻灯
- 旧混凝土路面加铺沥青混凝土面层施工组织设计方案
- 《成人鼾症》ppt课件
- 配电线路巡视记录单
- 乙炔气柜施工方案
- 狼和兔子的凄美爱情故事,前世今生的约定,看哭了很多人
- 体育测量与评价PPT课件-第四章 心肺功能的测量与评价
- 公路路基土建工程项目拌合站建设方案详细
- 雅马哈电子琴中英文音色对照表
评论
0/150
提交评论