假设检验的基本原理与t检验课件.ppt_第1页
假设检验的基本原理与t检验课件.ppt_第2页
假设检验的基本原理与t检验课件.ppt_第3页
假设检验的基本原理与t检验课件.ppt_第4页
假设检验的基本原理与t检验课件.ppt_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

XueFuzhong Schoolofpublichealth ShandongUniversity 假设检验的基本原理与t检验 假设检验的基本原理与t检验 假设检验的基本原理与t检验 假设检验的基本原理 假设检验 hypothesistest 亦称显著性检验 significancetest 是统计推断的两个重要内容之一 假设检验的方法很多 如t检验 u检验 方差分析 检验 秩和检验 应用时 需根据研究目的 设计方法 资料类型及其分布特征等选用 二十世纪二 三十年代Neyman和Pearson建立了统计假设检验问题的数学模型 假设检验的基本原理与t检验 假设检验的基本原理 假设检验的基本原理与t检验 假设检验的基本原理 假设检验的基本原理与t检验 假设检验的基本原理 假设检验是利用小概率反证法思想 从问题的对立面 H0 出发间接判断要解决的问题 H1 是否成立 然后在H0成立的条件下计算检验统计量 最后获得P值来判断 问题实质上都是希望通过样本统计量与总体参数的差别 或两个样本统计量的差别 来推断总体参数是否不同 这种识别的过程 就是本章介绍的假设检验 hypothesistest 假设检验的基本原理与t检验 假设检验的基本原理 例根据大量调查 已知健康成年男子脉搏的均数为72次 分钟 某医生在一山区随机测量了25名健康成年男子脉搏数 求得其均数为74 2次 分钟 标准差为6 5次 分钟 能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同 1 建立检验假设确定检验水准一种是无效假设 nullhypothesis 符号为H0 一种是备择假设 alternativehypothesis 符号为H1 H0 H1 假设检验的基本原理与t检验 假设检验的基本原理 假设检验的基本原理与t检验 假设检验的基本原理 检验水准亦称显著性水准 significancelevel 符号为 是判断拒绝或不拒绝的水准 也是允许犯 型错误的概率 通常用 必要时 可用0 01或0 10或0 20 假设检验的基本原理与t检验 假设检验的基本原理 2 选定检验方法和计算统计量根据研究设计的类型和统计推断的目的要求选用不同的检验方法 如完全随机设计中 两样本均数的比较可用t检验 样本含量较大时 n 100 可用u检验 不同的统计检验方法 可得到不同的统计量 如t值和u值 各检验方法都有其应用条件 选择时 须根据研究目的 设计类型 资料类型及其分布特征等选用适当的统计检验方法 并计算出相应的检验统计量 例如 本例为样本均数与总体均数比较 样本是随机抽取的 变量值为数值变量资料 样本含量较小 且总体标准差未知 因而选用单样本检验 假设检验的基本原理与t检验 假设检验的基本原理 2 选定检验方法和计算统计量 X N 72 2 假设检验的基本原理与t检验 假设检验的基本原理 2 选定检验方法和计算统计量 假设检验的基本原理与t检验 假设检验的基本原理 2 确定P值 作出结论 假设检验的基本原理与t检验 假设检验的基本原理 P值是指在H0所规定的总体中作随机抽样 获得等于及大于 或小于 现有统计量t值的概率 3 确定概率P值作出结论 假设检验的基本原理与t检验 假设检验的基本原理 3 确定概率P值作出结论 当P 时 表示在H0成立的条件下 出现等于及大于现有统计量的概率是小概率 根据小概率事件原理 现有样本信息不支持H0 因而拒绝H0 结论为按所取检验水准拒绝H0 接受H1 即差异有统计学意义 如例3 3可认为两总体脉搏均数有差别 当P 时 表示在H0成立的条件下 出现等于及大于现有统计量的概率不是小概率 现有样本信息还不能拒绝H0 结论为按所取检验水准不拒绝H0 即差异无统计意义 如例3 3尚不能认为两总体脉搏均数有差别 本例 结论为按所取检验水准不拒绝H0 即差异无统计意义 尚不能认为两总体脉搏均数有差别 假设检验的基本原理与t检验 假设检验的基本原理 3 确定概率P值作出结论 当P 时 表示在H0成立的条件下 出现等于及大于现有统计量的概率是小概率 根据小概率事件原理 现有样本信息不支持H0 因而拒绝H0 结论为按所取检验水准拒绝H0 接受H1 即差异有统计学意义 如例3 3可认为两总体脉搏均数有差别 当P 时 表示在H0成立的条件下 出现等于及大于现有统计量的概率不是小概率 现有样本信息还不能拒绝H0 结论为按所取检验水准不拒绝H0 即差异无统计意义 如例3 3尚不能认为两总体脉搏均数有差别 样本均数与总体均数的比较 小样本t检验法 目的 推断样本所代表的未知总体均数 与已知总体均数 0是否相等 t检验的适用条件 样本来自正态总体或近似正态总体 若不符合条件可考虑用非参数方法 秩和检验法 假设检验的基本原理与t检验 样本均数与总体均数的比较 小样本t检验法 例经产科大量调查得知某市婴儿体重均数为3 30kg 今随机测得35名难产儿平均出生体重为3 42kg 标准差为0 40kg 问该市难产儿出生体重与一般婴儿是否不同 假设检验的基本原理与t检验 样本均数与总体均数的比较 小样本t检验法 假设检验的基本原理与t检验 样本均数与总体均数的比较 大样本u检验法 国外统计书籍及统计软件亦称为单样本u检验 onesampleu test 样本均数与总体均数比较的u检验适用于 总体标准差 已知的情况 样本含量较大时 比如n 100时 对于后者 是因为n较大 也较大 则t分布很接近u分布的缘故 假设检验的基本原理与t检验 样本均数与总体均数的比较 大样本u检验法 假设检验的基本原理与t检验 样本均数与总体均数的比较 SAS运行结果 假设检验的基本原理与t检验 例题 已知某水样中碳酸钙的真值为20 7mg L 现用某法重复测定该水样11次 测得碳酸钙的含量分别为20 9920 4120 1020 0020 9122 6020 9920 4120 0023 0022 00 问用该法测得的碳酸钙含量的均知与真值差异有无统计学意义 dataa inputx y x 20 7 cards 20 9920 4120 1020 0020 9122 6020 9920 4120 0023 0022 00run procunivariatedata anormal vary run SAScode 样本均数与总体均数的比较 SAS运行结果 假设检验的基本原理与t检验 SASoutput 样本均数与总体均数的比较 SAS运行结果 假设检验的基本原理与t检验 SASoutput 样本均数与总体均数的比较 SAS运行结果 假设检验的基本原理与t检验 SASoutput 配对t检验 所谓配对样本 pairedsample 是指两个样本中的观察对象由于存在某种联系或具有某些相近的重要特征而结成对子 matching 每对中的两个个体随机分配接受两种不同的处理 医学研究中常见的配对样本 配成对子的两个个体分别给予两种不同的处理 如把同窝 同性别和体重相近的动物配成一对 把同性别 同病情和年龄相近的病人配成一对等 同一个体同时分别接受两种不同处理 如同一动物的左右两侧神经 同一份标本分成两部分 同一个体自身前后的比较 如高血压患者治疗前后的舒张压比较 肝炎患者治疗前后的转氨酶比较等 假设检验的基本原理与t检验 配对t检验 对于配对样本数据 应该首先计算出各对差值的均数 当两种处理结果无差别或某种处理不起作用时 理论上差值的总体均数应该为0 故可将配对样本资料的假设检验视为样本均数与总体均数 0的比较 所用方法为配对t检验 pairedt test 适用条件 要求差值的总体分布为正态分布 即差数来自正态分布总体 不符合条件时 可考虑用非参数检验 配对符号秩和检验法 假设检验的基本原理与t检验 配对t检验 例4 3将20只按体重 月龄及性别配对的大白鼠随机分入甲 乙2组 甲组给正常饲料 乙组饲料缺乏维生素E 10天后测定大白鼠肝脏的维生素A含量 IU g 结果如下 问2组大白鼠肝脏维生素A含量是否有差别 假设检验的基本原理与t检验 配对t检验 假设检验的基本原理与t检验 配对t检验 例4 4有12名志愿受试者服用某减肥药 服药前和服药一个疗程后各测量一次体重 kg 数据如表4 2所示 试判断此减肥药是否有效 假设检验的基本原理与t检验 配对t检验 假设检验的基本原理与t检验 配对t检验 假设检验的基本原理与t检验 SAS运行结果 例题 为研究女性服用某种避孕药后是否影响其血清总胆固醇含量 将20名女性按年龄配成10对 每对随机抽取1人服用该药 另1人服用安慰剂 经一段时间后 测定血清总胆固醇含量如下 问该药是否影响女性血清总胆固醇含量 SAScode 配对t检验 假设检验的基本原理与t检验 SAS运行结果 SASoutput 配对t检验 假设检验的基本原理与t检验 SAS运行结果 SASoutput 完全随机设计的两组数值变量资料比较 小样本t检验法 完全随机设计 completelyrandomdesign 把受试对象完全随机分为两组 分别给予不同处理 然后比较独立的两组样本均数 各组对象数不必严格相同 目的 比较两总体均数是否相同 适用条件 两样本均数均来自正态分布总体 两总体方差相等 方差齐 若有一条以上不符合 采用适当的变量变换方法 使其达到上述条件 若变量变换后仍不满足条件 则用非参数检验法 秩和检验 假设检验的基本原理与t检验 完全随机设计的两组数值变量资料比较 小样本t检验法 假设检验的基本原理与t检验 完全随机设计的两组数值变量资料比较 小样本t检验法 例4 6将20份钩端螺旋体患者的血清随机分为2组 分别用标准株和水生株做凝溶试验 结果见表4 3 试比较两法测得的血清抗体平均效价有无差别 假设检验的基本原理与t检验 2020 1 29 38 可编辑 完全随机设计的两组数值变量资料比较 小样本t检验法 假设检验的基本原理与t检验 完全随机设计的两组数值变量资料比较 正态性检验 正态性检验 normalitytest 方法 统计指标 偏度系数 峰度系数 W值 D值等统计图 P P图 Q Q图 直方图 茎叶图 箱图等 正态性检验是推断资料是否服从正态分布 或样本是否来自正态分布总体的方法 医学统计学中 许多统计方法仅适用于正态分布或近似正态分布资料 例如 用均数和标准差描述数值变量资料的分布特征 以及t u检验和方差分析时 均要求样本资料服从正态分布 因此 选定统计方法时 先要用正态性检验 testofnormality 推断资料是否服从正态分布 假设检验的基本原理与t检验 完全随机设计的两组数值变量资料比较 正态性检验 假设检验的基本原理与t检验 P P图 完全随机设计的两组数值变量资料比较 正态性检验 假设检验的基本原理与t检验 P P图 完全随机设计的两组数值变量资料比较 正态性检验 矩法 即分别对总体分布的偏度与峰度进行检验 假设检验的基本原理与t检验 P P图 完全随机设计的两组数值变量资料比较 正态性检验 矩法 即分别对总体分布的偏度与峰度进行检验 假设检验的基本原理与t检验 完全随机设计的两组数值变量资料比较 正态性检验 矩法 即分别对总体分布的偏度与峰度进行检验 假设检验的基本原理与t检验 检验水准取大些 完全随机设计的两组数值变量资料比较 两独立样本方差的齐性检验 两独立小样本均数的t检验 除要求两组数据均应服从正态分布外 还要求两组数据相应的两总体方差相等 即方差齐性 homoscedasticity 但即使两总体方差相等 两个样本方差也会有抽样误差 两个样本方差不等是否能用抽样误差解释 可进行方差齐性检验 注意 方差齐性检验本为双侧检验 但由于公式规定以较大的方差作分子 F值必然大于1 故附表3单侧0 025的界值 实对应双侧检验P 0 05 当样本含量较大时 如n1和n2均大于50 可不必作方差齐性检验 假设检验的基本原理与t检验 根据专业知识确定单 双侧检验 完全随机设计的两组数值变量资料比较 两独立样本方差的齐性检验 根据专业知识确定单 双侧检验 完全随机设计的两组数值变量资料比较 两独立样本方差的齐性检验 完全随机设计的两组数值变量资料比较 两独立样本方差的齐性检验 例某研究所为了了解水体中汞含量的垂直变化 对某氯碱厂附近一河流的表层水和深层水作了汞含量的测定 结果如下 试检验两个方差是否齐性 深层水 n1 8 样本均数 1 781 mg L S1 1 899 mg L 表层水 n2 10 样本均数 0 247 mg L S2 0 210 mg L 确定P值作出推断结论本例 1 8 1 7 2 10 1 9 查附表3 F界值表 方差齐性检验用 得F0 05 7 9 4 20 本例F 80 97 F0 05 7 9 4 20 故P 0 05 按 0 05水准 拒绝H0 接受H1 结论 故可认为两总体方差不齐 假设检验的基本原理与t检验 完全随机设计的两组数值变量资料比较 两独立样本方差的齐性检验 假设检验的基本原理与t检验 完全随机设计的两组数值变量资料比较 t 检验 近似t检验有3种方法可供选择 包括Cochran Cox法 Satterthwaite法和Welch法 其中1 2两种方法较为常用 Cochran Cox法是对临界值校正 而Satterthwaite法和Welch法则是对自由度校正 Satterthwaite法是目前计算机软件中普遍使用的方法 假设检验的基本原理与t检验 完全随机设计的两组数值变量资料比较 两大样本均数的u检验 two sample testforindependentsamples 在两个样本均数比较时 若两组样本含量都很大 可用u检验 其计算公式为 例4 8某医师欲比较某地工人和农民全血胆碱脂酶活力 检测工人143名 均数3 52 mol L 标准差为0 49 mol L 检测农民156名 均数3 36 mol L 标准差为0 53 mol L 问该地工人与农民全血胆碱脂酶活力有无差别 假设检验的基本原理与t检验 完全随机设计的两组数值变量资料比较 两大样本均数的u检验 two sample testforindependentsamples 假设检验的基本原理与t检验 完全随机设计的两组数值变量资料比较 SAS运行结果 假设检验的基本原理与t检验 例题 某克山病区测得急性克山病患者11名和该地健康人的血磷值如下 问两组血磷值差异是否有统计学意义 急性克山病患者 4 736 402 603 246 535 185 583 734 435 783 37健康人 2 342 501 981 671 983 602 333 734 574 825 784 174 14 完全随机设计的两组数值变量资料比较 SASoutput 假设检验的基本原理与t检验 Group 1 Group 2 完全随机设计的两组数值变量资料比较 SASoutput 假设检验的基本原理与t检验 完全随机设计的两组数值变量资料比较 SASoutput 假设检验的基本原理与t检验 型错误和 型错误 假设检验的基本原理与t检验 假设检验中作出的推断结论可能发生两种错误 拒绝了实际上是成立的H0 这叫 型错误 type error 或第一类错误 也称为 错误 1 即可信度 confidencelevel 重复抽样时 样本区间包含总体参数 m 的百分数 不拒绝实际上是不成立的H0 这叫 型错误 type error 或第二类错误 也称为 错误 1 即把握度 powerofatest 两总体确有差别 被检出有差别的能力 型错误和 型错误 假设检验的基本原理与t检验 型错误和 型错误 假设检验的基本原理与t检验 型错误和 型错误 假设检验的基本原理与t检验 型错误和 型错误 假设检验的基本原理与t检验 型错误和 型错误 假设检验的基本原理与t检验 假设检验中作出的推断结论可能发生两种错误的控制 型错误和 型错误 假设检验的基本原理与t检验 假定做了次检验 通常称为 族检验 familyoftests 在每一次检验 第一类错误 不变的情况下 K次检验的联合假阳性率将远远大于 假阳性率 falsediscoveryrate FDR 是在特定检验水准下 有 统计学意义 的结果中 为真的比例 多次重复检验造成的假阳性 每人的命中率0 95 而失误率为0 05 则多人的联合失误率会远远大于0 05 假设检验的基本原理与t检验 多次重复检验造成的假阳性 假设检验的基本原理与t检验 单侧检验与双侧检验 假设检验的基本原理与t检验 单侧检验与双侧检验 假设检验的基本原理与t检验 假设检验时应注意的事项 假设检验的基本原理与t检验 1 要有严密的抽样研究设计这是假设检验的前提 样本必须是从同质总体中随机抽取的 要保证组间的均衡性和资料的可比性 即对比组间除处理因素 如新药和常规药 外 非处理因素 如年龄 性别 病程 病情轻重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论