卫生统计学-潘海燕 卫统7假设检验-听_第1页
卫生统计学-潘海燕 卫统7假设检验-听_第2页
卫生统计学-潘海燕 卫统7假设检验-听_第3页
卫生统计学-潘海燕 卫统7假设检验-听_第4页
卫生统计学-潘海燕 卫统7假设检验-听_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 潘海燕潘海燕 公共卫生学院公共卫生学院 流行病与卫生统计学教研室流行病与卫生统计学教研室 统计分析:统计分析: 统计描述统计描述 统计推断统计推断: 参数估计参数估计 假设检验假设检验 假设检验(假设检验(hypothesis test,significant test)是统计是统计 推断的另一部分重要内容。推断的另一部分重要内容。 假设检验的基本原理和步骤假设检验的基本原理和步骤 型错误与型错误与型错误型错误 单侧检验与双侧检验单侧检验与双侧检验 假设检验应注意的事项假设检验应注意的事项 假设检验与区间估计的联系假设检验与区间估计的联系 主要内容主要内容 1 假设检验的基本思想和步骤 【例

2、【例7-1】为了解某地为了解某地1 1岁婴儿的血红蛋白浓度,某岁婴儿的血红蛋白浓度,某 医生从该地随机抽取了医生从该地随机抽取了1 1岁婴儿岁婴儿2525名,测得其血名,测得其血 红蛋白浓度的平均数为红蛋白浓度的平均数为123.5g/L,123.5g/L,标准差为标准差为11.6 11.6 g/Lg/L,而一般正常小儿的平均血红蛋白浓度为,而一般正常小儿的平均血红蛋白浓度为 125g/L125g/L,故认为该地故认为该地1 1岁婴儿的平均血红蛋白浓岁婴儿的平均血红蛋白浓 度低于一般正常小儿的平均血红蛋白浓度。度低于一般正常小儿的平均血红蛋白浓度。 1. 假设检验假设检验的的基本思想基本思想 与

3、与125不同的原因何在?不同的原因何在? 来自于总体均数为来自于总体均数为 125g/L的总体,差别由抽的总体,差别由抽 样误差导致。样误差导致。 来自另一总体,这个来自另一总体,这个 总体的血红蛋白均数未总体的血红蛋白均数未 知,差别不仅是抽样误知,差别不仅是抽样误 差,主要是本质的不同差,主要是本质的不同 。 2525名名1 1岁婴儿岁婴儿 血红蛋白浓度血红蛋白浓度 125 0 0 假设检验的目的假设检验的目的就是判断差别是就是判断差别是 由哪种原因造成的。由哪种原因造成的。 抽样误差造成的;抽样误差造成的; 本质差异造成的。本质差异造成的。 0 X造成造成 的原因可能有两个的原因可能有两

4、个: 一般正常小儿的平均血红蛋白浓度一般正常小儿的平均血红蛋白浓度 该地该地1岁婴儿的平均血红蛋白浓度岁婴儿的平均血红蛋白浓度 X 一种假设一种假设H0 另一种假设另一种假设H1 抽样误差抽样误差 总体不同总体不同 125g/L 0 125g/L 0 . 0 0 0 x 由抽样误差引起 由本质差别引起 两种假设可以总结为:两种假设可以总结为: : 0 H : 1 H 假设假设 ,即认为的差别是由抽样误差造成,即认为的差别是由抽样误差造成 的则可用公式计算的则可用公式计算t t值。根据值。根据t t值确定值确定 P P 值的大小,值的大小, 并作出推断。并作出推断。 P P 小于或等于预先规定的

5、概率值小于或等于预先规定的概率值 (如),则为(如),则为 小概率事件,即在一次抽样中发生的可能性很小,小概率事件,即在一次抽样中发生的可能性很小, 如果它发生了,则怀疑原假设如果它发生了,则怀疑原假设 可能不成立,故认为其对立面可能不成立,故认为其对立面 成立。成立。 0 0 0 假设检验假设检验(hypothesis testing)基本思想基本思想 应用反证法和小概率事件的原理,先对总体的参应用反证法和小概率事件的原理,先对总体的参 数或分布作出某种假设,在数或分布作出某种假设,在 成立的条件下成立的条件下,再用再用 适当的方法(如适当的方法(如 t 检验)根据样本对总体提供的信检验)根

6、据样本对总体提供的信 息,推断此假设应当拒绝或不拒绝。息,推断此假设应当拒绝或不拒绝。 0 H 具体解释:具体解释: 假设某两个或多个总体参数相等、总体分布假设某两个或多个总体参数相等、总体分布 相同或总体服从某种分布(称为原假设)相同或总体服从某种分布(称为原假设) 在该假设成立时计算相应的检验统计量在该假设成立时计算相应的检验统计量 如如t t、F F等等 根据相应的分布确定根据相应的分布确定P P值,作出统计推断值,作出统计推断 若若P值小于或等于预先规定的小概率水准值小于或等于预先规定的小概率水准 (如),则拒绝原假设(如),则拒绝原假设 。 若若P值大于预先规定的小概率水准,则尚无值

7、大于预先规定的小概率水准,则尚无 充分的理由拒绝原假设。充分的理由拒绝原假设。 2.假设检验的一般步骤假设检验的一般步骤 建立检验假设,确定检验水准建立检验假设,确定检验水准 :无效假设或零假设 无效假设或零假设(null hypothesis) :备择假设 :备择假设(alternative hypothesis) 检验水准检验水准(significance level) 通常取通常取 根据专业知识和研究目的确定单双侧检验(见根据专业知识和研究目的确定单双侧检验(见 第三节)第三节) 0 H 1 H 对于检验假设,须注意:对于检验假设,须注意: 检验假设是针对总体而言,而不是针对样本;检验假

8、设是针对总体而言,而不是针对样本; H0和和H1是相互联系,对立的假设,后面的结论是相互联系,对立的假设,后面的结论 是根据是根据H0和和H1作出的,因此两者不是可有可无,作出的,因此两者不是可有可无, 而是缺一不可;而是缺一不可; 【例【例7-1】 2.1 建立检验假设,确定检验水准建立检验假设,确定检验水准 :该地 该地1 1岁婴儿的岁婴儿的HBHB浓度总体均数与一般正常浓度总体均数与一般正常 小儿的小儿的HBHB浓度总体均数相等,即浓度总体均数相等,即 :该地 :该地1 1岁婴儿的岁婴儿的HBHB浓度总体均数浓度总体均数 与一般正与一般正 常小儿的常小儿的HBHB浓度总体均数不等,即浓度

9、总体均数不等,即 0 H 1 H 0 0 2.2 选定检验方法计算检验统计量选定检验方法计算检验统计量 根据研究目的、资料类型、分布类型、设计 根据研究目的、资料类型、分布类型、设计 类型、样本含量及适用条件等,选择合适的统类型、样本含量及适用条件等,选择合适的统 计方法,计算相应的检验统计量。计方法,计算相应的检验统计量。 0 123.5 125 0.6466 11.625 x x t S 124n 2.3 确定确定 值,作出推断结论值,作出推断结论 若若 ,则按,则按 水准,拒绝水准,拒绝 ,接受,接受 ,差异有统计,差异有统计 学意义(学意义(statistical significan

10、ce),可认为),可认为不同或不等不同或不等 P 若若 ,则按,则按 水准水准,不拒绝不拒绝 ,差异无统计学,差异无统计学 意义(意义( no statistical significance),尚不能认为),尚不能认为 不同或不等不同或不等 P P0 H 0 H 1 H 图图7-1 由由t 分布确定值的示意图分布确定值的示意图 本例中 , , ,故按 的水准,不拒绝 ,差异无统计学意 义(统计结论),(统计结论),尚不能认为该地1岁婴儿的血 红蛋白浓度平均水平与一般正常小儿的血红蛋 白浓度平均水平有差别(专业结论)(专业结论)。 0.05 2,24 2.064t 0.05 2,24 tt05

11、. 0P 05. 00 H 2 型错误与型错误 【例【例7-2】 总体总体是是100100例平原地区正常成年男子的红细胞例平原地区正常成年男子的红细胞 数,其总体参数数,其总体参数 , , ; 总体总体B B是是100100例高原地区正常成年男子的红细胞数,例高原地区正常成年男子的红细胞数, 其总体参数其总体参数 , , 。 现从总体现从总体B B中随机抽取的样本,其统计量为:中随机抽取的样本,其统计量为: L/1000.5 12 L/1043. 0 12 L/1050. 5 12 L/1045. 0 12 12 5.29 10/xL 12 0.42 10/SL 【例【例7-2】 若将该样本与

12、总体若将该样本与总体比较,则得比较,则得 1835. 2t0569. 0P 按按 水准,不拒绝水准,不拒绝 ,差别无统计学,差别无统计学 意义,尚不能认为总体意义,尚不能认为总体A A与总体与总体B B的红细胞均的红细胞均 数不同。数不同。 05. 00 H 型错误型错误(type error) :拒绝了拒绝了 实际上成立的实际上成立的 ,犯,犯“弃真弃真”的的 错误。其概率大小用错误。其概率大小用 表示表示, , 可可 取单侧亦可取双侧。取单侧亦可取双侧。 0 H 型错误型错误(type error) :不拒绝了不拒绝了 实际上不成立的实际上不成立的H0,犯,犯“存伪存伪”的错误。其的错误。

13、其 概率大小用概率大小用表示。表示。 只取单侧,其大小一只取单侧,其大小一 般未知,只有在已知两总体差值般未知,只有在已知两总体差值 , 及及 n n 时,才能估算出来。时,才能估算出来。 实际情况 检验结果 拒绝H0不拒绝H0 成立第类错误()结论正确(1-) 不成立结论正确(1-)第类错误() 推断结论与两类错误推断结论与两类错误 0 H 0 H 图7-2 型错误与型错误示意图 检验效能检验效能(power of a test) : 若两总体确有差别,按照水准 能够发现这种差别的能力。 它的大 小用(1-)表示。 (计算详见第十七章) 检验效能的影响因素 容许误差容许误差 总体标准差总体标

14、准差 型错误型错误 样本含量样本含量 n 3 单侧检验与双侧检验 单侧检验与双侧检验单侧检验与双侧检验 例例7-17-1中,该医生无法事先判断该地的环境因中,该医生无法事先判断该地的环境因 素如何影响素如何影响1 1岁婴儿的血红蛋白浓度,建立的岁婴儿的血红蛋白浓度,建立的 检验假设:检验假设: 00 :H 01 :H 显然包括 0 0 0 故称双侧检验故称双侧检验 (two-sided testtwo-sided test) 05. 0 单侧检验与双侧检验单侧检验与双侧检验 称单侧检验(称单侧检验(one-sided testone-sided test) 若检验假设如下: 0000 1010

15、 HH HH : 或 : 【例例7-3】已知某年某地健康成年男子脉搏均数为已知某年某地健康成年男子脉搏均数为 72次次/分。某医生测得某山区分。某医生测得某山区25名健康成年男子脉名健康成年男子脉 搏均数为次搏均数为次/分,标准差为次分,标准差为次/分。得:分。得: 查查 界值表界值表 单侧单侧 双侧双侧 83. 1t t 711. 1 24,05. 0 t 0.05 2,24 2.064t 本题结论应 该如何取? 单侧检验与双侧检验的关系单侧检验与双侧检验的关系 同一资料按相同方法分别进行双侧检验和单侧同一资料按相同方法分别进行双侧检验和单侧 检验,检验, ,则双侧检验所得的值一般大,则双侧

16、检验所得的值一般大 于单侧检验的值。于单侧检验的值。 若检验方法所基于的分布是对称的,则双侧检若检验方法所基于的分布是对称的,则双侧检 验所得的验所得的 值就是单侧检验所得值就是单侧检验所得 值的值的两倍两倍。 05. 0 PP 凡双侧检验凡双侧检验 ,单侧检验必,单侧检验必 凡单侧检验凡单侧检验 ,双侧检验必,双侧检验必 PP PP 单侧检验与双侧检验的选择单侧检验与双侧检验的选择 单侧检验,还是双侧检验,应依据专业知识和单侧检验,还是双侧检验,应依据专业知识和 研究目的,而不能在确定研究目的,而不能在确定 值时主观选择。值时主观选择。 P 误用单侧误用单侧检验会易犯检验会易犯型错误型错误 误用双侧误用双侧检验会易犯检验会易犯型错误型错误 以样本均数与总体均数比较为例 双侧检验双侧检验 单侧检验单侧检验 目的 0 是否 0 0 0 0 0 是否 0 是否 0 0 0 H 1 H 4 假设检验应注意的事项 1.应有严密的研究设计应有严密的研究设计 总体中的每个研究个体应具有同质性 样本的获取必须遵循随机化原则 比较的组间应具有可比性。 2.正确理解正确理解 水准和水准和 值的意义值的意义 是人为预先设定的一个概率值,可有多个 是假定 成立,得到实际观测数据的可能 性的大小 ,一个样本按某一方法只能得出一个 P P 0 H 3.正确理解结论的统计学意义正

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论