第7-8章参数估计和假设检验_第1页
第7-8章参数估计和假设检验_第2页
第7-8章参数估计和假设检验_第3页
第7-8章参数估计和假设检验_第4页
第7-8章参数估计和假设检验_第5页
免费预览已结束,剩余62页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、11月12日, 2015年 第七章 参数估计与假设检验的基本思想 ( Parameter estimate and Hypothesis test )沈月平 Ph.D., Associate Professor苏州大学 医学部 公共卫生学院 流行病与卫生统计系 E-mail: Contents参数估计假设检验的概念、步骤和基本思想*样本均数与总体均数的比较 (one-sample test)*配对设计数值变量资料比较(paired-samples t-test )* *完全随机化设计两样本均数的比较(independent-samples t-test) * *t检验的应用条件(正态性检验和方

2、差齐性检验)假设检验中需注意的问题* * 背景统计分析描述性统计推断性统计参数估计假设检验点估计区间估计 总体均数估计:置信区间法估计总体均数的95%置信区间的公式为: 例7-2 为了解苏州市15岁女中学生的身高,现抽取来自苏州市三个区的6个中学的60名15岁女中学生,测量她们的身高,得身高均数为155cm,标准差为12cm,试估计苏州市15岁女中学生身高均数的95%的置信区间。 苏州市15岁女中学生身高均数的95%置信区间为(151.9,158.1)cm。 总体率估计当n足够大,且p和1-p均不太小,如np和 n(1-p)均大于5时,样本率P的抽样分布逼近正态分布。 例7-7 在常熟市大规模

3、心血管疾病的调查中随机抽取某个社区,3060岁的居民共2000人,其中400人患高血压。试估计常熟市高血压患病率的95%置信区间。 例7-5 某市妇幼保健站于2012年在全市范围内作了大规模的女性乳腺癌患病情况的调查,现从调查的人群中随机抽取了2万名2550岁妇女,患者80人,试估计该地2550岁女性平均1万人乳腺癌患病人数的95%可信区间。Poisson分布总体均数的估计 Hypothesis test -Problems假设检验的概念?举例说明假设检验的步骤?讲述假设检验的基本思想? 1、什么是假设检验? 假设检验(hypothesis test):是利用反证法的原理对“假设”进行检验的一

4、种方法。是建立在抽样研究基础之上,用样本统计量推断两个或两个以上总体参数是否不等的一类基本方法。 2、假设检验步骤是什么? 例:已知一般中学男生的心率的均数为0=74次/分,为研究经常参加体育锻炼的中学生心脏功能是否增强,在某地中学生中随机抽取常年参加体育锻炼的男生100名,得到心率平均值为65次/分,标准差s=6次/分。问:常年参加体育锻炼的中学男生心率是否低于一般中学男生的心率? 例题示意 0=74次/分一般中学生=?=65次/分S=6次/分经常锻炼的中学生n=100?Hypothesis test task 0(6574)Why?True difference betweentwo po

5、pulationsChance(sampling error)evidenceSo the hypothesis task is to differentiate that the difference between the samples is from the true difference between two populations or from the chance!假设检验的步骤(1) 建立检验假设,确定检验水准H0:= 0=74次/分 (检验假设/零假设; hypothesis under test/ null hypothesis)H1:0 (备择假设/ alternat

6、ive hypothesis) =0.05 (检验水准/significance level) 双侧检验(Two-sided test)假设检验的步骤(2)根据资料和研究设计类型,选用公式计算统计量 (本研究属于样本均数与总体均数比较/ 单样本t检验one-sample t-test)假设检验的步骤(3)根据样本统计量的大小,确定值,按水平作出统计推断P值的定义是:指从规定的总体随机抽样,构造的检验统计量(如t,u,2等)等于及大于(或和等于及小于)现有样本统计量的概率假设检验统计推断标准双侧检验|t|, 拒绝,不拒绝,差异无 统计学意义;|t|t/2, ,P,接受,拒绝,差异有 统计学意义;

7、单侧检验|t|, 拒绝,不拒绝,差异无统计学意义;|t|t, ,P,接受,拒绝,差异有统计学意义;本例=100-1=99,t0.05/2,991.984; t0.01/2,992.626|t|t0.01/2,99,2.093 ,因此 ,按 水准,拒绝 ,接受 ,差别有统计学意义,可以认为蒙古族人群空腹血糖水平高于汉族人群。应用条件:样本均数来自正态总体配对设计数值变量资料比较(paired-samples t-test )P139 例8-2(本书答案有误)配对设计异体配对自身配对28配对设计配对条件:性别、年龄、体重等等自身配对:前后对照试验、同一对象采用两种不同的方法优点:实验误差较小、检验

8、效率较高、所需样本量也较小。缺点:当配对条件未能严格控制造成配对失败或配对欠佳时,反而会降低效率。研究对象纳入标准排除标准对子1配对条件实验组A2随机化对子2对子K对照组A1B1B2K1K229基本思想与步骤 编号 服药前服药后差值 1A1-1A1-2d1 2A2-1A2-2d2 .30A30-1A30-2d3031A31-1A31-2d31.kAk-1Ak-2dk=01建立检验假设,确定检验水准 : ,即口服补充VD3一年后血中25(OH)D水平没有变化 : ,即口服补充VD3一年后血中25(OH)D水平有变化 本例 n=25,3确定P值,作出统计推断 以=24查 t界值表得 ,按 水准,不

9、拒绝服药前和服药后血中25(OH)D水平无统计学差异,即可认为口服补充VD3一年后血中25(OH)D水平无变化。 例8-3 某研究者为研究煤尘对不同暴露程度的煤矿工人(掘进工-高暴露,采煤工-低暴露)肺部的早期损伤的情况,在某个煤矿选取掘进工人16名, 并在该煤矿按照年龄(相差不超过3岁)、工龄1:1匹配的原则选取16名采煤工。分别检测他们血清中氧化应激指标过氧化氢酶(CAT),结果见表8-2。试分析掘进工和采煤工血清过氧化氢酶CAT水平有无差别。完全随机化的两组样本均数的比较(independent-samples t-test)P142 例8-4 例题示意 1=?高血压组2=? =0.78

10、1/LS2=0.140g/L血压正常组? =0.814g/LS1=0.194g/Ln1=10n2=10检验步骤:1建立检验假设,确定检验水准即高血压组和正常血压组人尾加压素水平无差别即高血压组和正常血压组人尾加压素水平有差别2计算检验统计量 t值称为均数差值的标准误称为合并方差3确定P值,作出统计推断 以=18查 界值表得 ,本例 , 按 水准,不拒绝 ,两组均数差异无统计学意义,尚不能认为高血压组和正常血压组人尾加压素水平有差别。两独立样本均数的比较(independent-samples t-test)应用条件:独立性,方差齐性,正态性二、z检验 完全随机化设计的两样本均数比较,如果正态性

11、满足,方差齐性满足,并且当两样本含量较大时(一般要求 , ),构造的抽样分布t分布就趋近于标准正态分布z分布,则检验统计量按下面公式计算: 例8-5 某研究者为了研究藏族居民型糖尿病及空腹血糖受损情况,调查了370人(男性138人,女性232人)的空腹血糖情况,见表8-4,试比较男女性藏族居民空腹血糖水平是否相同(假设男女性空腹血糖水平服从正态分布)。表8-4 370名西藏拉萨市3070岁城镇居民空腹血糖情况性别ns男性1385.31.6女性2325.61.6检验步骤:1建立检验假设,确定检验水准即男女性藏族居民空腹血糖水平无差别即男女性藏族居民空腹血糖水平有差别2计算检验统计量 Z值3确定P

12、值,作出统计推断三、 t检验 当两总体呈正态分布,但方差不齐,即 时,可选用近似t检验 检验。其检验统计量为 ,有三种方法,即Satterhwaite , Welch法 检验和Cochran & Cox法 检验。其中Cochran & Cox法是对临界值校正,而Satterhwaite法和Welch法是对自由度进行校正。完全随机化设计的两组对数正态分布资料 比较的t检验例8-7 P148 t检验的应用条件正态性检验方差齐性检验变量变换正态性检验图示法:直方图、P-P图、Q-Q图P-P图横轴:样本观察值的实际累计频率纵轴:按正态分布计算的累计频率Q-Q图:以样本的分位数作为横坐标,以按照正态分布

13、计算的相应分位数作为纵坐标。检验法:W法(n50)、D法(50 n 1000)、矩法(最全面)正态性检验:假设检验例8-8 P152例8-9 矩法检验 P154方差齐性检验:F-test例8-10H0:21= 22,两组总体方差齐H1:21 22,两组总体方差不齐=0.10如果方差不齐,需要用t检验其它方法:方差齐性检验:levenes test ,Bartlett 2检验方差齐性检验:levene检验可用于两个或多个样本的方差齐性检验,不要求资料服从正态分布,结果更为稳健。软件包中常用此法。变量变换资料如不符合检验的条件,也可通过变量变换使其符合正态性或方差齐性对数变换:对数正态分布资料、标

14、准差与均数成比例或变异系数接近某一正常值平方根变换:方差与均数成比例的资料;服从poisson分布资料倒数变换:数据两端波动较大的资料平方根反正弦变换:二项分布的率或百分比较大或较小时假设检验中需注意的问题两类错误P值的含义单侧和双侧检验假设检验的应用条件假设检验与置信区间的关系统计学意义与实际意义两类错误*I类错误(type I error)和II类错误(type II error)I类错误:拒绝了实际成立的 ,大小为P值(P)II类错误:没有拒绝事实上不成立的 ,大小为I类错误和II类错误的关系检验效能:P值的含义P值的定义是:无效假设 成立时,从规定的总体随机抽样,构造的检验统计量(如t,u,2等)等于及大于(或和等于及小于)现有样本统计量的概率P值与的关系: 是事先确定的小概率事件的水准。 P值是拒绝 接受 时所犯的错误大小,不是无效假设成立的可能性大小(有争议!)。 I型错误的概率最大为;很显然,两次对同一研究的检验,P0.0001比P 2 对同一资料,单侧检验比双侧检验更容易拒绝无效假设假设检验的应用条件单样本t-test:样本均数来自正态总体配

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论