假设检验基础_第1页
假设检验基础_第2页
假设检验基础_第3页
假设检验基础_第4页
假设检验基础_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、假设检验的思维逻辑今天中午吃什么?

可选方案:面条、米饭这款手机是否适合我呢?对手机评价:适合(买)、不适合(不买)江津的四面山怎样吗?好就去,不好就不去对景区的评价:好玩(去)、不好玩(不去)人们在日常生活中都在做决策

所有的决策都遵循相同的基本模式陈述多种可供选择的方案(假设)收集支持这些方案的证据根据证据的强弱做出决策根据决定执行某种行为统计学中的假设检验也是一种决策过程,同样遵循这一基本模式假设检验(hypothesistest)假设检验,有时也称显著性检验(significancetest)是在两种相反的假设之间做出决定的一个过程它将被选择的方案表述为两种对立的假设,然后针对其中的一个假设收集证据,根据证据的强弱来决定是否拒绝这个假设例子

已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县(缺钙地区)抽取36名儿童,得前囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄是否迟于一般儿童?

研究背景:研究缺钙对幼儿生长发育的影响研究结果可供选择的结论(目前的假设)有哪些?1、该县儿童总体平均闭合月龄与一般儿童没有差异2、该县儿童总体平均闭合月龄迟于一般儿童两种假设在统计上的含义抽样研究存在抽样误差!!总体均数=14.1样本1样本2µ1=14.1样本1样本2样本3从总体1中抽样µ2≠14.1从总体2中抽样均数与14.1之间的差异是抽样误差造成均数与14.1之间的差异是本质差异造成µ1=14.1样本总体1µ2≠14.1总体2????即:需要推断14.3与14.1之间的差异是由抽样误差造成,还是由本质差异造成的?µ0=14.1统计上将前述两种差异表达为两种对立的假设实际观察到的样本µ1现在用两个符号来分别代表前面的两个总体,µ0表示一般儿童平均闭合时间µ1表示样本所来自的总体平均闭合时间假设1:观察到的差异是由抽样误差造成的即,µ1=µ0

称为:零假设(NullHypothesis),或原假设符号表示:H0假设2:观察到的差异是由本质差异造成的即,µ1≠µ0

称为:备择假设(AlternativeHypothesis)符号表示:H1注意:所有的假设检验都是对零假设(H0)进行检验!!

在目前观察结果的状况下,收集“否定H0的证据”,证据的强弱用概率p表示,概率越小证据越强,否定H0的理由就越充分。备择假设:有时也叫研究假设,它表示研究者希望得到的结论。研究者习惯称备择假设为“阳性结论”;而将零假设称为“阴性结论”它是利用反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。假设在H0成立的条件下计算检验统计量,获得P值,根据小概率原理来判断是否否定H0。假设检验基本思想理解两点:反证法思想、小概率原理二、假设检验的基本步骤零假设H0:μ=14.1备择假设

H1:

μ>14.1检验水准(sizeofatest):定义小概率事件的水平,用

α表示。通常取α=0.05,有时取0.011.建立检验假设并确定检验水准

本例,计算t检验的统计量t自由度:根据资料类型,目的等选择恰当的方法如Z检验、t检验、方差分析、卡方检验等2.选择恰当的统计检验方法,计算统计量3.确定P值P值的定义

如果H0成立的条件下,出现统计量目前值及更不利于H0的数值的概率

直观地看:就是统计量对应分布曲线下的尾部面积样本计算出来的t值P值示意图通过查表可以得到对应统计量的尾部面积,即p值

4.做推断结论假设检验的推断结论的出发点是:是否否定H02.若P>α,则意味着在H0成立的条件下获得目前的情况不是一个小概率事件,那么就还没有充足的理由否定H0

。于是做出不拒绝H0的决策。判断准则(小概率原理)1.若P≤α,则意味着在H0成立的条件下获得目前的情况是一个小概率事件,根据“小概率原理”,有充分的理由怀疑H0的真实性,从而否定(拒绝)H0,于是只能接受H1

。第二节t检验

随机样本来自正态总体均数比较时,要求两总体方差相等(方差齐性)应用条件一、单样本资料的t检验检验假设H0

:μ=μ0,

H1

:μ≠μ0(单侧检验μ>μ0或μ<μ0)统计量:见例7-1目的:推断样本来自的总体均数与已知的总体均数有无差别二、配对设计资料的t检验配对实施的形式主要有:(1)异体配对:将受试对象按特征相似的每两个对象配成一对,同对的两个对象分别接受不同处理(2)自身配对:同一对象的两个部位分别接受不同处理;或同一样品分成两份,分别接受不同处理

检验假设为H0:μd=0,

H1

:μd≠0当成立时,检验统计量

分析要点:对每对的两个观察值之差进行分析,推断差值的总体均数是否为0两种方法测定血清Mg2+

(mmol/l)的结果试样号甲基百里酚蓝(MTB)法葡萄糖激酶两点法差值10.940.92-0.0221.021.01-0.0131.141.11-0.0341.231.22-0.0151.311.320.0161.411.420.0171.531.51-0.0281.611.610.0091.721.720.00101.811.820.01111.931.930.00122.022.040.02例用两种方法测定12份血清样品中Mg2+

含量(mmol/l)的结果见表。试问两种方法测定结果有无差异?检验假设

H0:μd=0,

H1:μd≠0α=0.05

n=12,,Sd={[0.026-(-0.04)2/12]/(12-1)}1/2=0.01497计算统计量:自由度

ν=n-1=12-1=11.

查附表2(t临界值表),双侧

t0.20,11=1.363,知P>0.20,在α=0.05水平上不能拒绝H0。所以尚不能认为两法测定结果不同。

三、两独立样本资料的t检验

将受试对象随机分配成两个处理组,每一组随机接受的一种处理。一般把这样获得的两组资料视为代表两个不同总体的两份样本,据以推断它们的总体均数是否相等。在实际工作中按完全随机设计的两样本比较来对待。此类比较分为两种情况。

检验假设为H0:μ1=μ2,

H1:μ1≠μ2已知当H0成立时,检验统计量自由度=n1+n2-2(一)两样本所属总体方差相等

例7-4某研究者欲探索孕妇在孕期补充钙剂对血清骨钙素的影响,选取30名孕妇,分为两组,每组15人。试验组用选定的钙剂,对照组用传统膳食。产后45-50测定血清骨钙素改变值,如下:试验组:10.28.910.19.2-0.810.66.511.29.38.010.79.512.714.411.9试验组:5.06.7-1.44.07.1-0.62.84.33.75.84.6.04.15.14.7

检验假设H0:μ1=μ2

(两组孕妇骨钙素改变值总体均数相等)H1:μ1≠μ2

α=0.05这里n1=15,,S1=3.425,

n2=15,,S2=2.374。

自由度

ν=n1+n2-2=15+15-2=28查附表t界值表,

t0.5/2,28=2.048,知P<0.05,在α=0.05水准拒绝H0,接受H1,二者之间的差异有统计学意义。可以认为补钙组与传统膳食组的产妇骨钙素改变值的总体均数不相等,孕期补钙组骨钙素改变值较大。

检验假设为

H0:μ1=μ2,

H1:μ1≠μ2统计量t’作检验。

(二)两样本所属总体方差不等

---Satterthwaite近似法(t’检验)

例7-5为了比较特殊饮食与药物治疗改善血清胆固醇的效果,将24名志愿者随机分成两组,每组12人,甲组为特殊饮食组,乙组为药物治疗组。受试者试验前后各测量一次血清胆固醇,差值的结果见下表,请比较两种降血清胆固醇措施的效果是否相同?

检验假设H0:μ1=μ2,

H1:μ1≠μ2α=0.05

查附表2(t界值表),得,知P<0.05,在α=0.05水平上拒绝H0,二者之间的差异有统计学意义,所以可认为两种降血清胆固醇措施的效果有差异,特殊饮食组的效果较好。

四、两独立样本资料的方差齐性检验H0:,H1:

ν1=n1-1,ν2=n2-1

例7-6对例7-5的资料进行方差齐性检验。

查附表3.2,F0.05(11,11)=3.43,知P<0.05,在α=0.05水平上拒绝H0,二者之间的差异有统计学意义。可以认为两个总体方差不相等。

五、大样本资料的Z检验1、单样本资料的Z检验五、大样本资料的Z检验2、两独立样本资料的Z检验见例7-7第三节Poisson分布资料Z检验

Poisson分布资料的Z检验当总体均数λ≥20时,依据Poisson分布近似正态分布的原理,可以对其总体均数进行推断。

检验假设H0:λ=λ0,H1:λ≠λ0检验统计量为

例7-8某市计划2005年接种吸附百白破联合疫苗后无菌化脓发生率控制在25/10万人次以内。该市随机抽查2005年接种吸附百白破联合疫苗77755人次,其中发生无菌化脓例数为23例,试问2005年该市无菌化脓发生率能否达到要求?

需要转化为10万人的发生次数23/77755=29.58/10万建立检验假设H0:λ=25,H1:λ>25α=0.05

计算统计量确定P值和作推断

Z=0.916(单侧)对应的单侧概率为P=0.1788,因此P>0.05,按α=0.05水准,尚不能拒绝H0。可以认为无菌化脓发生率达到了预定目标。

当两总体均数都大于20时,依据Poisson分布近似正态分布的原理,可以应用Z检验对其总体均数进行推断。检验假设H0:λ1=λ2,

H1:λ1≠λ2两组独立样本资料的Z检验

当两样本观测单位数相等时,检验统计量为两样本观测单位数不等时,检验统计量

例7-9某市在对不同性别成年人(18岁以上)意外伤害死亡情况有无差异的研究中,随机抽取了该市2002年男女疾病监测数据各10万人,因意外伤害死亡的人数男女分别为51人和23人。试问,2002年不同性别每10万人口意外伤害死亡平均人数是否相等?

建立检验假设H0:λ1=λ2

,H1:λ1≠λ2α=0.05

计算统计量确定P值和作推断

按ν=∞查附表2(t临界值表),知Z0.05/2=1.96,所以P<0.05,按α=0.05水准拒绝H0,,接受H1,。可以认为该市不同性别意外伤害死亡平均人数有差异,且男性较高。

例7-10某车间改革生产工艺前,测得三次粉尘浓度,每升空气中分别有38、29、36颗粉尘;改进工艺后,测取两次,分别为25、18颗粉尘。问工艺改革前后粉尘数有无差别?建立检验假设H0:λ1=λ2

,H1:λ1≠λ2α=0.05

计算统计量因工艺改革前后观测单位数不等,故分别计算其均数。,n1=3

n2=2

Z=2.723>1.96,P<0.05,在α=0.05的水平上拒绝H0。可以认为工艺改革前后粉尘浓度不同,改革工艺后粉尘浓度较低。

第四节假设检验与区间估计的关系

置信区间具有假设检验的主要功能

可信区间包含所要检验的H0,则不拒绝H0;否则拒绝H0,接受H1置信区间可提供假设检验没有提供的信息

置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义假设检验比置信区间多提供的信息

假设检验可报告确切的P值;可以估计检验功效第五节假设检验的功效

假设检验的两类错误

第Ⅰ类错误(typeIerror):拒绝原本正确的H0,导致推断结论的错误。第Ⅱ类错误(typeⅡerror):

不拒绝原本错误的H0,导致推断结论的错误。推断结论和两类错误实际情况检验结果

拒绝H0,有差异

不拒绝H0,无差异H0成立,无差异第Ⅰ类错误(α)假阳性结论正确(1-α)H1成立,有差异结论正确(1-β)第Ⅱ类错误(β)假阴性假设检验中的两类错误假设检验的功效1-β称为假设检验的功效(powerofatest),也称为检验效能。其意义是,当所研究的总体与H0确有差别时,按检验水平α

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论