32第三讲2假设检验_第1页
32第三讲2假设检验_第2页
32第三讲2假设检验_第3页
32第三讲2假设检验_第4页
32第三讲2假设检验_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章第四章 假设检验假设检验(hypothesis testinghypothesis testing)样本样本2样本样本1总体总体a总体总体b样本样本3第一节第一节 假设检验的概念与原理假设检验的概念与原理何为假设检验何为假设检验? 假设检验是指对于一个或多个总体的概假设检验是指对于一个或多个总体的概率分布或参数的假设。率分布或参数的假设。 所作假设可能是正所作假设可能是正确的,也可能是错误的。确的,也可能是错误的。 为判断所作的假设是否正确,为判断所作的假设是否正确, 从总体从总体中抽取样本,根据样本的取值,按一定原中抽取样本,根据样本的取值,按一定原则进行检验,则进行检验, 然后作出接

2、受或拒绝所作假然后作出接受或拒绝所作假设的决定。设的决定。基本原理基本原理n反证法思想反证法思想:首先提出假设(未经检验是否成立,:首先提出假设(未经检验是否成立,称无效假设),用适当的统计方法确定假设成立称无效假设),用适当的统计方法确定假设成立的可能性大小,若可能性小则称不成立,拒绝它,的可能性大小,若可能性小则称不成立,拒绝它,如果可能性大,还不能认为它不成立。如果可能性大,还不能认为它不成立。n小概率思想小概率思想:是指小概率事件在一次随机试验中:是指小概率事件在一次随机试验中被认为基本不会发生。被认为基本不会发生。 概率小于多少算小概率是相对的,在进行统计分概率小于多少算小概率是相对

3、的,在进行统计分析时要事先规定,即检验水准析时要事先规定,即检验水准。检验目的检验目的: 与与 0是否相同是否相同 未知,只能比较样本均数未知,只能比较样本均数 与与 0 0,( ( 0 0)0)0有有两种可能两种可能: :1.1. 与与 0 0相等,差异由抽样引起;相等,差异由抽样引起;2.2. 与与 0 0本身不相等。本身不相等。xx假设检验的基本步骤假设检验的基本步骤一建立检验假设,确定检验水准一建立检验假设,确定检验水准 h0(无效假设):(无效假设):=0, 两总体均数相等,差异仅由抽样误差所致。两总体均数相等,差异仅由抽样误差所致。 h1(备择假设):(备择假设):0(或(或0 或

4、或,拒绝,拒绝h0的样本证据不足,就不拒绝的样本证据不足,就不拒绝h0,暂且认为,暂且认为h0成立成立 根据统计推断结果,结合相应的专业知识,给出根据统计推断结果,结合相应的专业知识,给出一个专业的结论。一个专业的结论。 统计结论和专业结论统计结论和专业结论例4-1一建立检验假设,确定检验水准一建立检验假设,确定检验水准 h0:=0, 常锻炼学生的心率与一般学生相等。常锻炼学生的心率与一般学生相等。 h1:0 ,常锻炼学生的心率低于一般学生常锻炼学生的心率低于一般学生。 =0.05二选择检验方法和计算统计量二选择检验方法和计算统计量 三确定概率三确定概率p值和作出统计推断值和作出统计推断 本例

5、本例pp,则不拒绝,则不拒绝h h0 0 ,差异无统计学意义(,差异无统计学意义(“阴性阴性”结果),结果),尚不能认为尚不能认为不同或不等不同或不等( (或拒绝或拒绝h h0 0的证据尚的证据尚不足不足) ) 4. 4. 下统计检验结论只能说有、无统计学意义,而不能下统计检验结论只能说有、无统计学意义,而不能说明专业上的差异大小。说明专业上的差异大小。p p值越小只能说明:作出值越小只能说明:作出拒绝拒绝h h0 0,接受接受h h1 1的统计学证据越充分,推论的统计学证据越充分,推论时时犯错误的机会越小犯错误的机会越小,与专业上与专业上| |0 0 | |差异的大小无直接关系差异的大小无直

6、接关系。5. 5. 应事先确定应事先确定。选。选0.050.05只是一种习惯,而不是只是一种习惯,而不是绝对的标准。绝对的标准。关于假设检验的几个观点关于假设检验的几个观点第二节第二节 t 检验检验一、单样本的一、单样本的t 检验检验 推断一个取自正态资料推断一个取自正态资料n(,2) ,容量为,容量为n的样本所代表的的样本所代表的未知总体均数未知总体均数与已知总体均数与已知总体均数0是否相等。是否相等。 当样本量当样本量n足够大(足够大(n 50)时,用)时,用z 检验。检验。 例例4-21.异源配对:将受试对象按某些混杂因素(如性别、年龄、窝别等)配成对子,然后将每对中的两个个体随机分配给

7、两种处理(如处理组与对照组)2.同源配对:同一受试对象作两次不同的处理,或一种处理的前后比较。 优点:配对设计减少了比较对子间的个体差异。 特点:资料成对,每对数据不可拆分。二、二、配对设计资料均数的配对设计资料均数的t t检验检验假设检验方法假设检验方法0.06 30.027ddsh0:d d0 0h1:d d0 021iiixxd表表4-1 15对孪生兄弟的出生体重对孪生兄弟的出生体重(kg)先出生者体重后出生者体重编号 12.792.69 0.1023.062.89 0.1732.342.24 0.1043.413.37 0.0453.483.50-0.0263.232.93 0.307

8、2.272.24 0.03 82.482.55-0.0793.032.82 0.21103.073.05 0.02113.613.58 0.03122.692.66 0.03133.093.20-0.11142.982.92 0.06152.652.60 0.05例例4-34-3的假设检验的假设检验三、三、完全随机设计两总体均数的完全随机设计两总体均数的t 检验检验 实验设计:实验设计:用完全随机设计用完全随机设计(completely random (completely random design) design) 方法,把受试对象随机分为两组,分别给予不同方法,把受试对象随机分为两组,分

9、别给予不同处理,然后比较独立的两组样本均数。各组对象数不必严处理,然后比较独立的两组样本均数。各组对象数不必严格相同。格相同。 调查设计:调查设计:从两组具有不同特征的人群中,分别随机从两组具有不同特征的人群中,分别随机抽取一定数量的样本,比较某一指标在不同特征人群中是抽取一定数量的样本,比较某一指标在不同特征人群中是否相等。否相等。 使用条件:假定资料来自使用条件:假定资料来自独立独立、随随机机的的正态正态总体,总体,且且1 12 2= =2 22 2两组完全随机设计资料的方差齐性检验两组完全随机设计资料的方差齐性检验222201211221112222:()()1,1hhsfnns双侧较大

10、,(较小)使用条件,两样本均服从正态分布使用条件,两样本均服从正态分布例4-4 两组病人服用降压药后的降压效果比较计算公式:计算公式:)11(212-21nnsscxx 2-) 1-() 1-(1-1-/)( -/)( -212222112122222121212nnsnsnnnnxxnxxsc 12121212() 0,-1-1-2xxxxtnnnns其中,均数差的标准误其中,均数差的标准误 当tt/2()时,p,拒绝h0,接受h1。当t,不拒绝h0。2.t 检验两总体均数的t检验方法t t检验的应用条件要求两个总体方差相等,检验的应用条件要求两个总体方差相等,如如不等不等时,可以:时,可以

11、:1. 1. 变量变换变量变换2. 2. 非参数检验非参数检验3. 3. 近似近似t t检验(即检验(即 tt检验)检验)两总体均数的z 检验大样本时使用(两组例数均50例),可用z 检验,优点:计算相对简单。 t t检验和检验和z 检验的条件检验的条件t检验:要求样本来自正态分布,且两均数比检验:要求样本来自正态分布,且两均数比较时还要求两总体方差相等。较时还要求两总体方差相等。z 检验:检验:n较大。较大。正态性检验单一总体单一总体t t检验检验时,要求样本相应的总体为正态总体配对配对t t检验检验时,要求每对数据差值的总体为正态总体两样本两样本t t检验检验时,要求相应的两总体为正态总体

12、且两总体方差相等,即方差齐性;如果方差不齐,则采用t检验正态性检验方法(normality test)1. 图示法直方图、pp图、qq图、箱图、茎叶图2. 计算法峰度系数、偏度系数、shapiro-wilk w法、kolmogorov-smirnov d法第三节第三节 假设检验与区间估计的关系假设检验与区间估计的关系l置信区间具有假设检验的主要功能;置信区间具有假设检验的主要功能;l置信区间可提供假设检验没有提供的信息;置信区间可提供假设检验没有提供的信息;l假设检验比置信区间多提供的信息:假设假设检验比置信区间多提供的信息:假设检验能够获得确切的概率检验能够获得确切的概率 p 值。值。l置信

13、区间与假设检验既能提供相互等价的置信区间与假设检验既能提供相互等价的信息,又有各自不同的功能,将二者结合信息,又有各自不同的功能,将二者结合可提供全面、完整的信息。可提供全面、完整的信息。 有实际专业意义的值 h0 (2) (3) (4) (5) (1) 有实际 可能有实际 无实际 样本例数 不拒绝 专业意义 专业意义 专业意义 太少 h0 有统计学意义 无统计学意义 图4-1 置信区间在统计推断上提供的信息一、两类错误一、两类错误 由于样本的随机性,假设检验中作出的结论可能会犯两类不由于样本的随机性,假设检验中作出的结论可能会犯两类不同类型的错误:同类型的错误: (1 1)实际情况与)实际情

14、况与h h0 0一致,但由于抽样的原因,使得统计量的一致,但由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝了原本正确的观察值落到拒绝域,拒绝了原本正确的h h0 0,这样的错误称第,这样的错误称第一类错误或一类错误或型错误或弃真错误。犯第一类错误的概率记作型错误或弃真错误。犯第一类错误的概率记作。 第四节第四节 假设检验的功效假设检验的功效 (2 2) 实际情况与实际情况与h h0 0不一致,也仅仅由于抽样的原因,不一致,也仅仅由于抽样的原因,使得统计量的观察值落到接受域,接受了原本错误的使得统计量的观察值落到接受域,接受了原本错误的h h0 0,这样的错误称第二类错误这样的错误称第二类错

15、误(type error )(type error )或或型错型错误或取伪错误。犯第二类错误的概率记作误或取伪错误。犯第二类错误的概率记作。 检验效能检验效能(power of a test):亦称把握):亦称把握度,度,1-,它的意义是当两总体确有差别,它的意义是当两总体确有差别,按规定检验水准按规定检验水准所能发现该差异所能发现该差异 的能力。的能力。两种错误的关系两种错误的关系拒绝拒绝h0只会犯只会犯型错误;不拒绝型错误;不拒绝h0,只会,只会犯犯型错误。型错误。样本含量一定时,样本含量一定时,越大,越大,越小;越小;越小,越小,越大。越大。如要同时减小如要同时减小、,只要增加样本,只要

16、增加样本含量。含量。 两类错误两类错误 i型错误(弃真) :拒绝实际正确的h0, i型错误的概率记为。(1a)即可信度:重复抽样时,样本区间包含总体参数(m)的百分数。ii型错误(取伪) : 不拒绝实际不正确的h0, ii型错误的概率记为。(1)即把握度(或检验效能):两总体确有差别,被检出有差别的能力假设检验应注意的问题假设检验应注意的问题 1. 要有严密的抽样研究计划要有严密的抽样研究计划 要保证样本是从同质总体中随机抽取。要保证样本是从同质总体中随机抽取。 除了对比的因素外,其它影响结果的因素除了对比的因素外,其它影响结果的因素应一致。应一致。 2选用的假设检验方法应符合其应用条件选用的假设检验方法应符合其应用条件 要了解变量的类型是计量的还是计数的,要了解变量的类型是计量的还是计数的,设计类型是配对设计还是成组设计,是大设计类型是配对设计还是成组设计,是大样本还是小样本。样本还是小样本。3.结论不能绝对化结论不能绝对化4.正确理解差别有无显著性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论