假设检验的概念及_第1页
假设检验的概念及_第2页
假设检验的概念及_第3页
假设检验的概念及_第4页
假设检验的概念及_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章假设检验的概念及t检验

总体样本抽取部分观察单位

统计量

参数

统计推断统计推断statisticalinference如:样本均数样本标准差S

样本率P如:总体均数总体标准差总体率内容:参数估计(estimationofparameters)

包括:点估计与区间估计2.假设检验(testofhypothesis)实例

通过以往大规模调查,已知某地一般新生儿的头围均数为34.50cm。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿55人,测得其头围均数为33.89cm,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?假设检验的步骤及有关概念总体间差异:1.个体差异,抽样误差所致;2.总体间固有差异判断差别属于哪一种情况的统计学检验,就是假设检验。

小概率思想:P<0.05(或P<0.01)是小概率事件。在一次试验中基本上不会发生。P≤α(0.05)样本差别有统计学意义;P>α(0.05)样本差别无统计学意义假设检验(testofhypothesis):,事先对总体的特征作出某种假设,通过分析样本数据,判断该样本信息是否支持这种假设,最后作出拒绝或不拒绝这种假设的取舍抉择。此方法称作假设检验。1、建立假设与确定检验水准(α)

H0:μ1=μ2无效假设(nullhypothesis)

H1:μ1≠μ2备择假设(alternativehypothesis)

检验水准(levelofatest):α=0.05(双侧)2、选定方法和计算统计量:根据统计推断目的、设计、资料组数、样本含量、等选择方法。如两组小样本比较用t检验、大样本比较u检验、方差齐性检验用F检验。3、确定P值,作出判断

P≤α(0.05)样本差别有统计学意义;

P>α(0.05)样本差别无统计学意义P值:指在H0成立的假设前提下,出现当前检验统计量以及更极端情况的概率。假设检验的步骤

1.差异来源该矿区新生儿总体均数与一般新生儿头围总体均数相同该矿区新生儿总体均数与一般新生儿头围总体均数不同

H0:μ=μ0=34.50,H1:μ≠μ0=34.50

单凭一份样本不可能证明哪一个正确,可考虑样本资料和哪一个假设有较大的矛盾来决定拒绝哪一个假设。一般考察样本资料是否与H0有较大的矛盾分析思路2.H0成立时会怎样?所得u值因样本而异,但其绝对值多数情况下落在0附近。u的分布规律可由u界值表查出3.当前状况如何,发生的可能性(P值)有多大?n=55,=33.89,μ0=34.50

得u=-2.273

拒绝域接受域拒绝域

P值系指在H0成立的假设前提下,出现当前检验统计量以及更极端情况的概率。查u界值表,当前u值以外的双侧尾部面积介于0.05和0.02之间4.决策决策者需要事先规定一个可以忽略的小概率值α。如取0.05,那么上述P值可认为很小。即H0成立时,几乎不可能出现当前的状况。于是,面临两种抉择,一是认为H0是成立的,而当前的极端情况又恰好偶然发生了;二是怀疑H0的正确性,从而接受H1。通常选择后者。本例,可认为该矿区新生儿总体均数与一般新生儿头围总体均数不同。例8-2:1995年,某地20岁应征男青年平均身高为168.5cm。2003年在当地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,问这两年身高是否不同。解:总体方差一般未知,当样本含量足够大时,用S作为σ

的估计值。

1

建立假设,确定检验水准

H0:μ=168.5,H1:μ≠168.5α=0.052计算统计量u3确定P值,下结论

查u界值表,4.70>u0.001/2=3.2905,得P<0.001,按照α=0.05水准,拒绝H0,接受H1,可认为2003年20岁应征男青年身高有变化,比1995年增高了。

例8-3:为比较某药治疗流行性出血热疗效,将72名患者随机分为试验和对照组,结果分别为n1=32,=2.9,S1=1.9;n2=40,=5.2,S2=2.7,问试验组和对照组的平均退热天数有无差别。解:可用两组大样本资料的u检验

H0:μ1=μ2,H1:μ1≠

μ2

α=0.05二两均数比较的u检验

u=-4.23

查u界值表,4.23>u0.001/2=3.2905,得P<0.001,按照α=0.05水准,拒绝H0,接受H1,可认为试验组和对照组退热天数的总体均数不等,疗效不同。试验组比对照组平均退热天数短。μ1-μ2

的95%可信区间为-3.3——-1.3天Ⅰ型错误和Ⅱ型错误由样本推断的结果真实结果拒绝H0不拒绝H0

H0成立Ⅰ型错误a

推断正确(1-a

)

H0不成立推断正确(1-b)Ⅱ型错误b

(1-b)即把握度(powerofatest):两总体确有差别,被检出有差别的能力(1-a)即可信度(confidencelevel):重复抽样时,样本区间包含总体参数(m)的百分数对于一般的假设检验,

a定为0.05(或0.01),b的大小取决于H1。通常情况下,比较总体间有无差异并不知道,即H1不明确,b值的大小无法确定,也就是说,对于一般的假设检验,我们并不知道犯Ⅱ型错误的概率b有多大。通常情况下Ⅱ型错误未知ab减少(增加)I型错误,将会增加(减少)II型错误增大n

同时降低a与ba与b间的关系

假设检验注意事项(1)可比性(随机性抽样、分组,资料具有均衡性和可比性)(2)正确选用假设检验方法(3)“差别”的实际意义(正确理解差别有统计学意义的涵义。有统计学意义指:样本来自不同的总体,而并非指差别很大,不能说明差别的大小.当专业上和统计学上都有“显著性意义”时,才有实用价值。)假设检验注意事项(4)判断结论时不能绝对化(原因是存在着两类错误写出精确P值:若对同一研究内容,A研究的结果P=0.002,B研究的结果P=0.04,虽结果均为拒绝H0,但A结果更为可信.(5)单侧检验与双侧检验(6)报告结果应写出统计量值、具体P值(单侧时应注明);95%CI既能说明差别的大小,也具有检验的作用,建议使用。(可信区间与假设检验均为统计推断方法,可信区间可以检验差值大小,假设检验可精确表示相关事件的概率。统计结果同时报告检验统计量、P值和可信区间更值得提倡。)第十章t检验(ttest)t检验,亦称studentt检验(Student’sttest),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。

一、样本均数与总体均数的比较二、配对资料的比较三、两样本均数的比较四、两方差齐性检验一、样本均数与总体均数的比较推断样本所代表的未知总体均数µ与已知总体均数µ0有无差别。已知总体均数µ0一般为理论值、标准值或经大量观察所得的稳定值。统计量t的计算公式:实例附表2

t界值表二、配对资料的比较

两种情况:1.随机配对设计(randomizedpaireddesign)是将受试对象按某些混杂因素(如性别、年龄、窝别等)配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组);2.或者同一受试对象作两次不同的处理(自身对照)。

优点:配对设计减少了个体差异。

特点:资料成对,每对数据不可拆分。表3-4两法测定12份尿铅含量的结果

表3-3两法测定12份尿铅含量的结果三、两样本均数的比较

完全随机设计(completelyrandomdesign):把受试对象完全随机分为两组,分别给予不同处理,然后比较独立的两组样本均数。各组对象数不必严格相同。

目的:比较两总体均数是否相同。条件:假定资料来自正态总体,σ12=σ22计算公式:其中,均数差的标准误

实例2.方差齐性检验Y=log(X+a)Y=Y=

Y=

方差齐性检验t检验的类型样本均数与总体均数比较的t检验(单组设计)(onesamplettest)

配对设计定量资料的t检验(pairedt-test)

成组设计定量资料的t检验(twosamplettest)小结三个概念

1独立性:指一批实验数据彼此之间是互相独立的。例如测得不同学生的身高、不同学生的考试成绩。2正态性:是指每个影响因素各水平组的定量资料来自于正态或近似正态分布的总体。3方差齐性:指每个影响因素各水平组的总体方差应当相等。一单组设计的特点及应满足的前提条件1设计特点:对一组同质的受试对象不按任何其它因素分组,直接观测或给予一种特定处理后观测这些受试对象某种或多种指标的取值。2已知总体均数µ0一般为理论值、标准值或经大量观察所得的稳定值。3前提条件:样本数据满足正态或近似正态分布。4统计量的计算:二配对设计的特点及应满足的前提条件1设计特点:A随机配对设计(randomizedpaireddesign)是将受试对象按某些混杂因素(如性别、年龄、窝别等)配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组);B.或者同一受试对象作两次不同的处理(自身对照)。优点:配对设计减少了个体差异。资料成对,每对数据不可拆分。2前提条件:成对数据间的差值满足正态或近似正态分布。3统计量的计算:三成组设计的特点及资料应满足的前提条件1设计特点:完全随机设计(completelyrandomdesign):把受试对象完全随机分为两组,分别给予不同处理,然后比较两组样本均数。两组数据是独立的,两组对象数不必严格相同。2前提条件:两组数据间是互相独立的、两组数据分别服从正态或近似正态分布、两组资料所对应的总体方差相等。3统计量的计算:五、资料不满足正态与方差齐时进行检验之对策1对数变换:常用于数据呈正偏态分布,较小数据多,较大数据少。2平方根变换:常用于服从Poisson分布的资料,算术均数=方差。3倒数变换:常用在数据呈极严重的正偏态分布,变换后可使特大数据变小,资料近似正态。对策五、资料不满足正态与方差齐时进行检验之对策平方根反正弦常用于百分率数据(如白血病患者的淋巴细胞转化率,脑电图波的变化率等)当数据有负数时,作对数或平方根变换可对原始数据相加一个常数使其变为正数。近似t检验(separatevarianceestimationt-test)

t‘检验非参数检验---秩和检验对策

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论