统计-1011假设检验_第1页
统计-1011假设检验_第2页
统计-1011假设检验_第3页
统计-1011假设检验_第4页
统计-1011假设检验_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验

hypothesistest统计学统计描述统计推断参数估计假设检验统计推断(statisticalinference)总体样本随机抽样

统计量

参数统计推断如:样本均数样本标准差S

样本率P如:总体均数总体标准差总体率2.假设检验(hypothesistest)参数估计(estimationofparameters)

点估计区间估计引例1:为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。某医生在一山区随机抽查了25名健康成年男子,求得其脉搏的均数为74.2次/分,标准差为6.0次/分。根据大量调查,已知健康成年男子脉搏均数为72次/分;能否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏均数?

问题转化为:由抽样结果判断假设

m

=

0

”是否成立?

引例2:将一批白鼠随机分为两组,分别喂不同饲料,一段时间后记录体重增加值,得到两样本均数`X1、`X2,推断喂不同饲料的白鼠平均体重增加值1、2是否有差别,以说明不同饲料对白鼠体重增加值的影响。

问题转化为:由抽样结果判断假设

“1=

2

”是否成立?

假设检验

事先对总体特征做出某种假设,通过分析样本信息,判断该样本信息是否支持这种假设,从而作出拒绝或不拒绝这种假设的取舍抉择。又称显著性检验(significancetest)。

根据样本的信息检验关于总体的某个假设是否正确。假设检验的基本思想例通过以往大规模调查,已知某地一般新生儿的头围均数为34.50cm,标准差为1.99cm。现从该地某矿区随机抽取新生儿55人,测得其头围均数为33.89cm,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?1.差异:

a个体差异,抽样误差所致矿区环境条件不影响新生儿头围大小

—无统计学意义(nosignificance)b总体间固有差异

矿区环境条件对新生儿头围有影响

—有统计学意义(significance)

判断差别属于哪一种情况假设H0条件成立,在这个条件下来考察样本均数与总体均数的差异能否用抽样误差解释。2.假设:假设矿区新生儿头围均数与一般新生儿头围总体均数0相同

----检验假设(hypothesistobetested)/零假设(nullhypothesis)

H0:

=0

,或H0:

=34.50`X=33.89

----备择假设(alternativehypothesis)

H1:

0

,或H1:

34.50

3.在H0条件下计算检验统计量:0-2.273假设检验中的小概率原理1.在一次试验中,一个几乎不可能发生的事件P<0.05(或P<0.01)----小概率事件小概率事件在一次试验中基本上不会发生2.在一次试验中小概率事件一旦发生,我们就有理由拒绝检验假设。4.统计决策是否拒绝H0:显著性水平(significancelevel):a临界值-1.9601.96-2.273图8-1标准正态分布下H0的接受域与拒绝域拒绝域拒绝域接受域临界值1.64是一个概率值界值两侧尾部面积为接受域|u|<u/2

拒绝域|u|>u/2P值(P-Value)

是一个概率值:在H0规定的总体中进行随机样,得到的大于等于(或小于等于)现有样本统计量的概率。0-2.2732.273阴影部分面积为P左侧检验,小于等于当前检验统计量的概率右侧检验,大于等于当前检验统计量的概率在H0成立的假设下,出现当前检验统计量及更极端情况的概率。P≤a

按a检验水准拒绝H0,接受H1,

差别有统计学意义;P>a

按a检验水准不拒绝H0,

差别无统计学意义;利用P值进行决策u0.05/2a/2P/2u0

本例,|u|=2.27,u0.05/2=1.96,u0.01/2=2.58,

u0.05/2<|u|

<u0.01/2,0.01<P<0.05(P=0.023)按a=0.05检验水准拒绝H0

,接受H1,样本均数与总体均数的差异有统计学意义,可以认为该矿区新生儿头围均数与一般新生儿不同,矿区新生儿头围小于一般新生儿。(提出假设→抽样实验→作出决策)总体P<0.05我认为矿区新生儿头围与一般的没有差别

提出假设

拒绝假设!

别无选择。作出决策抽样实验假设检验的基本步骤1、建立假设,确定检验水准:

H0:μ1=μ2

(检验假设)

H1:μ1≠μ2

(备择假设)

a=0.05(双侧)

2、选定方法,计算统计量:

根据统计推断目的、设计、资料组数、样本含量等选择方法。如两组大样本比较u检验、小样本比较用t检验、方差齐性检验用F检验。3、确定P值,作出统计决策:

P≤a

拒绝H0,差别有统计学意义;

P>a

不拒绝H0,差别无统计学意义。例通过大规模调查,已知某地新生儿出生体重均数为3.30kg。从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重总体均数与一般新生儿出生体重总体均数是否不同?

单样本均数的t检验

计算统计量:例通过大规模调查,已知某地新生儿出生体重均数为3.30kg。从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重总体均数与一般新生儿出生体重总体均数是否不同?1.建立假设,确定显著性水平

H0:

m=3.30(难产儿与一般新生儿平均体重相同)

H1:

m≠3.30(难产儿与一般新生儿平均体重不同)

a

=0.05(双侧检验)2.计算统计量解:本例,n=35,`X=3.42kg,m0=3.30,

未知,S=0.403.确定P值,作出统计决策检验界值t0.05/2,34

=2.032,|t|<t0.05/2,34

,得P>0.05,按a=0.05检验水准不拒绝H0

,差别无统计学意义,即尚不能认为难产儿平均出生体重与一般新生儿的出生体重不同。0图**单侧t检验的检验水准a1.6910.050.0250图*双侧t检验的检验水准a2.032-2.0320.025总体均数的假设检验:单侧检验比双侧检验更易得到拒绝H0的结论。n=34样本均数与总体均数比较的u检验大样本量:所代表的未知总体均数,记为μ;总体均数:记为μ0;检验目的:推断样本所代表的未知总体均数μ与已知总体均数μ0是否有差别。计算统计量:例1995年某地20岁应征男青年平均身高为168.5cm,2003年在当地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,问2003年该地20岁男青年的身高与1995年相比是否不同?建立假设,确定显著性水平

H0:μ=168.5(2003年该地20岁应征男青年平均身高与1995年相比没有变化)H1:μ≠168.5(2003年该地20岁应征男青年平均身高与1995年相比有变化)a

=0.05(双侧检验)解:本例,n=85,`X=171.2cm,μ0=168.5cm,

用样本标准差作为的估计值,即3.确定P值,作出统计决策检验界值u0.01/2

=2.58,|u|>u0.01/2

,得P<0.01,按a=0.05检验水准拒绝H0,接受H1

,即2003年该地20岁应征男青年身高与1995年相比,差别有统计学意义。可以认为2003年该地20岁应征男青年身高比1995年增高了。2.计算统计量1.

配成对子的两个受试个体分别随机的分配两种不同的处理

如把同窝、同性别和体重相近的动物配成一对;

把同性别、同病情和年龄相近的病人配成一对等;随机配对设计(randomizedpaireddesign)

配对样本均数的t检验

2.同一受试个体同时分别接受两种不同处理

如同一机体的左右两侧,同一标本分成两部分;3.

同一受试个体处理前后的比较

如高血压患者治疗前后的舒张压、肝炎患者治疗前后的转氨酶等。

配对样本均数的t检验

用简单法和常规法分别对12份人尿进行尿铅量测定,所得结果如下表。问根据现有资料能否说明两种方法检测结果不同?样本号尿铅含量(umol/L)d2简便法常规法差值(d)13.052.80.25.062523.763.04.72.518432.751.88.87.756943.233.43-.20.040053.673.81-.14.019664.494.00.49.240175.164.44.72.518485.455.41.04.001692.061.24.82.6724101.641.83-.19.0361112.551.451.101.2100121.23.92.31.0961合计--4.794.1721表两法测定12份尿铅含量的结果例

用简单法和常规法分别对12份人尿进行尿铅量测定,所得结果如下表。问根据现有资料能否说明两种方法检测结果不同?样本号尿铅含量(umol/L)d2简便法常规法差值(d)13.052.80.25.062523.763.04.72.518432.751.88.87.756943.233.43-.20.040053.673.81-.14.019664.494.00.49.240175.164.44.72.518485.455.41.04.001692.061.24.82.6724101.641.83-.19.0361112.551.451.101.2100121.23.92.31.0961合计--4.794.1721表两法测定12份尿铅含量的结果`d=4.79/12=0.3991.建立假设,确定显著性水平

H0:md=0(两种方法测定的结果相同)H1:md≠0(两种方法测定的结果不同)

a=0.05(双侧检验)

2.计算统计量3.确定P值,作出统计决策界值t0.05/2,11

=2.201,t>t0.05/2,11

,得P<0.05,按a=0.05检验水准拒绝H0

,接受H1

,差别有统计学意义,可以认为两种方法测定结果不同,即简便法的测量结果高于常规法。

两独立样本均数的t检验

将受试对象随机的分为两组,分别接受不同的处理两组即两个样本分别对应了两个未知的总体通过研究这两个样本,要推断这两个未知总体的均数有无差别在H0条件下,例将14只大白鼠随机分为两组,一组做成白血病模型鼠,一组为正常鼠,然后测量两组脾脏DNA含量(mg/g),问正常鼠和白血病鼠脾脏中DNA平均含量是否不同?

白血病组:12.313.213.715.215.415.816.9

正常组:10.811.612.312.713.513.514.8例将14只大白鼠随机分为两组,一组做成白血病模型鼠,一组为正常鼠,然后测量两组脾脏DNA含量(mg/g),问正常鼠和白血病鼠脾脏中DNA平均含量是否不同?

白血病组:12.313.213.715.215.415.816.9

正常组:10.811.612.312.713.513.514.8白血病组:n1=7,X1=14.64,S1=1.62正常组:n2=7,X2=12.74,S2=1.331.建立假设,确定显著性水平

H0:m1=m2(两组鼠脾脏中DNA含量的总体均数相同)H1:m1≠m2(两组鼠脾脏中DNA含量的总体均数不同)a

=0.05(双侧检验)2.计算统计量3.确定P值,作出统计决策检验界值t0.05/2,12

=2.179,t>t0.05/2,11

,得P<0.05,按a=0.05检验水准拒绝H0

,接受H1,差别有统计学意义,可以认为正常鼠与白血病鼠脾脏中DNA平均含量有差别,白血病鼠脾脏中DNA平均含量高于正常鼠。两均数比较的u检验适用于:完全随机设计中两组计量资料的比较。检验目的:通过分析两样本均数推断其分别对应的两个未知总体均数是否不同。例为比较某药治疗流行性出血热疗效,将72名流行性乙型脑炎患者随机分为试验组和对照组,两组的样本量、均数、标准差分别为:

问试验组和对照组的平均退热天数有无差别?基本原理:提出假设

H0:μ1=

μ2,或μ1-μ2

0

H1:μ1≠μ2,或μ1-μ2

0在H0条件下,例为比较某药治疗流行性出血热疗效,将72名流行性乙型脑炎患者随机分为试验组和对照组,两组的样本量、均数、标准差分别为:

问试验组和对照组的平均退热天数有无差别?解:1.

建立假设,确定显著性水平

H0:μ1=

μ2(两组平均退热天数无差别)

H1:μ1≠μ2(两组平均退热天数有差别)

a

=0.05(双侧检验)2.计算统计量3.确定P值,作出统计决策t检验的应用条件

随机性2.正态性--样本量较小,要求样本是来自正态分布总体的随机样本3.方差齐性--两小样本均数比较,要求两总体方差相等两均数比较样本与总体

单样本t检验配对配对t检验方差齐性

变量变化两样本Satterthwaitet检验两样本t检验非配对

不齐齐差值呈正态秩和检验指标呈正态可信区间假设检验用途推断总体均数的范围推断总体均数是否相等含义

当=0.05时,CI以95%的可能性包含总体均数。

在检验假设条件之下,考察样本均数与总体均数的差异是否是抽样误差造成的。方法

确定可信度(1-a),计算得到一个区间

在H0条件下,计算得到一个统计量,从而得到P值s未知:

1.建立假设,确定检验水准

2.计算统计量

3.确定P值,作出统计决策s已知或s未知但为大样本:检验水准和两类错误

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论