计量资料统计推断_第1页
计量资料统计推断_第2页
计量资料统计推断_第3页
计量资料统计推断_第4页
计量资料统计推断_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样误差与假设检验均数的抽样误差和总体均数的估计(一)、均数的抽样误差与标准误统计推断

用样本的信息推论总体的特征。参数估计统计推断假设检验健康女性体温102人

均数的抽样误差----由于抽样造成的样本均数与总体均数、样本均数之间的差异。℃样本1样本2样本k总体均数···根据中心极限定理:1.从正态总体中抽样,抽取样本含量为n的样本,样本均数服从正态分布。即使是从偏态总体中抽样,在样本含量足够(n>50)大时,

也近似正态分布。2.从均数为,标准差为的正态或偏态总体中抽样样本例数为n的样本,新样本组成的数据中,样本均数为,标准差标准误:样本均数的标准差反映各均数间的离散程度。标准误的意义:

描述抽样误差的大小,越小,说明抽样误差越小,样本均数越接近总体均数,用代表的可靠性越高。标准误的计算均数的标准误

以某地14岁健康女生身高的标准差σ=5.30cm及每个样本包含的例数10代入公式,求得

均数标准误的用途:①可用来衡量样本均数的可靠性。②与样本均数结合,可用于估计总体均数的可信区间;③可用于进行均数的假设检验。应用时,用样本标准差来代替总体标准差,则标准误的估计值为:???减少抽样误差的有效途径(二)t分布u变换(将正态分布转化为标准正态分布)t变换

全国14岁女生(身高)120人120人120人120人…………(t分布)(u分布)…………t分布特征:(1)单峰分布,以0为中心左右对称。(2)t分布是一簇曲线,其形状受ν的影响。t分布与标准正态分布(u

分布)区别:*

t分布曲线峰部较矮,尾部稍翘。*

n(自由度)越大,t

分布与u

分布越接近;当时,t

分布=u

分布。t分布的特征:t界值表:(附录9-P261)t界值表的特征:

⑴自由度相同时越大,概率P越小;⑵双侧概率P为单侧概率P的两倍。

自由度为,概率为(检验水准)时,

t

的界值记为。t界值表的查法:

=?通常取0.05或0.01

(t

越大,概率P

越小)2.2623.2501.962.58当n≥50,为大样本(t分布=u

分布),可用来代替

(三)总体均数的可信区间估计

统计描述统计分析参数估计---用样本指标估统计推断计总体指标假设检验点估计---用估计参数估计区间估计---按一定的概率估计总体均数落在某个范围这个范围称之为:

总体均数的可信区间CI

,用区间()表示。如(37.02,37.10),说明总体均数在37.02~37.10之间,但不包含上限(37.10)及下限(37.02)两个值。总体均数可信区间的计算1)已知

95%置信区间

99%置信区间

未知时总体均数可信区间的计算2)大样本----按u

分布

95%置信区间

99%置信区间例7-15102名健康女大学生口腔温度总体均数为=37.06℃,标准差S=0.198℃,标准误=0.0196℃,试估计该地健康女大学生口腔温度总体均数95%可信区间和99%可信区间。95%可信区间为37.06±1.96×0.0196,(37.02,37.10)99%可信区间为37.06±2.58×0.0196,(37.01,37.11)某市2001年120名7岁男童的身高=123.62

(cm)S=4.75(cm),计算该市7岁男童总体均数90%的可信区间。

n=120>100,故可以用标准正态分布代替t分布,u0.01=1.645==

总体均数可信区间的计算3)小样本或未知----按

t分布

95%置信区间

99%置信区间

随机抽取某地健康男子20人,测得该样本的收缩压均数为118.4mmHg,标准差S为10.8mmHg,试估计该地男子收缩压总体均数的95%置信区间。此为小样本,应按

t

分布。收缩压过高过低均为异常,故取双侧。95%置信区间:

代入数据

(

)

即(113.3,123.5)随机抽查某地30名40-44岁哈萨克族成年男性的骨密度,测得骨密度均数资料,=187.11mg/cm2,试估计该地40-44岁哈萨克族成年男性的骨密度总体均数的95%可信区间N=30,则v=29,查附表2,t界值表,t0.05/2,29=2.045可信区间的两个要素:1.准确度:反映在的大小上。2.精确度:反映在区间的长度上。在样本含量一定的情况下二者是矛盾的。常用的95%置信区间。

均数可信区间与参考值范围的区别

95%可信区间:从至范围有95%的可能性包含了总体均数。95%正常值范围:一组观察值中,有95%个体(频数)的观察值在至范围内。六、均数的假设检验(一)假设检验的基本思想—利用反证法的思想例

某地抽样调查了25名健康成年男性的脉搏,,其均数为74.2次/分,标准差为6.5次/分。已知正常成年男性脉搏的均数为72次/分。试问能否认为该地抽样调查的25名成年男性的脉搏与正常成年男性脉搏的均数不同?µ0=72次/分µn=25

=74.2次/分

S=6.5次/分已知总体未知总体差异的原因:

(1)由于抽样误差造成的.(实际上,但由于抽样误差不能很好代表)(2)该地成年男性的脉搏与正常成年男性脉搏均数不同()

假设检验的目的就是判断差异的原因:

求出由抽样误差造成此差异的可能性(概率P)有多大

!若P

较大(P>0.05),认为是由于抽样误差造成的。原因(1),实际上若P

较小(P≤0.05),认为不是由于抽样误差造成的。原因(2),实际上>(二)假设检验的基本步骤1、建立假设,确定检验水准H0:(无效假设)µ=µ0H1:(备择假设)µ>µ0检验水准的意义及确定2、选定检验方法,计算检验统计量3、确定P值,作出推断结论

(推断的结论=统计结论+专业结论)

P>0.05,按检验水准,不拒绝H0,差异无统计学意义(差异无显著性),还不能认为……不同或不等。

P≤0.05

,按检验水准,拒绝H0,接受H1,

差异有统计学意义(差异有显著性)

,可以认为……不同或不等。

P≤0.01,按检验水准,拒绝H0,接受H1,差异有高度统计学意义(差异有高度显著性)

,可以认为……不同或不等。72次/分

单、双侧检验的选择:

1、根据专业知识事先不知道会出现什么结果双侧事先知道只能出现某种结果单侧*通常用双侧(除非有充足的理由选用单侧之外,

一般选用保守的双侧较稳妥)

确定P值:(用求出的t值与查表查出的t

值比较)查t

值表:

(t

越大,P

越小)

(1)求出t=1.833,P>0.05

(2)求出t=4.18,

P<0.01

(3)求出t=2.96,

0.01<P<0.05(简写为P<0.05)

(4)求出t=3.25,P=0.01Pt0.050.013.2502.2621.833P>0.054.18P<0.01P<0.052.96

假设检验的思路是:首先对未知或不完全知道的总体提出一个假设,然后借助一定的分布,观察实测样本情况是否属于小概率事件。一般把概率P≤0.05的事件称为小概率事件,小概率事件在一次观察中可以认为是不会发生的,如实测样本情况属于小概率事件,则不拒绝原来的假设;如实测样本情况不属于小概率事件,则拒绝原来的假设。当然,小概率事件在一次观察中还是可能发生的,若我们恰好碰上,则假设检验的结论就是错误的,不过因为小概率事件发生的概率小,所以犯这种错误的概率也小。(1)建立假设、确定检验水准H0:µ=µ0即山区成年男子平均脉搏数与一般成年男子相等H1:µ>µ0

即山区成年男子平均脉搏数高于一般成年男子(2)选定检验方法,计算检验统计量(3)确定P值,作出推断结论T界值表,得t0.1,24=1.711,t<t0.1,24,故P>0.1

t检验和u检验t检验应用条件:

①当n<100时,要求样本取自正态分布的总体,总体标准差未知;②两小样本均数比较时,要求两样本总体方差相等(σ12=σ22)。一、样本均数与总体均数比较的t检验(即:样本均数代表的未知总体均数µ和已知总体均数µ0的比较)例9-15已知某小样本中含CaCO3的真值是20.7mg/L。现用某法重复测定该小样本15次,CaCO3含量(mg/L)分别为:20.99,20.41,20.62,20.75,20.10,20.00,20.80,20.91,22.60,22.30,20.99,20.41,20.50,23.00,22.60。问该法测得的均数与真值有无差别?(1)建立假设、确定检验水准H0:µ=µ0即该测量方法所得均数与真值相等H1:µ≠µ0

即该测量方法所得均数与真值不相等(2)选定检验方法,计算检验统计量n=25<100,故选用t检验。已知=21.13(3)确定P值,作出推断结论

查t界值表

为单侧检验Pt0.050.012.9772.145P>0.051.70P>0.05,按检验水准,不拒绝H0,无统计学意义。尚不能认为该法测得的均数与真值不同。二、配对设计的均数比较常见的配对设计主要有以下情形:①自身比较:同一受试对象处理前后。②同一受试对象分别接受两种不同的处理。③将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。配对t检验的基本原理:

假设两种处理的效应相同,即µ1=µ2

,则µ1-µ2=0,即可看成是差值的样本均数所代表的未知总体均数µd与已知总体均数µ0=0的比较,此时,我们可套用前述t检验的公式。例9-16应用某药治疗8例高血压患者,观察患者治疗前后舒张压变化情况,如表9-10,问该药是否对高血压患者治疗前后舒张压变化有影响?表9-10用某药治疗高血压患者前后舒张压变化情况病人编号舒张压(mmHg)差值dd2治疗前治疗后⑴⑵⑶⑷=⑵-⑶1

96

88

8642

112

108

4163

108

102

6364

102

98

4165

98

100

-246

100

96

4167

106

102

4168

100

92

864合计--36232

H0:

该药对舒张压无影响。

H1:

该药对舒张压有影响。Pt0.050.012.365P<0.014.023.499⑶确定P值,判断结果

自由度ν=n-1=8-1=7,查表9-9t界值表,t0.05,7=2.365,今4.02>2.365,故P<0.05,故按α=0.05水准,拒绝H0,接受H1,认为差异有高度显著性,可以认为该药有降低舒张压的作用。三、两个样本均数比较的t检验大样本(n>50)----u检验小样本---正态分布资料t检验偏态分布资料秩和检验1、两个大样本均数的比较

例9-17

某地随机抽取正常男性新生儿175名,测得血中甘油三酯浓度的均数为0.425mmol/L,标准差为0.254mmol/L;随机抽取正常女性新生儿167名,测得甘油三酯浓度的均数为0.438mmol/L,标准差为0.292mmol/L,问男、女新生儿的甘油三酯浓度有无差别?⑴建立假设,确定检验水准

H0:μ1=μ2

H1:μ1≠μ2

α=0.05⑵选择检验方法,计算检验统计量u值

(3)查u界值表(t界值表中自由度为的一行),u=0.438<1.96,故P>0.05,按=0.05水准,不拒绝H0,差异无统计学意义;尚不能认为正常男女新生儿血中甘油三酯浓度均数不同。

单样本均数的u检验适用于当n较大(如n>50)或已知时。检验统计量分别为P121例8-2

例1995年,已知某地20岁应征男青年的平均身高为168.5cm。2003年,在当地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,问2003年当地20岁应征男青年的身高与1995年相比是否不同?

检验界值u0.05/2=1.96,u0.01/2=2.58,u>u0.01/2,得P<0.01,按α=0.05水准,拒绝H0,接受H1,2003年当地20岁应征男青年与1995年相比,差别有统计学意义。2、两个小样本均数的比较例9-18两组雄性大鼠分别饲以高蛋白和低蛋白饲料,观察每只大鼠在实验第28天到84天之间所增加的体重,见表9-11。问用两种不同饲料喂养大鼠后,体重的增加有无差别?表9-11用两种不同蛋白质含量饲料喂养大鼠后体重增加的克数高蛋白组1341461041191241611078311312997123低蛋白组

70118101

85107132

94⑴建立假设,确定检验水准H0:μ1=μ2H1:μ1≠μ2α=0.05⑵选择检验方法,计算检验统计量t值⑶确定P值,判断结果查表9-9t界值表,t0.05,17=2.110,今1.891<2.110,故P>0.05,故按α=0.05水准,不拒绝H0,尚不能认为两种饲料喂养大鼠后体重的增加是不同的。PP=?t=1.891P=0.05tP=0.01t=2.110t=2.898四两独立样本方差的齐性检验

两独立小样本均数的t检验,除要求两组数据均应服从正态分布外,还要求两组数据相应的两总体方差相等,即方差齐性。但即使两总体方差相等,两个样本方差也会有抽样误差,两个样本方差不等是否能用抽样误差解释?可进行方差齐性检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论