《医学统计概论》第3章统计推断基础课件_第1页
《医学统计概论》第3章统计推断基础课件_第2页
《医学统计概论》第3章统计推断基础课件_第3页
《医学统计概论》第3章统计推断基础课件_第4页
《医学统计概论》第3章统计推断基础课件_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计推断基础统计推断基础总体样本抽样研究

统计量

参数

统计推断统计推断

statisticalinference如:样本均数样本标准差S

样本率P如:总体均数总体标准差总体率内容:参数估计(estimationofparameters)2.假设检验(testofhypothesis)总体样本抽样研究统计量参数统计推断统计推断样本mn样本2n样本1n总体第一节均数的抽样误差

抽样误差samplingerror:由于抽样导致的样本统计量与总体参数间的差别;以及统计量间的差别。m样本m样本2样本1总体第一节均数的抽样误差抽样误差m一、抽样试验

从正态分布总体N(5.00,0.50)中,每次随机抽取样本含量n=5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。按上述方法再做样本含量n=10、样本含量n=30的抽样实验;比较计算结果。一、抽样试验从正态分布总体N(5.00,0.50)抽样试验(n=5)抽样试验(n=5)抽样试验(n=10)抽样试验(n=10)抽样试验(n=30)抽样试验(n=30)1000份样本抽样计算结果总体的均数总体标准差s均数的均数均数的标准差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09131000份样本抽样计算结果总体的均数总体标准差s均数的均数均3个抽样实验结果图示3个抽样实验结果图示抽样实验小结

均数的均数围绕总体均数上下波动。

均数的标准差即标准误,

均数标准误(StandardError)的估计值

从正态总体N(m,s)中抽取样本,获得均数的分布仍近似呈正态分布N(m,)

。抽样实验小结均数的均数围绕总体均数上下波动。补充:中心极限定理centrallimittheorem①即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。②随着样本含量的增大,样本均数的变异范围逐渐变窄。补充:中心极限定理centrallimS与标准差描述的是一组观察值的离散程度,反映对该组观察值的代表性。论文中常用表达标准误描述的是抽样误差的大小,反映了的可靠性。论文中也可表达注意比较S与标准差描述的是一组观察值第二节t分布(Student’stdistribution)第二节t分布(Student’stdistribut一、t分布随机变量X~N(m,s)标准正态分布N(0,1)u变换均数~标准正态分布N(0,1)t分布t(n-1)一、t分布随机变量X~标准正态分布u变换均数~标准正态t分布的概率密度函数式中为伽玛函数;圆周率为自由度(degreeoffreedom),是t分布的唯一参数;t为随机变量。以t为横轴,f(t)为纵轴,可绘制t分布曲线。t分布的概率密度函数式中为伽玛函数;圆周率t分布曲线

t分布有如下性质:①单峰分布,曲线在t=0处最高,并以t=0为中心左右对称②与正态分布相比,曲线最高处较矮,两尾部翘得高;③随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。t分布曲线t分布有如下性质:t分布曲线下面积(附表2)双侧t0.05/2,9=2.262

=单侧t0.025,9单侧t0.05,9=1.833双侧t0.01/2,9=3.250

=单侧t0.005,9单侧t0.01,9=2.821双侧t0.05/2,∞=1.96

=单侧t0.025,∞单侧t0.05,∞=1.64t分布曲线下面积(附表2)双侧t0.05/2,9=2.262第三节总体均数的估计

1.总体均数的点估计与区间估计参数的估计点估计:由样本统计量直接估计总体参数区间估计:在一定可信度(Confidencelevel)下,同时考虑抽样误差,给出参数一个区间范围。第三节总体均数的估计1.总体均数的点估计与区间估可信度与可信区间

区间的可信度(如95%或99%)是重复抽样(如1000次)时,样本区间包含总体参数(m)的百分数。常用100(1-α)%或(1-α)表示,α值一般取0.05或0.01。可信度与可信区间区间的可信度(如95%或99可信度实验

可信度实验三、可信区间的解释

95%可信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括μ(估计正确),只有5个可信区间不包括μ(估计错误)。

95%可信区间99%可信区间公式区间范围窄宽估计错误的概率大(0.05)小(0.01)三、可信区间的解释95%可信区间:从总体中作随机

第四节t检验

(Student’sttest)第四节t检验(Student’sttest)问题的提出例3.5某医生测量了36名从事铅作业男性工人的Hb,算得其均数为130.83g/L,标准差为25.74g/L。问能否认为从事铅作业工人的Hb不同于正常男性Hb的平均值140.0g/L?问题的提出例3.5某医生测量了36名从事铅作业男性工人的差异原因1.仅仅是个体差异(抽样误差)所致;

2.总体间固有差异(本质差别)。

判断差别属于哪一种情况的统计学检验,就是假设检验(testofhypothesis)。

t检验是最常用的假设检验之一。差异原因1.仅仅是个体差异(抽样误差)所致;反证法的思路

小概率原理在随机试验中,如果一个事件发生的概率很小,称为小概率事件,则认为一次试验中是不会发生的;但是,若一次试验,该事件居然发生了的话,可以认为原先的假设存在错误。

反证法的思路

小概率原理在随机试验中,如果一个事件发生的概1、建立假设与确定检验水准(α)

H0:μ1=μ2无效假设(nullhypothesis)

H1:μ1≠μ2备择假设(alternativehypothesis)检验水准(levelofatest):α=0.05(双侧)2、选定方法和计算检验统计量:根据资料的性质(变量类型、设计类型、资料组数、样本含量等)和分析目的选择检验统计量。

注:所有检验统计量均在无效假设成立的前提下,可以证明其分布。3、确定P值,作出判断(利用小概率原理)

P值是指在H0成立的前提下,获得现有检验统计量值以及比该统计量值更极端情况下的概率。

P≤α(0.05)样本差别有统计学意义(significance);

P>α(0.05)样本差别无统计学意义(NS).4、结合专业知识下结论。

假设检验的基本思想与步骤

1、建立假设与确定检验水准(α)假设检验的基本思想与步骤一、样本均数与总体均数的比较

推断样本所代表的未知总体均数µ与已知总体均数µ0有无差别。已知总体均数µ0一般为理论值、标准值或经大量观察所得的稳定值。

要求:资料呈正态分布。

检验统计量t的计算公式:一、样本均数与总体均数的比较推断样本所代表的未知总体均数二、配对资料的比较配对设计:1)配对设计(paireddesign)是将受试对象按某些混杂因素配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组);2)或者同一受试对象作两次不同的处理(自身对照);3)一份标本一分为二,再用两种方法测定,比较两种检测方法。

优点:配对设计减少了个体差异。

特点:资料成对,每对数据不可拆分。二、配对资料的比较配对设计:配对t检验思路配对t检验思路例3-6(P49)关键:设计!例3-6(P49)关键:设计!三、两样本均数的比较

完全随机设计(completelyrandomdesign):把受试对象单纯依靠随机的办法分为两组,分别给予不同处理,然后比较独立的两组样本均数。两组样本含量不必严格相同,然而以样本含量相同时统计效率最高。

目的:比较两总体均数是否相同。

条件:假定资料来自正态总体,且σ12=σ22计算公式:其中,均数差的标准误

三、两样本均数的比较完全随机设计(comple第五节注意事项二类错误假设检验应注意的问题第五节注意事项二类错误假设检验结果可能的两类错误

假设检验的结果

真实情况

拒绝H0接受H0

H0成立Ⅰ型错误(a)

推断正确(1-a

)

H0不成立推断正确(1-b)Ⅱ型错误(b)

(1-b)即把握度(powerofatest):两总体确有差别,被检出有差别的能力。(1-a)即信度(confidencelevel):重复抽样时,样本CI包含总体参数(m)的概率。假设检验结果可能的两类错误

对于一般的假设检验,a定为0.05(或0.01),b的大小取决于H1。通常情况下,比较总体间有无差异并不知道,即H1不明确,b值的大小无法确定,也就是说,对于一般的假设检验,我们并不知道犯Ⅱ型错误的概率b有多大。通常情况下Ⅱ型错误未知对于一般的假设检验,a定为0.05(或0.01),b《医学统计概论》第3章统计推断基础课件ab减少(增加)I型错误,将会增加(减少)II型错误增大n

同时降低a与ba与b

间的关系ab减少(增加)I型错误,将会增加(减少)II型错误a与

假设检验注意事项(1)严密的设计,样本具有代表性且可比;(2)正确选用假设检验方法;(3)正确理解“统计学意义”(4)统计学意义(significance)不完全等同于实际意义(5)判断结论时不能绝对化;(6)单侧检验(onetailtest)与双侧检验的选择;(7)报告结果应注明样本含量、统计量值、具体P值,单侧时应注明;95%CI既能说明差别的大小,也具有检验的作用,建议使用。假设检验注意事项(1)严密的设计,样本具有代表性且可比;第六节t检验的条件检查正态性检验方差齐性检验

若条件不满足时,方法之一:变量变换(P63)方法之二:近似t检验(P52-P54)方法之三:秩和检验(后述)

第六节t检验的条件检查正态性检验若条件不满足时,一、正态性检验

(normalitytest)

统计指标:偏度系数、峰度系数;W值、D值等

统计图:P-P图、Q-Q图、直方图、茎叶图、箱图等一、正态性检验(nor二.方差齐性检验

1)F统计量(最常用)2)Levene’stest(日浙增多)经验:最大方差与最小方差不超过3倍,可认为方差齐性条件满足。二.方差齐性检验1)F统计量(最常用)2)Leven变量变换变量变换(variabletransformation)目的是为了满足t检验等参数统计的条件,转换后还是要通过其条件检验。一般情况下,方差齐了,正态性也就满足了。变量变换变量变换(variabletransformati近似t检验:

Satterthwaitet检验另:Cochran&Cox法,Welch法近似t检验:

Satterthwaitet检验另:Coch

统计推断基础统计推断基础总体样本抽样研究

统计量

参数

统计推断统计推断

statisticalinference如:样本均数样本标准差S

样本率P如:总体均数总体标准差总体率内容:参数估计(estimationofparameters)2.假设检验(testofhypothesis)总体样本抽样研究统计量参数统计推断统计推断样本mn样本2n样本1n总体第一节均数的抽样误差

抽样误差samplingerror:由于抽样导致的样本统计量与总体参数间的差别;以及统计量间的差别。m样本m样本2样本1总体第一节均数的抽样误差抽样误差m一、抽样试验

从正态分布总体N(5.00,0.50)中,每次随机抽取样本含量n=5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。按上述方法再做样本含量n=10、样本含量n=30的抽样实验;比较计算结果。一、抽样试验从正态分布总体N(5.00,0.50)抽样试验(n=5)抽样试验(n=5)抽样试验(n=10)抽样试验(n=10)抽样试验(n=30)抽样试验(n=30)1000份样本抽样计算结果总体的均数总体标准差s均数的均数均数的标准差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09131000份样本抽样计算结果总体的均数总体标准差s均数的均数均3个抽样实验结果图示3个抽样实验结果图示抽样实验小结

均数的均数围绕总体均数上下波动。

均数的标准差即标准误,

均数标准误(StandardError)的估计值

从正态总体N(m,s)中抽取样本,获得均数的分布仍近似呈正态分布N(m,)

。抽样实验小结均数的均数围绕总体均数上下波动。补充:中心极限定理centrallimittheorem①即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。②随着样本含量的增大,样本均数的变异范围逐渐变窄。补充:中心极限定理centrallimS与标准差描述的是一组观察值的离散程度,反映对该组观察值的代表性。论文中常用表达标准误描述的是抽样误差的大小,反映了的可靠性。论文中也可表达注意比较S与标准差描述的是一组观察值第二节t分布(Student’stdistribution)第二节t分布(Student’stdistribut一、t分布随机变量X~N(m,s)标准正态分布N(0,1)u变换均数~标准正态分布N(0,1)t分布t(n-1)一、t分布随机变量X~标准正态分布u变换均数~标准正态t分布的概率密度函数式中为伽玛函数;圆周率为自由度(degreeoffreedom),是t分布的唯一参数;t为随机变量。以t为横轴,f(t)为纵轴,可绘制t分布曲线。t分布的概率密度函数式中为伽玛函数;圆周率t分布曲线

t分布有如下性质:①单峰分布,曲线在t=0处最高,并以t=0为中心左右对称②与正态分布相比,曲线最高处较矮,两尾部翘得高;③随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。t分布曲线t分布有如下性质:t分布曲线下面积(附表2)双侧t0.05/2,9=2.262

=单侧t0.025,9单侧t0.05,9=1.833双侧t0.01/2,9=3.250

=单侧t0.005,9单侧t0.01,9=2.821双侧t0.05/2,∞=1.96

=单侧t0.025,∞单侧t0.05,∞=1.64t分布曲线下面积(附表2)双侧t0.05/2,9=2.262第三节总体均数的估计

1.总体均数的点估计与区间估计参数的估计点估计:由样本统计量直接估计总体参数区间估计:在一定可信度(Confidencelevel)下,同时考虑抽样误差,给出参数一个区间范围。第三节总体均数的估计1.总体均数的点估计与区间估可信度与可信区间

区间的可信度(如95%或99%)是重复抽样(如1000次)时,样本区间包含总体参数(m)的百分数。常用100(1-α)%或(1-α)表示,α值一般取0.05或0.01。可信度与可信区间区间的可信度(如95%或99可信度实验

可信度实验三、可信区间的解释

95%可信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括μ(估计正确),只有5个可信区间不包括μ(估计错误)。

95%可信区间99%可信区间公式区间范围窄宽估计错误的概率大(0.05)小(0.01)三、可信区间的解释95%可信区间:从总体中作随机

第四节t检验

(Student’sttest)第四节t检验(Student’sttest)问题的提出例3.5某医生测量了36名从事铅作业男性工人的Hb,算得其均数为130.83g/L,标准差为25.74g/L。问能否认为从事铅作业工人的Hb不同于正常男性Hb的平均值140.0g/L?问题的提出例3.5某医生测量了36名从事铅作业男性工人的差异原因1.仅仅是个体差异(抽样误差)所致;

2.总体间固有差异(本质差别)。

判断差别属于哪一种情况的统计学检验,就是假设检验(testofhypothesis)。

t检验是最常用的假设检验之一。差异原因1.仅仅是个体差异(抽样误差)所致;反证法的思路

小概率原理在随机试验中,如果一个事件发生的概率很小,称为小概率事件,则认为一次试验中是不会发生的;但是,若一次试验,该事件居然发生了的话,可以认为原先的假设存在错误。

反证法的思路

小概率原理在随机试验中,如果一个事件发生的概1、建立假设与确定检验水准(α)

H0:μ1=μ2无效假设(nullhypothesis)

H1:μ1≠μ2备择假设(alternativehypothesis)检验水准(levelofatest):α=0.05(双侧)2、选定方法和计算检验统计量:根据资料的性质(变量类型、设计类型、资料组数、样本含量等)和分析目的选择检验统计量。

注:所有检验统计量均在无效假设成立的前提下,可以证明其分布。3、确定P值,作出判断(利用小概率原理)

P值是指在H0成立的前提下,获得现有检验统计量值以及比该统计量值更极端情况下的概率。

P≤α(0.05)样本差别有统计学意义(significance);

P>α(0.05)样本差别无统计学意义(NS).4、结合专业知识下结论。

假设检验的基本思想与步骤

1、建立假设与确定检验水准(α)假设检验的基本思想与步骤一、样本均数与总体均数的比较

推断样本所代表的未知总体均数µ与已知总体均数µ0有无差别。已知总体均数µ0一般为理论值、标准值或经大量观察所得的稳定值。

要求:资料呈正态分布。

检验统计量t的计算公式:一、样本均数与总体均数的比较推断样本所代表的未知总体均数二、配对资料的比较配对设计:1)配对设计(paireddesign)是将受试对象按某些混杂因素配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组);2)或者同一受试对象作两次不同的处理(自身对照);3)一份标本一分为二,再用两种方法测定,比较两种检测方法。

优点:配对设计减少了个体差异。

特点:资料成对,每对数据不可拆分。二、配对资料的比较配对设计:配对t检验思路配对t检验思路例3-6(P49)关键:设计!例3-6(P49)关键:设计!三、两样本均数的比较

完全随机设计(completelyrandomdesign):把受试对象单纯依靠随机的办法分为两组,分别给予不同处理,然后比较独立的两组样本均数。两组样本含量不必严格相同,然而以样本含量相同时统计效率最高。

目的:比较两总体均数是否相同。

条件:假定资料来自正态总体,且σ12=σ22计算公式:其中,均数差的标准误

三、两样本均数的比较完全随机设计(comple第五节注意事项二类错误假设检验应注意的问题第五节注意事项二类错误假设检验结果可能的两类错误

假设检验的结果

真实情况

拒绝H0接受H0

H0成立Ⅰ型错误(a)

推断正确(1-a

)

H0不成立推断正确(1-b)Ⅱ型错误(b)

(1-b)即把握度(powerofatest):两总体确有差别,被检出有差别的能力。(1-a)即信度(confidencelevel):重复抽样时,样本CI包含总体参数(m)的概率。假设检验结果可能的两类错误

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论