![医学统计学课件 第三章 总体均数的估计与假设检验第_第1页](http://file4.renrendoc.com/view/0ec80eb6dd213e45d05ef0a0fab62ce0/0ec80eb6dd213e45d05ef0a0fab62ce01.gif)
![医学统计学课件 第三章 总体均数的估计与假设检验第_第2页](http://file4.renrendoc.com/view/0ec80eb6dd213e45d05ef0a0fab62ce0/0ec80eb6dd213e45d05ef0a0fab62ce02.gif)
![医学统计学课件 第三章 总体均数的估计与假设检验第_第3页](http://file4.renrendoc.com/view/0ec80eb6dd213e45d05ef0a0fab62ce0/0ec80eb6dd213e45d05ef0a0fab62ce03.gif)
![医学统计学课件 第三章 总体均数的估计与假设检验第_第4页](http://file4.renrendoc.com/view/0ec80eb6dd213e45d05ef0a0fab62ce0/0ec80eb6dd213e45d05ef0a0fab62ce04.gif)
![医学统计学课件 第三章 总体均数的估计与假设检验第_第5页](http://file4.renrendoc.com/view/0ec80eb6dd213e45d05ef0a0fab62ce0/0ec80eb6dd213e45d05ef0a0fab62ce05.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章
总体均数的估计
与假设检验第二军医大学卫生统计学教研室张罗漫11/17/20221医学统计学第三章
总体均数的估计
与假设检验第二军医大学卫生统计学均数的抽样误差与标准误t分布总体均数的估计t检验假设检验的注意事项正态性检验和两样本方差比较的F检验讲课内容11/17/20222医学统计学均数的抽样误差与标准误讲课内容11/10/20222医学统计第一节
均数的抽样误差与标准误11/17/20223医学统计学第一节11/10/20223医学统计学了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。对无限总体不可能对所有个体逐一观察,对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究(如对一批罐头质量检查)。借助抽样研究。
11/17/20224医学统计学了解总体特征的最好方法是对总体的每一11/10/20224医欲了解某地18岁男生身高值的平均水平,随机抽取该地10名男生身高值作为样本。由于个体变异与抽样的影响,抽得的样本均数不太可能等于总体均数,造成样本统计量与总体参数间的差异(表现为来自同一总体的若干样本统计量间的差异),称为抽样误差。抽样误差是不可避免的。抽样误差是有规律的。11/17/20225医学统计学欲了解某地18岁男生身高值的平均水平,11/10/202251999年某市18岁男生身高值Xi~N(μ,σ2)μ=167.7cmσ=5.3cm样本号1167.412.742165.566.573168.205.36·········99169.405.57100165.695.09ni=1011/17/20226医学统计学1999年某市18岁男生身高值样本号1样本均数抽样分布具有如下特点:
各样本均数未必等于总体均数各样本均数间存在差异样本均数围绕=167.69cm呈正态分布样本均数变异度()较原总体个体值变异度(σ=5.3cm)大大缩小11/17/20227医学统计学样本均数抽样分布具有如下特点:11/10/20227医11/17/20228医学统计学11/10/20228医学统计学中心极限定理(centrallimittheorem)
从均数为、标准差为的总体中独立随机抽样,当样本含量n较大时,
样本均数的分布将趋于正态分布此分布的均数为
标准差为11/17/20229医学统计学中心极限定理(centrallimittheorem)中心极限定理(centrallimittheorem)若Xi服从正态分布
则服从正态分布
若Xi不服从正态分布
n大(n>60):则近似服从正态分布n小(n<60):则为非正态分布11/17/202210医学统计学中心极限定理(centrallimittheorem)样本统计量的标准差称标准误(standarderror,SE)样本均数的标准差称均数的标准误(standarderrorofmean,SEM)11/17/202211医学统计学样本统计量的标准差称标准误11/10/202211医学统计学标准差与标准误的区别11/17/202212医学统计学标准差与标准误的区别11/10/202212医学统计学第二节
t分布11/17/202213医学统计学第二节11/10/202213医学统计学1908年,英国统计学家W.S.Gosset以笔名“Student”在《Biometrics》杂志上发表论文,首次提出t分布概念,后人又称Student’st-distribution,开创了小样本统计推断的新纪元,被认为是统计学发展史上的里程碑之一。11/17/202214医学统计学1908年,英国统计学家W.S.Gosset以笔名“StWilliamSeelyGosset(1876~1937,英)11/17/202215医学统计学WilliamSeelyGosset(1876~1937t分布的概念11/17/202216医学统计学t分布的概念11/10/202216医学统计学t分布的图形与特征t分布为一簇单峰分布曲线,不同,曲线形状不同t分布以0为中心,左右对称t分布与有关,越小,t值越分散,t分布的峰部越低,而两侧尾部翘得越高当逼近,逼近,t分布逼近u分布11/17/202217医学统计学t分布的图形与特征11/10/202217医学统计学
f(t)
=∞(标准正态曲线)
=5
=10.10.2-4-3-2-1012340.3自由度分别为1、5、∞时的t分布t值11/17/202218医学统计学f(t)=∞(标准正态曲线)=5=10.1-tt011/17/202219医学统计学-tt011/10/202219医学统计学t分布曲线下面积与横轴t值间关系(附表2)t界值表中一侧尾部面积称单侧概率(α)
两侧尾部面积之和称双侧概率(α/2)
t0.05/2,9=2.262,t0.05,9=1.833在相同自由度时,值增大,α减小在相同α时,单尾α对应的t值比双尾α的小11/17/202220医学统计学t分布曲线下面积与横轴t值间关系(附表2)t界值表中一侧尾部t0.05/2,9=2.262t0.05,9=1.83311/17/202221医学统计学t0.05/2,9=2.262t0.05,9=1.83-tt011/17/202222医学统计学-tt011/10/202222医学统计学第三节总体均数的估计11/17/202223医学统计学第三节11/10/202223医学统计学一、可信区间的概念参数估计是用样本统计量推断总体参数。有点估计和区间估计两种。点估计是用样本统计量直接估计其总体参数值。如用估计、S估计等。方法虽简单,但未考虑抽样误差大小。区间估计是按预先给定的概率(1),确定
一个包含总体参数的范围。该范围称为参数的可信区间(confidenceinterval,CI)11/17/202224医学统计学一、可信区间的概念参数估计是用样本统计量推断总体参数。点估计预先给定的概率(1)称为可信度(confidencelevel),常取95%或99%。总体参数是未知的、一个固定的值。(所以要用包含来描述)。样本统计量是随机变量。可信区间通常由两个数值构成,称可信限(confidencelimit,CL)。μ可信下限(L)可信上限(U)11/17/202225医学统计学预先给定的概率(1)称为可信度总体参数是未知的、一个固定二、总体均数可信区间的计算1.单一总体均数的可信区间(1)未知按t分布原理(2)已知或未知但n足够大(如n>60)按u分布原理2.两总体均数之差的可信区间11/17/202226医学统计学二、总体均数可信区间的计算1.单一总体均数的可信区间11/1.单一总体均数的1–α可信区间双侧(1)未知单侧11/17/202227医学统计学1.单一总体均数的1–α可信区间双侧(1)未知单侧11/1故该地18岁男生身高均数的95%可信区间为(164.35,169.55)cm。μ=167.7cm双尾例在例3-1中抽得第15号样本的=166.95(cm),S=3.64(cm),求其总体均数的95%可信区间。166.95±2.262×1.1511=164.35~169.55(cm)11/17/202228医学统计学故该地18岁男生身高均数的例在例3-1中抽得第15号样本1.单一总体均数的1–α可信区间双侧单侧(2)已知或未知但n足够大:11/17/202229医学统计学1.单一总体均数的1–α可信区间双侧单侧(2)已知或未知例某地抽取正常成年人200名,测得其血清胆固醇均数为3.64mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数95%可信区间。11/17/202230医学统计学例某地抽取正常成年人200名,测得其血清胆固醇均数为3.2.两总体均数之差的1–α可信区间双侧单侧11/17/202231医学统计学2.两总体均数之差的1–α可信区间双侧单侧11/10/2三、可信区间的确切含义从1999年某市18岁男生身高值总体N(μ=167.7cm,σ=5.3cm)中随机抽取100个样本计算了100个估计μ的95%CI其中有95个CI包含了μ有5个不包含μ=167.7cm20号161.00~165.5731号161.17~167.3354号168.05~171.0076号167.71~174.8482号167.98~174.2711/17/202232医学统计学三、可信区间的确切含义从1999年某市18岁男生身高值总体1来自N(0,1)的100个样本所计算的95%可信区间示意
11/17/202233医学统计学来自N(0,1)的100个样本所计算的95%可信区间示意1如果能够进行重复抽样试验,平均有(1)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为(1)。在实际工作中,只能根据一次试验结果计算一个可信区间,就认为该区间包含了相应总体参数,该结论犯错误的概率≤
。可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。可信度是事前概率。可信区间的确切含义11/17/202234医学统计学如果能够进行重复抽样试验,平均有(1)的可信区间包含了总正确性:可信度1,即区间包含总体参数的理论概率大小,愈接近1愈好。精确性:区间的宽度,区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。若只顾提高可信度,则可信区间会变宽。评价可信区间估计的优劣:11/17/202235医学统计学正确性:可信度1,即区间包含总体参数评价可信区间估计的优四、可信区间与参考值范围的区别可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计个体值的分布范围,个体值有很多。95%可信区间中的95%是可信度,即所求可信区间包含总体参数的可信程度为95%。95%参考值范围中的95%是一个比例,即所求参考值范围包含了95%的正常人。11/17/202236医学统计学四、可信区间与参考值范围的区别可信区间用于估计总体参数,总体第四节
t
检验11/17/202237医学统计学第四节11/10/202237医学统计学例某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?样本均数与总体均数间差异的原因:
1.总体均数不同?2.总体均数相同,差异由抽样误差造成?统计推断方法
假设检验(hypothesistest)11/17/202238医学统计学例某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得1.进行检验假设假设样本来自某一特定总体2.确定检验水准
确定最大允许误差3.选定检验方法计算检验统计量
计算样本与总体的偏离程度4.计算与统计量对应的P值5.作出结论
根据小概率反证法思想作出推断假设检验一般步骤11/17/202239医学统计学1.进行检验假设假设检验一般步骤11/10/202239医学t检验(Student’st-test)设计完全随机设计单样本完全随机设计两样本配对设计要求1.n较小(单组﹤60或两组合计﹤60)2.样本随机地取自正态总体3.两样本均数比较时所对应两总体
方差相等(homogeneityofvariance)11/17/202240医学统计学t检验(Student’st-test)11/10例某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?一、单样本t检验1.建立检验假设,确定检验水准H0:=0=140g/L铅作业男性工人的平均血红蛋白含量与正常成年男性的相等H1:≠0
=0.0511/17/202241医学统计学例某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得2.计算检验统计量3.确定P值,作出推断结论
|-2.138|>t0.05/2,35=2.030P<0.05按=0.05水准,拒绝H0,接受H1,有统计学意义。可认为从事铅作业男性工人的平均血红蛋白含量低于正常成年男性的。11/17/202242医学统计学2.计算检验统计量3.确定P值,作出推断结论11/10/20-2.0302.0300
=350.0250.025
t0.05/2,35=2.030
P(|t|≥2.030)=0.05
t值11/17/202243医学统计学-2.0302.0300=350.0250.025t二、配对样本t检验(pairedt-test)---变量为配对两组之差的d配对设计①两同质受试对象分别接受两种不同处理②同一受试对象分别接受两种不同处理前后测量设计③同一受试对象分别前后接受一种处理11/17/202244医学统计学二、配对样本t检验(pairedt-test)配对设计111/17/202245医学统计学11/10/202245医学统计学1.建立检验假设,确定检验水准H0:d=0,两种方法的测定结果相同H1:d≠0,=0.052.计算检验统计量11/17/202246医学统计学1.建立检验假设,确定检验水准2.计算检验统计量11/10/3.确定P值,作出推断结论t=7.925>t0.001/2,9=4.781P<0.001按=0.05水准,拒绝H0,接受H1,有统计学意义。两种方法对脂肪含量的测定结果不同,哥特里-罗紫法测定结果较高。11/17/202247医学统计学3.确定P值,作出推断结论11/10/202247医学统三、两样本t检验(twosamplet-test)1.总体方差相等的t检验11/17/202248医学统计学三、两样本t检验(twosamplet-test)1.研究目的:阿卡波糖胶囊降血糖效果试验设计:同期随机对照试验受试对象:40名II型糖尿病病人试验组:阿卡波糖胶囊对照组:拜唐苹胶囊观测指标:试验8周后空腹血糖下降值(1)建立检验假设,确定检验水准H0:1=2H1:1≠2
=0.05
11/17/202249医学统计学研究目的:阿卡波糖胶囊降血糖效果(1)建立检验假设,确定检验(2)计算检验统计量=n1+n22=(20+201)=3811/17/202250医学统计学(2)计算检验统计量=n1+n22=(20+201)=按=0.05水准,不拒绝H0,无统计学意义。还不能认为阿卡波糖胶囊与拜唐苹胶囊对降低II型糖尿病病人空腹血糖的效果不同。(3)确定P值,作出推断结论11/17/202251医学统计学按=0.05水准,不拒绝H0,无统计学意义。还不能认为阿2.总体方差不相等的t检验数据变换后进行t检验秩转换的非参数检验(第8章)近似t检验t'检验11/17/202252医学统计学2.总体方差不相等的t检验11/10/202252医Cochran&Cox法(1950)对临界值校正Satterthwaite法(1946)对自由度校正Welch法(1947)对自由度校正t'检验11/17/202253医学统计学Cochran&Cox法(1950)t'检验11/10/1.单样本u检验适用于n较大(n﹥60)或0已知时四、u
检验11/17/202254医学统计学1.单样本u检验四、u检验11/10/202254医2.两样本u
检验适用于两样本含量较大(n1+n2﹥60)11/17/202255医学统计学2.两样本u检验11/10/202255医学统计学t检验与u检验区别公式查表与n关系计算精度t检验较复杂需 无关 精确u检验简单否n较大 近似11/17/202256医学统计学t检验与u检验区别公式第五节两均数的等效检验equivalencetestfortwomeans11/17/202257医学统计学第五节equivalencetestfortwom例研究某新药对高血脂患者胆固醇的降低作用是否相同于标准药物,设定等效界值δ=0.52mmol/L即就认为两药物等效11/17/202258医学统计学例研究某新药对高血脂患者胆固醇的降低作用是否相同于标准药
(1)建立检验假设,确定检验水准H0:两药物不等效H1:两药物等效=0.0511/17/202259医学统计学(1)建立检验假设,确定检验水准11/10/20225(2)计算检验统计量ν=n1+n2
-
2=102+100-
2=20011/17/202260医学统计学(2)计算检验统计量ν=n1+n2-2=102+100∣t∣=3.569﹥t0.001/2,200=3.340P﹤0.001。按=0.05水准,拒绝H0,接受H1,有统计学意义。新药与标准药物对降低胆固醇的疗效相同(3)确定P值,作出推断结论11/17/202261医学统计学∣t∣=3.569﹥t0.001/2,200=3.340(3δ值须在等效试验前根据专业知识予以确定应用等效检验的注意事项研究者可把专业上或公认有临床实际意义的差值作为等效界值δ。如:血压δ值为0.67kPa(5mmHg),胆固醇δ值为0.52mmol/L(20mg/dl),白细胞δ值为0.5109/L(500个/mm3)。难以确定时可用0.20.5倍标准差作为参考11/17/202262医学统计学δ值须在等效试验前根据专业知识予以确定应用等效检验的注意事项H0:μT-μC≤-δ
H1:μT-μC>-δ0等效区间双单侧检验假设H1同时成立,才认为等效μT—试验药μC—对照药H0:μT-μC≥δ
H1:μT-μC
<δ11/17/202263医学统计学H0:μT-μC≤-δH1:μT
第六节假设检验的注意事项11/17/202264医学统计学第六节11/10/2022反证法根据研究目的建立假设H0,先假设H0是正确的,再分析样本提供的信息是否支持H0,即在H0成立的条件下计算检验统计量,获得相应P值,根据P值大小来判断。小概率事件原理小概率事件(P≤0.05)在一次抽样中发生的可能性很小,如果它发生了,则有理由怀疑H0的正确性,认为H1成立,该结论可能犯≤5%的错误。一、假设检验的基本思想11/17/202265医学统计学反证法根据研究目的建立假设H0,先假设H0是正确的,再分析1.建立检验假设,确定检验水准(1)H0零假设(nullhypothesis)(2)H1备择假设(alternativehypothesis)(3)α检验水准(sizeofatest)二、假设检验的基本步骤针对总体而不是针对样本而言H0:某两个总体参数相等,仅一种情况H1:某两个总体参数不等,有多种情况H0与H1的内容不能互换,否则无法决定拒绝多种情况中的哪一种情况11/17/202266医学统计学1.建立检验假设,确定检验水准二、假设检验的基本步骤针对总体H0:μ1=μ2H1:μ1>μ2或μ1<μ2单侧检验H0:μ1=μ2H1:μ1≠μ2双侧检验。单双侧检验主要根据专业知识预先确定。双侧检验较保守和稳妥。检验水准α:预先规定的拒绝假设H0时的最大允许误差,它确定了小概率事件标准。在实际工作中常取0.05,但并非一成不变。11/17/202267医学统计学H0:μ1=μ2H1:μ1>μ2或μ1应根据变量和资料类型、设计方案、统计推断的目的、方法的适用条件等选择检验统计量。所有检验统计量都是在H0成立的前提条件下计算出来的。检验统计量大小反映样本与总体的偏离程度(如t值反映样本均数与总体均数的偏离程度,以标准误进行标准化)2.计算检验统计量
11/17/202268医学统计学应根据变量和资料类型、设计方案、统2.计算检验统计量11P值是决策的依据P的含义是指从H0规定的总体中随机抽样,其检验统计量等于及大于现有样本的检验统计量的概率。即从H0假设总体中随机抽到差别至少等于现有样本差别的机会。根据获得的事后概率P,与事先规定的概率—检验水准进行比较,看其是否为小概率事件而得出结论。3.确定P值,作出推断结论11/17/202269医学统计学P值是决策的依据3.确定P值,作出推断结论11/10/20P≤,按检验水准,拒绝H0,接受H1有统计学意义(统计结论)statisticalsignificance可认为…不同,…高于…(专业结论)P>,按检验水准,不拒绝H0无统计学意义(统计结论)nostatisticalsignificance还不能认为…不同(专业结论)不拒绝H0不等于接受H0,因此时证据不足11/17/202270医学统计学P≤,按检验水准,拒绝H0,接受H111/10/2022三、I型错误和II型错误11/17/202271医学统计学三、I型错误和II型错误11/10/202271医学统计学
健康人与肝病病人的肝大指数分布(所拟合的两个正态曲线各按100%面积绘制)肝大指数健康人H0肝病病人H1第一类错误=误诊率(假阳性率)第二类错误=漏诊率(假阴性率)6.17.08.4568910114大,小;大,小。增加n可同时缩小,。11/17/202272医学统计学健康人与肝病病人的肝大指数分布肝大指数健康人肝病病可取单尾亦可取双尾。II型错误的概率大小用表示,只取单尾,值的大小一般未知,须在知道两总体差值(如12等)、及n时,才能算出。1称检验效能(powerofatest),过去称把握度。为当两总体确有差异,按检验水准所能发现该差异的能力。1只取单尾。拒绝H0,只可能犯I型错误,不可能犯II型错误;不拒绝H0,只可能犯II型错误,不可能犯I型错误。11/17/202273医学统计学可取单尾亦可取双尾。11/10/202273医学统计学四、假设检验应注意的问题1.要有严密的研究设计组间应均衡,具有可比性,除对比的主要因素(如临床试验用新药和对照药)外,其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近。11/17/202274医学统计学四、假设检验应注意的问题1.要有严密的研究设计11/10/2配对设计计量资料:配对t检验。完全随机设计两样本计量资料:小样本(任一ni≤60)且方差齐:两样本t检验方差不齐:近似t检验大样本(所有ni>60):u检验。2.不同资料应选用不同检验方法11/17/202275医学统计学配对设计计量资料:配对t检验。2.不同资料应选用不同检验方法3.正确理解“significance”一词的含义过去称差别有或无“显著性”,易造成两样本统计量之间比较相差很大的误解。现在称差别有或无“统计学意义”,相应推断为:可以认为或还不能认为两个或多个总体参数有差别。11/17/202276医学统计学3.正确理解“significance”一词的含义11/104.结论不能绝对化
因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列出检验统计量的值,尽量写出具体P值,而不简单写成P﹤0.05,以便读者与同类研究进行比较或进行循证医学时采用Meta分析。11/17/202277医学统计学4.结论不能绝对化11/10/202277医学统计学5.统计“有意义”与医学“有意义”统计“有意义”对应统计结论,医学“有意义”对应专业结论。统计结论有意义,专业结论无意义,最终结论没有意义,样本含量过大或设计存在问题。统计结论无意义,专业结论有意义,检查设计是否合理、样本含量是否足够。11/17/202278医学统计学5.统计“有意义”与医学“有意义”11/10/202276.可信区间与假设检验区别和联系可信区间可回答假设检验问题H0:=0=140g/L铅作业男性工人的平均血红蛋白含量与正常成年男性的相等H1:≠0
=0.05
铅作业男性工人平均血红蛋白含量总体均数的95%CI为(122.12,139.54)g/L,未包括0=140g/L
按=0.05水准,拒绝H0,接受H1。11/17/202279医学统计学6.可信区间与假设检验区别和联系可信区间可回答假设检验问题1可信区间说明量的大小即推断总体均数所在范围,假设检验推断质的不同即判断两总体均数是否不等。可信区间不但能回答差别有无统计学意义,还能提示差别有无实际专业意义。可信区间不能够完全代替假设检验。可信区间只能在预先规定概率的前提下进行计算,而假设检验能获得一较为确切的P值。11/17/202280医学统计学可信区间说明量的大小即推断总体均数11/10/202280医第七节*正态性检验和两样本方差比较的F检验11/17/202281医学统计学第七节*11/10/202281医学统计学两小样本t检验前提条件:相应的两总体为正态总体两总体方差相等,即方差齐性配对t检验前提条件:每对数据差值的总体为正态总体11/17/202282医学统计学两小样本t检验前提条件:11/10/202282医学统计学一、正态性检验(了解)1.图示法概率图(probability-probabilityplot)以实际累积频率(X)对正态分布理论累积频率(Y)作散点图分位数图(quantile-quantileplot)以实际分位数(X)对正态分布理论分位数()作散点图如果实际值与理论值吻合,图中散点几乎都在一直线上,可认为该资料服从正态分布11/17/202283医学统计学一、正态性检验(了解)1.图示法11/10/202283医学(168-167.69)/1.69=0.18(164-167.69)/1.69=-2.18(172-167.69)/1.69=2.5511/17/202284医学统计学(168-167.69)/1.69=0.1811/10/202.计算法偏度(skewness)指分布不对称的程度和方向,用偏度系数(总体:1样本:g1)衡量。1=0对称1﹥0正偏态1﹤0负偏态峰度(kurtosis)指分布与正态曲线相比的冒尖或扁平程度,用峰度系数(总体:2样本:g2)衡量。2=0正态峰2﹥0尖峭峰2﹤0平阔峰当同时满足对称和正态峰两个条件时,才能认为该资料服从正态分布。11/17/202285医学统计学2.计算法11/10/202285医学统计学对偏度和峰度各用一个指标评定,其中以矩法(methodofmoment)效率最高对偏度和峰度用一个指标综合评定H0:1=0且2=0,总体服从正态分布
H0:1≠0且2≠0,总体不服从正态分布α=0.10(减少Ⅱ型错误)11/17/202286医学统计学对偏度和峰度各用一个指标评定,其中以对偏度和峰度用一个指标综二、两样本方差比较的F检验第一个样本方差既可能大于也可能小于第二个样本方差,是双侧检验。公式规定以较大方差作分子,F必然大于1。附表3仅给出不对称F分布右侧界值
11/17/202287医学统计学二、两样本方差比较的F检验第一个样本方差既可能大于也可能小于
研究目的:阿卡波糖胶囊降血糖效果试验设计:同期随机对照试验受试对象:40名II型糖尿病病人试验组:阿卡波糖胶囊对照组:拜唐苹胶囊观测指标:试验8周后糖化血红蛋白下降值11/17/202288医学统计学研究目的:阿卡波糖胶囊降血糖效果11/10/2022
(1)建立检验假设,确定检验水准。(2)计算检验统计量(3)确定P值,作出推断结论3.775﹥2.15=F0.10(20,19)P﹤0.10按=0.10水准,拒绝H0,接受H1,有统计学意义。可认为对照组和试验组病人试验8周后糖化血红蛋白下降值总体方差不等。11/17/202289医学统计学(1)建立检验假设,确定检验水准。(2)计算检验统计均数的抽样误差与标准误t分布总体均数的估计t检验假设检验的注意事项正态性检验和两样本方差比较的F检验讲课内容11/17/202290医学统计学均数的抽样误差与标准误讲课内容11/10/202290医学统谢谢!11/17/202291医学统计学谢谢!11/10/202291医学统计学第三章
总体均数的估计
与假设检验第二军医大学卫生统计学教研室张罗漫11/17/202292医学统计学第三章
总体均数的估计
与假设检验第二军医大学卫生统计学均数的抽样误差与标准误t分布总体均数的估计t检验假设检验的注意事项正态性检验和两样本方差比较的F检验讲课内容11/17/202293医学统计学均数的抽样误差与标准误讲课内容11/10/20222医学统计第一节
均数的抽样误差与标准误11/17/202294医学统计学第一节11/10/20223医学统计学了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。对无限总体不可能对所有个体逐一观察,对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究(如对一批罐头质量检查)。借助抽样研究。
11/17/202295医学统计学了解总体特征的最好方法是对总体的每一11/10/20224医欲了解某地18岁男生身高值的平均水平,随机抽取该地10名男生身高值作为样本。由于个体变异与抽样的影响,抽得的样本均数不太可能等于总体均数,造成样本统计量与总体参数间的差异(表现为来自同一总体的若干样本统计量间的差异),称为抽样误差。抽样误差是不可避免的。抽样误差是有规律的。11/17/202296医学统计学欲了解某地18岁男生身高值的平均水平,11/10/202251999年某市18岁男生身高值Xi~N(μ,σ2)μ=167.7cmσ=5.3cm样本号1167.412.742165.566.573168.205.36·········99169.405.57100165.695.09ni=1011/17/202297医学统计学1999年某市18岁男生身高值样本号1样本均数抽样分布具有如下特点:
各样本均数未必等于总体均数各样本均数间存在差异样本均数围绕=167.69cm呈正态分布样本均数变异度()较原总体个体值变异度(σ=5.3cm)大大缩小11/17/202298医学统计学样本均数抽样分布具有如下特点:11/10/20227医11/17/202299医学统计学11/10/20228医学统计学中心极限定理(centrallimittheorem)
从均数为、标准差为的总体中独立随机抽样,当样本含量n较大时,
样本均数的分布将趋于正态分布此分布的均数为
标准差为11/17/2022100医学统计学中心极限定理(centrallimittheorem)中心极限定理(centrallimittheorem)若Xi服从正态分布
则服从正态分布
若Xi不服从正态分布
n大(n>60):则近似服从正态分布n小(n<60):则为非正态分布11/17/2022101医学统计学中心极限定理(centrallimittheorem)样本统计量的标准差称标准误(standarderror,SE)样本均数的标准差称均数的标准误(standarderrorofmean,SEM)11/17/2022102医学统计学样本统计量的标准差称标准误11/10/202211医学统计学标准差与标准误的区别11/17/2022103医学统计学标准差与标准误的区别11/10/202212医学统计学第二节
t分布11/17/2022104医学统计学第二节11/10/202213医学统计学1908年,英国统计学家W.S.Gosset以笔名“Student”在《Biometrics》杂志上发表论文,首次提出t分布概念,后人又称Student’st-distribution,开创了小样本统计推断的新纪元,被认为是统计学发展史上的里程碑之一。11/17/2022105医学统计学1908年,英国统计学家W.S.Gosset以笔名“StWilliamSeelyGosset(1876~1937,英)11/17/2022106医学统计学WilliamSeelyGosset(1876~1937t分布的概念11/17/2022107医学统计学t分布的概念11/10/202216医学统计学t分布的图形与特征t分布为一簇单峰分布曲线,不同,曲线形状不同t分布以0为中心,左右对称t分布与有关,越小,t值越分散,t分布的峰部越低,而两侧尾部翘得越高当逼近,逼近,t分布逼近u分布11/17/2022108医学统计学t分布的图形与特征11/10/202217医学统计学
f(t)
=∞(标准正态曲线)
=5
=10.10.2-4-3-2-1012340.3自由度分别为1、5、∞时的t分布t值11/17/2022109医学统计学f(t)=∞(标准正态曲线)=5=10.1-tt011/17/2022110医学统计学-tt011/10/202219医学统计学t分布曲线下面积与横轴t值间关系(附表2)t界值表中一侧尾部面积称单侧概率(α)
两侧尾部面积之和称双侧概率(α/2)
t0.05/2,9=2.262,t0.05,9=1.833在相同自由度时,值增大,α减小在相同α时,单尾α对应的t值比双尾α的小11/17/2022111医学统计学t分布曲线下面积与横轴t值间关系(附表2)t界值表中一侧尾部t0.05/2,9=2.262t0.05,9=1.83311/17/2022112医学统计学t0.05/2,9=2.262t0.05,9=1.83-tt011/17/2022113医学统计学-tt011/10/202222医学统计学第三节总体均数的估计11/17/2022114医学统计学第三节11/10/202223医学统计学一、可信区间的概念参数估计是用样本统计量推断总体参数。有点估计和区间估计两种。点估计是用样本统计量直接估计其总体参数值。如用估计、S估计等。方法虽简单,但未考虑抽样误差大小。区间估计是按预先给定的概率(1),确定
一个包含总体参数的范围。该范围称为参数的可信区间(confidenceinterval,CI)11/17/2022115医学统计学一、可信区间的概念参数估计是用样本统计量推断总体参数。点估计预先给定的概率(1)称为可信度(confidencelevel),常取95%或99%。总体参数是未知的、一个固定的值。(所以要用包含来描述)。样本统计量是随机变量。可信区间通常由两个数值构成,称可信限(confidencelimit,CL)。μ可信下限(L)可信上限(U)11/17/2022116医学统计学预先给定的概率(1)称为可信度总体参数是未知的、一个固定二、总体均数可信区间的计算1.单一总体均数的可信区间(1)未知按t分布原理(2)已知或未知但n足够大(如n>60)按u分布原理2.两总体均数之差的可信区间11/17/2022117医学统计学二、总体均数可信区间的计算1.单一总体均数的可信区间11/1.单一总体均数的1–α可信区间双侧(1)未知单侧11/17/2022118医学统计学1.单一总体均数的1–α可信区间双侧(1)未知单侧11/1故该地18岁男生身高均数的95%可信区间为(164.35,169.55)cm。μ=167.7cm双尾例在例3-1中抽得第15号样本的=166.95(cm),S=3.64(cm),求其总体均数的95%可信区间。166.95±2.262×1.1511=164.35~169.55(cm)11/17/2022119医学统计学故该地18岁男生身高均数的例在例3-1中抽得第15号样本1.单一总体均数的1–α可信区间双侧单侧(2)已知或未知但n足够大:11/17/2022120医学统计学1.单一总体均数的1–α可信区间双侧单侧(2)已知或未知例某地抽取正常成年人200名,测得其血清胆固醇均数为3.64mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数95%可信区间。11/17/2022121医学统计学例某地抽取正常成年人200名,测得其血清胆固醇均数为3.2.两总体均数之差的1–α可信区间双侧单侧11/17/2022122医学统计学2.两总体均数之差的1–α可信区间双侧单侧11/10/2三、可信区间的确切含义从1999年某市18岁男生身高值总体N(μ=167.7cm,σ=5.3cm)中随机抽取100个样本计算了100个估计μ的95%CI其中有95个CI包含了μ有5个不包含μ=167.7cm20号161.00~165.5731号161.17~167.3354号168.05~171.0076号167.71~174.8482号167.98~174.2711/17/2022123医学统计学三、可信区间的确切含义从1999年某市18岁男生身高值总体1来自N(0,1)的100个样本所计算的95%可信区间示意
11/17/2022124医学统计学来自N(0,1)的100个样本所计算的95%可信区间示意1如果能够进行重复抽样试验,平均有(1)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为(1)。在实际工作中,只能根据一次试验结果计算一个可信区间,就认为该区间包含了相应总体参数,该结论犯错误的概率≤
。可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。可信度是事前概率。可信区间的确切含义11/17/2022125医学统计学如果能够进行重复抽样试验,平均有(1)的可信区间包含了总正确性:可信度1,即区间包含总体参数的理论概率大小,愈接近1愈好。精确性:区间的宽度,区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。若只顾提高可信度,则可信区间会变宽。评价可信区间估计的优劣:11/17/2022126医学统计学正确性:可信度1,即区间包含总体参数评价可信区间估计的优四、可信区间与参考值范围的区别可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计个体值的分布范围,个体值有很多。95%可信区间中的95%是可信度,即所求可信区间包含总体参数的可信程度为95%。95%参考值范围中的95%是一个比例,即所求参考值范围包含了95%的正常人。11/17/2022127医学统计学四、可信区间与参考值范围的区别可信区间用于估计总体参数,总体第四节
t
检验11/17/2022128医学统计学第四节11/10/202237医学统计学例某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?样本均数与总体均数间差异的原因:
1.总体均数不同?2.总体均数相同,差异由抽样误差造成?统计推断方法
假设检验(hypothesistest)11/17/2022129医学统计学例某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得1.进行检验假设假设样本来自某一特定总体2.确定检验水准
确定最大允许误差3.选定检验方法计算检验统计量
计算样本与总体的偏离程度4.计算与统计量对应的P值5.作出结论
根据小概率反证法思想作出推断假设检验一般步骤11/17/2022130医学统计学1.进行检验假设假设检验一般步骤11/10/202239医学t检验(Student’st-test)设计完全随机设计单样本完全随机设计两样本配对设计要求1.n较小(单组﹤60或两组合计﹤60)2.样本随机地取自正态总体3.两样本均数比较时所对应两总体
方差相等(homogeneityofvariance)11/17/2022131医学统计学t检验(Student’st-test)11/10例某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?一、单样本t检验1.建立检验假设,确定检验水准H0:=0=140g/L铅作业男性工人的平均血红蛋白含量与正常成年男性的相等H1:≠0
=0.0511/17/2022132医学统计学例某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得2.计算检验统计量3.确定P值,作出推断结论
|-2.138|>t0.05/2,35=2.030P<0.05按=0.05水准,拒绝H0,接受H1,有统计学意义。可认为从事铅作业男性工人的平均血红蛋白含量低于正常成年男性的。11/17/2022133医学统计学2.计算检验统计量3.确定P值,作出推断结论11/10/20-2.0302.0300
=350.0250.025
t0.05/2,35=2.030
P(|t|≥2.030)=0.05
t值11/17/2022134医学统计学-2.0302.0300=350.0250.025t二、配对样本t检验(pairedt-test)---变量为配对两组之差的d配对设计①两同质受试对象分别接受两种不同处理②同一受试对象分别接受两种不同处理前后测量设计③同一受试对象分别前后接受一种处理11/17/2022135医学统计学二、配对样本t检验(pairedt-test)配对设计111/17/2022136医学统计学11/10/202245医学统计学1.建立检验假设,确定检验水准H0:d=0,两种方法的测定结果相同H1:d≠0,=0.052.计算检验统计量11/17/2022137医学统计学1.建立检验假设,确定检验水准2.计算检验统计量11/10/3.确定P值,作出推断结论t=7.925>t0.001/2,9=4.781P<0.001按=0.05水准,拒绝H0,接受H1,有统计学意义。两种方法对脂肪含量的测定结果不同,哥特里-罗紫法测定结果较高。11/17/2022138医学统计学3.确定P值,作出推断结论11/10/202247医学统三、两样本t检验(twosamplet-test)1.总体方差相等的t检验11/17/2022139医学统计学三、两样本t检验(twosamplet-test)1.研究目的:阿卡波糖胶囊降血糖效果试验设计:同期随机对照试验受试对象:40名II型糖尿病病人试验组:阿卡波糖胶囊对照组:拜唐苹胶囊观测指标:试验8周后空腹血糖下降值(1)建立检验假设,确定检验水准H0:1=2H1:1≠2
=0.05
11/17/2022140医学统计学研究目的:阿卡波糖胶囊降血糖效果(1)建立检验假设,确定检验(2)计算检验统计量=n1+n22=(20+201)=3811/17/2022141医学统计学(2)计算检验统计量=n1+n22=(20+201)=按=0.05水准,不拒绝H0,无统计学意义。还不能认为阿卡波糖胶囊与拜唐苹胶囊对降低II型糖尿病病人空腹血糖的效果不同。(3)确定P值,作出推断结论11/17/2022142医学统计学按=0.05水准,不拒绝H0,无统计学意义。还不能认为阿2.总体方差不相等的t检验数据变换后进行t检验秩转换的非参数检验(第8章)近似t检验t'检验11/17/2022143医学统计学2.总体方差不相等的t检验11/10/202252医Cochran&Cox法(1950)对临界值校正Satterthwaite法(1946)对自由度校正Welch法(1947)对自由度校正t'检验11/17/2022144医学统计学Cochran&Cox法(1950)t'检验11/10/1.单样本u检验适用于n较大(n﹥60)或0已知时四、u
检验11/17/2022145医学统计学1.单样本u检验四、u检验11/10/202254医2.两样本u
检验适用于两样本含量较大(n1+n2﹥60)11/17/2022146医学统计学2.两样本u检验11/10/202255医学统计学t检验与u检验区别公式查表与n关系计算精度t检验较复杂需 无关 精确u检验简单否n较大 近似11/17/2022147医学统计学t检验与u检验区别公式第五节两均数的等效检验equivalencetestfortwomeans11/17/2022148医学统计学第五节equivalencetestfortwom例研究某新药对高血脂患者胆固醇的降低作用是否相同于标准药物,设定等效界值δ=0.52mmol/L即就认为两药物等效11/17/2022149医学统计学例研究某新药对高血脂患者胆固醇的降低作用是否相同于标准药
(1)建立检验假设,确定检验水准H0:两药物不等效H1:两药物等效=0.0511/17/2022150医学统计学(1)建立检验假设,确定检验水准11/10/20225(2)计算检验统计量ν=n1+n2
-
2=102+100-
2=20011/17/2022151医学统计学(2)计算检验统计量ν=n1+n2-2=102+100∣t∣=3.569﹥t0.001/2,200=3.340P﹤0.001。按=0.05水准,拒绝H0,接受H1,有统计学意义。新药与标准药物对降低胆固醇的疗效相同(3)确定P值,作出推断结论11/17/2022152医学统计学∣t∣=3.569﹥t0.001/2,200=3.340(3δ值须在等效试验前根据专业知识予以确定应用等效检验的注意事项研究者可把专业上或公认有临床实际意义的差值作为等效界值δ。如:血压δ值为0.67kPa(5mmHg),胆固醇δ值为0.52mmol/L(20mg/dl),白细胞δ值为0.5109/L(500个/mm3)。难以确定时可用0.20.5倍标准差作为参考11/17/2022153医学统计学δ值须在等效试验前根据专业知识予以确定应用等效检验的注意事项H0:μT-μC≤-δ
H1:μT-μC>-δ0等效区间双单侧检验假设H1同时成立,才认为等效μT—试验药μC—对照药H0:μT-μC≥δ
H1:μT-μC
<δ11/17/2022154医学统计学H0:μT-μC≤-δH1:μT
第六节假设检验的注意事项11/17/2022155医学统计学第六节11/10/2022反证法根据研究目的建立假设H0,先假设H0是正确的,再分析样本提供的信息是否支持H0,即在H0成立的条件下计算检验统计量,获得相应P值,根据P值大小来判断。小概率事件原理小概率事件(P≤0.05)在一次抽样中发生的可能性很小,如果它发生了,则有理由怀疑H0的正确性,认为H1成立,该结论可能犯≤5%的错误。一、假设检验的基本思想11/17/2022156医学统计学反证法根据研究目的建立假设H0,先假设H0是正确的,再分析1.建立检验假设,确定检验水准(1)H0零假设(nullhypothesis)(2)H1备择假设(alternativehypothesis)(3)α检验水准(sizeofatest)二、假设检验的基本步骤针对总体而不是针对样本而言H0:某两个总体参数相等,仅一种情况H1:某两个总体参数不等,有多种情况H0与H1的内容不能互换,否则无法决定拒绝多种情况中的哪一种情况11/17/2022157医学统计学1.建立检验假设,确定检验水准二、假设检验的基本步骤针对总体H0:μ1=μ2H1:μ1>μ2或μ1<μ2单侧检验H0:μ1=μ2H1:μ1≠μ2双侧检验。单双侧检验主要根据专业知识预先确定。双侧检验较保守和稳妥。检验水准α:预先规定的拒绝假设H0时的最大允许误差,它确定了小概率事件标准。在实际工作中常取0.05,但并非一成不变。11/17/2022158医学统计学H0:μ1=μ2H1:μ1>μ2或μ1应根据变量和资料类型、设计方案、统计推断的目的、方法的适用条件等选择检验统计量。所有检验统计量都是在H0成立的前提条件下计算出来的。检验统计量大小反映样本与总体的偏离程度(如t值反映样本均数与总体均数的偏离程度,以标准误进行标准化)2.计算检验统计量
11/17/2022159医学统计学应根据变量和资料类型、设计方案、统2.计算检验统计量11P值是决策的依据P的含义是指从H0规定的总体中随机抽样,其检验统计量等于及大于现有样本的检验统计量的概率。即从H0假设总体中随机抽到差别至少等于现有样本差别的机会。根据获得的事后概率P,与事先规定的概率—检验水准进行比较,看其是否为小概率事件而得出结论。3.确定P值,作出推断结论11/17/2022160医学统计学P值是决策的依据3.确定P值,作出推断结论11/10/20P≤,按检验水准,拒绝H0,接受H1有统计学意义(统计结论)statisticalsignificance可认为…不同,…高于…(专业结论)P>,按检验水准,不拒绝H0无统计学意义(统计结论)nostatisticalsignificance还不能认为…不同(专业结论)不拒绝H0不等于接受H0,因此时证据不足11/17/2022161医学统计学P≤,按检验水准,拒绝H0,接受H111/10/2022三、I型错误和II型错误11/17/2022162医学统计学三、I型错误和II型错误11/10/202271医学统计学
健康人与肝病病人的肝大指数分布(所拟合的两个正态曲线各按100%面积绘制)肝大指数健康人H0肝病病人H1第一类错误=误诊率(假阳性率)第二类错误=漏诊率(假阴性率)6.17.08.4568910114大,小;大,小。增加n可同时缩小,。11/17/2022163医学统计学健康人与肝病病人的肝大指数分布肝大指数健康人肝病病可取单尾亦可取双尾。II型错误的概率大小用表示,只取单尾,值的大小一般未知,须在知道两总体差值(如12等)、及n时,才能算出。1称检验效能(powerofatest),过去称把握度。为当两总体确有差异,按检验水准所能发现该差异的能力。1只取单尾。拒绝H0,只可能犯I型错误,不可能犯II型错误;不拒绝H0,只可能犯II型错误,不可能犯I型错误。11/17/2022164医学统计学可取单尾亦可取双尾。11/10/202273医学统计学四、假设检验应注意的问题1.要有严密的研究设计组间应均衡,具有可比性,除对比的主要因素(如临床试验用新药和对照药)外,其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近。11/17/2022165医学统计学四、假设检验应注意的问题1.要有严密的研究设计11/10/2配对设计计量资料:配对t检验。完全随机设计两样本计量资料:小样本(任一ni≤60)且方差齐:两样本t检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度体育赛事赞助合同汇编
- 2025年度空调销售安装合同书-二零二五年度品质保障
- 2025年度跨境电子商务平台居间服务合同范本
- 2025年度科技项目居间合作合同参考
- 2025年度智慧城市基础设施建设合同-@-20
- 2025年度虚拟现实(VR)技术研发与应用合同-@-1
- 2025年度智能安防监控系统集成合同
- 2025年度城市配送电动车租赁服务合同
- 2025年度供配电工程监理合同规范正本
- 2025年度智能穿戴设备研发与生产劳动合同
- 2025年鲁泰集团招聘170人高频重点提升(共500题)附带答案详解
- 2024-2025学年成都高新区七上数学期末考试试卷【含答案】
- 企业员工食堂管理制度框架
- 《辣椒主要病虫害》课件
- 电力沟施工组织设计-电缆沟
- 2024年煤矿安全生产知识培训考试必答题库及答案(共190题)
- 《法律援助》课件
- 小儿肺炎治疗与护理
- GB/T 36547-2024电化学储能电站接入电网技术规定
- 学校物业管理投标书范本
- 《高处作业安全》课件
评论
0/150
提交评论