第三章总体均数的估计与假设检验第3章ppt课件

上传人：A*** IP属地：广东上传时间：2022-01-30 格式：PPT 页数：91 大小：1.65MB 积分：22 举报 版权申诉

已阅读5页，还剩86页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、u了解总体特征的最好方法是对总体的每一了解总体特征的最好方法是对总体的每一u 个体进展察看、实验，但这在医学研讨实个体进展察看、实验，但这在医学研讨实u 际中往往不可行。际中往往不可行。u对无限总体不能够对一切个体逐一察看，对无限总体不能够对一切个体逐一察看，u 对有限总体限于人力、财力、物力、时间对有限总体限于人力、财力、物力、时间u 或个体过多等缘由，不能够也没必要对所或个体过多等缘由，不能够也没必要对所u 有个体逐一研讨有个体逐一研讨(如对一批罐头质量检查如对一批罐头质量检查)。u借助抽样研讨。借助抽样研讨。 u欲了解某地欲了解某地18岁男生身高值的平均程度，岁男生身高值的平均程度，u

2、随机抽取该地随机抽取该地10名男生身高值作为样本名男生身高值作为样本。u由于个体变异与抽样的影响，抽得的样本由于个体变异与抽样的影响，抽得的样本u 均数不太能够等于总体均数，呵斥样本均数不太能够等于总体均数，呵斥样本统统u 计量与总体参数间的差别计量与总体参数间的差别(表现为来自同表现为来自同一一u 总体的假设干样本统计量间的差别总体的假设干样本统计量间的差别)，称，称为抽为抽u 样误差。样误差。u抽样误差是不可防止的。抽样误差是不可防止的。u抽样误差是有规律的。抽样误差是有规律的。2019年某市年某市18岁男生身高值岁男生身高值 XiN(, 2) =167.7cm =5.3cm样本号样本号i

3、XiS 1 167.41 2.74 2 165.56 6.57 3 168.20 5.36 99 169.40 5.57100 165.69 5.09ni = 10样本均数抽样分布具有如下特点：样本均数抽样分布具有如下特点：各样本均数未必等于总体均数各样本均数未必等于总体均数各样本均数间存在差别各样本均数间存在差别样本均数围绕样本均数围绕 =167.69cm呈正态分布呈正态分布样本均数变异度样本均数变异度( )较原总体个较原总体个体值变异度体值变异度( = 5.3cm)大大减少大大减少cm69. 1SX XnX 规范差为规范差为中心极限定理中心极限定理(central limit the

4、orem) 假设假设 X i 服从正态分布服从正态分布那么那么服从正态分布服从正态分布假设假设 X i 不服从正态分布不服从正态分布 n大大(n60)：那么：那么近似服从正态分布近似服从正态分布 n小小(n60)：那么：那么为非正态分布为非正态分布jXjXjX样本统计量的规范差称规范误样本统计量的规范差称规范误(standard error, SE)样本均数的规范差称均数的规范误样本均数的规范差称均数的规范误(standard error of mean, SEM)nX nSSX 规范差与规范误的区别规范差与规范误的区别1908年，英国统计学年，英国统计学家家 W.S.Gosset

5、以笔以笔名名 “ S t u d e n t 在在杂志上杂志上发表论文，初次提出发表论文，初次提出t分布概念，后人又分布概念，后人又称称Students t-distribution，开创了，开创了小样本统计推断的新小样本统计推断的新纪元，被以为是统计纪元，被以为是统计学开展史上的里程碑学开展史上的里程碑之一。之一。William Seely Gosset(18761937，英，英)1 , 0(N),(NXXu2 t 分布的概念分布的概念)1 , 0(N)n,(NXnXu2 分分布布t)n,(NXnSXt2 t分布的图形与特征分布的图形与特征t分布为一簇单峰分布曲线，分布为一簇单峰分布曲线，

6、不同，不同，曲线曲线外形不同外形不同t分布以分布以0为中心，左右对称为中心，左右对称t分布与分布与有关，有关，越小，越小， t值越分散值越分散，t分分布的峰部越低，而两侧尾部翘得越布的峰部越低，而两侧尾部翘得越高高当当逼近逼近, 逼近逼近，t分布逼近分布逼近u分布分布X XS f(t) =规范正态曲线规范正态曲线 =5 =10.10.2-4-3-2-1012340.3自在度分别为自在度分别为1、5、时的时的t分布分布 t 值值-tt0t分布曲线下面积与横轴分布曲线下面积与横轴t值间关系值间关系(附表附表2)ut界值表中一侧尾部面积称单侧概率界值表中一侧尾部面积称单侧概率 () u 两侧

7、尾部面积之和称双侧概率两侧尾部面积之和称双侧概率(/2)u t0.05/2,9=2.262 , t0.05,9=1.833u在一样自在度时，在一样自在度时，值增大，值增大，减小减小u在一样在一样时，单尾时，单尾对应的对应的t值比双尾值比双尾 u 的小的小tt0.05/2,9=2.262 t0.05,9=1.833-tt0一、可信区间的概念一、可信区间的概念u参数估计是用样本统计量推断总体参数。参数估计是用样本统计量推断总体参数。u有点估计和区间估计两种。有点估计和区间估计两种。Xu点估计是用样本统计量直接估计其总体参点估计是用样本统计量直接估计其总体参u 数值。如用数值。如用估计估计、

8、S估计估计等。等。u 方法虽简单，但未思索抽样误差大小。方法虽简单，但未思索抽样误差大小。u区间估计是按预先给定的概率区间估计是按预先给定的概率(1 )，确，确定定u 一个包含总体参数的范围。该范围称为参一个包含总体参数的范围。该范围称为参数数u 的可信区间的可信区间(confidence interval, CI)u预先给定的概率预先给定的概率(1)称为可信度称为可信度u(confidence level)，常取，常取95%或或99%。u总体参数是未知的、一个固定的值。总体参数是未知的、一个固定的值。所以要用包含来描画。所以要用包含来描画。u样本统计量是随机变量。样本统计量是随机变量。u可信

9、区间通常由两个数值构成，可信区间通常由两个数值构成，u 称可信限称可信限(confidence limit, CL) 。可信下限可信下限(L)可信上限可信上限(U)二、总体均数可信区间的计算二、总体均数可信区间的计算1. 单一总体均数的可信区间单一总体均数的可信区间(1)未知未知按按t分布原理分布原理(2)知或知或未知但未知但n足够大足够大(如如n60) 按按u分布原理分布原理2. 两总体均数之差的可信区间两总体均数之差的可信区间 1.单一总体均数的单一总体均数的1可信区间可信区间StStX,2X,2X , X 双侧双侧(1)未知未知单侧单侧StStX,X,X X 3.641.151110X

10、S 0.05 2,92.262t故该地故该地18岁男生身高均数的岁男生身高均数的95%可信区间为可信区间为(164.35, 169.55)cm。=167.7cm 双尾双尾例例在例在例3-1中抽得第中抽得第15号样本的号样本的 =166.95(cm)，S=3.64(cm)，求其总体均数的求其总体均数的95%可信区间。可信区间。 X166.952.2621.1511=164.35169.55(cm)1.单一总体均数的单一总体均数的1可信区间可信区间X,2X,2SX Xuu 或或双侧双侧单侧单侧SuuSuuX,X,X,X,X X X X 或或或或(2) 知或知或未知但未知但n足够大足够大: 例

11、例某地抽取正常成年人某地抽取正常成年人200名，测得其血名，测得其血清胆固醇均数为清胆固醇均数为3.64 mmol/L，规范差为，规范差为1.20mmol/L，估计该地正常成年人血清胆，估计该地正常成年人血清胆固醇均数固醇均数95%可信区间。可信区间。法，用近似正态分布的方60)/(81. 347. 30849. 096. 164. 320020. 196. 164. 3NLmmol2. 两总体均数之差的两总体均数之差的1可信区间可信区间双侧双侧21XX,2/21S)XX(t 21XX,2121S)XX()(t 单侧单侧21XX,2121S)XX()(t 三、可信区间确实切含义三、可信区

12、间确实切含义u从从2019年某市年某市18岁男生身高值总体岁男生身高值总体uN(=167.7cm, =5.3cm)中随机抽取中随机抽取100个样个样本本u计算了计算了100个估计个估计的的95%CIu其中有其中有95个个CI包含了包含了u 有有5个不包含个不包含 =167.7cmu20号号 161.00165.57 31号号 161.17167.33u54号号 168.05171.00 76号号 167.71174.84u82号号 167.98174.27 -2 -1 0 1 2 来自来自N(0,1)的的100个样本所计算的个样本所计算的95%可信区间表示可信区间表示 u假设可以进展反复抽样实

13、验，平均有假设可以进展反复抽样实验，平均有(1)的可信区间包含了总体参数，而不的可信区间包含了总体参数，而不是总体参数落在该范围的能够性为是总体参数落在该范围的能够性为(1)。u在实践任务中，只能根据一次实验结果计在实践任务中，只能根据一次实验结果计算一个可信区间，就以为该区间包含了相应算一个可信区间，就以为该区间包含了相应总体参数，该结论犯错误的概率总体参数，该结论犯错误的概率。u可信区间一旦构成，它要么包含总体参数，可信区间一旦构成，它要么包含总体参数，要么不包含总体参数，二者必居其一，无要么不包含总体参数，二者必居其一，无概率可言。可信度是事前概率。概率可言。可信度是事前概率。可信区间

14、确实切含义可信区间确实切含义u正确性：可信度正确性：可信度1，即区间包含总体参，即区间包含总体参数数u 的实际概率大小，愈接近的实际概率大小，愈接近1愈好。愈好。u准确性：区间的宽度，区间愈窄愈好。准确性：区间的宽度，区间愈窄愈好。u当样本含量为定值时，上述两者相互矛盾。当样本含量为定值时，上述两者相互矛盾。u 假设只顾提高可信度，那么可信区间会变假设只顾提高可信度，那么可信区间会变宽。宽。评价可信区间估计的优劣：评价可信区间估计的优劣：四、可信区间与参考值范围的区别四、可信区间与参考值范围的区别u可信区间用于估计总体参数，总体参数只可信区间用于估计总体参数，总体参数只u 有一个有一个。u参

15、考值范围用于估计个体值的分布范围，参考值范围用于估计个体值的分布范围，u 个体值有很多个体值有很多。u95%可信区间中的可信区间中的95%是可信度，即所求可是可信度，即所求可u 信区间包含总体参数的可信程度为信区间包含总体参数的可信程度为95%。u95%参考值范围中的参考值范围中的95%是一个比例，即是一个比例，即u 所求参考值范围包含了所求参考值范围包含了95%的正常人。的正常人。例例某医生丈量了某医生丈量了36名从事铅作业男性工人的名从事铅作业男性工人的血红蛋白含量，算得其均数为血红蛋白含量，算得其均数为130.83g/L，规，规范差为范差为25.74g/L。问从事铅作业工人的血红蛋。

16、问从事铅作业工人的血红蛋白能否不同于正常成年男性平均值白能否不同于正常成年男性平均值140g/L？u样本均数与总体均数间差别的缘由：样本均数与总体均数间差别的缘由：u 1.总体均数不同总体均数不同?u 2.总体均数一样，差别由抽样误差呵斥总体均数一样，差别由抽样误差呵斥?u统计推断方法统计推断方法假设检验假设检验(hypothesis test)1.进展检验假设进展检验假设假设样本来自某一特定总体假设样本来自某一特定总体2.确定检验水准确定检验水准确定最大允许误差确定最大允许误差3.选定检验方法计算检验统计量选定检验方法计算检验统计量计算样本与总体的偏离程度计算样本与总体的偏离程度4.

17、计算与统计量对应的计算与统计量对应的P值值5.作出结论作出结论根据小概率反证法思想作出推断根据小概率反证法思想作出推断假设检验普通步骤假设检验普通步骤 t 检验检验(Students t-test) 设计设计完全随机设计单样本完全随机设计单样本完全随机设计两样本完全随机设计两样本配对设计配对设计要求要求 1.n较小较小(单组单组60或两组合计或两组合计60) 2.样本随机地取自正态总体样本随机地取自正态总体 3.两样本均数比较时所对应两总体两样本均数比较时所对应两总体方差相等方差相等(homogeneity of variance)例例某医生丈量了某医生丈量了36名从事铅作业男性

18、工人的名从事铅作业男性工人的血红蛋白含量，算得其均数为血红蛋白含量，算得其均数为130.83g/L，规，规范差为范差为25.74g/L。问从事铅作业工人的血红蛋。问从事铅作业工人的血红蛋白能否不同于正常成年男性平均值白能否不同于正常成年男性平均值140g/L？一、单样本一、单样本t 检验检验1.建立检验假设，确定检验水准建立检验假设，确定检验水准H0: =0=140g/L 铅作业男性工人的平均铅作业男性工人的平均血红蛋血红蛋白含量与正常成年男性白含量与正常成年男性的相等的相等H1: 0 =0.05 351361n138. 23674.2514083.130nSXSXt0X0 2.计算检验统计

19、量计算检验统计量3.确定确定P值，作出推断结论值，作出推断结论 |2. | t0.05/2,35=2.030 P 2 或或 1 2 单侧单侧检验检验uH0: 1= 2 H1: 1 2 双侧检验。双侧检验。u单双侧检验主要根据专业知识预先确定。单双侧检验主要根据专业知识预先确定。u双侧检验较保守和稳妥。双侧检验较保守和稳妥。u检验水准检验水准：预先规定的回绝假设：预先规定的回绝假设H0时的时的最最u大允许误差，它确定了小概率事件规范。大允许误差，它确定了小概率事件规范。u在实践任务中常取在实践任务中常取0.05，但并非一成不变。，但并非一成不变。u应根据变量和资料类型、设计方案、统应根据变量和资

20、料类型、设计方案、统u 计推断的目的、方法的适用条件等选择计推断的目的、方法的适用条件等选择u 检验统计量。检验统计量。u一切检验统计量都是在一切检验统计量都是在H0成立的前提条成立的前提条u 件下计算出来的。件下计算出来的。u检验统计量大小反映样本与总体的偏离检验统计量大小反映样本与总体的偏离u 程度如程度如t值反映样本均数与总体均数值反映样本均数与总体均数u 的偏离程度，以规范误进展规范化的偏离程度，以规范误进展规范化2.计算检验统计量计算检验统计量 uP值是决策的根据值是决策的根据uP的含义是指从的含义是指从H0规定的总体中随机抽样，规定的总体中随机抽样，u其检验统计量等于及大于现有样本

21、的检验其检验统计量等于及大于现有样本的检验u统计量的概率。即从统计量的概率。即从H0假设总体中随机抽假设总体中随机抽u到差别至少等于现有样本差别的时机。到差别至少等于现有样本差别的时机。u根据获得的事后概率根据获得的事后概率P，与事先规定的，与事先规定的u概率概率检验水准检验水准进展比较，看其能否为进展比较，看其能否为u小概率事件而得出结论。小概率事件而得出结论。3.确定确定P 值，作出推断结论值，作出推断结论uP，按，按检验水准，回绝检验水准，回绝H0，接受，接受H1u有统计学意义有统计学意义(统计结论统计结论)ustatistical significanceu可以为可以为不同，不同，高于

22、高于(专业结论专业结论)uP，按，按检验水准，不回绝检验水准，不回绝H0u无统计学意义无统计学意义(统计结论统计结论)uno statistical significanceu还不能以为还不能以为不同不同(专业结论专业结论)u不回绝不回绝H0不等于接受不等于接受H0，因此时证据缺乏，因此时证据缺乏三、三、I型错误和型错误和II型错误型错误安康人与肝病病人的肝大指数分布安康人与肝病病人的肝大指数分布(所拟合的两个正态曲线各按所拟合的两个正态曲线各按100%面积绘制面积绘制肝肝大大指指数数安康人安康人H0肝病病人肝病病人H1第一类错误第一类错误误诊率误诊率 (假阳性率假阳性率)第二类错误第

23、二类错误漏诊率漏诊率 (假阴性率假阴性率) 6.1 7.0 8.456891011 4 大，大，小；小；大，大，小。添加小。添加n可同时减少可同时减少，。 u 可取单尾亦可取双尾。可取单尾亦可取双尾。uII型错误的概率大小用型错误的概率大小用表示表示, 只取单尾，只取单尾，u 值的大小普通未知，须在知道两总体差值的大小普通未知，须在知道两总体差值值u (如如 12等等)、及及n 时，才干算出。时，才干算出。u1称检验效能称检验效能(power of a test)，过去称把，过去称把u握度。为当两总体确有差别，按检验水准握度。为当两总体确有差别，按检验水准u 所能发现该差别的才干

24、。所能发现该差别的才干。1只取单尾。只取单尾。u回绝回绝H0，只能够犯，只能够犯I型错误，不能够犯型错误，不能够犯II型型u错误；不回绝错误；不回绝H0，只能够犯，只能够犯II型错误，不型错误，不u能够犯能够犯I型错误。型错误。四、假设检验应留意的问题四、假设检验应留意的问题1.要有严密的研讨设计要有严密的研讨设计组间应平衡，具有可比性，除对比的主要要组间应平衡，具有可比性，除对比的主要要素素(如临床实验用新药和对照药如临床实验用新药和对照药)外，其它能外，其它能够影响结果的要素够影响结果的要素(如年龄、性别、病程、如年龄、性别、病程、病情轻重等病情轻重等)在对比组间应一样或相近。在对比组间

25、应一样或相近。u配对设计计量资料：配对配对设计计量资料：配对t检验。检验。u完全随机设计两样本计量资料：完全随机设计两样本计量资料：u小样本小样本(任一任一ni60)且方差齐且方差齐: 两样本两样本t检验检验 u 方差不齐方差不齐: 近似近似t检验检验u大样本大样本(一切一切ni60): u检验。检验。2.不同资料应选用不同检验方法不同资料应选用不同检验方法3.正确了解正确了解“significance一词的含义一词的含义过去称差别有或无过去称差别有或无“显著性，易呵斥两显著性，易呵斥两样本统计量之间比较相差很大的误解。样本统计量之间比较相差很大的误解。如今称差别有或无如今称差别有或无“统计

26、学意义，统计学意义，相应推断为：可以以为或还不能以为两相应推断为：可以以为或还不能以为两个或多个总体参数有差别。个或多个总体参数有差别。4.结论不能绝对化结论不能绝对化因统计结论具有概率性质，故因统计结论具有概率性质，故“一定、一定、 “一定、一定、“必定等词不要运用。必定等词不要运用。在报告结论时，最好列出检验统计量的在报告结论时，最好列出检验统计量的值，尽量写出详细值，尽量写出详细P值，而不简单写成值，而不简单写成 P0.05，以便读者与同类研讨进展比，以便读者与同类研讨进展比较或进展循证医学时采用较或进展循证医学时采用Meta分析。分析。5.统计统计“有意义与医学有意义与医学“

27、有意义有意义统计统计“有意义对应统计结论，医学有意义对应统计结论，医学“有意有意义对应专业结论。义对应专业结论。统计结论有意义，专业结论无意义，最终统计结论有意义，专业结论无意义，最终结论没有意义，样本含量过大或设计存在结论没有意义，样本含量过大或设计存在问题。问题。统计结论无意义，专业结论有意义，检查统计结论无意义，专业结论有意义，检查设计能否合理、样本含量能否足够。设计能否合理、样本含量能否足够。6.可信区间与假设检验区别和联络可信区间与假设检验区别和联络u可信区间可回答假设检验问题可信区间可回答假设检验问题u H0: =0=140g/L 铅作业男性工人的铅作业男性工人的平均血红

28、蛋平均血红蛋 u 白含量与正常白含量与正常成年男性的相等成年男性的相等u H1: 0 u =0.05 u 铅作业男性工人平均血红蛋白含量总铅作业男性工人平均血红蛋白含量总体体u 均数均数的的95%CI为为(122.12， .54) g/L，u 未包括未包括0=140g/L u 按按=0.05水准，回绝水准，回绝H0 ，接受，接受H1。 u可信区间阐明量的大小即推断总体均数可信区间阐明量的大小即推断总体均数u 所在范围，假设检验推断质的不同即所在范围，假设检验推断质的不同即判判u 断两总体均数能否不等。断两总体均数能否不等。u可信区间不但能回答差别有无统计学意可信区间不但能回答差别有无统计学意u

29、义，还能提示差别有无实践专业意义。义，还能提示差别有无实践专业意义。u可信区间不可以完全替代假设检验。可可信区间不可以完全替代假设检验。可u 信区间只能在预先规定概率信区间只能在预先规定概率的前提的前提下下u 进展计算，而假设检验能获得一较为进展计算，而假设检验能获得一较为确确u 切的切的P值。值。两小样本两小样本t 检验前提条件：检验前提条件：相应的两总体为正态总体相应的两总体为正态总体两总体方差相等，即方差齐性两总体方差相等，即方差齐性配对配对t 检验前提条件：检验前提条件：每对数据差值的总体为正态总体每对数据差值的总体为正态总体一、正态性检验一、正态性检验(了解了解)1.图示法图示法概

30、率图概率图(probability-probability plot)以实践累积频率以实践累积频率(X)对正态分布实际累积频率对正态分布实际累积频率(Y)作散点图作散点图分位数图分位数图(quantile-quantile plot)以实践分位数以实践分位数(X)对正态分布实际分位数对正态分布实际分位数 ( )作散点图作散点图假照实践值与实际值吻合，图中散点几乎都假照实践值与实际值吻合，图中散点几乎都在不断线上，可以为该资料服从正态分布在不断线上，可以为该资料服从正态分布 S/ )XX(Y Normal Q-Q Plot of 100个样本均数(cm)Observed Value1741721

31、70168166164162Expected Normal3210-1-2-3(168-167.69)/1.69=0.18(164-167.69)/1.69=-2.18(172-167.69)/1.69=2.552.计算法计算法偏度偏度(skewness)指分布不对称的程度和方向指分布不对称的程度和方向，用偏度系数，用偏度系数(总体总体:1 样本样本:g1)衡量。衡量。1=0 对称对称 10 正偏态正偏态 10 负负偏态偏态峰度峰度(kurtosis)指分布与正态曲线相比的冒指分布与正态曲线相比的冒尖或扁平程度，用峰度系数尖或扁平程度，用峰度系数(总体总体:2 样本样本:g2)衡量。衡量。2=0 正态峰正态峰 20 尖峭峰尖峭峰 20 平阔峰平阔峰当同时满足对称和正态峰两个条件时，才干当

人人文库> 全部分类> 应用文书 > 工作计划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第三章总体均数的估计与假设检验第3章ppt课件

文档简介

温馨提示

最新文档

评论

第三章总体均数的估计与假设检验第3章ppt课件

文档简介

温馨提示

最新文档

评论

相关文档