医学统计学总体均数估计和假设检验课件_第1页
医学统计学总体均数估计和假设检验课件_第2页
医学统计学总体均数估计和假设检验课件_第3页
医学统计学总体均数估计和假设检验课件_第4页
医学统计学总体均数估计和假设检验课件_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、总体均数估计与假设检验尹家祥大理学院公共卫生学院总体均数估计与假设检验尹家祥总体均数的估计总体均数的估计普查(overall survey)是了解总体特征的最好方法。抽样研究(sampling study)的目的就是要用样本信息来推断相应总体的特征,这一过程称为统计推断(statistical inference)。统计推断包括两方面的内容:总体参数的估计和假设检验(显著性检验)。普查(overall survey)是了解总体特征的最好方法三类误差系统误差(systematic error):由于受试对象、研究者、仪器设备、研究方法、非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差。

2、可以避免。随机误差(random error):由于多种无法控制的偶然因素引起,对同一样品多次测量数据的不一致。无倾向性,不可避免。抽样误差(sampling error):由个体变异产生的、由于抽样而造成的样本均数与样本均数及样本均数与总体均数之间的差异称为均数的抽样误差。三类误差系统误差(systematic error):由于受抽样误差的概念 总体样本统计推断抽样抽样误差 抽样误差产生的根本原因是个体变异、产生的直接原因是抽样。只要有抽样,抽样误差就不可避免。抽样误差的概念 总体样本统计推断抽样抽样误差 抽样误差产生的抽样抽样误差。 。 。 。 。 。 。 。 。 。 。 。 。 。No

3、rmal distribution抽样抽样误差。Normal distribution样本均数的分布特点各样本均数未必等于总体均数;各样本均数间存在差异。样本均数分布很有规律,在正态总体中随机抽取例数为n的样本,样本均数服从正态分布。样本均数间相差较小,其变异范围较原变量值的变异范围缩小。在偏态总体中随机抽样,当n足够大时(n60),也近似正态分布。样本均数的分布特点各样本均数未必等于总体均数;各样本均数间存该资料是一个正偏峰的分布,用电脑从中随机抽取样本含量分别为5,10,30和50的样本各1000次,计算样本均数并绘制4个直方图。原始数据该资料是一个正偏峰的分布,用电脑从中随机抽取样本含量

4、分别为5 (b)n=5 (c)n=10 (d) n=30 (e) n=50 (b)n=5 (c)n=10 1)从正态总体N(,2)中,随机抽取例数为n的多个样本,样本均数 服从正态分布;即使是从偏态总体中随机抽样,当n足够大时(如n30), 也近似正态分布。数理统计推理和中心极限定理表明: 2)从均数为,标准差为的正态或偏态总体中抽取例数为n的样本,样本均数的标准差即标准误为 。 1)从正态总体N(,2)中,随机抽取例数为n的多标准误的概念 用于表示均数抽样误差的指标叫样本均数的标准差,根据其实际意义,常称作样本均数的标准误(standard error)。标准误的概念 用于表示均数抽样误差的

5、指标叫 标准误的大小与的大小成正比,与n的平方根成反比,而为定值,说明可以通过增加样本例数来减少标准误,以降低抽样误差。未知,用样本标准差S来估计总体标准差。用 来表示均数抽样误差的大小。(标准误的理论值)(标准误的估计值) 标准误的大小与的大小成正比,与n的平方根成反比,而为随着 n S 稳定 Sx 0均数的标准误与标准差成正比,与样本例数n的平方根成反比。因此,减少抽样误差最有效的办法:增加样本例数随着 n S 稳定 Sx 例 1 2000年某研究所随机调查某地健康成年男子27人,得到血红蛋白的均数为125g/L,标准差为15g/L 。试估计该样本均数的抽样误差。例 1 2000年某研究所

6、随机调查某地健康成年男子27人标准误的应用反映抽样误差大小:标准误越大,抽样误差越大;反映均数的可靠性:越大,样本均数的抽样误差越大,(用样本均数推算总体均数的)可靠性差;反之,越小,均数抽样误差越小,(用样本均数推算总体均数的)可靠性好。用于进行假设检验。标准误的应用反映抽样误差大小:标准误越大,抽样误差越大;标准差和标准误的区别和联系区别:概念不同:标准差是描述观察值(个体值)之间的变异程度,S越小,均数的代表性越好;标准误是描述样本均数的抽样误差,Sx越小,均数的可靠性越高;用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等

7、。与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。联系:标准差、标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。标准差和标准误的区别和联系区别:t 分布 在统计应用中,可以把任何一个均数为,标准差为的正态分布N(,2)转变为=0,=1的标准正态分布,即将正态变量值X用 来代替。由于 服从正态分布,故服从标准正态分布N (0,1)。t 分布服从标准正态分布N (0,1)。 实际资料的分析中,由于 往往未知,故标准化转换演变为:服从=n-1的t分布,即: 实际资料的分析中,由于 往往未服从=n-t-分布(f)-degree of

8、 freedom自由度= n-1t-分布(f)-degree of freedom自由度 t 分布曲线下面积规律:t 分布曲线下总面积仍为1或100%t 分布曲线下面积以0为中心左右对称。t 分布是一簇曲线,故t分布曲线下固定面积(如95%或99%)的界值不是一个常量,而是随自由度的大小而变化 。 t 分布曲线下面积规律:t 分布曲线下总面积仍为1或100t 分布曲线特点: 1) t 分布曲线是单峰分布,它以0为中心,左右对称。 2)t 分布的形状与样本例数n有关。自由度越小,则 越大,t 值越分散,曲线的峰部越矮,尾部则偏高。 3) 当 n时,则S逼近,t 分布逼近标准正态分布。 t 分布不

9、是一条曲线,而是一簇曲线。t 分布的图形和 t 分布表t 分布曲线特点:t 分布的图形和 t 分布表总体参数估计统计推断包括参数估计和假设检验。参数估计就是用样本指标(统计量)来估计总体指标(参数)。参数估计:点估计(point estimation):用相应样本统计量直接作为其总体参数的估计值。如用 估计、S估计等。其方法虽简单,但未考虑抽样误差的大小。 区间估计(interval estimation):按一定的概率(1)估计总体均数所在范围(置信区间)。总体参数估计统计推断包括参数估计和假设检验。参数估计就是用样 ,即认为2000年该地所有健康成年男性血红蛋白量的总体均数为125g/L

10、。1. 点估计: 用样本统计量直接作为总体参数的估计值。 例 2 2000年某研究所测得某地27例健康成年男性血红蛋白量的样本均数为125g/L,试估计其总体均数。 ,即认为2000年该地所有健康成年男2. 区间估计:按预先给定的置信水平(1)估计总体参数的可能位置,该范围就称为总体参数的1置信区间(confidence interval CI)。 预先给定的概率(1)称为置信度,常取95%或99%。如无特别说明,一般取双侧95%。 置信区间由两个数值即置信限(下限和上限)构成。2. 区间估计:按预先给定的置信水平(1)估计总体参数的通式: (双侧) (1)已知,按标准正态分布原理计算由z分布

11、,标准正态曲线下有95%的z值在1.96之间。95%的双侧置信区间:99%的双侧置信区间:总体均数可信区间的计算通式: (双侧) (1) 0 2.52.5-t0.05t0.05 0 通式: (双侧)(2)未知但样本例数n足够大(n50)时 由t分布可知,自由度越大,t分布越逼近标准正态分布,此时t曲线下约有95%的t值在1.96之间,即95%的双侧置信区间:99%的双侧置信区间:通式: (双侧)(2)例 3 某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,,试估计该地19岁健康男大学生的身高的95%置信区间。该市19岁健康男大学生的身高的95

12、%置信区间(171.3,173.1)cm例 3 某市2000年随机测量了90名19岁健康男大学生的身(3)未知且样本例数n 较小时,按t 分布原理,此时 某自由度的t曲线下约有95%的t值在t0.05/2()之间, 通式:95%的双侧置信区间:99%的双侧置信区间:t/2, 是按自由度=n-1,由附表2查得的t值。(3)未知且样本例数n 较小时,按t 分布原理,此时 通式例 4 已知某地27例健康成年男性血红蛋白量的均数为 ,标准差S=15g/L ,试问该地健康成年男性血红蛋白量的95%和99%置信区间。本例n=27,S=1595%CI:99%CI:例 4 已知某地27例健康成年男性血红蛋白量

13、的均数为 可信区间的确切涵义 从总体中作随机抽样,进行重复抽样的试验中,平均有1a的可信区间包含了总体参数,有a的可信区间不包括总体均数。即犯错误的概率为a,而a是小概率事件,对一次试验的可能性小,因此,实际应用中就认为总体均数在算得的可信区间内。可信区间的确切涵义 从总体中作随机抽样,95%的可信区间的理解(1)所要估计的总体参数有95%的可能在我们所估计的可信区间内。(2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数。(3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均

14、数。95%的可信区间的理解(1)所要估计的总体参数有95%的可能可信区间的两个要素准确度(accuracy):反映在可信度(1)的大小。1越接近1,就越准确。如可信度99%比95%准确。精确度(precision):反映在区间的长度。长度越小越好, 在例数n确定的情况下,二者呈反比关系:准确度, 精确度(范围变宽)。要兼顾准确度和精确度,一般取95%可信区间。可信区间的两个要素准确度(accuracy):反映在可信度(可信区间与参考值范围区别意义不同正常值范围是指绝大多数观察值在某个范围可信区间是指按一定的可信度估计总体均数(参数)的所在范围计算公式不同可信区间参考值范围应用不同可信区间:估计

15、总体均数参考值范围:判断某项指标是否正常可信区间与参考值范围区别意义不同假设检验假设检验 假设检验(hypothesis test)也称显著性检验(significance test),是用来判断样本与样本,样本与总体的差异是由抽样误差引起的?还是本质差别造成的?由于存在抽样误差,从总体中随机抽样所得的样本均数与总体均数之间存在误差,从同一总体中抽取的样本均数之间也有误差。假设检验原理 假设检验(hypothesis test例 5 某医生测量了36名从事铅作业的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140

16、g/L?例 5 某医生测量了36名从事铅作业的血红蛋白含量,算得例 50=140g/L已知总体X=130.83g/LS=25.74g/L未知总体=例 50=140g/L已知总体X=130.83g/L未知 完全由抽样误差引起,比较的均数来源于同一总体;的原因假设检验计算 的概率判断。 来自于不同的总体,均数之间存在本质差别。 完全由抽样误差引起,比较的均数来源于同一总体;的原0X差异完全由抽样误差引起0X差异完全由抽样误差引起0X差异完全由抽样误差引起0X差异完全由抽样误差引起0X来自于不同的总体0X来自于不同的总体0X来自于不同的总体0X来自于不同的总体假设检验的基本思想小概率思想:小概率事件

17、:在一次试验中认为基本上不可能发生。小概率事件的概率是相对的,统计分析时就是预先规定检验水准(size of a test),用表示,反证法思想:当检验假设H0成立时,用合适的统计方法获得现在样本的概率大小(P值)。如果是小概率事件,则推断假设是假的,因此拒绝它;如果不是小概率事件,则不能认为假设是假的,也因此不能拒绝它。假设检验的基本思想小概率思想:假设检验的基本步骤 1、建立假设和确定检验水准 2、选定检验方法和计算检验统计量 3、确定P值和作出推断结论 假设检验的基本步骤 1、建立假设和确定检验水准 2、选定检验1、建立假设和确定检验水准 (1)两个假设 无效假设: H0:u=u0 备择

18、假设: H1: uu01、建立假设和确定检验水准 (1)两个假设 无效假设:对于假设检验,须注意:检验的假设是针对总体而言,而不是针对样本; H0和H1是相互联系、对立的假设,后面的结论是根据H0和H1作出的,因此,两者不是可有可无,而是缺一不可; H0是无效假设,其假设通常是:某两个总体参数相等,或两个总体参数之差等于0等等。 H1的内容反映了检验的单双侧。对于假设检验,须注意:单侧检验:在比较两种药物的疗效时,根据专业知识可认为新药不会比旧药差,只关心新药是否比旧药好(至多相同,绝对排除出现相反的可能性),可用单侧检验。 (2) 确定单侧或双侧检验 根据专业知识和研究目的而定单侧检验:在比

19、较两种药物的疗效时,根据专业知识可认为新药不会双侧检验:在比较两种药物的疗效时,事先不能确定哪种药的疗效较好,只关心两药的疗效有无差别,要用双侧检验。 双侧检验若有差别,单侧检验肯定有差别;反之,单侧检验若有差别,双侧检验不一定有差别。 双侧检验:在比较两种药物的疗效时,事先不能确定哪种药的疗效较 甲均数与乙均数相比: 可能高,也可能低 双侧检验 肯定不会低(或高) 单侧检验H1 :0 0 1 2 1 2 甲均数与乙均数相比: 肯定不会低(或高) 医学统计学总体均数估计和假设检验课件 (3) 确定检验水准(显著性水准) 一般0.05,发生第一类错误的概率,即H0实际成立,但拒绝H0的概率。 (

20、3) 确定检验水准(显著性水准) 2、选定检验方法和计算检验统计量 不同设计、不同的资料类型和不同的推断目的,选用不同的检验方法。 2、选定检验方法和计算检验统计量 不同设计、不3、确定P值 P值是指由所规定的总体作随机抽样, 获得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。 手工计算:一般是通过查界值表获得。 统计软件:直接给出精确的P值3、确定P值手工计算:一般是通过查界值表获得。 统计软件:直4、作出推断结论(含统计结论和专业结论)统计结论: 拒绝H0,接受H1,差异有统计学意义。 专业结论:可认为 不同或不等。当 P时, 将获得的事后概率P与事先规定的概率进行比较。4、

21、作出推断结论(含统计结论和专业结论)统计结论:专业结论:当P时, 统计结论: 不拒绝H0,差异无统计学意义专业结论: 还不能认为 不同或不等。当P时, 专业结论:假设检验的特点: 1、统计检验的假设是关于总体特征的假设; 2、用于检验的方法是以检验统计量的抽样分布为理论根据的; 3、作出的结论是概率性的,不是绝对的肯定或绝对的否定。(无论是拒绝H0或不拒绝H0,都有可能发生错误) 假设检验的特点:假设检验中值与P值的区别:1、假设检验中值是检验水准,是拒绝或不拒绝H0的概率标准。的大小是人为选定的,一般取0.05。2、P值是指在H0所规定的总体中作随机抽样,获得等于或大于(等于或小于)现有样本

22、统计量的概率。通过P值与值的比较来确定拒绝或不拒绝H0。 假设检验中值与P值的区别: 未知 两样本较小(n1与n250) 两样本均数比较时,两样本的总体方差相等(即方差齐) 上述都要求:资料服从对称或正态分布。t检验适用条件 未知t检验适用条件 已知,x与比较 两大样本(n1与n250)均数比较 上述两种情况都要求:资料服从对称或正态分布。u检验适用条件 已知,x与比较u检验适用条件t检验和u检验类型 1、样本均数与总体均数的比较t检验 2、配对设计差值均数与总体均数0的比较t检验 3、两样本均数的比较t检验 4、两样本几何均数的比较t检验 5、两大样本均数比较u检验 t检验和u检验类型1、单

23、样本t检验 样本均数代表的未知总体均数和已知总体均数0的比较0理论值、标准值、稳定值X1、单样本t检验 样本均数代表的未知总体均数 样本均数与已知总体均数(一般为理论值、标准值或大量观测所得的稳定值)的比较,目的是推断样本所代表的总体与已知总体是否相等。根据是否已知和样本含量n的大小,选用u检验或t检验。 t检验计算公式为:t检验计算公式为:例 5 某医生测量了36名从事铅作业的血红蛋白含量,算得其均数为 =130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?例 5 某医生测量了36名从事铅作业的血红蛋白含量,算得其例 50=140

24、g/L已知总体 =130.83g/LS=25.74g/L未知总体=例 50=140g/L已知总体 =130.83g/L检验步骤: 例 5建立假设和确定检验水准 H0:=0=140g/L H1:0=140g/L 双侧=0.05检验步骤: 例 5建立假设和确定检验水准选定检验方法和计算检验统计量本例n=36, =130.83g/L,S=25.74g/L, 0=140g/L,按下式 v=n-1=36-1=35选定检验方法和计算检验统计量v=n-1=36-1=35例 5确定P值 以v=35查附表2,t界值表,得: (v一定时,t值越大,P值越小) 例 5确定P值(v一定时,t值越大,P值越小) 查t值

25、表时,先查P=0.05时的界值。 当P0.05时,需继续往P更大的一侧查,直到最大的P值为止。 如使用统计软件,会给出确切的概率值。注意 查t值表时,先查P=0.05时的界 今0.02P0. 05,按=0.05水准,拒绝H0,接受H1,差异有统计学意义(统计结论),可认为从事铅作业的男性工人平均血红蛋白量低于正常成年男性(专业结论)。 作出推断结论(统计结论和专业结论) 今0.02P0. 05,按=0.05水准,t0.05,v 0.05 不拒绝H0 无统计学意义 t0.05 ,v 0.05 拒绝H0,接受H1 有统计学意义 t0.01 ,v 0.01 拒绝H0,接受H1 有统计学意义t值、P值

26、与统计结论的关系(0.05)t值 P值 结论 差异的统计学意义t0.05,v 0.05 不拒绝例 6 根据大量调查已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查了30名健康男子,求得脉搏均数为74.2次/分,标准差为6.5次/分。能否认为该山区的成年男子的脉搏均数与一般男子的脉搏均数相等?例 6 根据大量调查已知健康成年男子的脉搏均数为72次/分。例 60=72次/分已知总体 =74.2次/分S=6.5次/分未知总体=例 60=72次/分已知总体 =74.2次/分未知总检验步骤: 例 6建立假设和确定检验水准 H0:=0=72次/分 H1:0=72次/分 双侧=0.05检验步骤

27、: 例 6建立假设和确定检验水准选定检验方法和计算检验统计量本例n=30, =74.2,S=6.5, 0=72,按下式 v=n-1=30-1=29选定检验方法和计算检验统计量v=n-1=30-1=29作出推断结论 今P0. 05,按=0.05水准,不拒绝H0,差异无统计学意义(统计结论),尚不能认为该山区的成年男子的脉搏均数高于一般男子的脉搏均数(专业结论)。 作出推断结论2、配对t检验(paired t-test) (1)同质的两个受试对象配成对子分别接受两种不同的处理。 (2)同一样品用两种方法(或仪器等)检验的结果或同一受试对象分别接受两种不同处理。 (3)同一受试对象接受(一种)处理前

28、后。 (这是难点也是重点,易和成组设计的两样本t检验相混淆)2、配对t检验(paired t-test) (1)同质例 7 随机选择9窝中年大鼠,每窝中取两只雌性大鼠随机地分入甲、乙两组,甲组大鼠不接受任何处理(即空白对照),乙组中的每只大鼠接受3mg/Kg的内毒素。分别测得两组大鼠的肌酐(mg/L)测定结果如下。 窝别编号: 1 2 3 4 5 6 7 8 9 甲(对照)组:6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 乙(处理)组:7.5 3.8 6.3 4.3 5.3 7.3 5.6 7.9 7.2 例 7 随机选择9窝中年大鼠,每窝中取两只雌性大鼠随机地分例

29、8 检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 问:检验甲乙两法检出血磷是否相同,用何统计方法? 样本号 1 2 3 4 5 6 7 乙 法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲 法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 例 8 检验血磷含量有甲、乙两种方法,其中,乙法具有快速、例 9 某脑电图室观察家兔注射AT3前后脑电图波形的变化,观测结果如下。试分析注射AT3前后脑电图波形是否发生了显著性变化。 注射AT3前后脑电图波形的变化率(%) 家兔编号 注射前

30、 注射后 1 29 37 2 28 44 3 38 52 4 29 35 5 34 41 6 41 43例 9 某脑电图室观察家兔注射AT3前后脑电图波形的变化, 医学研究中将配对计量资料也可分为: 同源配对:同一对象处理前后的数据,同一样品用两种方法测定的结果。 异源配对:将实验对象配成对子,对每一对子中的两个实验对象给予两种不同的处理,以推断两种处理的效果有无差别。 医学研究中将配对计量资料也可分为:1 10 62 13 93 7 4: : :n 8 5病人号 治疗前 治疗后某药治疗前后的血沉(mm/h)同源配对(自身配对)1 10 1 10 62 13 93 7 4: : :n 8 5样

31、品号 甲 乙同一批样品用两方法测定的结果同源配对1 10 1 A1a1 9 62 A2a2 8 33 A3a3 5 1: : : :n Anan 10 5 编号 甲 乙 甲指标 乙指标异源配对1 A1a1 9 注意:配对t检验的实质同于单样本的t检验,以上述第一种情况,两同质受试对象配对分别接受两种不同的处理为例。若两种处理效应相同,即1=2,则12=0(当成已知总体均数0)。因此,可将此类资料看成是差值的样本均数 所代表的未知总体均数d 与已知总体均数0= 0的比较。 注意:配对t检验的实质同于单样本的t检验,以上述第一配对t检验计算公式: 0 为差数的总体均数 d 为成对数据之差(差数)的

32、均数Sd 为差数均数的标准差配对t检验计算公式: 0 为差数的总体均数 3、两个独立样本t检验应用条件: (1)两样本均数来自正态总体 (2)两样本的方差齐 在正式的统计分析中,先要看方差是否齐,如果不齐,要选方差不齐的结果! 注:在一般的统计软件中,都会同时给出方差齐性检验的结果3、两个独立样本t检验应用条件: 注:在一般的完全随机设计资料的两种类型: 1、选择一定数量的观察对象,将它们随机分成两组或多组,分别给予不同处理; 2、从两组或多组具有不同特征的人群中,分别随机抽取一定数量的样本,比较某一指标在不同特征人群中是否相等。完全随机设计资料的两种类型:两小样本均数比较t检验t检验 方差不

33、齐 方差齐变量变换 秩和检验 t检验-两个小样本均数的比较两小样本均数比较t检验t检验 方差不齐 方差齐变量变换 秩 (1)总体方差相等时的检验 当两总体方差相等,即 时,可将两总体方差合并,求两者的共同方差-合并方差 。 (1)总体方差相等时的检验 两样本t检验计算公式即: 两样本t检验计算公式即:例 10 为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见下表,能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹

34、血糖的降糖效果不同?例 10 为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院 试验组和对照组空腹血糖下降值(mmol/L) -0.70 -5.60 2.00 2.80 0.70 3.50 4.00 5.80 7.10 -0.50 试验组X1 (n1=20) 2.50 -1.60 1.70 3.00 0.40 4.50 4.60 2.50 6.00 -1.40 3.70 6.50 5.00 5.20 0.80 0.20 0.60 3.40 6.60 -1.10 对照组X2 (n2=20) 6.00 3.80 2.00 1.60 2.00 2.20 1.20 3.10 1.70 -2.00 试

35、验组和对照组空腹血糖下降值(mmol/L) -0.70医学统计学总体均数估计和假设检验课件 (2)计算检验统计量 (2)计算检验统计量 (3)确定P值,作出推断结论 (3)确定P值,作出推断结论 U检验-两个大样本均数的比较 当两个大样本含量较大(均100)时,可用u检验。U检验-两个大样本均数的比较两种职业的血清胆固醇水平(mmol/L) 职业类型 人数 均值 标准差 教师 537 4.8 0.72 工人 643 4.6 0.81 例 11 某医生研究血清胆固醇水平与职业的关系,得调查资料如下表,问两种职业的血清胆固醇水平是否不同?两种职业的血清胆固醇水平(mmol/L) 职业类型 假设:H

36、0 :12 H1 :12 0.05计算u值448.464381.053772.06.48.4222221212_1_nSnSxxu- 假设:H0 :12 H1 :12 确定P值 u 2.58 P 0.01 统计推断结论 P 0.01 ,在0.05水准上拒绝H0,接受H1,差异有统计学意义。可认为教师的血清胆固醇水平高于工人。 确定P值 统计推断结论1.96 0.05 不拒绝H0 无1.96 0.05 拒绝H0,接受H1 有2.58 0.01 拒绝H0,接受H1 有高度u值、P值与统计结论的关系(0.05)u值* P值 结论 差异的统计学意义 *为双侧,单侧u界值为1.645、2.326。1.9

37、6 0.05 不拒绝H两个样本几何均数比较 1、应用条件: a.两样本的对数值均来自正态总体 b.两样本的对数值的方差齐 2、检验公式 与两样本均数的t检验和u检验公式相同,只是原始数据要作对数变换,用对数值的均数和标准差代公式。 两个样本几何均数比较 1、应用条件:2、检验公式 与两样本3、检验步骤 在使用统计软件进行分析时,先将原始数据取对数,然后用对数值作一般的t检验。注意啦!检验步骤同两样本均数比较的t检验3、检验步骤 在使用统计软件进行分析时,先将原始数据可信区间与假设检验的关系(1)可信区间亦可用于回答假设检验问题。(2)可信区间比假设检验还可提供更多的信息。 但这并不意味着可以完

38、全用可信区间代替假设检验。假设检验得到的P值可以较精确地说明结论的概率保证,而可信区间只能告诉我们在水准上有无统计意义,却不能象P值那样提供精确的概率。 可信区间与假设检验的关系(1)可信区间亦可用于回答假设检验问例 5 某医生测量了36名从事铅作业的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L? 95%CI为(122.12,139.54)g/L 140g/L例 5 某医生测量了36名从事铅作业的血红蛋白含量,算得有实际意义有统计意义,可能有实际意义有统计意义,无实际意义无统计意义,样本例数太少确实无差别有实际意义值H0有实际意义有统计意义,可能有实际意义有统计意义,无实际意义无变量变换 实际资料若不满足正态性或/和方差齐性的假定,尤其当是小样本资料时,这时如用一般的t检验可能会导致偏离真实结果较远。对于明显偏离上述应用条件的资料,可通过变量变换的方法加以改善。 变量变换 实际资料若不满足正态性或/和方 变量变换是将原始数据作某种函数转换,如转换为对数值,以达到某种分析的目的。(一)变量变换的定义 变量变换是将原始数据作某种函数转换,如转换为适当的函数转换可使 目的同时达到。(二)变量变换的目的 使各组达到方差齐性; 使资料转换为正态分布,以满足方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论