总体均数估计和假设检验.ppt_第1页
总体均数估计和假设检验.ppt_第2页
总体均数估计和假设检验.ppt_第3页
总体均数估计和假设检验.ppt_第4页
总体均数估计和假设检验.ppt_第5页
已阅读5页,还剩128页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学,医学统计学,第四章 总体均数估计和假设检验,主讲:黄志碧,重点掌握 1、抽样误差、标准误、可信区间、假设检验、检验效能(把握度)、单侧检验、双侧检验、型错误与型错误的概念。 2、标准差与标准误的区别和联系、t分布的特征、t分布和u分布的区别和联系。 3、标准误、可信区间的计算方法和应用。 4、假设检验的基本步骤, t检验和 u检验的应用及其条件。 5、应用假设检验注意事项。,资料的统计分析方法 统计描述(statistical descreptive): 频数表、直方图、平均数指标、离散度指标。说明数据分布特征和分布类型。 统计推断(statistical inference):

2、用样本信息来推断总体的特征(以小窥大)。 (1)参数估计(总体均数估计,总体率估计) (2)假设检验,第一节 均数的抽样误差与标准误,总体,样本,统计推断,抽样,抽样误差,一、均数抽样误差的概念,样本,用样本推断总体,总体均数,标准差,样本均数的均数,样本均数的标准差,.,n=10,在抽样研究中,由于总体中存在个体变异,而样本仅是总体的一部分,所以由抽样得到的样本均数与总体均数之间存在差异,这种差异称为抽样误差。,抽样研究中,抽样误差是不可避免的,但其大小可以控制和估计的。,均数的抽样误差,二、中心极限定理,1、在正态总体中,随机抽取例数为n的样本,样本均数 服从正态分布; 2、在偏态总体中随

3、机抽样,当n足够大时(n30),样本均数 也近似正态分布; 3、从均数为,标准差为的正态或偏态总体中,抽取例数为n的样本,样本均数的均数 仍为,标准差为 。,三、标准误意义及其计算方法,1、标准误意义:均数的标准差就是标准误,它说明均数的抽样误差大小。均数的标准误用 表示。,2、标准误计算方法:,.(理论值),.(估计值),随着 n S 稳定 0,均数的标准误与标准差成正比,与样本例数n的平方根成反比。,因此,减少抽样误差最有效的办法:,增加样本例数,例4.1 已知n=10, X=4.89, S =0.62, 求其标准误(第一个样本)。,3、均数标准误的应用,(1)反映均数抽样误差大小:标准误

4、越大,抽样误差越大,反之,就越小; (2)反映均数的可靠性:标准误越大,样本均数的抽样误差就越大,用样本均数推断总体均数的可靠性差;反之,越小,均数抽样误差越小,用样本均数推断总体均数的可靠性好。 (3)用于估计总体均数的可信区间和均数的假设检验(见下节),标准差和标准误的区别和联系 标准差和标准误都是变异指标,它们之间有区别,也有联系。 一、区别: 1、概念不同:标准差是描述观察值(个体值)之间的变异程度,S 越小,均数的代表性越好;标准误是描述样本均数的抽样误差,Sx越小,均数的可靠性越高;,3、与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚

5、至趋于0 。 联系: 标准差、标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。,2、用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。,第 二节 t 分 布,(一)、t 分布的概念,对正态变量X进行标准化变换,即u变换,可以把一般的正态分布变成标准正态分布,即u分布,给应用带来很大方便。,u(0,1),样本均数X也服从正态分布,也可以将进行u变换:,由于 往往未知, 常用 代替,不再服从标准正态分布,而服从t分布。,(二)、t分布特征: 1、以0为中心,左右对称的单峰分布; 2、t分布的形态与自由度有关, 越小,t分

6、布曲线越低平,尾部的面积较大; 逐渐增大,t分布逼近标准正态分布; ,t分布标准正态分布。,t分布也是一簇曲线,有不同的自由度就有不同形态的t分布曲线。,注:所有的t分布的曲线均比正态曲线低。说明在同样的曲线下面积,t值u值。例如,中间95%面积,在横轴上的区间: |u|=1.96; 而 |t|1.96,t值的表示方法:t/2,为t界值以外(曲线尾部)的面积;为自由度。,( 三)、t界值表(附表2) 对应于每一自由度取值,就有一条 t 分布曲线,每条曲线都有自身曲线下 t 值的分布规律,故相同的曲线下面积所对应的t界值不同,而计算t 值较为繁杂。为此,统计学家已制成 t 值表,通过查表即获得t

7、分布曲线下面积所对应的 t界 值。,查表须注意: 1、t 值有正负值,由于t分布是以0为中心的对称分布,故表中只列正值,查表时,不管 t 值正负只用绝对值; 2、t 值表中插图阴影部分,表示t,以外尾部面积占总面积的百分比, 即概率;,例 =10时: 单侧 =1.812 即 P(t-1.812)=0.05 或 P(t1.812)=0.05 P(t-1.812)=1-0.05=0.95 或P(t-t,)=1- 或 P(tt,)=1-,双侧 =2.228 即 P(t-2.228)+P(t2.228)=0.05 P(-2.228t2.228)=1-0.05=0.95 一般式: P(t-t/2,)+P

8、(tt/2,)= P(-t/2, t t/2,)=1-,/2,/2,2(/2),双侧,单侧,V=10,0 1.812,-2.228 0 2.228,第三节 总体均数的估计,一、参数估计的概念,统计推断,参数估计,假设检验,点估计,区间估计,用样本指标来 估计总体指标,二、参数估计的估计方法 1、点值估计:直接用样本均数来估计总体均数 缺点:没有考虑抽样误差(可靠性差) 2、区间估计:按一定的概率1-估计总体均数所在范围,1称可信度。 习惯上,常取1=0.95,即95%可信区间 或取1=0.99,即99%可信区间,若无特别说明,一般取双侧95%可信区间,(一)单一总体均数可信区间估计方法:,1、

9、当未知,且n较小(n100)时,按 t分布原理估计,按 1称可信度估计。,2、当已知,或未知但样本例数足够大(n100)时,按u分布原理估计:,已知,未知,例 n=30, =187.11mg/cm2, s=42.32mg/cm2, 估计骨密度95%可信区间。 ( t/2,. , t/2,. ) t0.05/2,29=2.045 (187.112.0457.7265, 187.11+2.0457.7265 ) (171.04,203.18)mg/cm2,例4.2 n=200, = 1.34mmol/L, S=0.33mmol/L, 估计血清甘油三酯总体均数95%可信区间。 u0.05/2=1.9

10、6 该地50-60岁正常成年男性血清甘油三酯总体均数95%可信区间是: 1.291.39mmol/L。,(二)两总体均数之差的可信区间 两总体均数之差 的可信区间为:,大样本时(n100):,估计男女红细胞数差值的95%可信区间。,某地抽查了部分健康成人的红细胞数,结果如下表。,女性红细胞数95%可信区间为:,男性红细胞数95%可信区间为:,男女红细胞数差值的95%可信区间为:,可信区间的涵义: 从总体中作随机抽样,根据每个样本可计算出一个可信区间,那么95%可信区间,意味着固定样本含量n作100次抽样,算得100个区间,有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数

11、(估计错误)。 5%是小概率事件,对一次试验而言出现的可能性小,因此在实际应用中可认为总体均数就在所算得的可信区间之内。,思考题 下面哪种说法是正确的? 1、 95%可信区间包含总体均数的可能性为95%。 2、按95%可信区间估计总体均数,对的可能性为95%。 3、总体均数落在95%可信区间的可能性为95%。,可信区间的两个要素: 准确度:反映在可信度(1)的大小。1越接近1,就越准确。如可信度99%比95%准确。 精确度:反映在区间的长度。长度越小越好。 在例数n确定的情况下,二者呈反比关系:准确度, 精确度(范围变宽)。 要兼顾准确度和精确度,一般取95%可信区间。 可信度确定后,增加样本

12、例数可以提高精确度。,三、可信区间与参考值范围区别,(1)意义不同 参考值范围是指绝大多数观察值在某个范围; 可信区间是指按一定的可信度估计总体均数(参数)的所在范围;,(2)计算公式不同,可信区间,参考值范围,(3)应用不同,可信区间:估计总体均数;,参考值范围: 判断某项指标是否正常。,第四节 假设检验的原理和基本步骤,一、假设检验原理,例 4.5,0=72.1次/分,已知总体,n=36 X=74.3 S=5.4,未知总体,推断误差原因,本研究目的是判断是否 (72.1次/分)。由于存在抽样误差,来自某一总体的随机样本其样本均数 与总体均数 往往不等;或者,从同一总体中抽取的两个随机样本的

13、样本均数 和 也往往不同。因此,在比较一个样本均数与一个已知的总体均数,或者,比较两个样本均数的差别时,需要判断这种差别的性质和意义,造成这种差别的原因有两种:,1、总体均数不等(来自不同总体),有本质差别; 2、总体均数相等(来自相同的总体),其差别由抽样误差所致,无本质差别。 要判断差异属于那种可能,需要通过假设检验来进行。,二、假设检验概念 根据研究目的,对样本所属总体特征提出一个假设,然后用适当方法, 根据样本提供的信息, 推断此假设应当拒绝或不拒绝,以便研究者了解在假设条件下, 差异由抽样误差引起的可能性大小。,三、假设检验基本思想 假设检验要推断样本(一个或多个)所来自的总体其总体

14、参数(均数、率)是否有差别,可通过判断样本指标的差别是由抽样误差引起的,还是总体均数不同(来自不同总体)所致来达到,运用反证法。,首先建立检验假设: 如上述例子,先假设 ; 如果假设成立,即 来自 ,则 两者相差不大,则 根据样本资料计算所得t值或u值应较小(t值或u值称检验统计量),出现该t值或u值的概率P较大,如为大概率(如P ),就认为原假设成立(样本均数的差异是由于抽样误差引起)。,或,如果计算所得的t值或u值较大,则出现该t值或u值的概率P较小,如P ,就认为原假设不成立,而认为其对立面 成立。 作出这种推断的理由:小概率事件在一次抽样中一般不会发生,如果发生了就怀疑原假设成立的可能

15、性,就认为不成立。 如何得到P值?可以通过u分布和t分布的原理,由t值或u值确定P值。,四、假设检验的一般步骤,1、建立假设和确定检验水准,2、选定检验方法和计算检验统计量,3、确定P值和作出推断结论,1、建立假设和确定检验水准,基本步骤,(1)两个假设 无效假设: H0 (检验假设) 备择假设: H1,(2)确定单侧或双侧检验,根据专业知识和研究目的而定,单侧检验:如在比较新旧两种药物的疗效时,如能根据专业知识认为新药疗效不会比旧药差,只关心新药是否比旧药好(疗效至少相同,绝对排除出现相反的可能性),可用单侧检验。,双侧检验:在比较甲乙两种药物的疗效时,事先不能确定哪种药的疗效较好,只关心两

16、药的疗效有无差别,要用双侧检验。双侧检验若有差别,单侧检验肯定有差别;反之,单侧检验若有差别,双侧检验不一定有差别。 单侧检验更容易得到有统计学意义的结论。,样本均数与总体均数比较 检验类型 检验目的 H0 H1 双侧检验 是否 单侧检验 是否 是否,两 样本均数均数比较 检验类型 检验目的 H0 H1 双侧检验 是否 单侧检验 是否 是否,建立检验假设注意事项 (1)检验假设是对总体特征的假设; (2)H1是与0 相互联系和相互对立的假设,两者缺一不可; (3)0 相假设的内容是两个总体参数相等,或其差值等于0,处理无效,无相关,资料服从某一分布等; (4)H1反映出单侧还是双侧检验。,(3

17、)确定检验水准:,检验水准用表示,是拒绝或不拒绝0的概率标准,也就是小概率事件标准,是人为选定的概率值,一般取0.05(根据需要也可取0.2、0.15、0.1、0.01等)。,2、选定检验方法和计算检验统计量,根据研究设计方案、资料类型、样本含量大小及分析目的选用适当的检验方法,并根据样本资料计算相应的检验统计量;不同的检验方法要用不同的公式计算现有样本的检验统计量(t ,u,F值)。检验统计量是在H0成立的前提下计算出来。,3、确定P值 P值是指由所规定的总体作随机抽样, 获得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。P也表示H0成立的概率大小。,手工计算:一般是通过查界值

18、表获得。,统计软件:直接给出精确的P值,4、作出推断结论(含统计结论和专业结论),统计结论:拒绝H0,接受H1,差异有统计学意义),专业结论:可认为 不同或不等。,当 P时:,将获得的事后概率P与事先规定的概率进行比较,推断统计结论。,当P时 统计结论: 不拒绝H0,差异无统计学意义,专业结论: 还不能认为 不同或不等。,注意:对于H0,只能说拒绝或不拒绝;对于H1只能说接受。,假设检验的特点: 1、统计检验的假设是关于总体特征的假设; 2、用于检验的方法是以检验统计量(t , u)的抽样分布为理论根据; 3、作出的结论是概率性的,不是绝对的肯定或否定。,假设检验中值与P值的区别 1、假设检验

19、中值是检验水准,是拒绝或不拒绝H0的概率标准。的大小是人为选定的,一般取0.05。 2、P值是指从H0所规定的总体中作随机抽样,获得等于及大于 (或等于及小于)现有样本统计量的概率。通过 P值与 值的比较来确定拒绝或不拒绝H0。,第五节 t检验,t检验用途:用于一个或两个样本均数的假设检验。 t检验类型 1、样本均数与总体均数比较的t检验 2、配对设计t检验 3、两小样本均数比较的t检验 4、两样本几何均数比较的t检验,t检验应用条件 1、样本来自正态总体。 2、两样本均数比较,还要求样本的总体方差相等 。,一、样本均数与总体均数比较(单样本t检验),目的:推断样本均数代表的未知总体均数和已知

20、总体均数0是否有差别,即是否,理论值、标准值、稳定值,公式 :,= n-1,条件:样本来自正态总体。,例 4.5,0=9.3cm,已知总体,X=9.3975cm S=0.3293cm n=12,未知总体,是否,检验步骤:,例4.5,建立假设和确定检验水准 H0:= =9.3cm H1: 单侧=0.05 今n=12, X =9.3975cm,s=0.3293cm =9.3cm,例4.5,选定检验方法和计算检验统计量,v=n-1=12-1=11,例4.5,确定P值 以v=11查附表2,t界值表,得: 单侧: t0.05, 11=1.796, t0.1,11=1.363 t0.2,11=0.876

21、t0.1,11 t t0.2,11 0.2P0.1,(v一定时,t 值越大,P值越小),查t值表时,先查P=0.05时的界值。 当P0.05时,需继续往P更大的一侧查,直到最大的P值为止。,如使用统计软件,会给出确切的概率值。,注意,例4.5,作出推断结论(两个结论:统计结论和专业结论) 今0.2P0.1,按=0.05水准,不拒绝H0, 差异无统计学意义(统计结论),尚不能认为该山区正常产男婴双顶径大于一般男婴双顶径(专业结论)。,二、 配对t检验(paired t-test),用于配对设计计量资料,配对设计: 将条件相同或相近的两个对象配成一对,然后将两个对象随机分到两个不同的处理组。,配对

22、设计的情形: (1) 配对的两个受试对象分别给予两种处理; (2) 同一受试对象分别接受两种不同处理; (3) 同一样品用两种方法检测; (4) 同一受试对象处理前、后所得数据。 配对资料t检验的目的:推断两种处理(或方法)的结果有无差别。,随机选择9窝中年大鼠,每窝中取两只雌性大鼠随机地分入甲、乙两组,甲组大鼠不接受任何处理(即空白对照),乙组中的每只大鼠接受3mg/Kg的内毒素。分别测得两组大鼠的肌酐(mg/L)测定结果如下。,窝别编号: 1 2 3 4 5 6 7 8 9 甲(对照)组:6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 乙(处理)组:7.5 3.8

23、6.3 4.3 5.3 7.3 5.6 7.9 7.2,检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 问:检验甲乙两法检出血磷是否相同,用何统计方法?,样本号 1 2 3 4 5 6 7 乙 法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲 法 4.49 1.21 2.13 7.52 5.81 3.35 9.61,某脑电图室观察家兔注射AT3前后脑电图波形的变化,观测结果如下。试分析注射AT3前后脑电图波形是否发生了显著性变化。,注射AT3前后脑电图波形的变化率(%),家兔编号 注射前 注射后 1

24、29 37 2 28 44 3 38 52 4 29 35 5 34 41 6 41 43,两种测声计A和B对同一场地声音的测定结果 场地 测声计A 测声计B 差值d (1) (2) (3) (4)=(2)-(3) 1 87 86 1 2 65 66 -1 3 74 77 -3 4 95 95 0 5 65 60 5 6 55 53 2 7 63 62 1 8 88 85 3 9 61 59 2 10 54 55 -1 9,克矽平治疗前后患者血清粘蛋白(mg/L) 患者号 治疗前 治疗后 差值,d 1 65 34 31 2 73 36 37 3 73 37 36 4 30 26 4 5 73

25、43 30 6 56 37 19 7 73 50 23 180,配对号 新药组 安慰剂组 差值 (1) (2) (3) (4)=(2)-(3) 1 4.4 6.2 -1.8 2 5.0 5.2 -0.2 3 5.8 5.5 0.3 4 4.6 5.0 -0.4 5 4.9 4.4 0.5 6 4.8 5.4 -0.6 7 6.0 5.0 1.0 8 5.9 6.4 -0.5 9 4.3 5.8 -1.5 10 5.1 6.2 -1.1 -4.3,新药组与安慰剂组血清总胆固醇含量(mmol/L),检验公式 :,v=n-1,应用条件:差值来自正态总体。,例 4-6,检验步骤,1、建立检验假设,确定

26、检验水准 H0: d0 H1:d 0 0.05(单侧),2、本例为配对计量资料,用配对t检验,n=8,n-1=8-1=7,3、确定P值,=7, 查附表2,得:,4、推断结论 0.05P0.025, 按0.05水准,拒绝H0,接受H1,差异有统计学意义,认为实验组Wister大鼠血中胆碱酯酶活性高于对照组。,例4-7,1、建立检验假设,确定检验水准 H0: d0 H1:d 0 0.05,2、本例为配对计量资料,用配对t检验,v=n-1=12-1=11,0.05 P 0.02,3、确定P值,推断结论,0.05P0.02, 按0.05水准,拒绝H0,接受H1,差异有统计学意义,认为豚鼠注入肾上腺素前

27、后灌流滴数不同,注入后灌流滴数增加。,三、成组设计两样本均数比较t检验,(一)t 检验应用条件: 1、两样本均来自正态总体 2、两样本的方差齐 在正式的统计分析中,先要看方差是否齐,如果不齐,要选方差不齐的结果! 一般的统计软件,都会同时给出方差齐性检验的结果及方差齐和不齐的检验结果。,(二)成组设计和及其检验的目的 1、成组设计(又称完全随机随机设计、单因素设计)含义: 将受试对象按随机化的方法分配到各处理组中(或从两个或多个研究总体中抽取样本)。各处理组(样本)的例数可以相等也可以不等。,研究对象,甲组,乙组,总体1,总体2,样本1,样本1,2、检验的目的:检验两样本均数 和 所代表的两总

28、体均数 和 是否有差别,或检验两样本几何均数G1和G2所代表的两总体几何均数是否有差别。,两小样本均数比较,t检验,t检验,方差不齐,方差齐,变量变换,秩和检验,(三)总体方差相等时两小样本均数的比较t检验,v=n1+n2-2,例4-8 不同组小鼠琼脂肉芽肿重量(mg) 骨肌康组 108.0 74.8 31.2 132.0 147.6 98.5 82.2 93.3 85.5 110.4 乙醇组 94.8 122.5 144.1 151.2 189.3 204.2 155.6 160.3 178.3 165.4,该资料为成组设计资料,将20只小鼠随机分配到实验组和对照组,看两组小鼠琼脂肉芽肿重量

29、有无差异,用t检验。,H0: 即两组小鼠琼脂肉芽肿重量总体均数相等 H1: 即两组小鼠琼脂肉芽肿重量总体均数不相等,V =n1+n2-2=10+10-2=18 查t界值表得: t0.001,18=3.922 , t t0.001,18 , P0.001。 按 =0.05,拒绝H0,接受 H1,差别有统计学意义,可以认为骨肌康组和乙醇对照组琼脂肉芽肿平均重量不等,试验组低于对照组,即大剂量骨肌康搽剂对小鼠琼脂肉芽肿有抑制作用。,成 组设计两个样本几何均数比较,1、应用条件: (1)两样本的对数值均来自正态总体 (2)两样本的对数值的方差齐,2、检验公式 与两样本均数的t检验和u检验公式相同,只是原始数据要作对数变换,用对数值的均数和标准差代公式。,3、检验步骤 与两样本均数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论