统计推断120课件_第1页
统计推断120课件_第2页
统计推断120课件_第3页
统计推断120课件_第4页
统计推断120课件_第5页
已阅读5页,还剩114页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章统计推断医学统计学1(statisticalinference)第4章统计推断医学统计学1(statisti第四章统计推断统计推断由一个样本或一糸列样本所得的结果来推断总体的特征参数估计假设检验第四章统计推断统由一个样参数估计假设检验第四章第一节第二节第三节第四节第五节假设检验的原理与方法样本平均数的假设检验样本频率的假设检验参数的区间估计与点估计方差的同质性检验第四章第一节第二节第三节第四节第五节假设检验的原理与方法样本第一节假设检验的原理与方法第一节假设检验的原理与方法第一节假设检验一、基本概念假设检验(hypothesistest)亦称显著性检验(significancetest)是利用小概率反证法思想,先对总体特征做出两种对立的假设(H0与H1),然后在H0成立的条件下计算检验统计量,以获得概率值,并与预先规定的概率值α相比较来间接判断H1是否成立的统计推断过程。第一节假设检验一、基本概念医学统计学假设检验的原理反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。6小概率原理:概率很小的事件在一次抽样试验中实际是几乎不可能发生的。=0.05/0.01如果假设一些条件,并在假设的条件下能够准确地算出事件A出现的概率α为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生。医学统计学假设检验的原理反证法:当一件事情的医学统计学假设检验的原因

从两个总体中进行随机抽样,得到两个样本均数、。

、不同。不同的原因是什么?不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性。(2)分别所代表的总体均数不同。差别有显著性。7医学统计学假设检验的原因从两医学统计学实例分析例

根据大量调查,已知健康成年男子脉搏的均数为72次/分钟,某医生在一山区随机测量了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同?8二、假设检验的步骤医学统计学实例分析例根据大量调查,已知医学统计学本例两个均数不等有两种可能性①山区成年男子的脉搏总体均数与一般健康成年男子的脉搏总体均数是相同的,差别仅仅由于抽样误差所致;②受山区某些因素的影响,两个总体的均数是不相同的。如何作出判断呢?按照逻辑推理:如果第一种可能性较大时,可以接受它,统计上称差异无统计学意义;如果第一种可能性较小时,可以拒绝它而接受后者,统计上称差异有统计学意义。9医学统计学本例两个均数不等有两种可能性①山区医学统计学1.建立检验假设(1)一种是无效假设(nullhypothesis),符号为H0;(2)一种是备择假设(alternativehypothesis),符号为H1。10差别仅由抽样误差引起确有差别二、假设检验的步骤医学统计学1.建立检验假设10差别仅由抽样医学统计学样本均数所代表的未知总体均数

与已知总体均数的比较11医学统计学样本均数所代表的未知总体均数医学统计学两样本均数所代表的未知总体均数的比较12医学统计学两样本均数所代表的未知总体均数的比单尾检验双尾检验22否定区否定区否定区接受区接受区三、双尾检验与单尾检验单尾双尾22否定区否定区否定区接受区接受区三、医学统计学

2.确定检验水准检验水准(sizeofatest)亦称显著性水准(significancelevel),符号为α。它是判别差异有无统计意义的概率水准,其大小应根据分析的要求确定。通常取α=0.05。14根据选定的显著性水平(0.05或0.01),决定接受还是拒绝H0.二、假设检验的步骤医学统计学2.确定检验水准检验水准(医学统计学

3.选定检验方法和计算统计量

根据研究设计的类型和统计推断的目的要求选用不同的检验方法。如完全随机设计中,两样本均数的比较可用t检验,样本含量较大时(n>100),可用Z检验。不同的统计检验方法,可得到不同的统计量,如t值和u值。15选择适当的统计方法计算H0成立的可能性即概率有多大二、假设检验的步骤医学统计学3.选定检验方法和计算统计量医学统计学4.确定概率P值

P值是指在H0所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量的概率。即在H0为真的前提下出现观察样本以及更极端情况的概率。│t│≥tα,υ,则P≤α;

│t│<tα,υ,则P>α。16或样本间的差异由抽样误差所致的概率。可以认为差别不由抽样误差引起,可以拒绝H0二、假设检验的步骤医学统计学4.确定概率P值16或样本间医学统计学5.作出推断结论

①当P≤α时,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,根据小概率事件原理,现有样本信息不支持H0,因而拒绝H0,结论为按所取检验水准拒绝H0,接受H1,即差异有统计学意义,如前例可认为两总体脉搏均数有差别。②当P>α时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不能拒绝H0,结论为按所取检验水准不拒绝H0,即差异无统计意义,如前例尚不能认为两总体脉搏均数有差别。17二、假设检验的步骤医学统计学5.作出推断结论17二、假设医学统计学下结论时的注意点P≤α,拒绝H0,不能认为H0肯定不成立,因为虽然在H0成立的条件下出现等于及大于现有统计量的概率虽小,但仍有可能出现。同理,P>α,不拒绝H0,也不能认为H0肯定成立。由此可见,假设检验的结论是具有概率性的,无论拒绝H0或不拒绝H0,都有可能发生错误,即第一类错误或第二类错误。假设检验只是统计结论。判断差别还要根据专业知识。18医学统计学下结论时的注意点P≤α,拒绝H医学统计学四、Ⅰ型错误和Ⅱ型错误

假设检验中作出的推断结论可能发生两种错误:①拒绝了实际上是成立的H0,这叫Ⅰ型错误(typeⅠerror)或第一类错误,也称为α错误。②不拒绝实际上是不成立的H0,这叫Ⅱ型错误(typeⅡerror)或第二类错误,也称为β错误。推断结论和两类错误实际情况检验结果拒绝H0

不拒绝H0H0真第Ⅰ类错误(α)结论正确(1-α)H0不真结论正确(1-β)

第Ⅱ类错误(β)19弃真错误纳伪错误医学统计学四、Ⅰ型错误和Ⅱ型错误假设检验医学统计学犯第Ⅰ类错误的概率用α来控制,其大小与检验水准相同。根据研究者的需要α常取为0.05或0.01等。当α取为0.05时,其意义是:如果原假设H0成立,按照同样的方法在原假设H0规定的总体种重复抽样,那么在每100次检验结论中平均可以有5次拒绝H0(犯第Ⅰ类错误)。Ⅰ错误α的意义20医学统计学犯第Ⅰ类错误的概率用α来控0.025=

00.950.025错误犯第一类错误的概率等于显著水平值Ⅰ错误α的意义0.025=00.950.025错误犯第一类错误的概医学统计学犯第Ⅱ类错误的概率β来控制。因为HO不成立是检验统计量的精确分布往往难以确定,所以在多数情况下准确估计β的数值比较困难。

β的意义:如果H0并不成立,即所研究的总体与H0有实质差异,按照同样的方法在总体中重复抽样,那么在100次检验结论中平均可以有100β次接受H0(犯第Ⅱ类错误)。Ⅱ错误β的意义22医学统计学犯第Ⅱ类错误的概率β来控制医学统计学23三、Ⅰ型错误和Ⅱ型错误医学统计学23三、Ⅰ型错误和Ⅱ型错误第3章总体均数区间估计和假设检验第24页联系:一般α增大,则β减小;α减小,则β增大;区别:(1)一般α为已知,可取单侧或双侧,如0.05,或0.01。(2)一般β为未知,只取单侧,如取0.1或0.2。两类错误的联系与区别n,

2可使两类错误的概率都减小.第3章总体均数区间估计和假设检验第24页联系:一般α增第二节样本平均数的假设检验第二节样本平均数的假设检验大样本平均数的假设检验--u检验小样本平均数的假设检验--t检验单样本双样本大样本平均数的假设检验小样本平均数的假设检验单样本双样本一、一个样本平均数的假设检验样本平均数的假设检验一、一个样本平均数样本平均数适用范围:检验某一样本平均数x所属的总体平均数是否和某一指定的总体平均数0相同。若相同,则说明该样本属于这个以0为平均数的指定总体;若不相同,则说明该样本所属的总体与这个指定总体(0

)不同,即有统计学差异。一、样本均数与总体均数比较适用范围:检验某一样本平均数x所属的总体平均数是否和某一指医学统计学一、样本均数与总体均数比较计算公式总体标准差σ已知时,不管n的大小。总体标准差σ未知时,但n≥30时。29医学统计学一、样本均数与总体均数比较计算公式医学统计学例

某托儿所三年来测得21~24月龄的47名男婴平均体重11kg。查得近期全国九城市城区大量调查的同龄男婴平均体重11.18kg,标准差为1.23kg。问该托儿所男婴的体重发育状况与全国九城市的同期水平有无不同?(全国九城市的调查结果可作为总体指标)实例分析130医学统计学例某托儿所三年来测得21~24医学统计学(1)建立检验假设,确定检验水准

H0:μ=μ0,即该托儿所男婴的体重发育状况与全国九城市的同期水平相同。

H1:μ≠μ0

,即该托儿所男婴的体重发育状况与全国九城市的同期水平不同。α=0.05(2)计算Z值本例因总体标准差σ已知,故可用Z检验。已知:n=47,样本均数=11,总体均数=11.18,总体标准差=1.23,代入公式有:31实例分析1医学统计学(1)建立检验假设,确定检验水准医学统计学(3)确定P值,作出推断结论

查t界值表(附表2,t界值表中为∞一行),得Z0.05/2=1.96,Z=1.003<Z0.05/2=1.96,故P>0.05。按α=0.05水准,不拒绝H0,差异无统计学意义。结论:可认为该托儿所男婴的体重发育状况与全国九城市的同期水平相同。32实例分析1医学统计学(3)确定P值,作出推断结论查例:生产某种纺织品,要求棉花纤维长度平均为30mm以上,现有一棉花品种,以n=400进行抽查,测得其纤维平均长度为30.2mm,标准差为2.5mm,问该棉花品种的纤维长度是否符合纺织品的生产要求?分析(1)这是一个样本平均数的假设检验,因总体σ2未知,

n=400>30,可用s2代替σ2进行u检验;(2)棉花纤维只有>30mm才符合纺织品的生产要求,因此进行单尾检验。实例分析2例:生产某种纺织品,要求棉花纤维长度平均为30mm以上,现有(1)假设(2)水平(3)检验(4)推断H0:μ=μ0=30(cm),即该棉花品种纤维长度达不到纺织品生产的要求。H1:μ>μ0,即该棉花品种纤维长度达到了纺织品生产的要求。选取显著水平α=0.05u<1.645P>0.05,不拒绝H0,尚不能认为H1是正确的,无统计学意义,即尚不能认为该棉花品种纤维长度符合纺织品生产的要求。(1)假设(2)水平(3)检验(4)推断H0:μ=μ0=30医学统计学一、样本均数与总体均数比较计算公式总体标准差σ未知且n较小时。35医学统计学一、样本均数与总体均数比较计算公式医学统计学例

根据大量调查,已知健康成年男子脉搏的均数为72次/分钟,某医生在一山区随机测量了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同?实例分析36医学统计学例根据大量调查,已知健康成年男医学统计学(1)建立检验假设,确定检验水准

H0:μ=μ0

,即该山区健康成年男子脉搏均数与一般健康成年男子脉搏均数相同;

H1:μ≠μ0

,即该山区健康成年男子脉搏均数与一般健康成年男子脉搏均数不同。

α=0.05

(2)计算t值本例n=25,s=6.5,样本均数=74.2,总体均数=72,代入公式37实例分析医学统计学(1)建立检验假设,确定检验水准3医学统计学(3)确定P值,作出推断结论

本例υ=25-1=24,查附表2,t界值表,得t0.05/2,24=2.064,现t=1.692<t0.05/2,24=2.064,故P>0.05。按α=0.05的水准,不拒绝H0,差异无统计学意义。

结论:即根据本资料还不能认为此山区健康成年男子脉搏数与一般健康成年男子不同。38实例分析医学统计学(3)确定P值,作出推断结论二、两个样本平均数的假设检验样本平均数的假设检验二、两个样本平均数样本平均数适用范围:检验两个样本平均数x1和x2所属的总体平均数1和2是否来自同一总体。二、两个样本均数的假设检验适用范围:检验两个样本平均数x1和x2所属的总体平均数1和样本1X1样本2X2总体1μ1

总体2μ21、提出假设无效假设H0:μ1=μ2

,两个平均数的差值是随机误差所引起的;备择假设HA:μ1=μ2

,两个平均数的差值除随机误差外还包含其真实的差异,即由处理引起的;二、两个样本均数的假设检验样本1样本2总体1总体21、提出假设无效假设H0:μ1=μ医学统计学计算公式σ12和σ22已知时,不管n的大小。σ12和σ22未知,但n1、n2≥30时。42二、两个样本均数的假设检验医学统计学计算公式σ12和σ22已知σ12例:某杂交黑麦从播种到开花的天数的标准差为6.9dA法:调查400株,平均天数为69.5dB法:调查200株,平均天数为70.3d差异?分析(1)这是两个样本(成组数据)平均数比较的假设检验,σ12=σ22=(6.9d)2,样本为大样本,用u检验。(2)因事先不知A、B两方法得到的天数孰高孰低,用双尾检验。试比较两种调查方法所得黑麦从播种到开花天数有无显著差别。二、两个样本均数的假设检验例:某杂交黑麦从播种到开花的天数的标准差为6.9dA法:调查(1)假设(2)水平(3)检验(4)推断H0:μ1=μ2,即认为两种方法所得天数相同。H1:μ1≠μ2,即认为两种方法所得天数不同。选取显著水平α=0.05在0.05显著水平上,不拒绝H0,尚不能接受H1,无统计学意义,即尚不能认为两种方法所得黑麦从播种到开花天数没有差别。u<1.96,P>0.05(1)假设(2)水平(3)检验(4)推断H0:μ1=μ2例:为了比较“42-67XRRIM603”和“42-67XPB86”两个橡胶品种的割胶产量,两品种分别随机抽样55株和107株进行割胶,平均产量分别为95.4ml/株和77.6ml/株,割胶产量的方差分别为936.36(ml/株)2和800.89(ml/株)2。试检验两个橡胶品种在割胶产量上是否有显著差别。分析(1)这是两个样本(成组数据)平均数比较的假设检验,σ12和σ22未知,n1>30且n2>30

,用u检验。(2)因事先不知两品种产量孰高孰低,用双尾检验。二、两个样本均数的假设检验例:为了比较“42-67XRRIM603”和“42-67XP(1)假设(2)水平(3)检验(4)推断H0:μ1=μ2,即认为两品种割胶产量没有显著差别。H1:μ1≠μ2,即认为两品种割胶产量有显著差别。选取显著水平α=0.01在0.01显著水平上,拒绝H0,接受H1,有统计学意义,即认为两个橡胶品种的割胶产量存在差别。u>2.58,P<0.01(1)假设(2)水平(3)检验(4)推断H0:μ1=μ2医学统计学47当σ12和σ22未知,两样本都为小样本时t检验二、两个样本均数的假设检验医学统计学47当σ12和σ22未知,两样本医学统计学(一)成组设计两样本均数的比较应用条件:适用于比较按完全随机设计而得到的两组资料,比较的目的是推断它们各自所代表的总体均数和是否相等。若n1和n2较小且两总体方差相等时:

48医学统计学(一)成组设计两样本均数的比较应用医学统计学例

测得14名慢性支气管炎病人与11名健康人的尿中17酮类固醇(mol/24h)排出量如下,试比较两组人的尿中17酮类固醇的排出量有无不同。实例分析49医学统计学实例分析49医学统计学原始调查数据如下:病人X1:n=14;

10.05,18.75,18.99,15.9413.96,17.67,20.51,17.22,14.69,15.109.42,8.21,7.24,24.60;健康人X2:n=11;

17.95,30.46,10.88,22.38,12.89,23.01,13.89,19.40,15.83,26.72,17.29;50实例分析医学统计学原始调查数据如下:50实例分医学统计学(1)建立检验假设

H0:μ1

=μ2

,即病人与健康人的尿中17酮类固醇的排出量相同

H1:μ1≠μ2

,即病人与健康人的尿中17酮类固醇的排出量不同

α=0.05

51实例分析医学统计学(1)建立检验假设51实例医学统计学(2)计算t值

本例:n1=14,ΣX1=212.35,ΣX12=3549.0919n2=11,ΣX2=210.70,ΣX22=4397.64

52实例分析医学统计学(2)计算t值52实例分医学统计学(3)确定P值作出推断结论

υ=14+11-2=23,查t界值表,得t0.05/2,23=2.069,现t=1.8035<t0.05/2,23=2.069,故P>0.05。按α=0.05水准,不拒绝H0,差异无统计学意义。(4)结论:尚不能认为慢性支气管炎病人与健康人的尿中17酮类固醇的排出量不同。53实例分析医学统计学(3)确定P值作出推断结论F检验:医学统计学54F=S12/S22F检验:医学统计学54F=S12/S22例:用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大白鼠的增重(g)高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123低蛋白组:70,118,101,85,107,132,94分析(1)这是两个样本平均数的检验,σ12和σ22未知,且为小样本,用t检验。(2)事先不知两种饲料饲养大白鼠增重量孰高孰低,用双尾检验。试问两种饲料饲养的大白鼠增重量是否有差别?实例分析例:用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测(1)假设(2)水平(3)检验H0:σ12=σ22=σ2H1:σ12≠σ22选取显著水平α=0.05

(4)推断两样本方差相等。第一步F检验(1)假设(2)水平(3)检验H0:σ12=σ22=σ2(3)检验(1)假设(2)水平H0:μ1=μ2,即认为两种饲料饲养的大白鼠增重无差异。H1:μ1≠μ2选取显著水平α=0.05第二步t检验(3)检验(1)假设(2)水平H0:μ1=μ2,即认为两(4)推断在0.05检验水准上,不拒绝H0,尚不能认为H1是正确的。即尚不能认为两种饲料饲养大白鼠的增重有差异。t0.05/2(17)=2.110P>0.05df=(n1-1)+(n2-1)=17(4)推断在0.05检验水准上,不拒绝H0,尚不能认为H1是σ12≠σ22,n1≠n2,采用近似地t检验,即

Aspin-Welch检验法。σ12≠σ22,n1≠n2,采用近似地t检验,即医学统计学(二)配对设计的均数比较

医学科研中配对资料主要有四种类型:1、同一批受试对象治疗前后某些生理、生化指标的比较;2、同一种样品,采用两种不同的方法进行测定,来比较两种方法有无不同;3、配对动物试验,各对动物试验结果的比较等。配对实验设计得到的资料称为配对资料。4、同一只动物对称部位:测量2个数据形成配对数据。60医学统计学(二)配对设计的均数比较医学x1x2样本1样本2……n对(二)配对设计的均数比较x1x2样本1样本2……n对(二)配对设计的均数比较医学统计学

先求出各对子的差值d的均值,若两种处理的效应无差别,理论上差值d的总体均数μd应为0。

所以这类资料的比较可看作是样本均数与总体均数为0的比较。注意:要求差值的总体分布为正态分布。公式为:配对资料的t检验62df=n-1医学统计学先求出各对子的差值d的均值,若医学统计学例

设有12名志愿受试者服用某减肥药,服药前和服药后一个疗程各测量一次体重(kg),数据如表3-4所示。问此减肥药是否有效?

注意:是否有效,即指单侧检验。(1)建立检验假设

H0:μd=0,即该减肥药无效;

H1:μd<0,即该减肥药有效。单侧α=0.0563配对资料的t检验医学统计学例设有12名志愿受试者服用某减医学统计学64配对资料的t检验医学统计学64配对资料的t检验医学统计学(2)计算t值

本例n=12,Σd=-16,Σd2=710,差值的均数=Σd/n=-16/12=-1.33(kg)65配对资料的t检验医学统计学(2)计算t值65配对资料的t检验医学统计学(3)确定P值,作出推断结论

自由度=n-1=12-1=11,查附表2,t界值表,得单侧t0.05,11=2.201,现t=0.58<t0.05,11=2.201,故P>0.05。按α=0.05水准,不拒绝H0,差异无统计学意义。结论:故尚不能认为该减肥药有减肥效果。66配对资料的t检验医学统计学(3)确定P值,作出推断结论自医学统计学例

某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近配成8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组,然后定期将大白鼠杀死,测得其肝中维生素A的含量如表3-5。

试分析:不同饲料组的大白鼠肝中维生素A含量有无差别?

67配对资料的t检验医学统计学例某单位研究饮食中缺乏维生素E医学统计学68配对资料的t检验医学统计学68配对资料的t检验医学统计学(1)建立检验假设

H0:ud=0,即正常饲料组和维生素E缺乏组肝中维生素A的含量相同

H1:ud≠0,即正常饲料组和维生素E缺乏组肝中维生素A的含量不同

α=0.05

(2)计算t值本例n=8,∑d=6.81,∑d2=8.0867,

d的均数=6.81/8=0.85169配对资料的t检验医学统计学(1)建立检验假设

H0:ud=0医学统计学(3)确定P值,作出推断结论

根据自由度:υ=n-1=8-1=7,查附表2,t界值表,得t0.005/2,7=4.029,本例t=4.208>4.029,故P<0.005<0.05。拒绝H0,接受H1,差异有统计学意义。

(4)结论:可认为不同饲料的大白鼠肝中维生素A含量有差别,正常饲料组含VA较高。70配对资料的t检验医学统计学(3)确定P值,作出推断结论

第三节样本频率的假设检验第三节样本频率的假设检验种子发芽不发芽害虫存活死亡植物结实不结实后代红花白花产品合格不合格二项分布频率分布合格率发芽率死亡率结实率性状比二项成数目标性状种子发芽不发芽害虫存活死亡植物结实不结实后代红花白花产品合格频率的假设检验当np或nq<5时直接概率法概率函数

Cnxpxqn-xP(x)P(0)C50p0q50.00001P(1)C51p1q40.00045P(2)C52p2q30.0081P(3)C53p3q20.0729P(4)C54p4q10.32805P(5)C55p5q00.59049表1孵化小鸡的概率表(p=0.90q=0.10)P(0)或P(1)或P(2)<0.05,差异显著;P(3)或P(4)或P(5)>0.05,差异不显著。频率的假设检验当np或nq<5时直接概率法概率函数频率的假设检验当5<np或nq<30

由于二项总体的百分数(频率)是由某一属性的个体计算来的整数,所以是离散型的。当样本不太大时,把它当作连续型的近似正态总体来处理,结果会有些出入,容易发生第一类错误。补救的办法时仍按正态分布的假设检验计算,但必须进行连续性矫正,即随机变量所落的区间+0.5,如一个样本由矫正为。在经连续型校正之后所作的推断其准确性不亚于2×2列联表。频率的假设检验当5<np或nq<30由频率的假设检验当np和nq>30中心极限定理正态分布(u检验)近似频率的假设检验当np和nq>30中心极限定理正态分一、一个样本频率的假设检验样本频率假设检验一、一个样本频率样本频率适用范围:检验一个样本频率(记为)和某一理论值或期望值p的差异显著性。pπ适用范围:检验一个样本频率(记为)和某一理论值或期

在二项分布中,事件A发生的频率

x/n称为二项成数,即百分数或频率。则二项成数的平均数和标准差分别为:

也称为二项总体成数的标准误,当p未知时,常以样本百分数来估计。此时上式改写为:

=

称为样本成数标准误。样本频率的标准误在二项分布中,事件A发生的频率x/n1、当np和nq>30,不需连续性矫正,则u值为:1、当np和nq>30,不需连续性矫正,则u值为:2、当5<np或nq<30时,需要进行连续性矫正,uc值为(n≥30):n<30时,用t检验其中“+”表示在>p时取“-”;<p时取“+”。2、当5<np或nq<30时,需要进行连续性矫正,uc例:有一批蔬菜种子的平均发芽率为0.85,现随机抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽,检验种衣剂对种子发芽有无效果?(3)不知使用种衣剂的发芽率是高是低,用双尾检验。分析(1)一个样本频率的假设检验;(2)np和nq>30,无需连续矫正,用u检验;例:有一批蔬菜种子的平均发芽率为0.85,现随机抽取500粒(1)假设(2)水平(3)检验(4)推断H0:p=0.85,即用该种衣剂浸种后的发芽率仍为0.85;H1:p≠0.85选取显著水平α=0.05u>1.96,P<0.05在0.05显著水平上,拒绝H0,接受H1;认为种衣剂浸种能够显著提高蔬菜种子的发芽率。(1)假设(2)水平(3)检验(4)推断H0:p=0.85,例:规定种蛋的孵化率>0.80为合格,现对一批种蛋随机抽取100枚进行孵化,结果有78枚孵出,问这批种蛋是否合格?(3)只有孵化率≤0.80,才认为是不合格,故采用单尾检验。分析(1)一个样本频率的假设检验;(2)np和nq>5,但nq<30,需要进行连续矫正,由于n>30,用u检验;例:规定种蛋的孵化率>0.80为合格,现对一批种蛋随机抽取1(1)假设(2)水平(3)检验(4)推断H0:p≤0.80,即该批种蛋不合格。H1:p>0.80,即该批种蛋合格。选取显著水平α=0.05uc<1.645,P>0.05在0.05显著水平上,不拒绝H0,尚不能认为H1是正确的,即尚不能认为这批种蛋是合格的。(1)假设(2)水平(3)检验(4)推断H0:p≤0.80二、两个样本频率的假设检验样本频率假设检验二、两个样本频率样本频率第6章总体率的区间估计和假设检验第86页适用条件为:两样本的np和nq均大于30。计算公式为:二、两样本率比较的Z检验合并样本率Pc:第6章总体率的区间估计和假设检验第86页适用条件为:两第6章总体率的区间估计和假设检验第87页Forexample

某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发生率,其结果见表6-1。问两组流感发生率有无差别?第6章总体率的区间估计和假设检验第87页Forexa第6章总体率的区间估计和假设检验第88页第6章总体率的区间估计和假设检验第88页第6章总体率的区间估计和假设检验第89页计算结果

本例:n1=100,p1=14%,n2=120,p2=25%,pc=20%,1-pc=80%,Pc=20%。代入公式:判断:Z=2.031>Z0.05/2=1.96,故P<0.05。在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。结论:两组流感发生率有差异。第6章总体率的区间估计和假设检验第89页计算结果本例第四节参数的区间估计与点估计验第四节参数的区间估计与点估计验一、参数区间估计与点估计的原理三、两个总体平均数差数的区间估计与点估计二、一个总体平均数的区间估计与点估计四、一个总体频率、两个总体频率差数的区间估计与点估计一、参数区间估计与点估计的原理三、两个总体平均数差数的区间估医学统计学用样本统计量估计总体参数称为参数估计,是统计推断的一个重要方面。总体均数的估计有两种:(1)点值估计(pointestimation)(2)区间估计(intervalestimation)。92一、一个总体均数的估计医学统计学用样本统计量估计总体参数称为参数估医学统计学点值估计是用相应样本统计量直接作为其总体参数的估计值。如用估计、S估计等。其方法虽简单,但未考虑抽样误差的大小。区间估计是按预先给定的概率(1)所确定的包含未知总体参数的一个范围。该范围称为参数的可信区间或置信区间(confidenceinterval,CI);预先给定的概率(1)称为可信度或置信度(confidencelevel),常取95%或99%。93一、一个总体均数的估计医学统计学点值估计是用相应样本统计量直接作为医学统计学可信区间的涵义从总体中作随机抽样,根据每个样本可算得一个可信区间,如95%可信区间,意味着固定样本含量n作100次随机抽样,算得100个可信区间,有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误),即犯错误的概率是5%。94医学统计学可信区间的涵义从总体中作随医学统计学(一)σ未知且n较小按t分布的原理有(二)σ未知且n足够大按Z分布的原理(三)σ已知按Z分布的原理95一、一个总体均数的估计医学统计学(一)σ未知且n较小按t分布医学统计学例

抽取某高校某年级大学生25人。某课程的平均成绩为75分,标准差为6分。试计算该年级此课程的总体平均成绩的95%可信区间是多少?

【分析】由于只抽取25人为小样本。可用小样本区间估计CI。

标准误为:

t0.05/2,24值为:2.064则95%的可信区间为:75±2.064×1.2,即(72.52,77.48)。该年级此课程的总体平均成绩的95%可信区间是(72.52,77.48)分。96一、一个总体均数的估计医学统计学例抽取某高校某年级大学生25人医学统计学又例:若上述例子的人数改为:100人。计算95%的可信区间。

标准误为:

95%的可信区间为:75±1.96×0.6,

即(73.82,76.18)。

可见:抽取的n越大,可信区间的范围越小,估计的越精确。反之亦然。97一、一个总体均数的估计医学统计学又例:若上述例子的人数改为:100医学统计学注意点标准误愈小(σ越小或n越大),估计总体均数可信区间的范围也愈窄,说明样本均数与总体均数愈接近,对总体均数的估计也愈精确;反之,标准误愈大(σ越大或n越小),估计总体均数可信区间的范围也愈宽,说明样本均数距总体均数愈远,对总体均数的估计也愈差。98医学统计学注意点标准误愈小(σ越小或医学统计学可信区间的两个要素区间估计的精确度:指区间范围的宽窄,范围越宽精确度越差。99%的可信区间差于95%的可信区间(n,S一定时)。区间估计的准确度:判断正确的可能性大小,用(1-)来衡量。99%的可信区间好于95%的可信区间(n,S一定时)。99医学统计学可信区间的两个要素区间估计的精确度100

当两个总体方差σ12和σ22为已知,或总体方差σ12和σ22未知但为大样本时,在置信度为P=1-α下,两个总体平均数差数µ1-µ2的区间估计为:二、两个总体平均数差数µ1-µ2的区间估计与点估计100当两个总体方差σ12和σ22为已知,或总体方差σ1101当两个样本为小样本,总体方差σ12和σ22未知,当两总体方差相等,即σ12=σ22=σ2时,可由两样本方差s12和s22估计总体方差σ12和σ22,在置信度为P=1-α下,两总体平均数差数µ1-µ2的区间估计为:二、两个总体平均数差数µ1-µ2的区间估计与点估计101当两个样本为小样本,总体方差σ12和σ22未知,当102当两个样本为小样本,总体方差σ12和σ22未知,且两总体方差不相等,即σ12≠σ22时,可由两样本方差s12和s22对总体方差σ12和σ22的估计而算出的t值,已不是自由度df=n1+n2-2的t分布,而是近似的服从自由度df'的t分布,在置信度为P=1-α下,两总体平均数差数µ1-µ2的区间估计为:二、两个总体平均数差数µ1-µ2的区间估计与点估计102当两个样本为小样本,总体方差σ12和σ22未知,且103当两样本为成对资料时,在置信度为P=1-α时,两总体平均数差数µ1-µ2的置信区间可估计为:()ddstdstdaa+-,二、两个总体平均数差数µ1-µ2的区间估计与点估计103当两样本为成对资料时,在置信度为P=1-α时,两总体104例题用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大白鼠的增重重量(g),两组的数据分别为:高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123低蛋白组:70,118,101,85,107,132,94试进行置信度为95%时两种蛋白饲料饲养的大白鼠增重的差数区间估计和点估计。二、两个总体平均数差数µ1-µ2的区间估计与点估计104例题用高蛋白和低蛋白两种饲料饲养一月龄大白鼠

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论