![卫生统计学钟崇洲计量资料的统计推断新_第1页](http://file4.renrendoc.com/view/30332e9b93617ebb7966895162693b0e/30332e9b93617ebb7966895162693b0e1.gif)
![卫生统计学钟崇洲计量资料的统计推断新_第2页](http://file4.renrendoc.com/view/30332e9b93617ebb7966895162693b0e/30332e9b93617ebb7966895162693b0e2.gif)
![卫生统计学钟崇洲计量资料的统计推断新_第3页](http://file4.renrendoc.com/view/30332e9b93617ebb7966895162693b0e/30332e9b93617ebb7966895162693b0e3.gif)
![卫生统计学钟崇洲计量资料的统计推断新_第4页](http://file4.renrendoc.com/view/30332e9b93617ebb7966895162693b0e/30332e9b93617ebb7966895162693b0e4.gif)
![卫生统计学钟崇洲计量资料的统计推断新_第5页](http://file4.renrendoc.com/view/30332e9b93617ebb7966895162693b0e/30332e9b93617ebb7966895162693b0e5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计学钟崇洲计量资料的统计推断新第1页/共55页数值变量资料的
统计分析抽样误差.标准误.可信区间的估计第2页/共55页
正态分布有2个参数或特征量——均数μ和标准差其中均数作为总体变量值和代表值最重要的,因此计量资料主要研究的目的就是用样本信息来推断总体特征这叫统计推断。一、均数的抽样误差与标准误
1)抽样和抽样误差
σ
抽样研究方法必须随机化原则抽样误差第3页/共55页2)均数的标准误
组段151-152-153-154-155-156-157-158-159-及以上频数1610182920862样本100第4页/共55页
由频数表可见,在同一总体中抽取的样本均数虽然有大有小,但可以看出样本均数的分布近似服从正态分布,为了说明其集中趋势,可以计算其样本均数的均数为155.52cm,为了说明均数的离散趋势,可以计算样本均数的标准差(为1.64)统计学中把样本均数的标准差称为均数的标准误,简称标准误。均数的标准误是描述均数的抽样误差大小的统计指标,均数的标准误越大,均数的抽样误差就越大,说明样本均数的离散程度越高,与总体均数的差异程度越大
第5页/共55页统计理论表明:①如原变量X服从正态分布(总体正态分布)从总体中随机抽取例数的n的样本,样本均数也服从正态分布,即使原变量X服从偏态分布,当n是够大时(n>30)样本均数也近似服从正态分布。②
若原变量X的总体(不管正态或偏态)均数μ标准差为抽取的例数n的样本,样本均数的总体均为μ标准差
与的关系(公式4-1):
均数的标准误
样本标准差样本例数第6页/共55页举例(教材286页)如:14岁健康女生身高的标准差σ=5.30每个样本例数
n=10代入公式由于实际的抽样研究中,常属末知,只能用样本标准差S作为正常估计值,所以,计算标准误的公式σ举例(28页4-1)第7页/共55页③均数标准误的用途a)用来衡量样本均数的可靠性:均数标准误越少说明样本均数与总体均数的差异程度越小,因此用样本均数估计总体均数越可靠,反之亦然。b)结合样本均数和正态分布曲线下的面积分布规律可以用以估计总体均数的置信区间。c)用于均数的假设检验④标准误与标准差的区别均数与S相似都是说明离散程度的指标,但与S有区别的,标准差描述个体间的变异程度,凡同性质资料S大表示个体变异大,S小表示个体变异小。(举例)而标准误是样本均数的标准差,描述样本均数的抽样误差,即样本均数与总体均数接近程度,凡同性质资料,大,说明用样本均数代表总体均数可靠性小,小,则说明用样本均数代表总体均数可靠性大。
第8页/共55页二t分布μ,正态分布N(μ)X叫正态变量标准正态分布N(0.1)U叫作标准正态变量。正态分布
N(μ)抽取例数为n的样本样本均数服从正态分布N(μ)标准正态分布N(01)即u分布。在实际工作中往往不知道,多用来估计,这时对正态变量采用的不是u变换而是t变换即:不是u分布而是t分布。(t-distrbution)第9页/共55页
特点:
t--分布与标准正态分布相比有以下特征:
a)二者都是单峰分布,以0为中心,左右两侧对称。
b)t分布的峰部较矮而尾部翘得较高,说明远侧的t值个数相对较多即尾部面积(概率)越大,他与自由度υ=n-1有关,自由度υ越小,这种情况越明显(样本含量)随着自由度的增大,t分布曲线逐渐逼近标准正态曲线,当自由度无穷大时,则t分布曲线与标准正态曲线完全吻合。同标准正态分布曲线一样,统计应用中,最关心的是t分布曲线下的面积(即概率P或α)SS
第10页/共55页
面积:t分布曲线下的整个面积为1(100%)t分布曲线下t从a到b
(>a)的面积为t值分布在此范围内的百分比,即t值落在此范围内的概率.
当n=∝
时,t分布趋向于标准正态分布,即均数为0,S为
1的正态分布;
t值在±1.96范围内的面积占95%,在±2.58的范围内占99%,把自由度为υ
的t分布曲线两侧外面积5%的界值称而把两侧外面积1%界限值称,和两界限很重要是统计上常用t值的显著性,
第11页/共55页举例(教材238页)
根据自由度和检验水准,可以从表2查t值当υ=9时,超过横轴距离±2.262以外的两侧之和为0.05±3.250以外的两侧之和0.01.
可用如下表示:,
第12页/共55页三、估计总体均数的置信区间
统计推断包括两个重要方面
所谓参数估计就是用样本指标(统计量)估计总体指标(参数)
参数估计
参数估计假设检验点(值)估计区间估计第13页/共55页
区间估计:
所估计的区间叫总体均数的可信区间(置信区间)其可信度(概率)预先确定来估计总体参数在哪个范围的估计方法称为区间估计.
第14页/共55页
根据已知条件选用不同的方法估计总体均数的置信区间a)σ已知时,按正态分布原理,公式:95%99%σ未知,且样本例数较小,一般按t分布的原理.公式:
95%99%σ未知,但样本例数n足够大时,按正态分布原理.公式:
95%99%第15页/共55页举例
随机抽取某地健康男子20人,测得该样本的收缩压均数=118.4mmhgS=10.8mmhg,估计该地男子收缩压总体均的95%置信区。解υ=20-1=19
查t值表t0.05(19)=2.093代入公式:
第16页/共55页四、假设检验(t检验)
1)假设检验的基本思想
总体均数的假设检验有二个目的的。
a)推断单个总体均数μ是否等于已知总体均数.b)推断两个总体均数μ1和μ2是否相等.
造成和μ0或与的差别有二种情况。
a)完全由抽样误差造成,即μ=μ0,或μ1=μ2这种情况差别相对小,称为无显著性。
b)除了由抽样误差造成外,造成总体均数差别.
即μ≠μ0或,μ1=μ2这种情况差别相对大,称为差别有显著性
第17页/共55页
=136.0g/LS=6.0g/Ln=280抽样举例:某地抽样调查了280名健康成年男性的血红蛋白,其均数为136.0g/L,S=6.0g/L。已知成年男性的血红蛋白的均数为140.0g/L试问能否认为该地抽样凋的280名成年男性血红蛋白含量与正常男性的血红蛋白含量的均数不同?第18页/共55页1)建立检验假设,2.步骤a)μ=μ0
称无效假设,用Ho表示b)称备择假设,用H1或HA表示,应当注意:1)检验假设是针对总体而言,而不是针对样本。2)Ho和H1是相互联系,对立的假设.结论是根据Ho和H1作出的3)Ho为无效假设,其假定是某两个(或多个)总体参数相等,或某两个总体参数之差等于另或4)H1的内容反映出检验单双侧,若H1假设为μ>μ0
,则检验为单侧检验.2)确定检验水准,称为显著性水准,用α表示一般取α
=0.05。3)选定方法,计算统计量根据变量或资料类型,设计方案.检验方法的适用条件等选择检验方法4)确定P值作出推断结论:根据计算出的检验统计量,查相应的界值表即可得概率P,第19页/共55页举例:计算统计量.确定P值.推断结论:本例t检验(公式9-20)
结论:若P≤α则结论为按所取的α检验水准,拒绝Ho,接受H1有统计学意义(统计结论)可以认为不同或不等,例如t=-11.16,t0.01200=2.601,因为11.16>2.601所以P<0.01,则拒绝Ho接受H1有统计学意义,认为该地健康成年男性血红蛋白数低于一般正常成年男性血红蛋白。若P>α
,则结论为α检验水准,不拒绝Ho,无统计学意义,还不能认为不同或不等。
第20页/共55页第四节:t检验和u检验
假设检验的方法是以选定的检验统计量而命名,如t检验和u检验,分别根据要用特定的公式计算t统计和u统计而命名
T检验(t-test)的应用条件:当样本例数n较小,样本来自正态总体,总体标准差未知。在做两个样本均数比较时还要求两样本相应的总体方差相等。1)样本均数与总体均数的比较
举例,如:已知健康成年男子脉搏均数为72次/分,现某医生在一山区随机抽查了25名健康成年男子,求得脉搏均数为74.2次/分,标准差为6.0次/分,问山区成年男子的脉搏均数高于一般成年男子脉搏均数?
第21页/共55页a)建立检验假设,确定检验水准
Hoμ=μo=72次/分H1μ>μoα=0.05
b)选定检验方法,计算检验统计量t值。
=74.2次/分S=60次/分μ=72次/分代入公式
υ=n-1=25-1=24
c)确定P值,作出推断结论υ=24,查t值表,因t0.0524=1.711<1.833故单尾概率
P<0.05按α=0.05拒绝Ho接受H1
有统计意义,可认为该山区健康成年男子脉搏数高于一般成年男子脉搏数。第22页/共55页
2)配对t检验配对设计主要有以下情形(有三种情况)
a)自身比较是指同一受试对象处理前后的比较,目的是推断这种处理有无作用。
b)同一样品用两种方法检验的结果。
c)成对设计的两个受试对象分别给予两种处理,目的都是推断两种处理的效果有无差别.第23页/共55页例9-16
应用某药治疗8例高血压患者,观察患者治疗前后舒张压变化情况,如表9-10,问该药是否对高血压患者治疗前后舒张压变化有影响
表9-10某药治疗高血压患者前后舒张压变化情况
19688821121084310810264102984598100-2610096471061024病人编号舒张压(mmHg)治疗前治疗后差值d36第24页/共55页(2)选择检验方法,按公式9-24计算检验统计量t值(3)确定P值,判断结果自由度
υ
=n-1=8-1=7,查表9-9t界值表今4.02>2.365,故P<0.05故按a=0.05水准,拒绝H0,接受H1,可认为该药有降低舒张压的作用。
(1)建立假设,确定检验水准第25页/共55页3)两个样本均数的比较:
a)两个大样本均数的比较,当两个样本含量较大(均>50)可用μ检验,目的是推断它们各自代表的总体均数有无差别,按公式(9-25)计算检验统计量u值为两样本均数差值标准误,或叫合并标准误
第26页/共55页举例:某地随机抽取正常男性新生儿175名,测得血中甘油三酯浓度的均数为0.425mmol/L,标准差为0.245mmol/L;随机抽取正常女性新生儿167名,测得血中甘油三酯浓度的均数为0.438mmol/L,标准差为0.292mmol/L,问男、女新生儿甘油三酯浓度有无差别?(1)建立检验假设,确定检验水准(3)确定P值,判断结果查u界值表(即表9-9t界值表中自由度为∞一行),得P>0.10,按α=0.05水准,不拒绝Ho,尚不能认为正常男,女新生儿甘油三酯浓度均数不同第27页/共55页b)两个小样本均数的比较
可用于样本含量较小时,且要求两正态总体方差相等,公式:
(2)选择检验方法,按公式9-25计算检验统计量u值为两样本均数差值的标准误
为合并方差
第28页/共55页
例9-18:
两组雄性大鼠分别饲以高蛋白和低蛋白饲料,观察每只大鼠在实验第28天到84天之间所增加的体重,见表9-11。问用两种不同饲料喂养大鼠后,体重增加有无差别
表9-11用两种不同蛋白质含量饲料喂养大鼠后体重增加的克数高蛋白组
低蛋白组
X1X2X2X2
1341795670490014621316118139241041081610110201119141618572251241537610711449161259211321742410711449948836836889113127691291664197940912315129144017783270773959第29页/共55页1.建立假设,确定检验水准
N1=
12
n2=7第30页/共55页(3)确定P值,判断结果表2t界值表今1.891<2.110,故p>0.05,按α=0.05水准,不拒绝Ho,尚不能认为两种不同蛋白质含量饲料喂养大鼠后体重增加是不同的。
第31页/共55页C)方差不齐时两小样本均数比较
1.)两样本方差的齐性检验用t检验进行完全随机设计两总体均数比较时,要求两总体的方差相等。因此在做两总体样本均数比较的t检验前,首先应对两总体的方差是否相等进行检验。方差相等称为方差齐性,方差检验的适用条件是两样本均来自正态分布的总体
为了方便,通常是用较大方差比较较小方差,因此构造了统计量F,
第32页/共55页t’检验(t’检验—近似t检验)
近似t检验有3种方法可供选择,包括Cochran&Cox法、Satterthwaite法和Welch法。其中第1,2种方法较为常用。现选择Cochran&Cox法(1950)该法是对临界值校正,其检验统计量t’
为第33页/共55页D)成组设计的两样本几何均数的比较
成组设计的两样本几何均数的比较的目的是推断两样本几何均数各自代表的总体几何均数有无差别。适宜于用几何均数表示其平均水平的资料(如等比级数资料和对数正态分布资料)。此种情况下,应先把观察值X进行对数变换(即lgX),用变换后的数据代入式(3.8)计算统计量t值。例3.9为比较两种狂犬病疫苗的效果,将120名患者随机分为两组,分别注册精制苗和PVRV,测定45天两组的狂犬病毒抗体滴度,结果见表3.4,问两种狂犬病疫苗的效果有无差别?表3.42种疫苗狂犬病毒抗体滴度的比较疫苗血清滴度人数类型5010020040080016003200640012800
精制苗601337462673PVRV60131410531590第34页/共55页(1)
建立检验假设,确定检验水准Ho:两种疫苗的总体几何均数对数值相等H1:两种疫苗的总体几何均数对数值不等(2)计算统计量将两组数据分别取对数,记做X1,X2。用变换后的数据计算,S1,。S2。=3.2292,S1=0.5714,=2.9482。S2=0.6217代入式(3.8)第35页/共55页(3)
确定P值,作出统计推断查附表2,t界值表,得0.01<P<0.02,按α=0.05水准拒绝Ho,接受H1,差异有统计学意义,可认为两种疫苗的平均抗体滴度不同,精制苗高于PVRV。
第36页/共55页五、假设检验注意事项:
1)要有严密的抽样设计保证样本是从同质总体中随机抽取的。比较的组间要具有均衡性和可比性,即除了要比较的因素外,其他可能影响结果的因素如年龄、性别、病情轻重、病程等在对比的组间应尽可能相同或相近。
2)选用的检验方法必须符合其适用条件应根据分析目的、资料类型、样本含量大小等选用适当的检验方法,理论上要求样本来自正态分布总体。非正态分布选用非参数检验
。第37页/共55页3)单侧检验和双侧检验
根据研究目的和专业知识选择适当的方法,单侧检验和双侧检验中计算统计量t的过程是一样的,但确定概率时的临界值是不同的。
4)假设检验的结论不能绝对化
因为统计结论是概率性的,不论拒绝Ho,还是不拒绝Ho,都有可能发生推断错误,所以做统计结论时不能绝对化,不宜用“肯定”、“必定”、“一定”等词。第38页/共55页5)正确理解P值与差别有无统计意义假设检验的结果并不表示专业上的实际意义
6)假设检验和可信区间的关系假设检验和区间估计之间既存在密切的关系,又有区别。假设检验用以推断两总体均数是否相同,而可信区间则用于推断总体均数在哪个范围。第39页/共55页
第六节:两型错误和检验效能
假设检验时,根据样本统计量作出的推断结论(拒绝Ho或不拒绝Ho)并不是百分之百的正确,可能发生两种错误:1.拒绝了实际上成立的Ho,这类“弃真”的错误为I型错误;
2.不拒绝实际上不成立的Ho,这类“存伪”的错误为
II型错误。下面以样本均数与总体均数比较的单侧u检验为例说明之,如图5-2,设Ho:μ=μ0,
H1:μ>μ0
第40页/共55页
(1).I型错误样本来自μ=μ0的总体,即Ho实际上成立,由于抽样的偶然性得到了较大的u值(u≥ua),按检验水准α拒绝了Ho,接受了H1,即μ>μ0,此推断当然是错误的.
I型错误的概率常用α表示,若确定检验水准α=0.05,则犯I型错误的概率为0.05,理论上平均每100次抽样有5次发生这类错误
。
第41页/共55页(2)II型错误样本来自μ>μ0的总体,即Ho实际上不成立,由于抽样的偶然性得到了较小的u值(u<ua),按检验水准α不拒绝Ho,此推断当然是错误的.
II型错误的概率常用β表示,但β值的大小很难确切的估计,只有在已知样本含量n、两总体均数差值δ以及所规定的检验水准α的条件下,才能估算出β的大小。通常当n固定时,α愈小,β愈大;反之α愈大,β愈小。图3.4中的1-β=0.9的含义是,若两总体确有差别,理论上平均100次抽样有90次能得出有差别的结论。检验效能越大,俺α水准拒绝Ho,推断两总体均数确有差别的把握就越大。第42页/共55页推断正确(1-α)ABCD(I型错误α)
推断错误推断错误(II型错误β)推断正确(1-β)拒绝Ho
拒绝Ho
拒绝Ho不拒绝HoHo成立Ho不成立第43页/共55页三、假设检验的两类错误实际情况H0正确H0错误研究结论拒绝H0Ⅰ型错误正确接受H0正确Ⅱ型错误1-1-第44页/共55页第45页/共55页
错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小第46页/共55页第47页/共55页图5-2中的1-β=0.9的含义是,若两总体确有差别,理论上平均100次抽样有90次能得出有差别的结论。检验效能越大,按α水准拒绝Ho,推断两总体均数确有差别的把握就越大.
检验效能是否足够大,是研究在科技设计阶段必须考虑的重要内容。总结如下:
客观实际拒绝Ho不拒绝Ho
Ho成立I型错误(α)推断正确(1-α)Ho不成立推断正确(1-β)II型错误(β)
实际工作中,可根据研究要求适当控制α和β。若重点在于减少α,一般取α=0.01;若字典在于减小β,一般取α=0.05.同时减小α和β的唯一方法是增加样本含量第48页/共55页
小结
一、均数的抽样误差在抽样研究中,由于存在个体差异,在样本均数与总体均数、样本均数与样本均数之间不可避免的存在着差异,这种差异就叫做抽样误差
1)标准误描述样本均数的变异程度的指标,表示抽样误差的大小。可应用于估计总体均数的可信区间和进行均数间差异的假设检验第49页/共55页
2).标准差和标准误有何区别和联系
(1)区别
标准差与标准误的区别标准差(α或s)标准误()意义上描述一组变量值之间的离散描述样本均数间的离散趋势趋势应用上①s越小,表示变量值围绕①越小,表示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业生产项目管理与风险控制作业指导书
- 营销人的选书与读书
- 2025年延边货运从业资格证考试题库答案
- 小学三年级上册数学口算题100题
- 小学二年级数学下学期口算练习
- 2025年湖北交通运输从业资格证怎样考试
- 2025年昆明货运从业资格考试技巧
- 电力行业合作协议(2篇)
- 湘教版数学八年级上册1.2《分式的乘方》听评课记录2
- 2024-2025学年新教材高中历史第一单元从中华文明起源到秦汉统一多民族封建国家的建立与巩固单元优化提升链接学考含解析新人教版必修中外历史纲要上
- 2024-2025年中国专网通信行业市场前景预测及投资战略研究报告
- 二零二五年度能源行业员工劳动合同标准范本3篇
- 2024年石柱土家族自治县中医院高层次卫技人才招聘笔试历年参考题库频考点附带答案
- 西藏事业单位c类历年真题
- 2025中国移动安徽分公司春季社会招聘高频重点提升(共500题)附带答案详解
- 七年级英语下学期开学考试(深圳专用)-2022-2023学年七年级英语下册单元重难点易错题精练(牛津深圳版)
- 2025江苏省全日制劳动合同书范本
- 部编版语文小学二年级下册第一单元集体备课(教材解读)
- 放射科护理常规
- 儒释道文化秒解
- 新时代中小学教师职业行为十项准则
评论
0/150
提交评论