第十章 数值变量资料的统计分析(二)_第1页
第十章 数值变量资料的统计分析(二)_第2页
第十章 数值变量资料的统计分析(二)_第3页
第十章 数值变量资料的统计分析(二)_第4页
第十章 数值变量资料的统计分析(二)_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE7第四章抽样误差与假设检验课时:2学时授课对象:临床医学、康复医学、中医学本科目的要求:1.掌握均数抽样误差的概念及其总体均数可信区间的估计。2.熟悉标准差与标准误的区别;假设性检验的基本步骤。重点:抽样误差的概念、总体均数可信区间的估计。难点:标准差与标准误在应用上的区别。教学方式:大班讲授学时安排:组织教学1分钟,复习旧课2分钟,讲授新课85分钟,小结2分钟。教学基本内容如下:第一节均数的抽样误差和标准误在医疗、卫生实践和医学科学研究工作中,往往不可能,也没必要对所研究总体包含的每个个体逐一地加以观察与研究。通常是从总体中随机抽取一部分个体作为样本,以样本的研究结果对总体进行估计,这种研究方法称为统计推断。例如为了解某地20岁健康男大学生身高的总体均数,就可采取抽样的方法在该地随机抽取110名健康男大学生,得出身高的=172.73cm,用它估计20岁男大学生的身高的,由于个体差异的存在,样本均数往往不等于总体均数(≠),若同时抽取=110若干个样本,所得的各个样本均数往往也不相等(≠)。这种由抽样误差而造成的样本均数与总体均数的差别或各样本均数间的差别称为均数的抽样误差(samplingerrorofmean)。抽样误差在抽样研究中是不可避免的,变异是客观存在的,抽样时由于每个样本所饱含不同的个体,致使抽样研究产生抽样误差,其大小可用均数的标准差描述。样本均数的标准差,简称标准误(Standarderror,SE),此便于与个体变异的标准差区别。它同标准差一样,也是一种变异指标,同质资料中,标准误差大,说明抽样误差大,用样本均数代表总体均数的可靠性小,而标准误差小,则说明抽样误差小,用样本均数代表总体均数的可靠性大。标准误的计算公式为:(4-1)在实际工作中,总体标准差往往未知,通常用样本标准差S作为的估计值,因此有:(4-2)由公式(4-2)知,当固定时,标准误差与标准差成正比,标准差固定时,标准误与样本含量的平方根成反比,故控制标准差和扩大样本含量是控制抽样误差的主要方法。标准误的应用:1.用以衡量抽样误差的大小,从而说明样本均数的可靠性,同性质资料小,说明抽样误越小,样代表的可靠性越大,反之,可靠性越小。在医学文献上常用样本的形式来表示资料的均数其可靠程度。如某地110名20岁男大学生身高资料,、、,此资料就可写成2.结合正态分布,t分布曲线下的面积规律,估计总体均数的可信区间。3.应用标准误来进行均数的显著性检验——假设检验.。第二节总体均数的估计一、可信区间的概念用样本指标值(统计量)估计总体指标值(参数),称为参数估计(parameterestimation)是统计推断的一个重要方面,总体均数的估计方法有两种:即点估计和区间估计。点估计(pointestimation):就是用样本统计量直接作为总体参数的估计值,如用估计相应的,该法简单,但未考虑抽样误差的影响,所以估计的正确程度很难评价。区间估计(intervalestimation):是指按预先给定的概率估计未知总体均数的可能范围(),a与b是区间的上下界。在估计总体均数的置信区间时,可能估计错误,其概率用表示,估计正确的概率为1-,也称置信度。根据一定的置信度估计得到的区间,称为可置信区间(confidenceinterval,CI),又称置信区间。统计学上习惯用95%或99%可信区间表示总体均数有95%(或99%)的可能性在某一范围。如总体均数的95%的可信区间表示该区间包括总体均数的概率为95%,若作100次抽样算得100个可信区间,平均有95个可信区间包括,只有5个可信区间不包括,即估计错误。但错误概率为5%是小概率,仅仅在一次试验中结果出现错误的可能性很小。可信区间通常由两个数值即可信限构成。其中较小的数值称为下限(lowerlimit),较大的数值称为上限(upperlimit)。二、总体均数可信区间的计算可信区间的计算方法应根据总体是否已知以及样本含量的大小而异。计算方法有两种:1.已知或未知,但足够大时(>100),按正态分布原理进行计算,其公式:已知:95%可信区间=99%可信区间=未知,足够大时:95%可信区间=99%可信区间=2.未知且样本含量较小时,按分布原理进行计算,计算公式为:95%可信区间=99%可信区间=式中和分别称为自由度为时,概率是0.05和0.01的t值,在界值表中可以查到。例4-1某地110名20岁健康男大学生的身高资料,算得=172.73(cm)S=4.09(cm)试估计该地20岁男大学生身高均数的95%可信区间。该例=110,n较大95%的可信区间=下限上限该地20岁男大学生身高均数的95%的可信区间为171.97~173.49(cm)又如,测得11名20岁健康男大学生身高资料,=172.25(cm)S=3.31(cm),试估计该地20岁男大学生身高均数的95%可信区间。该例=11,较小身高均数95%的可信区间=查表下限上限()该地20岁健康男大学生身高均数的95%可信区为:170.03~174.47(cm)第三节假设检验的意义(基本思想)和步骤如前面所述,若从同一总体中以固定随机抽样,由于抽样误差的影响,样本均数与总体均数往往不相等,并且两个样本均数和也往往不相等。因此,在实际工作中遇到这种情况时要考虑两种可能性。①由于抽样误差所致。②两者来自不同总体。到底是哪一种可能呢,如何作出判断,统计学上通过假设检验(hypothesistesting),又称显著性检验来回答这个问题。假设检验是统计推断的另一重要内容,下面以样本均数与总体均数的比较为例,介绍假设检验的基本步骤。一、建立检验假设,确定显著性水准假设有二种:一是无效假设,符号为H0,是假设样本指标与总体指标或样本指标与样本指标所代表的各自总体之间的差别,是由单纯抽样的随机性所致,而不是真正两总体的差别,这种假设称为无效假:二是备择假设,符号为,是假设两总体均数不相等,即样本所代表的总体与假设的总体均数,或两样本均数所代表的总体均数与不相等,这种差别不是由单纯抽样所致,而是两总体均数存在着本质差别,这种假设称作备样假设。双侧检验简记为:单侧检验简记为:>或<>或<检验水准,符号为,是假设检验时发生第一类错误的概率,通常取=0.05或=0.01,其大小应根据分析的要求确定,一般多取=0.05的水准,实验要求严格时,可取=0.01的水准。二、选定检验方法和计算统计量根据资料类型和分析目的,选用适当的检验方法,计算相应的统计量,如完全随机设计两样本均数比较,选用检验(大样本)或检验,计算值或值,如配对设计两样本均数比,选用配对检验等。三、确定概率值,做出统计推断结论(一)用算得的统计量与相应的界值作比较,确定值。值是指在所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有统计量的概率。当求得统计量后,根据自由度和有关统计用表得出值,根据值大小作出拒绝或不拒绝无效假设的统计推断结论。①若>,按检验水准,不拒绝;②若≤,按检验水准,拒绝,可接受。但是,不拒绝不等于肯定成立,同理,拒绝,也不能认为肯定不成立。假设检验的结论是一种概率性推断,无论是拒绝或不拒绝,都有可能发生错误(I型错误和Ⅱ型错误),因此,下结论时,对比只能做出拒绝或不拒绝的统计判断,不宜作出“接受”的判断,而对只能说可接受。例如进行检验,值的概率是通过值表中查出界值,并与求得的统计量值相互比较(一般常与和值相比较),根据值大,概率小;值小,概率大的规律,得出统计量值的概率。在=0.05的检验水准上:<时,>0.05差别无统计学意义,即两样均数的差是由抽样误差造成的,不拒绝。≥时,≤0.05差别有统计学意义,拒绝。在=0.01的检验水准上:<时,>0.01差别无统计学意义,即两样均数的差是由抽样误差造成的,不拒绝。≥时,≤0.01差别有统计学意义,拒绝。(二)统计推断统计推断包括统计结论和专业结论两部分,统计结论只能说明有统计学意义或无统计学意义,而不能说明专业上的差异大小,只能把统计结论和专业知识有机的结合,才能得出恰如其分的专业结论。如当样本足够大或标准差特别小的时候,即是两样本相差很小,也可能得出≤0.05。例如,临床上用某药治疗高血压患者45名,另以45名患者服某常用抗高血压药作对照,最后分别测定两组病人服药后的舒张压,得两组舒张压之差的平均数为2.5mmHg,作两样本均数的检验,<0.05有统计学意义,但实际上两组高血压病人服药后舒张压下降之差较小,不足有临床意义的差值5mmHg,故并没有实际的临床意义。一般而言,当统计结论和专业结论一致时,则最终结论与这两者均一致。若统计结论与专业结论不一致,则需根据实际情况仔细分析,当统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在严重问题,导致结果的偏倚,那么最终结论也无意义。若统计结果无意义,而专业结论有意义,应当检查设计是否合理,统计方法是否恰当等,并进一步

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论