医学统计学第六版1-11章_第1页
医学统计学第六版1-11章_第2页
医学统计学第六版1-11章_第3页
医学统计学第六版1-11章_第4页
医学统计学第六版1-11章_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料★统计分析包括:统计描述、统计推断,统计推断包括参数估计和假设检验。★常见的统计资料的类型有:定量数据(计量资料);定性数据(计数资料);有序数据(等级资料)频数分布的两个重要特征:集中趋势和离散趋势正态分布的两个参数:均数;标准差。μ=0、δ=1的正态分布即为标准正态分布。当μ和δ未知时,可以利用样本均数x拔和标准差S计算z对服从的任意随机变量X,都可经z变换转化成标准正态分布,正态性判定的方法有两类:一是图示法,二是计算法。★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析描述定性资料的数据特征,通常需要计算相对数。根据不同的研究目的,常用率、构成比、相对比(例数之比;相对危险度RR;比数比OR)等指标来进行统计描述。比较两个不同人群的患病率、发病率、死亡率等资料时,为消除其内部构成(如年龄、性别、工龄、病程长短、病情轻重等)对率的影响,可以使用标准化率。从外形上看,统计表可由标题、标目(包括横标目、纵标目)、线条、数字和备注5部分构成。统计图通常由标题、图域、标目、图例和刻度5个部分组成。统计表的编制原则和结构:重点突出,简单明了;主谓分明,层次清楚;数据表达规范、文字和线条尽量从简。描述定量数据的统计图有直方图、线图、箱式图、误差条图和散点图。描述定性数据的统计图有直条图和构成图(圆图和百分条图)。样本均数标准误的估计值,计算公式为:样本率的标准差也称为率的标准误,用来描述样本率抽样误差的大小。率的标准误越小,则率的抽样误差越小。参数估计包括点估计和区间估计。可信区间估计的效果由可信度1-α和区间的宽度来反映,有可信度计算出来的总体均数μ的概率越接近1越好,区间越窄估计越精确。总体均数的区间估计:(1)δ已知:变量X服从标准正态分布,95%的z值在-1.96和1.96之间,则得到95%的可信区间是:(2)δ未知:这时可以用其估计量S代替,但z值已不再服从标准正态分布,而是服从著名的t分布。计算:小样本情况下,只要原始变量服从正态分布即可用:大样本(n>=50),无论变量是否服从正态分布将上式的t..改为zα/2假设检验中,包括原假设H0和备择假设H1两种假设。假设检验的基本步骤:建立假设和确定检验水准、选择检验方法和计算检验统计量和根据P值做出统计推断。两样本方差齐性检验:在正态分布情况下,检验统计量F值按下列公式计算ν1=n1-1,ν2=n2-1若F>=Fα/2(ν1,ν2)则P<=α,拒绝H0,接受H1,可认为两总体方差不齐。采用t’检验,主要有Satterthwaite法近似t检验、Welch法近似t检验和Cochran&Cox法近似t检验。其中Cochran&Cox法是对临界值校正;而Satterthwaite法和Welch法是对自由度进行校正。I类错误(假阳性错误,α)是指当H0为真时,假设检验结论拒绝H0,接受H1;II类错误(假阴性错误,β)是指当H0不成立的时候,假设检验不拒绝H0.U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。多个样本率间多重比较有X2分割法、可信区间法和Bonferroni方法,应用这些方法能够保证假设检验中I型错误的概率α不变。非参数检验方法有多种,如配对比较的Wilcoxon符号秩和检验、两组比较的Wilcoxon秩和检验、多组比较的Kruskal-Wallis秩和检验等,其中最常用的是Wilcoxon秩和检验。两个变量之间存在的线性相关关系称为线性相关或简单相关,用于分析双变量正态分布资料。计算公式为X2检验的通用的基本公式为:(n>=40且T>=5),v=(行数-1)(列数-1)理论频数计算公式:(i行j列)四格表资料X2检验的专用公式:(n>=40且T>=5)abcd四格表资料X2检验的校正公式:(n>=40,1=<T<5)四格表资料的Fisher确切概率法:(n<40或T<1)Pi=[(a+b)!(c+d)!(a+c)!(b+d)!]/(a!b!c!d!)配对四格表的X2检验公式:R*C表X2检验公式:多样本率之间多重比较重新设定检验水准α’:(k实验组或样本率的个数)1、多个实验组之间两两比较:α’=2α/[k(k-1)]2、实验组与同一个对照组的比较:α’=α/(k-1)使用步骤:1)两个样本率或实验组1、建立检验假设并确定检验水准H0:π1=π2,即两XXX的有效率/总体xx率/xx率相等H1:π1≠π2,即两XXX的有效率/总体xx率/xx率不相等α=0.052、计算检验统计量X2=?v=?3、确定P值,做出推断结论。根据v值,查X2界值表得X2(v,α),X2>X2(v,α),P<0.05,在α=0.05的检验水准下,拒绝H0,可以认为两XXX的有效率/总体xx率/xx率不相等。若X2<X2(v,α),P>0.05,在α=0.05的检验水准下,不拒绝H0,尚不可以认为两XXX的有效率/总体xx率/xx率不相等。2)三个样本率或构成比等(1)1、建立检验假设并确定检验水准H0:不同XXX的有效率/总体xx率/xx率/构成比相等H1:不同XXX的有效率/总体xx率/xx率/构成比不相等α=0.052、计算检验统计量X2=?v=?3、确定P值,做出推断结论。根据v值,查X2界值表得X2(v,α),X2>X2(v,α),P<0.05,在α=0.05的检验水准下,拒绝H0,可以认为两XXX的有效率/总体xx率/xx率不相等。若X2<X2(v,α),P>0.05,在α=0.05的检验水准下,不拒绝H0,尚不可以认为两XXX的有效率/总体xx率/xx率不相等(2)1、建立检验假设并确定检验水准H0:π1=π2,即任两对比组的xxx相等H1:π1≠π2,即任两对比组的xxx不相等α=0.052、计算检验统计量(两两比较)X2=?v=?3、确定P值,做出推断结论。根据v值,查X2界值表得X2(v,α’),X2>X2(v,α’),P<α’,在α=α’的检验水准下,拒绝H0,可以认为两XXX的有效率/总体xx率/xx率的差异有统计学意义。若X2<X2(v,α’),P>α’,在α=α’的检验水准下,接受H0,两XXX的有效率/总体xx率/xx率之间无显著差异。线性回归方程:★.描述分类变量常用的指标有率、构成比、相对数。★四格表卡方专用公式应用条件n≥40,且Tmin≥5★从总体中抽取样本,一定要遵循科学原则:代表性;随机性;可靠性编制频数表的步骤:确定组数;确定组距;确定组限;确定频数。二、判断:(1)制订医学参考值范围的注意事项:1.确定同质的参照总体;一般选择“正常”人,主要是排除了对研究指标有影响的疾病或有关因素的同质人群。2.选择足够例数的参照样本;通常情况下,确定参考值范围需要大样本,如果例数过少,确定的参考值范围往往不够准确3.控制检测误差:为保证原始数据可靠,检测过程中要严格控制随机误差,避免系统误差和过失误差。4.选择单、双侧界值:依据专业知识确定,研究指标无论过高或过低均属异常,采用双侧界值;有些指标仅过大或者过小为异常,采用单侧界值。5.选择适当的百分数范围:百分数范围的不同将导致不同的假阳性率和假阴性率。6.选择计算参考值范围的方法:根据资料的分布类型,样本含量的多少和研究目的等,选用百分位数发和正态近似法(2)常用相对数及其使用的注意事项1、相对数是两个有关的绝对数之比,也可以是两个有关联统计指标之比。2、相对数的性质取决于其分子和分母的意义,不同类型的相对数具有不同的性质。3、计算相对数的意义主要是把基数化作相等,便于相互比较4、构成比之和应为100%,某一构成部分的增减会影响其它构成部分相应的减少或增加5、而某一部分率的变化并不影响其它部分的变化。6、需要注意:死因构成比只能说明某病死亡人数在总死亡人数中所占比重,如果需要描述致死的严重程度,则要计算病死率。7、相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,这两个指标可以是性质相同,如不同时期的患病人数;也可以是性质不同,如体重与身高的平方之比。8、不要把构成比与率相混淆,构成比只能说明事物内部各组成部分的比重和分布,不能说明其强度及频率9、使用相对数时分母不宜过小,过小相对数不稳定,且观察例数小时,最好用绝对数,以免误解。10、注意资料的可比性,比较相对数时,资料应同质。内部构成不同时须标准化。11、样本率或构成比存在抽样误差,不能单凭数字表面的大小下结论,须对各组样本率或构成比的差异做假设检验(3)统计表与统计图统计表把统计资料和结果用表格的形式来表达,目的是简洁、清晰、直观,方便对比和阅读。标题,放在表的上方中间位置,包括时间、地点、和研究内容。标目:横标目位于表的左侧,说明各行数据涵义,纵标目位于表头右侧,说明各列数据的涵义表内不留空格,无数字用“–”表示,缺失数字用“…”表示备注说明时可用“*”号标出,将说明文字写在表格的下面。统计图不能精确地显示数据大小,所以经常需要与统计表一起使用一个图通常只表达一个中心内容和一个主题,即一个统计指标标题,放在图的下方中间位置,包括时间、地点、和研究内容。绘制线图时应注意:横轴代表分组标志,纵轴代表统计指标;横轴和纵轴的刻度都可以不从“0”开始箱式图的中间横线表示中位数,箱体的长度表示四分位数间距,两端分别是P75和P25,箱体越长表示数据离散程度越大,绘制箱式图时纵轴起点不一定从“0”开始。散点图,纵轴和横轴的起点不一定从“0”开始。直条图的指标可以是绝对数,也可以是相对数。绘制时纵轴尺度必须从“0”开始且要等距;直条的宽度要相等,直条的间隔要等距,单(复)式条图:具有一个统计指标,一(多)个分组因素(4)由抽样造成的样本统计量与总体参数的差异称为抽样误差。均数的标准误小于原始测量值的标准差,均数的标准误越小说明估计越精确。在样本含量一定的情况下,均数的标准误与标准差成正比,在同一总体中随机抽样,样本含量越大,均数的标准误越小。建立检验假设的同时,还必须给出检验水准。检验水准亦称显著性水准,用α表示,是预先规定的拒绝域的概率值,实际中一般取α=0.05或α=0.01。显然,值越大越容易得出有差别的结论。P值越小越有理由拒绝原假设,认为总体之间有差别的统计学证据越充分。不拒绝H0不等于支持H0成立。(5)t检验的注意事项:做假设检验用的样本资料必须能代表相应的总体,且各对比组具有良好的均衡性。假设检验的结论不能绝对化正确理解P值的统计意义:P值越小越有理由拒绝原假设,认为不同组之间有差别的统计学证据越充分。P<=α只能说明差异具有统计学意义。假设检验和可信区间的关系:假设检验用于推断总体均数是否不同,可信区间适用于估计总体均数所载的范围。检验效能(1-β)表示当两总体确实有差别时,按规定的检验水准能发现其差别的能力,增加样本量可以提高检验效能。给出的检验水准α越小,出现II类错误的概率β越大,反之亦然,若要同时减小α和β,通过增加样本量。t检验要求资料服从正态分布,且两总体方差相等。若两总体方差不等,可采用数据变换或t’检验,也可以采用第十章的秩转换的非参数检验方法。均数间的多重比较不能直接使用两均数比较的t检验。卡方检验:1行×列表资料中各格的理论频数不应小于1,并且1=<T<5的格子数不宜超过格子总数的1/5。若出现上述情况,可通过增加样本含量,或根据专业知识考虑列或将理论频数太小的行或列与性质相近的邻行或邻列合并等方式解决。2多个样本率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的有差别,但不能说明任两个总体率之间均有差别。3行×列表资料卡方检验与分类变量的顺序无关,对于有序的R×C表资料不宜用卡方检验。单向有序表资料,宜选用秩转换的非参数检验;分析两个有序分类变量间是否存在相关关系,宜用等级相关分析。非参数秩和检验:配对资料的符号秩和检验:适用情况:(1)配对设计的计量资料—但不服从正态分布或分布未知(2)配对设计的等级资料两独立样本比较的秩和检验:适用条件:完全随机设计的两个样本比较,若不满足参数检验的应用条件,则用本法;另外,适合两个等级资料比较。多独立样本比较的秩和检验:适用条件:(1)不满参数检验的应用条件的完全随机设计的多个样本比较;(2)多个等级资料比较。非参数检验方法的优点是适用范围广,当数据满足参数检验条件时,应首选参数检验,否则检验效能降低(增加II类错误);当数据不满足参数检验的条件时,选择非参数检验方法更为合适。(8)线性回归与相关相关系数r没有度量衡单位,其数值为。r>0表示正相关;r<0表示负相关;r=0表示无相关,即无直线关系。当时称为完全相关。相关系数的绝对值愈接近1,表示相关愈密切;相关系数愈接近0,表示相关愈不密切。回归分析的应用:方程的应用:①分析两个变量之间是否存在线性依存关系;②利用回归方程由自变量X对应变量Y进行估计,必要时可以作区间估计;③利用回归方程进行统计控制,即利用回归方程进行逆运算,通过控制自变量X取值来限定应变量Y在一定范围内波动如果变量之间因果关系难以确定,则应以易于测定或变异较小者为X。自变量X既可以是随机变量也可以是给定的量,如果Y不服从正态分布,在进行回归分析前,应先进行变量的变换以使应变量符合回归分析的要求。使用回归方程估计Y值时,尽量不要把估计的范围扩大到建立方程时的自变量的取值范围之外。、线性相关分析的应用;、如果资料不服从正态分布,应先通过变量变换,使之近似正态化后计算相关系数。相关系数可以描述两个变量间相互关系的密切程度和方向。然而,不能因为两变量间的相关系数有统计学意义,就认为两者之间存在着因果关系对同一资料进行相关与回归分析,相关系数r与回归方程中的b正负号相同相关系数的计算只适用于两个数值变量都服从正态分布的情形,而在回归分析中,应变量是随机变量,自变量既可以是随机变量(Ⅱ型回归模型),也可以是给定的量(I型回归模型)。线性相关表示两个变量之间的相互关系是双向的,线性回归则反映两个变量之间单向的依存关系,更适合分析因果关系的数量变化;对同一样本可以得出r与b互相转化的公式,两种假设检验完全等价。三、简答题:1、计量资料统计分析中,常用的集中趋势指标有哪些?适用条件有何不同?答:算术均数、几何均数、中位数,统称为平均数,均反映集中趋势。算术均数应用:主要适用于对称分布或偏斜度不大的资料,尤其适合正态分布资料。几何均数:应用于对数正态分布,也可应用于呈倍数关系的等比资料。在医院中主要用于抗原(体)滴度资料。中位数:①变量值中出现个别特小或特大的数值;②资料的分布呈明显偏态,即大部分的变量值偏向一侧;③变量值分布一端或两端无确定数值,只有小于或大于某个数值;④资料的分布不清。2、★离散趋势的指标及适用范围极差适用条件:除了两端有不确定数据之外,均可计算极差。四分位数间距:主要用于衡量明显偏态分布资料的变异程度。方差和标准差:用于描述正态分布计量资料的离散程度。变异系数适用条件:用于对均数相差较大或单位不同的几组观察值的变异程度进行比较。定性数据的统计分析方法有哪些?答:定性数据,又称计数资料,变量的观测值是定性,表现为互不相容的类别或属性。统计描述:相对数,包括率、相对比,构成比等统计推断:卡方检验定量数据的统计分析方法有哪些?答:定量数据又称计量资料,变量观测值是定量的,能用数值大小衡量期水平高低统计描述:频数表、直方图和集中趋势统计指标:算术均数、几何均数、中位数;变异程度的统计指标:极差,四分位数间距、方差、标准差和变异系数。统计推断:t检验、F检验5、正态分布的两个参数及其意义?答:正态分布由两个参数μ和δ决定μ是位置参数,描述正态分布的平均水平,决定着正态曲线在X轴上的位置。δ是形状参数,描述正态分布的变异程度,决定着正态曲线的分布形状。δ越大曲线越矮胖。6、医学参考值范围的两种计算方法的适用条件?答:百分位数法适合于任何分布类型的资料,在实际中最为常用。使用百分位数法必须要有较大的样本含量,否则结果不稳定。正态分布法要求资料服从或近似服从正态分布,优点是结果比较稳定,在样本含量不是很大的情况下仍然能够进行处理;若偏态分布资料经变量变换能转换为正态分布或近似正态分布,仍可用正态分布法。7、医学参考值范围的正态分布法和百分位数法的计算公式?答:8、标准化直接法的计算公式以及标准构成选取的原则:答:1、2、选取标准的方法通常有下面三种:(1)选取有代表性的、较稳定的、数量较大的人群构成为标准,如全国范围或全省范围的数据作为标准构成;(2)选择相互比较的各组例数合计作为标准构成;(3)从比较的各组中任选其一作为标准构成。9、各种统计图的适用条件?答:1、描述定量数据:直方图主要用于表示连续变量频数分布情况,绘制直方图时应注意:纵轴刻度必须从“0”开始,而横轴刻度按实际范围制定线图适用于描述一个变量随另一个变量变化的趋势。箱式图用于比较两组或多组资料的集中趋势和离散趋势,主要适用于描述偏态分布的资料。误差条图用于比较多组资料的均值和可信区间。散点图用点的密集程度和变化趋势表示两指标之间的直线或曲线关系。2、描述定性数据直条图又称条图,用等宽直条的长短来表示相互独立的统计指标数值大小和它们间的对比关系。构成图:用于描述构成比资料,常用的构成图有圆图(piechart)和百分条图(percentagechart)。10、各类t检验的适用条件?答:单样t检验的应用条件是总体标准α未知的小样本资料(如n<50),且服从正态分布,适用于样本均数与已知总体均数μ0的比较,比较目的是检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差别。配对样本均数t检验适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。两独立样本t检验适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等,要求方差齐性即两组总体方差相等。t检验的步骤?答:单样本配对样本两独立样本(1)建立检验假设,确定检验水准(1)建立检验假设,确定检验水准(1)建立检验假设,确定检验水准H0:μ=μ0,x与x平均...相同H0:μd=0,x前后..平均...差异为0H0:μ1=μ2,xx...总体均数相同H1:μ≠μ0,x与x平均....不同H1:μd≠0,x前后..平均...差异不为0H1:μ1≠μ2,xx...总体均数不同α=0.05α=0.05α=0.05计算检验统计量(2)计算检验统计量(2)计算检验统计量t=,v=n-1t=t=(3)根据P值,做出推断结论(3)根据P值,做出推断结论(3)根据P值,做出推断结论根据v,查t界值表,若t<t0.005/2,v,根据v,查t界值表,若t<t0.005/2,v,根据v,查t界值表,若t<t0.005/2,v,故P>0.05,表明差异无统计学意义,故P>0.05,表明差异无统计学意义,故P>0.05,表明差异无统计学意义,按照α=0.05水准不拒绝H0,按照α=0.05水准不拒绝H0,按照α=0.05水准不拒绝H0,尚不能认为x与x平均....存在差异。尚不能认为x前后..平均..存在差异。尚不能认为xx...的存在差异。完全随机设计的方差分析的具体步骤?答:(1)提出假设检验,确定检验水准H0:μ1=μ2=μ3,即xxx的总体均数相同。H1:μ1,μ2,μ3不全相同,即xxx的总体均数不全相同。α=0.05(2)计算检验统计量F值F=MS组间/MS组内(3)确定P值,做出推断结论分子自由度v组间=2,分母自由度v组内=X,F0.05(2,X-1)=xx,若F>F0.05(2,X-1),从而P<0.05,按照α=0.05的检验水准拒绝H0,可以认为xxx不全相同。反之,.....。10.标准差和标准误的联系和区别有哪些?①概念不同:标准差是描述观察值(个体值)之间的变异程度,S越小,均数的代表性越好;标准误是描述样本均数的抽样误差,越小,均数的可靠性越高;②用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。与样本含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0联系:标准差、标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。11、★★简述非参数秩和检验的适用范围?答:(1)总体分布为偏态或分布形式未知的计量资料(尤其在n<30的情况下);(2)等级资料或半定量资料;(3)个别数据偏大或数据的某一端无确定的数值,如“<0.01mg”、“>150mg”等,只有一个下限或上限,而没有具体数值;(4)各组离散程度相差悬殊,即各总体方差不齐。12.方差分析的应用条件答:方差分析常用于三个及以上样本均数的比较,当用于两个均数的比较时,同一资料所得结果与t检验等价,即有如下关系t2=F(1)各样本是相互独立的随机样本,且来自正态分布总体。(2)各样本的总体方差相等,即方差齐性13、非参数秩和检验的步骤?答:(1)建立假设检验,确定检验水准(配对)H0:xx差值的总体中位数为0(独立)H0:两总体分布相同H1:xx差值的总体中位数不为0H1:两总体分布不同α=0.05α=0.05(2)计算统计量T(2)计算统计量T求正负秩和:T+,T-,然后任取分别求秩和,取其中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论