医学统计学期末考试 名词解释_第1页
医学统计学期末考试 名词解释_第2页
医学统计学期末考试 名词解释_第3页
医学统计学期末考试 名词解释_第4页
医学统计学期末考试 名词解释_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 10、测定某地107名正常人尿铅含量(“mol/L)如下表,该资料是计量资料,呈正偏态分布,欲表示该资料的集中趋势和离散趋势,宜选用的指标分别是虫位数和四分位数间距。12、算术均数常用于描述对称分布资料和正态分态资料的平均水平。13、描述正态分布或对称分布资料离散程度常用的指标是标准差,而反映偏态分布资料离散程度用四分位数间距。16、中位数一般用于描述偏态分布、分布型不明或开口资料的平均水平。19、正态分布是以为中心左右对称,正态曲线在均数位置最高,离中心越远,观察值分布越少。25、正态分布的形态由_a_决定,t分布的形态由自由度决定。20、正态分布和t分布都呈单峰和对称分布,但是曲线下相同

2、的面积所对应的界值是不同的,t界值比u界值大,而且自由度越小,二者相差越大。22、计算正态分布资料95%正常值范围的公式是X1.96S;估计总体均数95%可信区间的公式是X士L96SX。26、在抽样研究中,当样本含量趋向无穷大时,X趋向等于,Sx趋向于,t()趋向于(0.05,v)1.96。选有代表性的、较稳定的、数量较大的人群做标准;将相互比较的各组数据合并作标准;选择相互比较的各组中的一组作为标准一、名词解释1、定量资料:又称计量资料,是用定量的方法测定观察单位某项指标数值的大小,所得到的资料称为定量资料。根据变量的取值特征,可分为连续型数据(身高、体重)和离散型数据(家庭成员数、白细胞计

3、数)。2、定性资料:又称计数资料,是将观察单位按照某种属性或类别分组,清点各组的观察单位数,所得的资料称为定性资料。各类别属性没有程度或顺序上的差别,如男女,血型。3、等级资料:又称有序分类资料,是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料称为等级资料。各类别属性有程度或顺序上的差别,如显效、有效、无效等。4、总体:是根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。5、样本:是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。具有随机性、代表性、客观性。6、参数:描述总体特征的指标7、统计量:描述样本特征的指标8、同质:是指根据

4、研究目的所确定的性质大致相同的观察单位。9、变异:如果观察同一指标,各观察单位之间由于存在个体差异,也会是测量结果不同,这种差异成为变异。_7、变异系数:标准差S与均数X乏比用百分数表示。公式是CV=SCX100%。10、概率:是描述某事件发生可能性大小的度量。统计符号为P,P值的取值范围为0WPW1.11、小概率事件:医学研究中,习惯上把PW0.05的事件称为小概率事件,表示某事件发生的可能性很小。12、小概率原理:小概率事件在一次试验中几乎不可能发生。利用该原理可对科研资料进行假设检验。13、10、P值:指由H0所规定的总体中作随机抽样,获得等于及大于(或等于及小于)现有样本检验统计量的概

5、率,P的取值范围在0-1之间。14、频率:在相同条件下,独立重复做n次试验,事件A出现了m次,贝吐匕值m/n称为随机事件A在n次试验中出现的频率。15、率:表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比,说明某现象出现的强度或频率。率=(某事物或现象发生的实际数/某事物或现象发生的所有可能数)X比例基数。16、构成比:表示某一事物内部各组成部分所占的比重或分布。常用来表示疾病或死亡的顺位、位次或所占比重。构成比=(该事物内部某一组成部分的观察单位数/某事物内部的所有观察单位之和)X100%。17、比:又称相对比,是A、B两个有关联指标值之比,说明A是B的若干倍或百分之几。通常用倍

6、数或百分数表示。这两个指标可以性质相同,也可以性质不同。14、标准化率:在比较两个或两个以上的总率时,采用一个共同的内部构成标准,把两个或多个样本的不同内部构成调整为共同的内部构成标准,以消除因内部构成(年龄、性别、工龄、病程长短、病情轻重等)不同对总率产生的影响,使算得的标准化率具有可比性。只代表相互比较的各组间的相对水平,而不能反映实际情况。选用的标准不同,得到的标准化率可能不同。21、生存率:病人能存活到某时点的生存概率。19、参数统?计:在统计推断中,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知,统计推断的目的就是对这些未知参数进行估计或检验。20、非参数检验:在统计

7、推断中,不依赖于总体的分布形式,直接对总体分布位置是否相同进行检验的方法,称非参数检验。二、简答题3、频数分布有哪两个重要特征?答:频数分布有两个重要特征:集中趋势和离散趋势,是频数分布两个重要方面。将集中趋势和离散趋势结合起来分析,才能全面地反映事物的特征。一组同质观察值,其数值有大有小,但大多数观察值集中在某个数值范围,此种倾向称为集中趋势。另一方面有些观察值较大或较小,偏离观察值集中的位置较远,此种倾向称为离散趋势。2、频数分布有哪几种类型?答:频数分布有以下两种类型:对称分布和偏态分布。对称分布:指频数分布集中的位置居中,左右两侧频数分布大体对称;偏态分布:指集中位置偏向一侧,频数分布

8、不对称,根据集中位置和偏向不同,偏态分布又可分为:正偏态分布和负偏态分布。正偏态分布是指集中位置偏向观察值小的一侧,长尾向观察值大的一侧延伸;均数大于中位数负偏态分布是指集中位置偏向观察值大的一侧,长尾向观察值小的一侧延伸。不同分布类型的资料,要采用不同的统计方法来分析。1、频数分布表的用途作为陈述资料的形式,可以代替原始资料,便于进一步分析揭示资料的分布类型(正态分布还是偏态分布)揭示变量的分布特征(集中趋势与离散趋势)便于发现某项离群体的特大或特小值当样本含量比较大是,可用各组段的频率作为概率的估计值便于进一步计算统计指标和统计分析如何编制频数分布表确定组数,一般分为8-15组确定组距:将

9、全距(数据中最大值与最小值之差)除以组数可以得到组距的近似值。确定组限统计频数正态分布的用途确定医学参考值范围质量控制正态分布是很多统计方法的理论基础(t检验,方差分析)t分布与正态分布曲线的区别与联系区别:t分布曲线:以0为中心,左右对称一簇单峰分布曲线t分布与自由度v有关,v越小,t分布的峰部越低,而两侧的尾部越高正态分布:单峰分布,以x=u为中心,左右完全对称;正态曲线以X轴为渐近线,两端与X轴不相交在x=u处有最大值;在x=ub处有拐点,呈现为钟型正态分布有两个参数u,a;u为位置参数,b为形态参数联系:当V趋向时,t分布趋近标准正态分布,故标准正态分布是t分布的特例18、a:检验水准

10、,通常我们会根据研究问题的背景,规定一个“小”的概率a若P小于a就认为“P值较小”,若P不小于a就认为“P值较大”。一般取a等于0.05或0.01,以保证犯假阳性错误的概率不超过0.05或0.01.这个a称为检验水准。19、检验水准:用于判断是否拒绝H0的概率标准,用a表示,一般取a=0.05,Pa,不拒绝H0;PWa,拒绝H0O20、1-B:称为检验效能或把握度,表示当两总体确实有差别时,按规定的检验水准发现其差别的能力(概率)。21、1-a:置(可)信度,其中a由研究者预先确定,一般取0.1,0.05,或0.01,常取0.05在医学研究中,最常用的置信度是95%。计算得到的区间叫可信区间。

11、表示总体均数估计的95%可信区间包括总体均数p的概率为95%OI类错误与II类错误的区别与联系区别:定义:第一类错误:拒绝了实际上是成立的H0所产生的错误,即弃真,其概率大小为ao第二类错误:接受了实际上不成立的H0所产生的错误,即存伪,其概率大小为卩,一般a为已知,可取单侧或双侧,如0.05或0.01,一般B是未知的,其大小与a有关。只取单侧,如取0.1或0.2。1-B(把握度)不小于0.75。统计学上把1-P称为检验效能(把握度)联系:一般a增大,则B减小;a减小,则B增大;若要同时减小a、B,可以通过增加样本量的方法实现。使用相对数的注意事项不要把构成比和率混淆。计算相对数时分母一般不宜

12、过小,分母过小时相对数不稳定。注意资料的可比性。比较的资料应该是同质的,样本率或构成比存在抽样误差。不能单凭数字表面相差的大小而下定论,应对各组的样本率或构成比的差别做假设检验。对观察单位数不等的几个率,不能直接相加求其总率。应当注意不能用构成比动态分析代替率的动态分析标准化法使用注意事项标准划法是采用统一标准人口年龄构成标准化后的率并不表示某地实际水平,只能表明相对水平如不计算标准化率,而分别比较各组的率,也可得出正确结论,但不能比较总率的大小两样本标准化率是样本值,存在抽样误差,应做假设检验方差分析的用途进行两个或两个以上样本均数的比较进行两个或多个样本的方差齐性检验可以同时分析一个、两个

13、或多个因素对试验结果的作用和影响分析多个因素间的独立作用及多个因素之间的交互作用3、标准差有什么用途?答:标准差是描述变量值离散程度常用的指标,主要用途如下:描述变量值的离散程度。两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。结合均数描述正态分布或近似正态分布特征;结合均数计算变异系数CV;结合样本含量计算标准误。8、标准差,标准误有何区别和联系?答:标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别:概念不同;标准差是描述观察值(个体值)

14、之间的变异程度标准误是描述样本均数的抽样误差;用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。它们与样本含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误趋于0。联系:标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。4、变异系数(CV)常用于哪几方面?答:变异系数是

15、变异指标之一,它常用于以下两个方面:比较均数相差悬殊的几组资料的变异度。如比较儿童的体重与成年人体重的变异度,应使用CV;比较度量衡单位不同的几组资料的变异度。如比较同性别,同年龄人群的身高和体重的变异度时,宜用CV。8、t检验和u检验的应用条件各是什么?(1)t检验的应用条件是:样本取自正态总体,作两样本均数比较时还要求两总体方差相等;(2)u检验的条件是:样本例数n较大(如n100),或n虽小而总体标准差。已知。2、不同类型统计资料之间的关系如何?答:根据分析需要,各类统计资料可以互相转化。如男孩的出生体重,属于计量资料,如按体重正常与否分两类,则资料转化为计数资料;如按体重分为:低体重,

16、正常体重,超体重,则资料转化为等级资料。计数资料或等级资料也可经数量化后,转化为计量资料。如性别,结果为男或女,属于计数资料,如男性用0(或1),女性用1(或0)表示,则将计数资料转化为计量资料。14、参考值范围与可信区间区别是什么?(1)意义不同:参考值范围是指同质总体中包括一定数量(如95%或99%)个体值的估计范围,如95%参考值范围,意味该数值范围只包括95%的个体值,有5%的个体值不在此范围内。可信区间是指按一定的可信度来估计总体参数所在范围。如95%的可信区间,意味着做100次抽样,算得100个可信区间,平均有95个可言区间包括总体参数(估计正确)有5个可信区间不包括总体均数(估计

17、错误)。(2)计算方法不同:参考值范围用XuS计算。a可信区间用X土tS或XuS计算;前者用标准差,后者用标准误。a、vxax6、制定参考值范围有几种方法?各自适用条件是什么?答:制定参考值范围常用方法有两种:正态分布法:此法是根据正态分布的原理,依据公式:X土uS计算,仅适用于正态分布资料或对数、倒数转换后正态分布资料。不适合偏态分布若为对数正态分布资料,先求出对数值的均数及标准差,求得正常值范围的界值后,反对数即可。优点是结果较稳定,在样本含量不是很大的情况下仍然能够进行处理。百分位数法。用PP估计95%双侧参考值范围;P或P为95%单侧正常值范围。百分位数法2.597.5595适用于各种

18、分布的资料(包括分布未知),计算较简便,快速。使用条件是样本含量较大,分布趋于稳定。一般应用于偏态分布资料、分布不明资料或开口资料。5、制订医学参考值范围的注意事项确定同质的参照总体选择足够例数的参照样本控制检测误差选择单、双侧界值选择适当的百分数范围选择计算参考值范围的方法5、计量资料中常用的集中趋势指标及适用条件各是什么?答:常用的描述集中趋势的指标有:算术均数、几何均数及中位数。算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;几何均数:用G表示,也称倍数均数,反映变量值平均增减的倍数,适用于等比资料,对数正态分布资料;中位数:用M表示,中位数是一

19、组观察值按大小顺序排列后,位置居中的那个观察值。它可用于任何分布类型的资料,但主要应用于偏态分布资料或两端无确定数值时。百分位数:用来描述资料的观察值序列在某百分位置的水平。适用于任何频数分布资料,单靠近两端的百分位数仅在样本例数较大时才比较稳定。P=P组的下限+(总例数*x%-P组段之前的累计频数)*组距/P组的频数xxxx用P2.5和P97.5规定医学95%的参考值范围。9、统计推断包括哪几方面内容?答:统计推断包括:参数估计及假设检验两方面。参数估计是指由样本统计量(样本均数,率)来估计总体参数(总体均数及总体率),估计方法包括点值估计及区间估计。点值估计直接用样本统计量来代表总体参数,

20、忽略了抽样误差;区间估计是按一定的可信度来估计总体参数所在的范围,按X土UO或XX土uS来估计。X假设检验是根据样本所提供的信息,推断总体参数是否相等。13、如何正确理解差异有无显著性的统计学意义?答:在假设检验中,如PWa,则结论是:拒绝H0,接受H1,习惯上又称“显著”,此时不应该误解为相差很大,或在医学上有显著的(重要的)价值;相反,如果Pa,结论是不拒绝H。习惯上称“不显著”,不应理解为相差不大或一定相等。有统计学意义(差异有显著性)不一定有实际意义;如某药平均降低血压5mmHg,经检验有统计学意义,但在实际中并无多大临床意义,不能认为该药有效。相反,无统计学意义,并不一定无实际意义。

21、如用新疗法治疗某病,有效率与旧疗法无差异,此时无统计学意义,如果新疗法方法简便,省钱,更容易为病人接受,则新疗法还是有实际意义。10、假设检验的目的和意义是什么?答:在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成:其一是抽样误差所致,其二是由于样本来自不同总体。如果是由于抽样误差原因引起的差别,则这种差异没有统计学意义,认为两个或两个以上的样本来自同一总体;另一方面如果样本是来自不同的总体而引起的差异,则这种差异有统计学意义,说明两个或两个以上样本所代表的总体的参数不相等。样本统计量之间的差异是由什么原因引起,可以通过假设检验来确定。因此假设检

22、验的目的是推断两个或多个样本所代表的总体的参数是否相等。7、何谓假设检验?其一般步骤是什么?假设检验:根据研究目的,对样本所属总体特征提出一个假设,然后用适当方法根据样本提供的信息,推断此假设应当拒绝或不拒绝,以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析。目的是比较总体参数之间有无差别。实质是判断观察到的差别是由抽样误差引起还是总体上的不同。假设检验一般分为五个步骤:1、建立假设检验一种是无效假设,符号为H0;一种是备择假设,符号为,是在H0成立证据不足的情况下而被接受。Ho:Md=0Hi:Md02、确定检验水准检验水准亦称为显著性水准,符号为a。它是判别差异有无统

23、计意义的概率水准,是预先规定的拒绝域的概率值,其大小应根据分析的要求确定。通常取a=0.05或a=0.01。3、选定检验方法和计算统计量根据资料类型,研究设计的方案和统计推断的目的要求选用不同的检验方法和计算公式。如完全随机设计中,两样本均数的比较可用t检验,样本含量较大时(n100),可用u检验。不同的统计方法可得到不同的统计量。t检验,z检验、F检验、X2检验等。4、确定概率P值P值是指在H0所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量的概率。/5、作出推断结论如当Pa时,表示在Ho成立的条件下,出现等于及小于现有统计量的概率是小概率,根据小概率事件原理,现有样本信息不支持H0,因而拒绝H0,结论为按所取检验水准拒绝H0,接受H1,即差异有统计学意义。反之,当Pa,结论为按所取检验水准不拒绝H0,即差异无统计意义。12、假设检验有何特点?统计检验的假设是关于总体特征的假设;用于检验的方法是以检验统计量的抽样分布为理论依据的;作出的结论是概率性的,不是绝对的肯定或否定。15、X2检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论