医学统计学问答题含答案_第1页
医学统计学问答题含答案_第2页
医学统计学问答题含答案_第3页
医学统计学问答题含答案_第4页
医学统计学问答题含答案_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

精选资料可修改编辑简答题0.算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。(3)中位数:适用各种类型的资料,尤其以下情况:A资料分布呈明显偏态;B资料一端或两端存在不确定数值(开口资料或无界资料);C资料分布不明。1.对于一组近似正态分布的资料,除样本含量n外,还可计算和,问各说明什么?(1)为算数均数,说明正态分布或近似正态分布资料的集中趋势(2)S为标准差,说明正态分布或近似正态分布的离散趋势(3)可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。2.试述正态分布、标准正态分布的联系和区别。正态分布标准正态分布原始值X无需转换作u=(X-µ)/σ转换分布类型对称对称集中趋势µµ=0均数与中位数的关系µ=Mµ=M参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为µ,标准差为σ(µ为任意数,而σ为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。3.说明频数分布表的用途。4.变异系数的用途是什么?多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。5.试述正态分布的面积分布规律。(1)X轴与正态曲线所夹的面积恒等于1或100%;(2)区间µ±σ的面积为68.27%,区间µ±1.96σ的面积为95.00%,区间µ±2.58σ的面积为99.00%。6.试举例说明均数的标准差与标准误的区别与联系。7.标准正态分布(u分布)与t分布有何不同?t分布为抽样分布,标准正态分布(u分布)为理论分布。t分布比正态分布的峰值低,且尾部翘得更高。随着自由度的增大,t分布逐渐趋近于标准正态分布。即当自由度ν→∞时,t分布→标准正态分布。8.均数的可信区间与参考值范围有何不同?9.假设检验时,一般当P<0.05时,则拒绝H0,理论根据是什么?10.假设检验中和P的区别何在?11.t检验的应用条件是什么?12.I型错误与II型错误有何区别与联系?I型错误是指拒绝了实际上成立的所犯的“弃真”错误,其概率大小用α表示。II型错误则是“接受”了实际上不成立的所犯的“取伪”错误,其概率大小用β表示。当样本含量n确定时,α愈小,β愈大;反之α愈大,β愈小。13.假设检验和区间估计有何联系?假设检验用于推断质的不同即判断两个(或多个)总体参数是否不等,而可信区间用于说明量的大小即判断总体参数的范围。两者既互相联系,又有区别。假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题,若算得的可信区间包含了,则按α水准,不拒绝;若不包含,则按α水准,拒绝,接受。也就是说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等价的。14.为什么假设检验的结论不能绝对化?因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝时,有可能犯I型错误;“接受”时可能犯II型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字如“肯定”,“一定”,“必定”就不恰当。15.方差分析的基本思想和应用条件是什么?方差分析的基本思想是:根据研究资料设计的类型及研究目的,把全部观察值总变异分解为两个或多个组成部分,其总自由度也分解为相应的几个部分。例如完全随机设计的方差分析,可把总变异分解为组间变异和组内变异,即SS总=SS组内+SS组间,总的自由度也分解为相应的两部分,即ν总=ν组内+ν组间。离均差平方和除以自由度得均方MS,组间均方(MS组间)与误差均方(MS误差)之比为F值;如果各组处理的效应一样,则组间均方等于组内均方,即F=1;但由于抽样误差,F值不正好等于1,而是接近1;如果F值较大,远离1,说明组间均方大于误差均方,反映各处理组的效应不一样,即各组均数差别有意义,至于F值多大才能认为差别有意义,可查F界值表(方差分析用)来确定。方差分析的应用条件:①各样本是相互独立的随机样本且来自正态总体②各组总体方差相等,即方差齐性。16.在完全随机设计方差分析中间、S内各表示什么含义?表示组间变异,指各组处理样本均数大小不等,是由处理因素(如果有)和随机误差造成的;表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。17.随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?区别点完全随机设计随机区组设计设计采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理。随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个受试对象数量相同,区组内均衡。变异分解三种变异:=+四种变异:=++18.以实例说明为什么不能以构成比代替率?19.秩和检验的优缺点?20.简述直线回归与直线相关的区别与联系。联系:1对于既可做相关又可做回归分析的同一组数据,计算出的b与r正负号一致。2相关系数与回归的假设检验等价,即对于同一样本,tb=tr3同一组数据的相关系数和回归系数可以互相换算:r=by,x*Sx/Sy4用回归解释相关:由于决定系数,当总和平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则越接近1,说明相关的效果越好。二者的区别:(1)资料要求上:相关要求X、Y服从双变量正态分布,这种资料进行回归分析称为Ⅱ型回归;胡桂要求Y在给定某个X值时服从正态分布,X是可以精确测量和严格控制的变量,称为Ⅰ型回归。(2)应用上:说明两变量间互相关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,说明Y如何依赖于X而变化。(3)意义上:r说明具有直线关系的两变量间相互关系的方向和密切程度;b表示X每变化一个单位所导致Y的平均变化量。(4)计算上:,(5)取值范围:-1≤r≤1,-∞<b<∞.二项分布、Poission分布的应用条件二项分布的应用条件:医学领域有许多二分类记数资料都符合二项分布(传染病和遗传病除外),但应用时仍应注意考察是否满足以下应用条件:(1)每次实验只有两类对立的结果;(2)n次事件相互独立;(3)每次实验某类结果的发生的概率是一个常数。Poisson分布的应用条件:医学领域中有很多稀有疾病(如肿瘤,交通事故等)资料都符合Poisson分布,但应用中仍应注意要满足以下条件:(1)两类结果要相互对立;(2)n次试验相互独立;(3)n应很大,P应很小。3、极差、四分位数间距、标准差、变异系数的适用范围有何异同?答:这四个指标的相同点在于均用于描述计量资料的离散程度。其不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,不宜用极差来比较资料的离散程度。四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。4.中位数、均数、几何均数的适用条件有何异同。(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。第一类错误与第二类错误的区别与联系。当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第一类错误,其概率用α表示。当假设检验接受实际上不成立的零假设时,所犯的错误称为第二类错误,其概率用β表示。当样本含量一定时,α愈大,β愈小,反之,α愈小,β愈大。1-β称为检验效能或把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。运用相对数时要注意哪些问题?应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性;(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。7.方差分析后进行两两比较能否用t检验?为什么?t检验仅用在单因素两水平设计(包括配对设计和成组设计)和单组设计(给出一组数据和一个标准值的资料)的定量资料的均值检验场合;而方差分析用在单因素k水平设计(k≥3)和多因素设计的定量资料的均值检验场合。方差分析有十几种,不同的方差分析取决于不同的设计类型。t检验进行两两比较其一,将多因素各水平的不同组合、简单地看作单因素的多个水平(即视为单因素水平),混淆了因素与水平之间的区别,从而错误地确定了实验设计类型;其二,分析资料时,常错误用单因素多水平设计或仍采用多次t检验进行两两比较。误用这两种方法的后果是,不仅无法分析因素之间的交互作用的大小,而且,由于所选用的数学模型与设计不匹配,易得出错误的结论。参数检验与非参数检验的区别何在?各有何优缺点?(1)区别:参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。(2)优缺点:参数检验:优点是符合条件时,检验效能高。缺点是对资料要求严格,如等级资料、分布不明或末端有不明确数据的资料不能用参数检验,要求资料的分布类型已知且总体方差相等。非参数检验:优点是应用范围广、简便;缺点是对于符合参数统计的资料,如果用非参数统计会造成资料信息的丢失,致使检验效能下降,犯第二类错误的概率增大。故符合参数统计条件的资料,要首先选用参数统计的方法。当参数统计的应用条件得不到满足时,应选用非参数统计。对于同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以何种结果为准。当资料满足参数检验方法的条件时,应使用参数检验方法,当资料不满足参数检验方法的条件时,必须采用非参数检验方法。12、常见的统计图有哪些?如何根据资料的性质选用适当的统计图?常用的统计图及适用条件是:①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及远圆图,适用于构成比资料,反映各组成部分的大小;③普通线图:适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。⑤直方图:适用于连续性变量资料,反映连续变量的频数分布。⑥散点图:适用于成对数据,反映散点分布的趋势。极差、四分位数间距、标准差、变异系数的适用范围有何异同?答:这四个指标的相同点在于均用于描述计量资料的离散程度。其不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,不宜用极差来比较资料的离散程度。四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。t检验、u检验和F检验的应用条件各是什么?

t检验的应用条件是:①σ未知而且n较小时,要求样本来自正态总体;②两小样本均数比较时,还要求两样本所属总体的方差相等。u检验的应用条件是:①σ已知;②σ未知但样本含量较大。方差分析的应用条件是:①各样本是相互独立的随机样本;②各样本来自正态总体;③各处理组总体方差相等。2.普通线图和半对数线图在制作和应用中有何主要区别?

普通线图绘制时,纵轴的尺度为算术尺度,并且一般应从“0”开始;而半对数线图纵坐标的尺度为对数尺度,起点没有0。应用上,普通线图反映某事物随时间变动的趋势或某现象随另一现象变迁的情况;而半对数线图用来比较两种或两种以上事物物随时间变动的速度(相对比)。应用相对数的注意事项应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性;(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。

简述率的标准化法的基本思想当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。例如比较两人群的死亡率、出生率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。简述非参数检验的适用资料。(1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性。简述进行直线相关回归分析应注意的事项(1)相关分析注意的事项相关系数r是用来描述两个变量间线性相关关系的密切程度和方向的统计指标。所以,如果目的是想定量地描述两个变量间相互关系的密切程度和方向,则应作相关分析。而且,r的绝对值大小,对利用回归方程进行变量预测具有指导意义,如果r的绝对值很小,利用回归方程从一个变量预测另一个变量的值是没有多大意义的。应用相关分析时应注意的问题:①进行相关分析时要有实际意义,不能把毫无关联的两事物或现象作相关分析。②相关关系不一定是因果关系,可能仅是表面上的伴随关系,或两个变量同时受另一因素的影响。③不能只根据相关系数绝对值的大小来推断两事物现象之间有无相关以及相关的密切程度,而必须进行相关系数的显著性检验。另外,不要把相关系数的显著性误解为两事物或现象相关的强度。④关于相关分析的样本的合并与分层问题,应审慎对待。⑤散点图在相关分析中具有重要作用,要充分利用。(2)回归分析的注意事项①作回归分析要有实际意义,不能把毫无关联的两种现象,随意进行回归分析,忽视事物现象间的内在联系和规律。②直线回归分析的资料,一般要求因变量Y是来自正态分布总体的随机变量,自变量X可以是正态随机变量,也可以是精确测量和严格控制的值。③进行回归分析时,应先绘制散点图。④绘制散点图后,若出现一些特大特小的离群值(异常点),则应及时复核检查。⑤回归直线不要外延。均数、几何均数和中位数的适用范围是什么?(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。

全距、四分位数间距、方差、标准差、变异系数各有何特点?(1)全距是一组观察值中最大值与最小值之差,计算简单,意义明了,但全距的不能反映组内其他观察值之间的离散情况,并且容易受个别特大值或特小值的影响,稳定性较差;(2)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度;(3)方差是离均差平方和的均数,克服了全距和四分位数间距不能反映组内每个观察值离散度的缺点,但方差把观察值的原度量单位变成了平方单位,导致计算结果难于解释;(4)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度;(5)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。1、统计资料可以分成几类?答:根据变量值的性质,可将统计资料分为数值变量资料(计量资料),无序分类变量资料(计数资料),有序分类变量资料(等级资料或半定量资料)。用定量方法测定某项指标量的大小,所得资料,即为计量资料;将观察对象按属性或类别分组,然后清点各组人数所得的资料,即为计数资料;按观察对象某种属性或特征不同程度分组,清点各组人数所得资料称为等级资料。2、不同类型统计资料之间的关系如何?答:根据分析需要,各类统计资料可以互相转化。如男孩的出生体重,属于计量资料,如按体重正常与否分两类,则资料转化为计数资料;如按体重分为:低体重,正常体重,超体重,则资料转化为等级资料。计数资料或等级资料也可经数量化后,转化为计量资料。如性别,结果为男或女,属于计数资料,如男性用0(或1),女性用1(或0)表示,则将计数资料转化为计量资料。3、频数分布有哪两个重要特征?答:频数分布有两个重要特征:集中趋势和离散趋势,是频数分布两个重要方面。将集中趋势和离散趋势结合起来分析,才能全面地反映事物的特征。一组同质观察值,其数值有大有小,但大多数观察值集中在某个数值范围,此种倾向称为集中趋势。另一方面有些观察值较大或较小,偏离观察值集中的位置较远,此种倾向称为离散趋势。4、标准差有什么用途?答:标准差是描述变量值离散程度常用的指标,主要用途如下:①描述变量值的离散程度。两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。②结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误。5、变异系数(CV)常用于哪几方面?答:变异系数是变异指标之一,它常用于以下两个方面:①比较均数相差悬殊的几组资料的变异度。如比较儿童的体重与成年人体重的变异度,应使用CV;②比较度量衡单位不同的几组资料的变异度。如比较同性别,同年龄人群的身高和体重的变异度时,宜用CV。6、制定参考值范围有几种方法?各自适用条件是什么?答:制定参考值范围常用方法有两种:①正态分布法:此法是根据正态分布的原理,依据公式:X±uS计算,仅适用于正态分布资料或对数正态分布资料。95%双侧参考值范围按:X±1.96S计算;95%单侧参考值范围是:以过低为异常者,则计算:X-1.645S,过高为异常者,计算X+1.645S。若为对数正态分布资料,先求出对数值的均数及标准差,求得正常值范围的界值后,反对数即可。②百分位数法。用P2.5~P97.5估计95%双侧参考值范围;P5或P95为95%单侧正常值范围。百分位数法适用于各种分布的资料(包括分布未知),计算较简便,快速。使用条件是样本含量较大,分布趋于稳定。一般应用于偏态分布资料、分布不明资料或开口资料。7、计量资料中常用的集中趋势指标及适用条件各是什么?答:常用的描述集中趋势的指标有:算术均数、几何均数及中位数。①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;②几何均数:用G表示,也称倍数均数,反映变量值平均增减的倍数,适用于等比资料,对数正态分布资料;③中位数:用M表示,中位数是一组观察值按大小顺序排列后,位置居中的那个观察值。它可用于任何分布类型的资料,但主要应用于偏态分布资料,分布不明资料或开口资料。8、标准差,标准误有何区别和联系?答:标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别:①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。联系:标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。9、统计推断包括哪几方面内容?答:统计推断包括:参数估计及假设检验两方面。参数估计是指由样本统计量(样本均数,率)来估计总体参数(总体均数及总体率),估计方法包括点值估计及区间估计。点值估计直接用样本统计量来代表总体参数,忽略了抽样误差;区间估计是按一定的可信度来估计总体参数所在的范围,按X±uσX或X±uSX来估计。假设检验是根据样本所提供的信息,推断总体参数是否相等。10、假设检验的目的和意义是什么?答:在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成:其一是抽样误差所致,其二是由于样本来自不同总体。如果是由于抽样误差原因引起的差别,则这种差异没有统计学意义,认为两个或两个以上的样本来自同一总体,;另一方面如果样本是来自不同的总体而引起的差异,则这种差异有统计学意义,说明两个或两个以上样本所代表的总体的参数不相等。样本统计量之间的差异是由什么原因引起,可以通过假设检验来确定。因此假设检验的目的是推断两个或多个样本所代表的总体的参数是否相等。何谓假设检验?其一般步骤是什么?所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。假设检验一般分为以下步骤:①建立假设:包括:H0,称无效假设;H1:称备择假设;②确定检验水准:检验水准用α表示,α一般取0.05;③计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P值;⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0,差别有统计学意义。12、假设检验有何特点?答:假设检验的特点是:①统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论