高等教育-医学统计学第二版高等教育出版社课后习题答案范本参考_第1页
高等教育-医学统计学第二版高等教育出版社课后习题答案范本参考_第2页
高等教育-医学统计学第二版高等教育出版社课后习题答案范本参考_第3页
高等教育-医学统计学第二版高等教育出版社课后习题答案范本参考_第4页
高等教育-医学统计学第二版高等教育出版社课后习题答案范本参考_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第PAGE第16页第一章 绪论举例说明总体和样本的概念。研究人员通常需要了解和研究某一类个体, 这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值 (即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的, 如研究药物疗效,某病患者是无限总体,后者指总体中的个体是有限的, 它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于 2019年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地 2019年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取 2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。简述误差的概念。误差泛指实测值与真实值之差, 一般分为随机误差和非随机误差。 随机误差是重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差, 系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。举例说明参数和统计量的概念。某项研究通常想知道关于总体的某些数值特征, 这些数值特征称为参数,如整城市的高血压患病率。根据样本算得的某些数值特征称为统计量, 如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。 一般情况下,这些参数是难以测定的, 仅能够根据样本估计。显然,只有当样本代表了总体时, 根据样本统计量估计的总体参数才是合理的。简述小概率事件原理。当某事件发生的概率小于或等于 0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小, 进而认为它在一次抽样中不可能发生, 这是所谓的小概率事件原理,它是进行统计推断的重要基础。第二章 调查研究设计调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素 (包括研究因素和非研究素是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。简述调查设计的基本内容。①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查试比较常用的四种概率抽样方法的优缺点。)单纯随机抽样 优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号, 比较麻烦,实际工作中有时难办到。)系统抽样 优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的, 其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。 但对于适合采用系统抽样的情形, 一旦确定抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差, 因此这样计算得到的抽样误差一般偏大。)分层抽样 优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。 点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。)整群抽样 优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差, 。常用的非概率抽样方法有哪些?有偶遇抽样、立意抽样、定额抽样、雪球抽样等。简述调查问题的顺序安排。调查问题顺序安排总原则:①符合逻辑②一般问题在前,特殊问题在后③易答题合全部调查对象,并采用跳答的形式安排问题和给出指导语。第四章 定量资料的统计描述均数、中位数、几何均数的适用范围有何异同?相同点是都用于描述定量资料的集中趋势。不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料②几何均数用于变量值间呈倍数关系的中位数用于不对称分布资料、两端无确切值的资料以及分布不明确的资料。同一资料的标准差是否一定小于均数?同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。 标准差大,表观察值之间变异大,即一组观察值的分布较分散; 标准差小。表示观察值之间变异小即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。极差、四分位数间距、标准差、变异系数的适用范围有何异同?相同点是都用于描述资料的离散程度。 不同点:①极差可用于描述单峰对称分小样本资料的离散程度,或用于初步了解资料的变异程度②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确的资料的离散程度③标准差用于描述正态分布或近似正态分布资料的离散程度④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。正态分布有哪些基本特征?①正态曲线在横轴上方均数处最高②正态分布以均数为中心, 左右对称③正态布有两个参数,即位置参数μ和形态参数σ④正态曲线下的面积分布有一定规律,正态曲线与横轴间的面积恒等于 1。曲线下区间(μ 内的面积为 区间(μ+2.58σ)内的面积为 99.00%制定医学参考值范围时,正态分布法和百分位数法分别适用于何种资料?取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。第五章、定性资料的统计描述应用相对数时需要注意哪些问题?①应有足够的观察单位数; ②不能以构成比代替率;③计算观察单位数不等的及格率的合计率和平均率时, 不能简单的把各组率相加求其平均值而得, 而应该别将分子和分母合计,再求出合计率和平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样品率或样品构成比的比较应作检验假设。为什么不能以构成比代替率?率是指某现象实际发生数和某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占比重,不能说明某现象发生的频率或强度大小。标准化率计算的直接法和间接法的应用有何区别?如对死亡率的年龄构成标准化, 当已知被标化组的年龄别死亡率时, 宜采用直接法;当不知道被标化组的年龄别死亡率, 只有年龄别人口数和死亡总数时, 可采用间接法。常用动态数列分析指标有哪几种?各有何用途?绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。期内个环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展速度;与平均增长速度是说明事物在一定时间内逐年的平均增长速度。率的标准化需要注意那些问题?①仅用于相互间的比较,实际水平应采用未标化率来反映。 ②样品的标化率是样品指标,存在抽样误差,若要比较其代表的总体标准化率是否相同, 需作假设验。③注意直接法和间接法的选用。 ④各年龄组若出现明显交叉, 或呈非平行变化趋势时,不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其他条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。第六章 总体均数的估计1、什么是均数的抽样误差?决定均数的抽样误差大小的因素有哪些?抽样研究中,由于同质总体中的个体间存在差异, 即个体变异,因而从同总体中随机抽取若干样本, 样本均数往往不等于总体均数, 且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。2、样本均数的抽样分布有何特点?样本均数的抽样分布特点有: 、各样本均数未必等于总体均数; 2、样本数之间存在差异;、样本均数服从正态分布; 、样本均数的变异范围较原变量的变异范围小;、随着样本含量的增加,样本均数的变异范围逐渐缩小。3、阐述标准差与标准误的区别与联系。标准差与标准误的区别在于: 1、计算公式不同; 、统计学意义:标准差越小,说明个体值相对越集中, 均数对数据的代表性越好; 而标准误越小,说明样本数的分布越集中,样本均数与总体均数的差别越小, 抽样误差越小,由样本均估计总体均数的可靠性越大; 3、用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。标准差与标准误的联系: 当样本量n一定时,标准误随标准差的增加而增加, 式为:看小抄。4、如何运用抽样分布规律估计总体均数?中心极限定理:从均数为 标准差为σ的正态总体中进行独立随机抽样,其样本均数服从均数为 标准差为σ/根号下u的正态分布;即使是从非正态总体中进行独立随机抽样,当样本含量逐渐增加时( n大于等于 ,其样本均数的分布近似于均数为 u,标准差为σ/根号下u的正态分布。σx越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。 反之,σx越小,抽样误差越小由样本均数估计总体均数的可靠性越大。5、阐述总体均数的置信区间与医学参考值范围的区别。区别区别均数的置信区间医学参考值范围意义估计的总体均数所在的区间范围大多数“正常人”的某项解剖、生理、生化指标的波动范围计算公式、σ未知⋯⋯;、σ未知而 n较大⋯⋯;、σ已知⋯⋯195%的参考值范围为(⋯⋯)用途用于总体均数的估计或判断观察对象的某项指假设检验标正常与否,为临床诊断提供参考第七章 假设检验1、解释零假设与备择假设的含义。零假设又称无效假设或无差异假设,记为H0,表示目前的差异是由抽样误差引起的;备择假设又称对立假设,记为H1,表示目前的差异是因为比较的对象之间存在本质不同造成的。2、简述假设检验的基本步骤。假设检验的基本步骤如下:(建立检验假设,确定检验水准。 (计算验统计量(确定P值,作出统计推断。3、比较单侧检验与双侧检验的区别。选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。 例如,在床试验中,比较甲、乙两种治疗方法的疗效有无差异, 目的只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。如果有充分的理由认为甲法疗效不比乙法差,此时应选用单侧检验。 若从专业角度无法确定的情况下, 一般采用双侧检验。4、解释I型错误、II 型错误和检验效能,并说明它们之间的关系。拒绝实际成立的 H0所犯的错误称为 I型错误,记为α。不拒绝实际不成立的 H0所犯的错误称为 II型错误,记为β。如果两个总体参数间确实存在差异, 即H1:μ≠μ0成立,按照现有检验水准,使用假设检验方法能够发现这种差异(即拒绝H0)的能力被称为检验效能,记为( 。三者的关系为:当样本量确定时,α与β成反比,与( 1-β)成正比。如果把设置得很小,势必增加犯 II 型错误的概率,从而降低检验效能;反之,如果把重点放在减少β上,势必增加犯 I型错误的概率,从而降低了置信度。要同时减小α和β,只有通过增加样本含量来实现。5、简述假设检验与置信区间估计的联系。假设检验与置信区间估计的联系是:二者都属于统计推断的范畴,且统计推断结与假设检验的作用是相辅相成的, 将两者结合起来,可以提供更为全面的统计推断信息。第八章 t检验1、在t检验中,一般当P〈,则拒绝H0,其理论根据是什么?理论根据是小概率时间和小概率反证法。P值表示H0成立时,出现等于及大于(或等于及小于)现有样本统计量的概率。〈0.05则表示在H0提下,得到现有样本统计量概率为小概率事件,所以拒绝H0。2、配对t检验的应用条件是什么?配对t检验的应用条件是资料为配对设计,且数据差值服从正态分布。3、正态性检验时,如何确定检验水准α ?理论上讲α应取得大一些, 如0.10或目的是减少犯 II型错误的概率在实际应用中,常取α 。4、变量变换的目的是什么?变量变换的目的在于使变换后的资料满足正态分布或方差齐性等条件, 便于进步的统计分析。第九章 方差分析1、方差分析的基本思想及其应用条件是什么?方差分析的基本思想是把全部观察值的总变异按设计类型分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较, 以判断各部分的变异是否具有统计学意义。应用条件:各样本是相互独立的随机样本, 且服从正态分布各样本的总体方差齐性。2、在完全随机设计方差分析中 SS总、SS组间、SS组内各表示什么含义?SS总是各观察值与总均值之差的平方和,即总离均差平方和,表示总变异的大小;SS组间表示组间变异,指各处理组均值大小的不同,是由处理因素和随机误差造成的; SS组内表示组内变异,指同一处理组内部各观察值之间的变异,是由随机误差造成的。3、什么是交互效应?请举例说明。交互效应是指某一因素的效应随另一因素不同水平的变化而变化, 称这两个因素之间存在交互效应。例如:某实验研究 AB两种药物在不同剂量情况下对某病的治疗效果,药物 A在不同剂量时,B药的效应不同,或者药物 B在不剂量时,A药的效应不同,则 A、B两药间存在交互效应。4、重复测量资料具有何种特点?重复测量资料中的处理因素在受试者间是随机分配的, 受试者内的因素即间因素是固定的,不能随机分配;重复测量资料各受试者内的数据彼此不独立,具有相关性,后一个时间点的数据可能受到前面数据的影响, 而且时间点离的近的数据相关性越高。5别需要进行多重比较?方差分析中备择假设是多个总体均数不等或不全相等, 拒绝原假设只说明多个体均数总的来说差别有统计学意义,并不能说明任意两总体均数之间均有差别。因此,若希望进一步了解两两的差别,需进行多重比较。第十章、二项分布和 Poisson分布Bernoulli 试验的适用条件答:1.每次试验只会发生两种互斥结果之一,即两种互斥结果的概率之和恒等于在相同试验条件下,每次试验产生某种结果的概率固定不变; 3.重复试验互相独立的,即任何一次试验结果的出现不会影响其他试验结果出现的概率。Poisson分布的性质答总体均数μ与总体方差相等; 当n很大,而π很小,且为常数时Poisson分布可看作是二项分布的极限分布; 3.当μ增大时,Poisson分布渐近正太分布,一般而言μ≥ 20时,Poisson分布资料可作为正态分布处理; 4.Poisson分布具备可加性; 的大小决定了 Poisson分布的图形特征二项分布与 Poisson分布的区别答:随机变量 X服从二项分布,是指在 n重Bernoulli试验中,发生某种结果的次数X=0n的一种概率分布,其恰好发生 X个阳性的概率为 X)=(公式且总有概率总和=1.而随机变量 X服从Poisson分布,是指X满足①取值范围为 ,,⋯,;②相应的概率为 (X)=eμ·μx/X,且总有概率总和在总体率π很小,而样本含量n趋向于无穷大时,二项分布近似于 分布。因此 Poisson分布可看作是二项分布的一种极限情况,可用来描述小概率事件的发生规律。4.二项分布、Poisson分布和正态分布的联系答在n很大,而π很小,且nπ=μ为常数时,二项分布的极限分布为 分布;在n较大、π不接近 0也不接近1时,二项分布 近似正态分布,而相应的样本率 p的分布也近似正态分布; 当μ增大时,Poisson分布渐近正态分布,一般μ≥ 20时,Poisson分布资料可作为正态分布处理。第十一章、 x2检验x2检验的基本思想是什么?可以用于解决哪些问题?答:基本思想:在 H0成立的条件下,推算出各个格子的理论频数 T,然后利用理论频数T和实际频数 A构造x2统计量公式反映实际频数与理论频数的吻合程度。若无效假设 H0成立,则各个格子的 A与T相差不应该很大,即 统计量不应该很大。 A与T相差越大,x2值越大,相对应的 P值越小,当 α,则越有理由认为无效假设不成立,继而拒绝 H0,作出统计推断。由于格子越多,x2值也会越大,因而考虑 x2值大小的意义时,应同时考虑格子数的多少,这样x2值才能更准确地反映 A与T的吻合程度。x2比较,频数分布的拟合优度检验,线性趋势检验。四格表的Z检验和x2检验有何联系答:能用四格表Z检验进行两样本率比较的资料,都可以用x2检验。四格表的双侧Z检验与x2检验是完全等价的,两个统计量的关系为Z2=x2,相对应的界值关系为Z2(底数0.05/2)=x2(底数0.05,1)拟合优度x2检验的基本思想及用途用x2检验,推断实际频数与理论频数的吻合程度。为什么有些四格表资料的假设检验必须用确切概率法答:x2检验的理论是基于 x2分布,但是只有在大样本时检验统计量才近似服从x2分布,才能使用 x2检验公式。如四格表资料,若 n≥40,且有1≤T<5时尚可以校正检验统计量使其近似服从 x2分布;当40时这种近似性就很差,x2检验就不适用了,只能用确切概率法。x2检验的应用条件有哪些?答:当n≥40,且≥5时,用非连续校正的 x2检验 (公式)②当n≥40,且有1≤T<5时,用连续性校正的 x2检验或用四格表的确切概法(公式)③当n<40或T<1时,用四格表确切概率法。独立样本 R×C列联表x2检验的专用公式为:。。①不宜有1/5以上格子的理论频数小于 或有1个格子的理论频数小于 1.②结果为有序多分类变量的 R×C列联表,在比较各处理组的平均效应有无差时,应该用秩和检验或 Ridit检验。配对四格表的 x2检验①当40公式)②当b+c<40时,作连续性校正,(公式)第十二章、秩和检验参数检验和非参数检验的区别答参数检验是以特定的总体分布为前提, 对未知总体参数做推断的假设检验方法非参数检验不以特定的总体分布为前提, 也不针对决定总体分布的参数做推断,又称任意分布检验。非参数检验不要求总体的分布类型,适用性广泛;在非参数检验中,一般不直接用样本观测值做分析, 统计量的计算基于原数据在样中的秩次,因此对于符合参数检验的资料, 或经变量变换后符合参数检验的资料应首选参数检验;对不满足参数检验条件的资料,应选用非参数检验。非参数检验的适用范围答:①总体分布不明或未知的资料; ②一端或两端有不确实数值的资料; ③等资料;④极度偏态分布的资料。同一资料,又出于同一研究目的,当参数检验和非参数检验所得结果不一致时答:应以资料满足的条件为准。 若资料满足参数检验的条件, 应以参数检验的结果为准,此时非参数检验的检验效能低于参数检验。 若资料不服从正态分布, 者分布情况未知,不能用参数法进行推断,宜采用非参数法对总体分布位置进行假设检验。第十三章 双变量关联性分析1.两变量间的关联性是否可解释为因果关系?双变量关联性分析的目的在于推断从某一总体中随机抽取的同一份样本观测出的两个关联间是否存在关联性,以及这种关联性的密切程度如何。关联性只反应变量间数量上的关系,但数量上的关联并不表示专业上的因果关系,是否确为因果关系还需结合专业知识、因果逻辑上的时间先后顺序等作进一步判定。2.2X2列联表的关联性分析与两样本率的比较的x2检验有何不同?2X2列联表的关联性分析与两样本率比较的 x2检验是从两个检验的数据形式非常相似,x2检验的公式以及应用条件也完全不同。 但区别在于:两样本率比较x2检验是从两个总体中分别抽取样本, 两样本有各自的频数分布, 所检验的是总体的率是否相同;而 2X2列联表的关联性分析是从同一个总体中进行随机抽样对样本中的每个个体考察其两个变量的关系, 检验两个分类之间是否存在关联性或者说是否独立。3、相关系数 r经假设检验有统计学意义,且得到的 P值很小,是否表示两变间一定有很强的直线关系?P值越小,说明越有理由拒绝 H0,犯I型错误的概率越小。相关系数 r经设检验有统计学意义且得到非常小的 P值表示有足够的理由认为两变量总体相关系数ρ≠0,只能定性回答两变量是否存在直线相关,并非意味着其直线相关的强度。若要定量回答相关性的强弱,需结合样本相关系数 r的大小和总体相系数ρ的置信区间来说明。4.Pearson积矩相关与 Spearman秩相关的区别与联系答:区别1.积矩相关适用于二元正态分布资料, 秩相关适用于不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料。 ②积矩相关是基于原始数据进行统计分析, 而秩相关是将原始数据进行秩变换后进行统计分析。积矩相关是参数检验方法,而秩相关不以特定的总体分布为前提,为非参数检验的方法。两种相关系数的取值都介于—1和1之间,无单位,小于0大于0为正相关。用原始数据的秩次来计算Pearson相关系数,得到的即为秩相关系数。第十五章生存分析简述生存分析中截尾数据的常见原因。①失访:指失去联系。②退出:指死于非研究因素或非处理因素而退出研究。③终止:指设计时规定的研究时限已到而终止观察,但研究对象依然存活。简述生存率和生存概率的区别与联系。生存概率表示某单位时段开始时存活个体到该时段结束时仍存活的可能性大小;生存率是指观察对象活过某时刻的概率, 实质上是累积生存概率。生存概率是位时段的概率,生存率是多个时段的累计结果。简述死亡率和死亡概率的区别与联系。死亡概率是指在某个单位时段开始时存活的个体在该时段内死亡的可能性大小;死亡率表示所有观察对象在某时刻的平均死亡水平。 二者分母不同,死亡率的母常用其中人口数,而死亡概率则用期初人数。生存时间资料能计算均数和标准差吗?如果资料所包含的数据都是完全数据, 可以计算均数和标准差;若资料中包含尾数据,则不可以计算。简述两样本比较的生存时间资料不宜采用 t检验或x方检验进行分析的理由。因为随访资料具有特殊性,观察对象既有随访时间又有随访结果,随访期间可能出现失访等,生存时间数据不完整,分布类型复杂,因而不能简单的应用t检验或x方检验。第二十章检测手段的效度和信度评价简述效度、信度的概念和目的。效度用以反映测量结果与“真值”的接近程度。信度用以反映相同条件下重发测定结果的一致程度。评价效度、信度的目的是评价量表对真实情况反映的准确性、可靠性。简述评价效度和信度的常用方法及其特点。评价效度的常用方法有:标准效度分析、内容效度分析、结构效度分析、区分效度分析。评价信度的常用方法有:重复测量法、分半信度法、 Cronbach’sa数法。特点标准效度分析需要一个“金标准”作为参考;内容效度分析对概念的定义有依赖性;结构效度分析需借助因子分析来完成;区分效度分析通过 t检验或方差分析可比较不同群组间的差别有无统计学意义。 重复测量法需要重复两次或两次以上测量;分半信度法将调查的问题条目分成两半; Cronbach’sa数法适用于奇偶两半条目方差不等的情况。简述分半信度法的优点和不足。优点:分半信度法只在一个时间点上进行;不受记忆效应的影响;在重复测量法中容易出现的误差项之间的相关在分半信度法中不易出现;分半信度法比较经济和简便。同的结果。简述如何考察测量手段和反应度。①使用测量手段分别在治疗前后或施加干预措施前后对研究对象进行测量, 记治疗前后或施加干预措施前后的测量结果。②使用效应尺度统计量评价测量的反应度。效应尺度 =(治疗后得分—治疗前分)/治疗前后得分的标准差第二十一章 医学人口与疾病统计常用指标疾病统计中的观察单位“病例”和“病人”有何区别?疾病统计的观察单位可以是病人,也可以是病例。一个人每发生一次疾病就算是一个病例,一个病人可以先后数次患同一种疾病,也可以同时患数种不同的疾病。发病率、时点患病率、期间患病率有何区别?发病率表示在一定时期内, 可能发生某病的一定人群中新病例出现的频率, 其子是一定期间内的新发病例数。 患病率指在某特定时间内总人口中某病新旧病例所占比例,适用于病程较长的疾病或发病时间不易轻易明确的疾病的统计研究,按观察时间的不同可分为时点患病率和期间患病率。 时点患病率用于反映在调查或检查时点一定人群中某病的现患情况(包含该病的新、旧病例) ;期间患病率可用于反映在观察期间内一定人群存在或流行某病的频度, 包括观察期间内的病例数和现患病例数,但资料收集较为困难。年龄别死亡概率与年龄别死亡率有何区别?两者间有什么关系?年龄别死亡概率( nqx)是表示一批人在 x到x+n岁之间的死亡概率,即同时出生的人群中,刚满x岁的尚存者在今后 n年内死亡的可能性。因此,死亡概率公式定义为:nqx=(x岁到x+n岁之间死亡人数) /活满x岁的人口数而年龄别死亡率(nmx)是表示某年龄别人口在n年内的平均死亡水平,其公式定义为:nmx=(x岁到x+n岁之间死亡人数)/(x岁到x+n岁之间的平均人口数)可见,两者分母不同,当年龄分组为 1岁时,即n=1时,qx比mx略小,年龄分组大于 1岁时,即n〉1时,则nqx约比nmx大n倍。死亡率与死亡概率之间可以互相换算,现有许多种由 nmx推算nqx的方法,目前常用的计算死亡概率的公式为:nqx=2*n*nmx/(2+n*nmx)平均寿命与平均死亡年龄有何区别?平均寿命实际上是同时出生的一批人, 以各年龄组死亡人数作为权数计算出来的平均岁数,其大小取决于各年龄组死亡人数的相对水平。 用寿命表方法计算的平均寿命的大小,仅取决于年龄别死亡率的高低, 两地的平均寿命可以直接比较。但平均死亡年龄的大小, 不仅取决于年龄别死亡率的高低, 也取决于年龄人口构成。如用甲、乙两地的平均死亡年龄作比较, 即使两地的年龄组死亡率完全相同,若甲地人口中青壮年比重较大, 而老年人比重较小,可导致甲地平均死亡年龄较低。显然,这种平均死亡年龄的差别,是由于人口年龄构成不同所致,并不反映两地人口的平均寿命不同。 因此,一般情况下,两地的平均死亡年龄不能直接比较,不能把平均死亡年龄当作平均寿命应用。某地的平均寿命高,则老年人口占总人口数的比例一定很高, 这种说法对吗?这种说法不正确。用寿命表法计算的平均寿命, 其大小仅取决于年龄别死亡率的高低,某地的平均寿命高,并不表明老年人口所占的比例高。 如果人群的第PAGE第18页龄别死亡率降低,尤其是婴幼儿组死亡率降低,该地人群的平均寿命就会增高。卫生管理制度1 总则1.1 为了加强公司的环境卫生管理,创造一个整洁、文明、温馨的购物、办公环境,根据《公共场所卫生管理条例》的要求,特制定本制度。1.2 集团公司的卫生管理部门设在企管部,并负责将集团公司的卫生区域详细划分到各部室,各分公司所辖区域卫生由分公司客服部负责划分,确保无遗漏。2 卫生标准2.1 室内卫生标准2.1.1 地面、墙面:无灰尘、无纸屑、无痰迹、无泡泡糖等粘合物、无积水,墙角无灰吊、无蜘蛛网。2.1.2 门、窗、玻璃、镜子、柱子、电梯、楼梯、灯具等,做到明亮、无灰尘、无污迹、无粘合物,特别是玻璃,要求两面明亮。2.1.3 柜台、货架:清洁干净,货架、柜台底层及周围无乱堆乱放现象、无灰尘、无粘合物,货架顶部、背部和底部干净,不存放杂物和私人物品。2.1.4 购物车(筐)、直接接触食品的售货工具(包括刀、叉等):做到内外洁净,无污垢和粘合物等。购物车(筐)要求每天营业前简单清理,周五全面清理消毒;售货工具要求每天消毒,并做好记录。2.1.5 商品及包装:商品及外包装清洁无灰尘(外包装破损的或破旧的不得陈列)。2.1.6 收款台、服务台、办公橱、存包柜:保持清洁、无灰尘,台面和侧面无灰尘、无灰吊和蜘蛛网。桌面上不得乱贴、乱画、乱堆放物品,用具摆放有序且干净,除当班的购物小票收款联外,其它单据不得存放在桌面上。2.1.7 垃圾桶:桶内外干净,要求营业时间随时清理,不得溢出,每天下班前彻底清理,不得留有垃圾过夜。2.1.8 窗帘:定期进行清理,要求干净、无污渍。2.1.9 吊饰:屋顶的吊饰要求无灰尘、无蜘蛛网,短期内不适用的吊饰及时清理彻底。2.1.10 内、外仓库:半年彻底清理一次,无垃圾、无积尘、无蜘蛛网等。2.1.11 室内其他附属物及工作用具均以整洁为准,要求无灰尘、无粘合物等污垢。第一章 绪论举例说明总体和样本的概念。研究人员通常需要了解和研究某一类个体, 这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值 (即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的, 如研究药物疗效,某病患者是无限总体,后者指总体中的个体是有限的, 它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于 2019年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地 2019年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取 2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。简述误差的概念。误差泛指实测值与真实值之差, 一般分为随机误差和非随机误差。 随机误差是重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差, 系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。举例说明参数和统计量的概念。某项研究通常想知道关于总体的某些数值特征, 这些数值特征称为参数,如整城市的高血压患病率。根据样本算得的某些数值特征称为统计量, 如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。 一般情况下,这些参数是难以测定的, 仅能够根据样本估计。显然,只有当样本代表了总体时, 根据样本统计量估计的总体参数才是合理的。简述小概率事件原理。当某事件发生的概率小于或等于 0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小, 进而认为它在一次抽样中不可能发生, 这是所谓的小概率事件原理,它是进行统计推断的重要基础。第二章 调查研究设计调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素 (包括研究因素和非研究素是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。简述调查设计的基本内容。①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查试比较常用的四种概率抽样方法的优缺点。)单纯随机抽样 优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号, 比较麻烦,实际工作中有时难办到。)系统抽样 优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的, 其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。 但对于适合采用系统抽样的情形, 一旦确定抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差, 因此这样计算得到的抽样误差一般偏大。)分层抽样 优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。 点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。)整群抽样 优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差, 。常用的非概率抽样方法有哪些?有偶遇抽样、立意抽样、定额抽样、雪球抽样等。简述调查问题的顺序安排。调查问题顺序安排总原则:①符合逻辑②一般问题在前,特殊问题在后③易答题合全部调查对象,并采用跳答的形式安排问题和给出指导语。第四章 定量资料的统计描述均数、中位数、几何均数的适用范围有何异同?相同点是都用于描述定量资料的集中趋势。不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料②几何均数用于变量值间呈倍数关系的中位数用于不对称分布资料、两端无确切值的资料以及分布不明确的资料。同一资料的标准差是否一定小于均数?同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。 标准差大,表观察值之间变异大,即一组观察值的分布较分散; 标准差小。表示观察值之间变异小即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。极差、四分位数间距、标准差、变异系数的适用范围有何异同?相同点是都用于描述资料的离散程度。 不同点:①极差可用于描述单峰对称分小样本资料的离散程度,或用于初步了解资料的变异程度②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确的资料的离散程度③标准差用于描述正态分布或近似正态分布资料的离散程度④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。正态分布有哪些基本特征?①正态曲线在横轴上方均数处最高②正态分布以均数为中心, 左右对称③正态布有两个参数,即位置参数μ和形态参数σ④正态曲线下的面积分布有一定规律,正态曲线与横轴间的面积恒等于 1。曲线下区间(μ 内的面积为 区间(μ+2.58σ)内的面积为 99.00%制定医学参考值范围时,正态分布法和百分位数法分别适用于何种资料?取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。第五章、定性资料的统计描述应用相对数时需要注意哪些问题?①应有足够的观察单位数; ②不能以构成比代替率;③计算观察单位数不等的及格率的合计率和平均率时, 不能简单的把各组率相加求其平均值而得, 而应该别将分子和分母合计,再求出合计率和平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样品率或样品构成比的比较应作检验假设。为什么不能以构成比代替率?率是指某现象实际发生数和某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占比重,不能说明某现象发生的频率或强度大小。标准化率计算的直接法和间接法的应用有何区别?如对死亡率的年龄构成标准化, 当已知被标化组的年龄别死亡率时, 宜采用直接法;当不知道被标化组的年龄别死亡率, 只有年龄别人口数和死亡总数时, 可采用间接法。常用动态数列分析指标有哪几种?各有何用途?绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。期内个环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展速度;与平均增长速度是说明事物在一定时间内逐年的平均增长速度。率的标准化需要注意那些问题?①仅用于相互间的比较,实际水平应采用未标化率来反映。 ②样品的标化率是样品指标,存在抽样误差,若要比较其代表的总体标准化率是否相同, 需作假设验。③注意直接法和间接法的选用。 ④各年龄组若出现明显交叉, 或呈非平行变化趋势时,不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其他条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。第六章 总体均数的估计1、什么是均数的抽样误差?决定均数的抽样误差大小的因素有哪些?抽样研究中,由于同质总体中的个体间存在差异, 即个体变异,因而从同总体中随机抽取若干样本, 样本均数往往不等于总体均数, 且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。2、样本均数的抽样分布有何特点?样本均数的抽样分布特点有: 、各样本均数未必等于总体均数; 2、样本数之间存在差异;、样本均数服从正态分布; 、样本均数的变异范围较原变量的变异范围小;、随着样本含量的增加,样本均数的变异范围逐渐缩小。3、阐述标准差与标准误的区别与联系。标准差与标准误的区别在于: 1、计算公式不同; 、统计学意义:标准差越小,说明个体值相对越集中, 均数对数据的代表性越好; 而标准误越小,说明样本数的分布越集中,样本均数与总体均数的差别越小, 抽样误差越小,由样本均估计总体均数的可靠性越大; 3、用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。标准差与标准误的联系: 当样本量n一定时,标准误随标准差的增加而增加, 式为:看小抄。4、如何运用抽样分布规律估计总体均数?中心极限定理:从均数为 标准差为σ的正态总体中进行独立随机抽样,其样本均数服从均数为 标准差为σ/根号下u的正态分布;即使是从非正态总体中进行独立随机抽样,当样本含量逐渐增加时( n大于等于 ,其样本均数的分布近似于均数为 u,标准差为σ/根号下u的正态分布。σx越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。 反之,σx越小,抽样误差越小由样本均数估计总体均数的可靠性越大。5、阐述总体均数的置信区间与医学参考值范围的区别。区别区别均数的置信区间医学参考值范围意义估计的总体均数所在的区间范围大多数“正常人”的某项解剖、生理、生化指标的波动范围计算公式、σ未知⋯⋯;、σ未知而 n较大⋯⋯;、σ已知⋯⋯195%的参考值范围为(⋯⋯)用途用于总体均数的估计或判断观察对象的某项指假设检验标正常与否,为临床诊断提供参考第七章 假设检验1、解释零假设与备择假设的含义。零假设又称无效假设或无差异假设,记为H0,表示目前的差异是由抽样误差引起的;备择假设又称对立假设,记为H1,表示目前的差异是因为比较的对象之间存在本质不同造成的。2、简述假设检验的基本步骤。假设检验的基本步骤如下:(建立检验假设,确定检验水准。 (计算验统计量(确定P值,作出统计推断。3、比较单侧检验与双侧检验的区别。选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。 例如,在床试验中,比较甲、乙两种治疗方法的疗效有无差异, 目的只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。如果有充分的理由认为甲法疗效不比乙法差,此时应选用单侧检验。 若从专业角度无法确定的情况下, 一般采用双侧检验。4、解释I型错误、II 型错误和检验效能,并说明它们之间的关系。拒绝实际成立的 H0所犯的错误称为 I型错误,记为α。不拒绝实际不成立的 H0所犯的错误称为 II型错误,记为β。如果两个总体参数间确实存在差异, 即H1:μ≠μ0成立,按照现有检验水准,使用假设检验方法能够发现这种差异(即拒绝H0)的能力被称为检验效能,记为( 。三者的关系为:当样本量确定时,α与β成反比,与( 1-β)成正比。如果把设置得很小,势必增加犯 II 型错误的概率,从而降低检验效能;反之,如果把重点放在减少β上,势必增加犯 I型错误的概率,从而降低了置信度。要同时减小α和β,只有通过增加样本含量来实现。5、简述假设检验与置信区间估计的联系。假设检验与置信区间估计的联系是:二者都属于统计推断的范畴,且统计推断结与假设检验的作用是相辅相成的, 将两者结合起来,可以提供更为全面的统计推断信息。第八章 t检验1、在t检验中,一般当P〈,则拒绝H0,其理论根据是什么?理论根据是小概率时间和小概率反证法。P值表示H0成立时,出现等于及大于(或等于及小于)现有样本统计量的概率。〈0.05则表示在H0提下,得到现有样本统计量概率为小概率事件,所以拒绝H0。2、配对t检验的应用条件是什么?配对t检验的应用条件是资料为配对设计,且数据差值服从正态分布。3、正态性检验时,如何确定检验水准α ?理论上讲α应取得大一些, 如0.10或目的是减少犯 II型错误的概率在实际应用中,常取α 。4、变量变换的目的是什么?变量变换的目的在于使变换后的资料满足正态分布或方差齐性等条件, 便于进步的统计分析。第九章 方差分析1、方差分析的基本思想及其应用条件是什么?方差分析的基本思想是把全部观察值的总变异按设计类型分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较, 以判断各部分的变异是否具有统计学意义。应用条件:各样本是相互独立的随机样本, 且服从正态分布各样本的总体方差齐性。2、在完全随机设计方差分析中 SS总、SS组间、SS组内各表示什么含义?SS总是各观察值与总均值之差的平方和,即总离均差平方和,表示总变异的大小;SS组间表示组间变异,指各处理组均值大小的不同,是由处理因素和随机误差造成的; SS组内表示组内变异,指同一处理组内部各观察值之间的变异,是由随机误差造成的。3、什么是交互效应?请举例说明。交互效应是指某一因素的效应随另一因素不同水平的变化而变化, 称这两个因素之间存在交互效应。例如:某实验研究 AB两种药物在不同剂量情况下对某病的治疗效果,药物 A在不同剂量时,B药的效应不同,或者药物 B在不剂量时,A药的效应不同,则 A、B两药间存在交互效应。4、重复测量资料具有何种特点?重复测量资料中的处理因素在受试者间是随机分配的, 受试者内的因素即间因素是固定的,不能随机分配;重复测量资料各受试者内的数据彼此不独立,具有相关性,后一个时间点的数据可能受到前面数据的影响, 而且时间点离的近的数据相关性越高。5别需要进行多重比较?方差分析中备择假设是多个总体均数不等或不全相等, 拒绝原假设只说明多个体均数总的来说差别有统计学意义,并不能说明任意两总体均数之间均有差别。因此,若希望进一步了解两两的差别,需进行多重比较。第十章、二项分布和 Poisson分布Bernoulli 试验的适用条件答:1.每次试验只会发生两种互斥结果之一,即两种互斥结果的概率之和恒等于在相同试验条件下,每次试验产生某种结果的概率固定不变; 3.重复试验互相独立的,即任何一次试验结果的出现不会影响其他试验结果出现的概率。Poisson分布的性质答总体均数μ与总体方差相等; 当n很大,而π很小,且为常数时Poisson分布可看作是二项分布的极限分布; 3.当μ增大时,Poisson分布渐近正太分布,一般而言μ≥ 20时,Poisson分布资料可作为正态分布处理; 4.Poisson分布具备可加性; 的大小决定了 Poisson分布的图形特征二项分布与 Poisson分布的区别答:随机变量 X服从二项分布,是指在 n重Bernoulli试验中,发生某种结果的次数X=0n的一种概率分布,其恰好发生 X个阳性的概率为 X)=(公式且总有概率总和=1.而随机变量 X服从Poisson分布,是指X满足①取值范围为 ,,⋯,;②相应的概率为 (X)=eμ·μx/X,且总有概率总和在总体率π很小,而样本含量n趋向于无穷大时,二项分布近似于 分布。因此 Poisson分布可看作是二项分布的一种极限情况,可用来描述小概率事件的发生规律。4.二项分布、Poisson分布和正态分布的联系答在n很大,而π很小,且nπ=μ为常数时,二项分布的极限分布为 分布;在n较大、π不接近 0也不接近1时,二项分布 近似正态分布,而相应的样本率 p的分布也近似正态分布; 当μ增大时,Poisson分布渐近正态分布,一般μ≥ 20时,Poisson分布资料可作为正态分布处理。第十一章、 x2检验x2检验的基本思想是什么?可以用于解决哪些问题?答:基本思想:在 H0成立的条件下,推算出各个格子的理论频数 T,然后利用理论频数T和实际频数 A构造x2统计量公式反映实际频数与理论频数的吻合程度。若无效假设 H0成立,则各个格子的 A与T相差不应该很大,即 统计量不应该很大。 A与T相差越大,x2值越大,相对应的 P值越小,当 α,则越有理由认为无效假设不成立,继而拒绝 H0,作出统计推断。由于格子越多,x2值也会越大,因而考虑 x2值大小的意义时,应同时考虑格子数的多少,这样x2值才能更准确地反映 A与T的吻合程度。x2比较,频数分布的拟合优度检验,线性趋势检验。四格表的Z检验和x2检验有何联系答:能用四格表Z检验进行两样本率比较的资料,都可以用x2检验。四格表的双侧Z检验与x2检验是完全等价的,两个统计量的关系为Z2=x2,相对应的界值关系为Z2(底数0.05/2)=x2(底数0.05,1)拟合优度x2检验的基本思想及用途用x2检验,推断实际频数与理论频数的吻合程度。为什么有些四格表资料的假设检验必须用确切概率法答:x2检验的理论是基于 x2分布,但是只有在大样本时检验统计量才近似服从x2分布,才能使用 x2检验公式。如四格表资料,若 n≥40,且有1≤T<5时尚可以校正检验统计量使其近似服从 x2分布;当40时这种近似性就很差,x2检验就不适用了,只能用确切概率法。x2检验的应用条件有哪些?答:当n≥40,且≥5时,用非连续校正的 x2检验 (公式)②当n≥40,且有1≤T<5时,用连续性校正的 x2检验或用四格表的确切概法(公式)③当n<40或T<1时,用四格表确切概率法。独立样本 R×C列联表x2检验的专用公式为:。。①不宜有1/5以上格子的理论频数小于 或有1个格子的理论频数小于 1.②结果为有序多分类变量的 R×C列联表,在比较各处理组的平均效应有无差时,应该用秩和检验或 Ridit检验。配对四格表的 x2检验①当40公式)②当b+c<40时,作连续性校正,(公式)第十二章、秩和检验参数检验和非参数检验的区别答参数检验是以特定的总体分布为前提, 对未知总体参数做推断的假设检验方法非参数检验不以特定的总体分布为前提, 也不针对决定总体分布的参数做推断,又称任意分布检验。非参数检验不要求总体的分布类型,适用性广泛;在非参数检验中,一般不直接用样本观测值做分析, 统计量的计算基于原数据在样中的秩次,因此对于符合参数检验的资料, 或经变量变换后符合参数检验的资料应首选参数检验;对不满足参数检验条件的资料,应选用非参数检验。非参数检验的适用范围答:①总体分布不明或未知的资料; ②一端或两端有不确实数值的资料; ③等资料;④极度偏态分布的资料。同一资料,又出于同一研究目的,当参数检验和非参数检验所得结果不一致时答:应以资料满足的条件为准。 若资料满足参数检验的条件, 应以参数检验的结果为准,此时非参数检验的检验效能低于参数检验。 若资料不服从正态分布, 者分布情况未知,不能用参数法进行推断,宜采用非参数法对总体分布位置进行假设检验。第十三章 双变量关联性分析1.两变量间的关联性是否可解释为因果关系?双变量关联性分析的目的在于推断从某一总体中随机抽取的同一份样本观测出的两个关联间是否存在关联性,以及这种关联性的密切程度如何。关联性只反应变量间数量上的关系,但数量上的关联并不表示专业上的因果关系,是否确为因果关系还需结合专业知识、因果逻辑上的时间先后顺序等作进一步判定。2.2X2列联表的关联性分析与两样本率的比较的x2检验有何不同?2X2列联表的关联性分析与两样本率比较的 x2检验是从两个检验的数据形式非常相似,x2检验的公式以及应用条件也完全不同。 但区别在于:两样本率比较x2检验是从两个总体中分别抽取样本, 两样本有各自的频数分布, 所检验的是总体的率是否相同;而 2X2列联表的关联性分析是从同一个总体中进行随机抽样对样本中的每个个体考察其两个变量的关系, 检验两个分类之间是否存在关联性或者说是否独立。3、相关系数 r经假设检验有统计学意义,且得到的 P值很小,是否表示两变间一定有很强的直线关系?P值越小,说明越有理由拒绝 H0,犯I型错误的概率越小。相关系数 r经设检验有统计学意义且得到非常小的 P值表示有足够的理由认为两变量总体相关系数ρ≠0,只能定性回答两变量是否存在直线相关,并非意味着其直线相关的强度。若要定量回答相关性的强弱,需结合样本相关系数 r的大小和总体相系数ρ的置信区间来说明。4.Pearson积矩相关与 Spearman秩相关的区别与联系答:区别1.积矩相关适用于二元正态分布资料, 秩相关适用于不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料。 ②积矩相关是基于原始数据进行统计分析, 而秩相关是将原始数据进行秩变换后进行统计分析。积矩相关是参数检验方法,而秩相关不以特定的总体分布为前提,为非参数检验的方法。两种相关系数的取值都介于—1和1之间,无单位,小于0大于0为正相关。用原始数据的秩次来计算Pearson相关系数,得到的即为秩相关系数。第十五章生存分析简述生存分析中截尾数据的常见原因。①失访:指失去联系。②退出:指死于非研究因素或非处理因素而退出研究。③终止:指设计时规定的研究时限已到而终止观察,但研究对象依然存活。简述生存率和生存概率的区别与联系。生存概率表示某单位时段开始时存活个体到该时段结束时仍存活的可能性大小;生存率是指观察对象活过某时刻的概率, 实质上是累积生存概率。生存概率是位时段的概率,生存率是多个时段的累计结果。简述死亡率和死亡概率的区别与联系。死亡概率是指在某个单位时段开始时存活的个体在该时段内死亡的可能性大小;死亡率表示所有观察对象在某时刻的平均死亡水平。 二者分母不同,死亡率的母常用其中人口数,而死亡概率则用期初人数。生存时间资料能计算均数和标准差吗?如果资料所包含的数据都是完全数据, 可以计算均数和标准差;若资料中包含尾数据,则不可以计算。简述两样本比较的生存时间资料不宜采用 t检验或x方检验进行分析的理由。因为随访资料具有特殊性,观察对象既有随访时间又有随访结果,随访期间可能出现失访等,生存时间数据不完整,分布类型复杂,因而不能简单的应用t检验或x方检验。第二十章检测手段的效度和信度评价简述效度、信度的概念和目的。效度用以反映测量结果与“真值”的接近程度。信度用以反映相同条件下重发测定结果的一致程度。评价效度、信度的目的是评价量表对真实情况反映的准确性、可靠性。简述评价效度和信度的常用方法及其特点。评价效度的常用方法有:标准效度分析、内容效度分析、结构效度分析、区分效度分析。评价信度的常用方法有:重复测量法、分半信度法、 Cronbach’sa数法。特点标准效度分析需要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论