卫生统计学习题及答案(精华版)_第1页
卫生统计学习题及答案(精华版)_第2页
卫生统计学习题及答案(精华版)_第3页
卫生统计学习题及答案(精华版)_第4页
卫生统计学习题及答案(精华版)_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学习题二、简答1 .简述描述一组资料的集中趋势和离散趋势的指标。集中趋势和离散趋势是定量资料中总体分布的两个重要指标。( 1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数) 、百分位数(是一种位置参数,用于确定医学参考值范围,P50 就是中位数) 、众数。算术均数: 适用于对称分布资料, 特别是正态分布资料或近似正态分布资料; 几何均数:对数正态分布资料(频率图一般呈正偏峰分布) 、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。( 2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距: 适用于各种分布的

2、资料, 特别是偏峰分布资料, 常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。 方差和标准差: 都适用于对称分布资料, 特别对正态分布资料或近似正态分布资料, 常把均数和标准差结合起来描述资料的集中趋势和离散趋势; 变异系数: 主要用于量纲不同时, 或均数相差较大时变量间变异程度的比较。2 . 举例说明变异系数适用于哪两种形式的资料,作变异程度的比较?度量衡单位不同的多组资料的变异度的比较。 例如, 欲比较身高和体重何者变异度大, 由于度量衡单位不同, 不能直接用标准差来比较, 而应用变异系数比较。3 . 试比较标准差和标准误的关系与区别。区别:标准差S:意义:描述个体观察值变异

3、程度的大小。标准差小,均数对一组观察值得代表性好; 应用: 与均数结合, 用以描述个体观察值的分布范围,常用于医学参考值范围的估计;与 n的关系:n越大,S越趋于稳定;标准误SX : 意义: 描述样本均数变异程度及抽样误差的大小。 标准误小, 用样本均数推断总体均数的可靠性大; 应用于均数结合, 用以估计总体均数可能出现的范围以及对总体均数作假设检验;与 n的关系:n越大,Sx越小。联系:都是描述变异程度的指标;由 Sx=s/n-1可知,Sx与S成正比。n一定 时,s越大,Sx越大。4 . 简述应用相对数时的注意事项。应用相对数应该注意: 防止概念混淆, 避免以比代率的错误现象; 计算相对数时

4、分母应有足够数量,如果例数较少会使相对数波动较大,应该使用绝对数;正确的计算频率 (或强度) 指标的合计值。 当分组的资料需要合并起来估计频率(或强度)时,应将各组频率的分子相加作为合并估计的分子,各组的分母相加作为合并估计的分母; 频率型指标的解释要紧扣总体和属性; 相对数间比较要具备可比性: 要注意观察对象是否同质、 研究方法是否相同、 观察时间是否一致、 观察对象内部结构是否一致、 对比不同时期资料应注意客观条件是否相同;正确进行相对数的统计推断: 在随机抽样的情况下, 从样本估计值推断总体相对数应该考虑抽样误差,因此要进行参数估计和假设检验。5 .说明率的标准化的基本思想及注意事项。标

5、准化:两个率或多个率之间进行比较时,为消除内部构成不同的影响,采用 统一的标准,对两组或多组资料进行校正(调整),计算得到标准化率后再做比 较的方法,称为。其目的是统一内部构成,消除混杂因素,是资料具有可比性。 应用标准化法的注意事项:标准化法的应用范围很广。当某个分类变量在 两组中分布不同时,这两个分类变量就成为两组频率比较的混杂因素,标准化的 目的是消除混杂因素。 标准化后的标准化率,已经不再反映当时当地的实际 水平,只表示相互比较的资料间的相对水平。标准化法实质是找一个标准,使两组得意在一个共同的平台上进行比较。 选择不同的标准,算出的标准 化率也 会不同,比较的结果也未必相同,因此报告

6、比较结果时必须说明所选用的标准和 理由。两样本标准化率是样本值,存在抽样误差。比较两样本标准化率,当样 本含量较小时,还应作假设检验。6 .简述二项分布、Poisson分布、正态分布三者的关系。二项分布与Poisson分布的关系:当n很大,发生卞K率冗(或1-兀)很小,二 项分布B (n,兀)近似于 Poisson分布P兀);二项分布与正态分布的关系:当 n较大,冗不接近0或1 (特别是当n九和n (1-冗)均大于5时),二项分布B (n,冗)近似于正态分布 N (n* n tt (1- 兀);Poisson分布与正态分布的关系:当人学20时,Poisson分布渐进正态分布 N (入,入)。7

7、.试述假设检验中I型错误与II型错误的意义及关系统计推断实际情况拒绝H0,有差异不拒绝H0 ,无差异H0成立,无差异第I类错误(假阳性), 概率二a正确,概率=1-aH1成立,后差异正确,该概率=1- B第R类错误(假阴性), 概率二B关系:a + B不一定等于1。在样本容量确定的情况下,a 与B不能同时增加或减少 统计检验力(1- B )。8.试比较完全随机设计和随机区组设计资料的方差分析基本思想。设计力泵SS总的分解v总完全随机设计r $总=$组问+ss组内V总7组间+v组内随机区组设计$总二$处理+SS区组+SS误差V总=v处理+V区组+V误差9、参考值范围与总体均数置信区间的区别(1身

8、胃值越憎宣义:姬大多敢人某项指板的数位箱阐;_计算:正态分.'电X ±20 . vS;单值I I X - 4工8 )或1-9. X + 19 £)植端分布获pjRJ牵似(Pi. g1或:-g, p-.M)任应用;判断某项指后正常与否二总体均数的置售区间tj克义;技一定的罟信度佶计总体功数:i在/用:2 lift;正态分布 L; 口:娟侧了二士hS-,鼠伸I. 产二,g)或,,一%.5:0 己如:双巾 X ±Z_ n a _ * 单例(X Z 0一 支 S , X + Zn a _ :0 工 1 *6' X口J X正态分布江侑峰分布1 o米勒但n是5

9、大】JKWX ±Ztt1.Si 单恻f5-4” S-P a 或C-U 。1 XU.i Jl应用:估计总体均数所在棺围.10 .医院拟研究某新药治疗高血压的疗效,试确定该研究设计中的三要素。实验设计的基本要素:受试对象、处理因素、实验效应;受试对象即为高血压患 者,且应分实验组与对照组;处理因素至少应包括旧药治疗、新药治疗,最好设 有安慰剂治疗;实验效应即疗程开始及结束时患者血压变化状况。11 .简述非参数检验的应用条件和优缺点。非参数检验适用于:有序变量资料;总体分布类型不明的资料;分布不对 称且无法转化为正态分布资料;对比组间方差不齐,有无适当变换方法达到方 差齐性的资料;一端或两

10、端观察值不确切的资料;等级资料。优缺点:不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断, 进行的是分布之间的检验。一般不直接用样本观察值做分析,统计量的计算基于 原数据在整个样本中按大小所占位次。 由于丢弃了观察值的具体数据,只保留了 大小次序的信息,凡适合参数检验的资料,应首选参数检验。12 .举例简要说明随机区组设计资料秩和检验的编秩方法。随机区组设计资料秩和检验的编秩方法为将每个区组的数据由小到大分别编秩,遇相同数据取平均秩次,按处理因素求秩和;T+T-=n (n+1) 12。13 .简述相关分析的步骤。进行相关分析前,应先绘制散点图。只有散点有线性趋势时,才能进行直线相

11、 关分析。线性相关分析要求两个变量都是随机变量,而且仅适用于二元正态分 布资料;出现离群值慎用相关;相关关系不一定是因果关系;分层资料盲 目合并易出现假象;样本的相关系数接近零并不意味着两变量间一定无相关性, 有可能是非线性的曲线关系。14 .简述回归模型的适用条件。线性回归模型的适用条彳线性:因变量 Y与自变量X称线性关系; 独立:每个个体观察值之间互相独立; 正态性:任意名&定X值,对应的随机变 量Y都服从正态分布;等方差性:在一定范围内不同的 X值所对应的随机变 量Y的方差相等。简记为LINE。15 .试述直线相关与直线回归的区别与联系。区别: 单位:相关系数r没有单位,回归系数

12、b有单位;所以,相关系数与单位无 关,回归系数与单位有关;应用目的:说明两变量间的关联性用相关分析, 说明两者依存变化的数量关系则用回归分析;对资料的要求不同:线性回归要求应变量Y是服从正态分布的随机变量;线性相关要求两个变量 X和Y 为服从双变量正态分布的随机变量。 取值范围:-oo<b<+oo, -1 00 1 ; 意义:回归系数b表示X每增(减)一个单位,Y平均改变b个单位;相关 系数r说明具有线性关联的两个变量间关系的密切程度与相关方向;计算:联系:方向一致:r与b的正负号一致;假设检验等价:tr=tb ;用回归解释相关决定系数(coefficient of determi

13、nation):回归平方和越接近总平方和,则 r2越接近1, 相关性越好。三、分析题(不需要具体计算,给出大概计算步骤即可)1 .某研究调查了山区、丘陵、平原和沿海地区居民饮用水中氟含量与氟骨症患病 率如下表,试问:1)饮用水中氟含量与氟骨症患病率有无关系?2)有人说,如相关系数的检验结果为 P<0.05,可认为,饮水中氟含量高是导致氟骨症高发 的原因之一,对吗?氟含量(mg/l)0.48 0.64 4.00 1.48 1.60 2.86 3.21 4.71患病率(%)22.37 23.31 25.32 22.29 28.59 35.00 46.07 46.081)通过相关分析确定是否有

14、关系:由于两个变量中患病率不能确定其正态性, 本研究宜采用秩相关分析;首先对资料依次进行编秩,根据公式计算秩相关系数 rs,然后进行秩相关系数的假设检验,Ho: p s=0相关系数为0, Hi: p s*0相关 系数不为0; a =0.05;通过查表或t检验的方法求得统计量与 P值,按检验水准 作出统计推断。2 ) P<0.05只能说明他们有统计学上的关联,不能推断因果关系,同时,这个结 果是从局域水平上说明两个指标之间的关系,可能存在生态学谬误。2.某医生欲比较三种镇咳药的疗效,分析三种镇咳药延迟咳嗽的时间。结果经 方差分析得下表。(1)请补充并完成方差分析;(2)解释结果。表X1三种

15、镇咳药延迟咳嗽时间的方差分析表变异来源SSVMSFP组间变异P 4994.167组内变异总变异:31810.00039变异来源SSVMSFP组间变异4994.167224973.445查F界值表 确定P<0.05组内变异26815.83337724.752总变异31810.00039815方差分析步骤:(1)建立检验假设,确定检验水准Ho:三种镇咳药疗效相同(误)Hi:三种镇咳药疗效不同(误)Ho:三种镇咳药延迟咳嗽的时间总体均数相同Hi:三种镇咳药延迟咳嗽的时间总体均数不全相同 a =0.05(2)计算检验统计量根据公式F=MS组间/MS组内,求得F=3.445确定P值,作出推断根据v

16、 1=丫组间=2, v 2=丫组内=37,查F界值表,可知 P< 0.05,按a =0.05水准, 差异具有统计学意义,可认为三种镇咳药延迟咳嗽的时间总体均数不全相同。3 .测得老年性慢性支气管炎病人与健康人的尿中17酮类固醇排出量见下表,比较两组均数差异是否有统计学意义并解释结果。表X2老年慢支病人与健康人尿中17酮类固醇排出量(mg/24h)病人组 2.90 5.415.48 4.60 4.03 5.10 5.92 4.97 4.24 4.36 2.72 2.37 2.097.10健康组 5.18 8.493.14 6.46 3.72 6.64 4.01 5.60 4.57 7.71

17、 4.99答:该资料宜采用两独立样本t检验进行分析:(1)建立检验假设,确定检验水准H0:甲二仙2,即慢性支气管炎病人组与健康人组的尿中17酮类固醇排出量总体均数相同。H1:中W N 2,慢性支气管炎病人组与健康人组的尿中17酮类固醇排出量总体均数不同。a =0.05(2)计算检验统计量根据两组资料方差齐性检验确定用t检验或t检验,根据公式求得统计量t (t ) 确定P值,作出推断根据v =n1+n2-2,查t界值表,判断P值大小 若P>0.05,接受H。,可认为两组17酮类固醇排出量总体均数无差异 若P< 0.05,拒绝Ho,接受Hi认为两组类固醇排出量总体均数有差异。4.在某地

18、卫生服务调查中随机抽样调查了 400户家庭,他们的平均年医疗费用 支出是947元,标准差是291元。设家庭医疗费用近似正态分布,请估计这些 家庭的95%年医疗费用支出范围,并估计当地家庭年医疗费用平均支出。答:假设该地平均年医疗费用支出服从t分布,由于n=400,可认为t分布近似 服从标准正态分布。1)这些家庭的95%年医疗费用支出范围即按照 95%的标准计算这些家庭年医疗 费用支出的置信区间,根据公式:均数 即准差*Z0.05/n-1求得95%置信区间为: 947±291*1.96/400得出这些家庭的95%年医疗费用支出范围为(918, 976)。2)估计当地家庭年医疗费用平均支

19、出即提供当地家庭大多数家庭年医疗费用支 出,即提供一个参考值范围,根据公式:均数班准差*Z0.05求得参考值范围为:947 ±291*1.96 (377-1517)。5、某牧区观察慢性布鲁氏病患者植物血凝素(PHA)皮肤试验反应,问活动型与稳定型布鲁氏病患者PHA阳性反应率有无差别(写出详细步骤)。分型阳性阴性合计活动型11415稳定型3710提示:四格表周边合计/、艾的情况卜,不同组合的确切概率如卜。(1)(2)(3)(4)(5)0 151142133124 11146|37|281 1 91 0 100.01660.14230.37350.35970.1079(1)建立检验假设,

20、确定检验水准H。:冗产冗2,活动型与稳定型布鲁氏病患者 PHA阳性反应率无差别H1:冗1 w冗2,活动型与稳定型布鲁氏病患者 PHA阳性反应率有差别a =0.05(2)计算检验统计量由于有格子出现1&T&5,因此用确切概率法计算 P值。确定P值,作出推断由提示中表(2)可知P=0.14>0.05,不才!绝H0,认为活动型与稳定型布鲁氏 病患者PHA阳性反应率无差别。6、观察局部温热治疗移植肿瘤小鼠的疗效,以小鼠的生存天数作为观察指标,结果如下。问: 局部温热治疗对移植肿瘤小鼠的生存天数是否有影响?(g=i)对照组(g=2)生存日数秩次生存日数秩次1021231541551661771882092310>90111213(1)对该资料进行编秩,以便进行统计分析(2)两组的理论秩和分别为多少?(3)作出统计推断。5 (6分)视察局部温热治疗移植肿病小鼠的疔效,以小鼠的生存天数作为观察 指标,结果如下 问:局赤逞甚治疗寸移植肿海小鼠的生存

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论