同济医学院2009医学检验专业卫生统计学试AB卷及答案_第1页
同济医学院2009医学检验专业卫生统计学试AB卷及答案_第2页
同济医学院2009医学检验专业卫生统计学试AB卷及答案_第3页
同济医学院2009医学检验专业卫生统计学试AB卷及答案_第4页
同济医学院2009医学检验专业卫生统计学试AB卷及答案_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卫生统计学课程考试(A卷)一、名词解释(每题3分,共30分)1. 均数标准误2. power of test3. 同质4. 确定系数5. 简单线性回归分析6. 生存分析7. 随机区组设计8. 交互效应9可信区间10type I error二、单选题(每题1分,共20分)1以下关于抽样误差,错误的是_。A抽样研究中,抽样误差是不可避免的B抽样误差是由于抽样的随机性造成的C抽样误差指的是样本统计量值和总体参数值之差D对于同一总体的若干样本统计量间,也存在抽样误差E抽样误差的大小可用标准误来说明2比较20头河马体重和20只小白鼠体重两组数据变异程度大小宜采用 。A 变异系数(CV) B 方差(S2

2、) C 极差(R) D 标准差(S) E 四份位数间距3某厂男职工 370 人,女职工 456 人,慢性苯中毒人数男女分别为 8 和 10 人,(456/370)×100%为 。A率B构成比C相对比D平均率E标化患病比4两样本均数比较时,分别取以下检验水准,以_所对应的第二类错误最小。A=0.01B=0.05C=0.10D=0.20E=0.255有一组某地居民19501968 年伤寒与结核病死亡率(1/10 万)资料,下列哪种统计图可以形象化地反映两种疾病的死亡率随着时间推移的变化速度: 。A条图或圆图B直方图C散点图D普通线图E半对数线图6关于检验假设,下面哪项说法是错误的 。A检

3、验假设是对总体作的某种假定 B在研究设计阶段对单侧检验还是双侧检验作出规定C检验假设与备择假设是对立的 D检验假设与备择假设地位是相等的E检验结果若P值大于0.05,则接受H0犯错误的可能性很小7经调查获知甲乙两地的冠心病粗死亡率均为4/105,经统一年龄构成后,甲地标化率为4.5/105,乙地为3.8/105。因此认为:_ _。A 甲地人群较乙地年轻B 乙地人群较甲地年轻C 甲地的诊断较乙地准确D 乙地的诊断较甲地准确E 标化率符合实际8以下关于可信区间,正确的是_。A可信区间是包含未知总体参数的一个范围B可信区间包含可信区间上下限两个值C可信区间的确切含义是指有(1-)的可能认为计算出的可

4、信区间包含了总体参数D可信区间的确切含义也可理解是总体参数落在该范围的可能性为 1-E以上说法均不对9在比较两样本均数的假设检验中,结果t=3.24,t0.05(v)=2.086,t0.01(v)=2.845。正确的结论是 。A两样本均数不同B两样本均数差异很大C两总体均数差异很大D两样本均数来自同一总体E两样本均数来自不同总体10对四格表资料作c2 检验时,若有一个实际数字为0,则 。A不能作c2 检验 B必须用校正c2 检验C还不能决定是否可计算c2 统计量作检验 D不必计算校正c2 统计量E还不能确定是否需要作校正11用某中草药预防流感,其用药组与对照组的流感发病情况如下表:组别观察人数

5、发病人数发病率(%)用药组1001414对照组1203025则构成四格表的四个格子内的数字是 。 A10014B10014C10086D1486E14141203012025120903090302512. 完全随机设计资料的方差分析中,有_。A. B. C. D. E. 13. 对k个处理组,b个随机区组资料的方差分析,其误差的自由度为_。A. kbkb B. kbkb1C. kbkb2D. kbkb+1 E. kbkb+214四种基本的概率抽样方法为_。A系统抽样、整群抽样、偶遇抽样、简单随机抽样B单阶段抽样、多阶段抽样、雪球抽样、便利抽样C简单随机抽样、分层抽样、整群抽样、配额抽样D简单

6、随机抽样、分层抽样、系统抽样、整群抽样E多阶段抽样、分层抽样、系统抽样、机械抽样15. 两因素析因设计资料的方差分析中,存在_。A. B. C. D. E. 16. 在以下关于非参数检验的叙述中,不正确的是_。A一般不直接对样本观察值进行分析。B对不清楚是否适合于参数检验的资料,应采用非参数检验。C对于难以确定分布,又出现少量异常值的小样本数据,应采用非参数检验。D非参数检验结论的稳健性之好,可由剔除数据中异常值前后结论的一致性显示出。E非参数检验具有广泛的适用性,因此而成为通常情况下的首选检验方法。17. 不属于基于秩次的非参数检验的方法是_。A单样本的符号秩和检验B配对设计资料的符号秩和检

7、验C两组独立样本比较的秩和检验D多组独立样本两两比较的秩和检验E多组独立样本比较的秩和检验18. 在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明_。AX 对 Y 的影响占Y 变异的 30%BX 增加一个单位,Y 平均减少 30%CX 增加一个单位,Y 平均减少 0.30 个单位DY 增加一个单位,X 平均减少 30%EY 增加一个单位,X 平均减少 0.30 个单位19. 如果直线相关系数=1,则一定有_。ASS总=SS残BSS残=SS回CSS总=SS回DSS总>SS回E以上都不正确20. 在直线回归中,如果自变量X乘以一个不为0且不为1的常数,则有_。A截距改

8、变B回归系数改变C两者都改变D两者都不改变E以上情况都可能三、简答题(共30分)1. 请简述假设检验与区间估计的区别与联系。(7分)2. 线性回归模型的适用条件。(7分)3. 回归中个体Y值的预测带。(8分)4. 简述实验设计的原则,并解释遵循这些原则的理由。(8分)四、计算分析题(20分)1. 用两种方法检验已确诊的肝癌患者120名,得到如下资料。(1)请解释表中42、18两个数字的意义。(2分)(2)请通过c2 检验说明两种方法检查的阳性检出率有无差别。(6分)表1 整理表格甲法乙法合计423072183048合计60601202.为研究三种不同处理下大白鼠血糖浓度随室温()的变化,抽取条

9、件相同或相近的24只大白鼠随机分配于三种不同处理的八种室温下进行实验,结果见表2。表2 不同处理及不同室温下大白鼠的血糖浓度(g/L)处理05101520253035A0.980.961.101.081.201.251.401.45B0.860.801.001.161.151.301.201.40C0.900.950.981.201.221.361.351.50请填写表3数据,并回答三种处理的血糖浓度是否不同?八种室温的血糖浓度是否不同?(12分)表3 随机区组资料方差分析表变异来源处理组0.02720.042区 组0.01360.000误 差总变异0.898623卫生统计学试题(A卷)答案及

10、评分标准一、名词解释(每题3分,共30分)1. 均数标准误:它反映样本均数间的离散程度,也反映样本均数和相应总体均数间的差异,说明了均数抽样误差的大小。2. power of test:检验效能(1分),用概率1-表示,其中为假设检验不拒绝H0时犯类错误的概率。其意义是,当两总体确有差别,按检验水准,假设检验能发现其差别(拒绝H0)的能力。(2分)3. 同质:是指同一总体中个体的性质、影响条件和背景相同或非常相近。4. 确定系数: 回归平方和与总离均差平方和之比称为确定系数, 取值在0到1之间,且无单位。它反映了回归贡献的相对程度,即在因变量Y的总变异中回归关系所能解释的部分所占的比例。(3分

11、)5. 简单线性回归分析: 是描述因变量(Y)如何依赖于自变量(X)的变化而发生线性变化的规律性的一种统计分析方法。 (3分)6. 生存分析:是将终点事件的是否出现与观察对象到达终点所经历的时间长短结合起来分析的一类统计学分析方法。(3分)7. 随机区组设计: 它通常是将受试对象按性质(如动物的性别、体重,病人的病情、性别、年龄等非实验因素)相同或相近者组成b个区组(或称单位组、配伍组),再将每个区组中的k个受试对象分别随机分配到k个处理组中去。8. 交互效应: 当某因素的各单独效应随另一因素水平不同而变化时,则称这两个因素间存在交互效应。9. 可信区间又称置信区间,是按给定概率(1-a)由样

12、本估计未知总体参数的可能取值范围。(2分)10type I error型错误或1类错误(1分),当H0为真时,检验结果却拒绝H0,而接受H1,则犯I型错误,其大小记为。(2分)二、单选题1D 2A 3C 4E 5E 6E 7A 8C 9E 10C11D 12.A 13.D 14.D 15.E 16.E 17.D 18.C 19.C 20.D三、简答题1请简述假设检验与区间估计的区别与联系。(7分)一方面,可信区间可回答假设检验的问题,算得的可信区间若包含了H0,则按a水准,不拒绝H0;若不包含H0,则按a水准,拒绝H0,接受H1。(2分)另一方面,可信区间不但能回答差别有无统计学意义,而且还能

13、比假设检验提供更多的信息,即提示差别有无实际的专业意义。(2分)虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率检验水准a的前提下进行计算,而假设检验能够获得一较为确切的概率P值。(3分)2. 线性回归模型的适用条件:(1) 因变量Y与自变量X呈线性(linear)关系;(2) 每个个体观察值之间相互独立;(3) 在一定的范围内,与任意给定X值相对应的随机变量Y的值服从正态分布;(4)在一定的范围内,各X值所对应的随机变量Y值的方差相等。(7分)3. 回归中个体Y值的预测带:计算出对应于所有X值的Y的预测区间,以相应

14、的X为横坐标,Y为纵坐标,在直角坐标系中描点,然后将预测区间的上下限分别连接起来,形成两条弧形线,二者之间的区域,称为Y值的预测带。(8分)4. 简述实验设计的原则,并解释遵循这些原则的理由。(8分)一、对照原则(3分)在确定接受处理因素的实验组(experimental group)时,应同时设立对照组(control group)。只有设立了对照才能较好地控制非处理因素对实验结果的影响,从而将处理因素的效应充分显露出来,将效应归因于处理因素。不设立对照往往会误将非处理因素造成的偏倚当成处理效应,而得出错误的结论。二、随机化原则(3分)随机化使非处理因素在实验组和对照组中的影响相当,并可归于

15、实验误差之中;它也是对资料进行统计推断的前提,各种统计分析方法都是建立在随机化的基础上。三、重复原则(2分)重复最主要的作用是估计实验误差。实验误差是客观存在的,只有在同一实验条件下对同一观测指标进行多次重复测定,才能计算出误差的大小。重复的另一作用就是降低实验误差,多次重复测定的均数误差较小。四、计算分析题1(1)请解释表中42、18两个数字的意义。“42”表示两种方法检验结果一致的例数,“18”是指两者不一致的例数。(2分)(2)请通过c2 检验说明两种方法检查的阳性检出率有无差别。1)建立检验假设,确定检验水准:H0:两法检验结果无差别或一致; H1:两法检验结果有差别或不一致;a=0.

16、052)计算检验统计量:因配对四格表b+c=48>40,故可不用校正法。 3)确定P值并作结论:自由度=1,界值,今<,故P>0.05,不拒绝H0,即尚不能认为甲法与乙法的检验结果有差别。(6分)2.为研究三种不同处理下大白鼠血糖浓度随室温()的变化,抽取条件相同或相近的24只大白鼠随机分配于三种不同处理的八种室温下进行实验,结果见表2。表2 不同处理及不同室温下大白鼠的血糖浓度(g/L)处理05101520253035A0.980.961.101.081.201.251.401.45B0.860.801.001.161.151.301.201.40C0.900.950.98

17、1.201.221.361.351.50请填写表3数据,并回答三种处理的血糖浓度是否不同?八种室温的血糖浓度是否不同?(12分)表3 随机区组资料方差分析表变异来源处理组0.02722(0.5分)0.01364.011(0.5分)0.042区 组0.8240(0.5分)7(0.5分)0.1177(0.5分)34.748(0.5分)0.000误 差0.0474(0.5分)14(0.5分)0.0034(0.5分)总变异0.898623-(0.5分)按a=0.05水准(1分),处理因素和区组因素,均拒绝H0,接受H1,有统计学意义。(2分). 认为三种处理的血糖浓度不全相同,八种室温的血糖浓度不全相

18、同。(2分)卫生统计学课程考试(B卷)一、名词解释(每题4分,共40分)1可信区间2型错误3Variation4. 总体5. 算术均数6. 随机区组设计7. 均数标准误8. 回归参数估计的最小二乘原则9. 残差10. PH假定二、单选题(每题1分,共20分)1对于一组样本来说,若标准差固定不变,可通过_来减少抽样误差。A增大样本均数B增大样本含量C减小变异系数D减小几何均数E以上都不对2比较身高与坐高两组单位相同数据变异度的大小,宜采用 。A极差(R) B标准差(S) C方差(S2) D变异系数(CV)E四分位间距3某医师治疗了两例视网膜炎患者,1例有效,下列哪项说法错误的是_。A有效率为50

19、%B最好用绝对数表示C必须用率表示时,应同时给出其可信区间D分母太小,用相对数不可靠E不能得知总体有效率4设为型错误的概率,为型错误的概率,当两总体均数确定且抽取的样本含量不变时,有_。A增大,减小B增大,增大C减小,减小D的改变不影响的大小E以上均不对5为比较某地两年几种疾病的患病率,可采用 。A. 直方图B.复式直条图C. 线图D. 构成比直条图E.圆图6关于假设检验的以下论述中,正确的是。A单侧检验优于双侧检验B当根据样本作出的结论是拒绝H0时,可能犯类错误C当两总体确有差异时,按规定的检验水准所发现该差异的能力是D检验结果若P值大于0.05,则接受H0犯错误的可能性很小E在已知A药降血

20、压疗效只会比B药好或相等时,可选单侧检验7B区胃癌总死亡率高于A 区,但标化后A区高于B区,这是因为_。AA区总人口多于B 区所致BB区总人口多于A 区所致CA区老龄人构成较B 区多所致DB区老龄人构成较A 区多所致E总死亡率与年龄别人口构成无关8关于标准正态分布曲线下的面积,错误的是 。A -1.96到1.96间曲线下面积是95%B1.96到2.58间曲线下面积是2%C大于1.645的曲线下面积是2.5%D-1.96到-1.645间曲线下面积是2.5%E大于1.96的曲线下面积为2.5%9两样本均数比较的u检验,差别有统计学意义时,P值越小,说明 。A两样本均数差别越大B两总体均数差别越大C

21、越有理由认为两样本均数不同D越有理由认为两总体均数不同E越有理由认为两总体均数相同10当四格表的周边合计不变时,如果某个格的实际频数有变化,则其理论频数 。A 增大B 减小C 不变D 不确定E 随该格实际频数的变化而变化11几个样本率比较的c2检验,得 P<0.05,可推论为 。A几个样本率不全相等B几个总体率不全相等C几个总体率间的差异无统计学意义D每两总体率间差异有统计学意义E每两个样本率间差异有统计学意义12两样本均数比较时,分别取以下检验水准,以_所对应的第二类错误最小。A=0.01B=0.05C=0.10D=0.20E=0.2513对四格表资料作c2 检验时,若有一个实际数字为

22、0,则 。A不能作c2 检验 B必须用校正c2 检验C还不能决定是否可计算c2 统计量作检验 D不必计算校正c2 统计量E还不能确定是否需要作校正14. 对k个处理组,b个随机区组资料的方差分析,其误差的自由度为_。A. kbkb B. kbkb1C. kbkb2D. kbkb+1 E. kbkb+215. 在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明_。AX 对 Y 的影响占Y 变异的 30%BX 增加一个单位,Y 平均减少 30%CX 增加一个单位,Y 平均减少 0.30 个单位DY 增加一个单位,X 平均减少 30%EY 增加一个单位,X 平均减少 0.30

23、个单位16、在下列方法中,不属于非参数检验方法是_。A、符号检验B、方差分析C、等级相关分析D、秩和检验E、卡方检验17、在例数相等的两组独立样本比较的秩和检验中,若无效假设成立,则对样本来说,_。A、两组秩和相等B、两组秩和的绝对值相等C、两组秩和相差很大D、两组秩和相差一般不会很大E、两组秩和的差值为零18、在直线回归中,如果自变量X乘以一个不为0且不为1的常数,则有_。A、截距改变B、回归系数改变C、两者都改变D、两者都不改变E、以上情况都可能19、Cox回归方法属于_。A、参数法B、非参数法C、半参数法D、logistic回归E、以上均不是20、两因素析因设计资料的方差分析中,存在_。

24、A. B. C. D. E. 三、简答题(共30分)1. 样本均数的标准差与标准误有何区别和联系?(10分)2. 简述实验设计的原则,并解释遵循这些原则的理由。(10分)3. 在关于身高与肺死腔容积之间的简单相关与回归分析中,试简述分析的步骤。(10分)四、计算分析题(10分)1. 1988年某省对07岁儿童贫血情况作抽样调查,结果为:A地区483人,贫血人数88人,贫血患病率为18.23%;B 地区500人,贫血人数200人,贫血患病率为40.00%;C地区450人,贫血人数90人,贫血患病率为20.00%。据此资料回答下列问题:(1)这是什么资料?(1分)(2)能否根据患病率直接下结论?(

25、2分)(3)若要比较三地贫血患病率有无差别,应该选用何种统计方法?(1分)(4)列出计算表。(3分)(5)列出主要分析步骤(不必计算)。(3分)卫生统计学课程考试(B卷答案)一、名词解释(每题4分,共40分)1可信区间:又称置信区间,是按给定概率(1-a)由样本估计未知总体参数的可能取值范围。2型错误:当H0为真时,检验结果却拒绝H0,而接受H1,则犯I型错误,其大小记为。(2分)3Variation:变异,是指同质的个体之间存在的差异。4. 总体:表示大同小异的对象全体。5. 算术均数:全部观察值的平均数量水平。特别是正态分布或近似正态分布资料,均数有非常重要的作用。6. 随机区组设计:它通

26、常是将受试对象按性质(如动物的性别、体重,病人的病情、性别、年龄等非实验因素)相同或相近者组成b个区组(或称单位组、配伍组),再将每个区组中的k个受试对象分别随机分配到k个处理组中去。7. 均数标准误:它反映样本均数间的离散程度,也反映样本均数和相应总体均数间的差异,说明了均数抽样误差的大小。8. 回归参数估计的最小二乘原则:在因变量与自变量的散点图中,为了找到一条能够代表所有数据点的“合理”的直线,即所有的数据点与这条直线的距离“最近”,这条直线就必须符合以下原则:把每个实测值与这条直线上 (即对应于的的平均值的估计值)的纵向距离()作为考察对象,要使所有点的()的值达到最小。由于考虑到所有

27、点的()值有正有负,通常把上述问题变成考察所有点的()平方和最小。这个原则就是最小二乘原则。9. 残差:在因变量与自变量的回归直线图中,任意点p与回归直线的纵向距离,即前述的实测值Y与其估计值之差,称为残差。10. PH假定:任两个个体风险函数之比,即风险比(RR或HR) 与h0(t)无关,也与时间t无关,即模型中自变量的效应不随时间而改变,称为比例风险假定,简称PH假定。二、单选题1B 2D 3A 4A 5B 6E 7D 8C 9D 10C 11B 12. E 13.E 14.D 15. C 16. B 17. D 18. D 19. C 20. E 三、简答题1. 样本均数的标准差与标准误有何区别和联系?(10分)(1)区别: 标准差是描述一组变量值之间的离散趋势; s值越小,表示变量值围绕均值分布越密集,说明均数的代表性越好;可用 估计变量值范围;n越大,s 越趋于稳定。(3分) 标准误是描述样本均数间的离散趋势;标准误越小,表明样本均数与总体均数越接近,说明样本均数推断总体均数的可靠性越大;可用 估计总体均数可信区间;n越大,标准误越小。(3分)(2) 联系:两者均是表示变异度大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论