医学统计学历年考题及答案_第1页
医学统计学历年考题及答案_第2页
医学统计学历年考题及答案_第3页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、试题】 2010-01-05/ 山东大学 / 医学院 /2009 级/ 研究生 / 医学统计简答1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对?为什么?如果是你,用什么?3 假设检验的基本思想和原则4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值) ,判断哪个方程回归效果最好,为什么?5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么?你的设计是什么?6 一型

2、错误和二型错误的区别和联系7 什么是抽样误差?举例说明分类资料和数量资料的抽样误差计算1给了健康人的白天和晚上血压的相关数值(x 和 y 各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值(1)比较白天晚上血压有无差别( 配对 t 检验计算 )(2)白天和晚上血压有无相关( 相关分析 )(3)如何用白天血压估计晚上血压( 回归分析 )2多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3 问,第一问是配对t 检验计算,第二问相关分析,第三问,回归分析,都是计算题15 分)3 样本率与总体率的比较(u检验 ) (也有人说:配伍

3、组方差分析)20081. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等)2. 医学统计中,将正态分布视为近似正态分布有哪几种情况?列出应用条件和公式3. 数值资料的统计描述指标?公式?4. 多元回归模型的基本形式?参数含义 ?回归效果的评价?5. 什么叫截尾值?产生原因?举例说明6. 一同学两样本率的比较 用了卡方检验,你有什么建议?若不符合卡方检验的应用条件,你又有什么建议?他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议?7. 一个三因素的 2X2X2的析因设计的实验设计及分析思路8. 给了一个数值资料:小鼠的饮食量X1,X2,X

4、3,X4,X5,X6,X7,X8,X9共十个数值小鼠的体重增加量也有十个值(1)对体重增加量资料进行统计描述(2)求饮食量和体重增加量的关系(3)由体重增加量的样本估计其代表总体均数的可信区间(4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的 95%的置信区间(5)(3)和( 4)中的可信区间有什么差别?20061 直线回归中的b 与多元线性回归中的B 有什么区别 ?多元线性回归中,是否可以用 B 来表示各自变量对因变量的影响?为什么 ?2 数值变量的完全随机设计的样本与总体的比较,配对设计的两样本的比较,成组设计两样本比较的统计分析思路3 统计分析中 P.a,B 以及 1

5、-B 的意义4 给了一个单向有序资料,统计效应是有序的,他用了t 检验,问你对不对,为什么 ?应该用什么统计方法,并写出统计思路5 有一个两样本的秩和检验的应用题, 写思路,不要求计算6 生存分析中,有哪些非参数检验的方法?两个生存率的比较用什么检验?7 给了一个实验,测量抗体.样本序列抗体滴度效应是否有效11:40+是21:160+是. 就是几个表格,让你给每个列个表, 并且应该用哪些指标来描述.8 正态分布,二项分布,poisson 分布的可信区间9 有两个变量,让你说出分析它们相关的统计分析思路10 有个析因设计的题 , 让你写出检验的思路 , 好象是还要写出公式 . 2005(研究生)

6、1. 举例说明变量及变量类型。 ( 10 分)答案:变量:在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,该特征称为变量。如身高、体重、疗效等变量按其性质可分为两种类型:( 1)数值变量:其变量值是定量的,表现为数值的大小,通常是使用仪器或某种尺度测定出来的,多有度量衡单位。如身高( cm)、体重( kg)、心律(次 /min )、血压( mmHg)等。(2)分类变量:表现为互不相容的类别或属性,它又分为无序与有序两类:a. 无序分类变量:是指所分类别或属性之间无程度或顺序上的差别,如:性别(男、女)血型(A、B、O、AB)等。b. 有序分类变量:

7、是指所分类别或属性之间有程度或顺序上的差别。如尿糖化验结果按- 、+- 、 +、+、 +分类,疗效按治愈、好转、无效、恶化分组。2. 在假设检验过程中,若设定a 为 0.05 ,算得统计量后,得p 值为 0.015 ,按a=0.05 的检验水准拒绝无效假设。请对这一结论做出适当的评论,并为此写例假设检验中 p 值的含义,以及p 与 a 的关系。( 10 分)答案: P 值为 0.015 小于检验水准a( 0.05 ),依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H0 ,接受 H1,尚可以认为现有样本所代表的总体与已知总体不相等。P 值的含义是指从H0 所规定的总体中随机抽样时,

8、获得等于及大于 (负值为等于及小于)现有样本统计量的概率。若p>a,按 a 检验水准不拒绝H0,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的。若 p<=a,依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H0,接受 H1;可认为从已知总体中抽到现有样本的可能性很小,该样本可能来自另一总体。3. 写出数值变量资料中完全随机设计的多个样本比较的统计分析思路(不必写出计算公式)。(15 分)答案:(1)统计描述:描述资料的类型:数值变量资料频数表资料的分布:正态性检验服从正态分布:均数、标准差(方差);不服从正态分布,服从对数正态分布:几何均数、几何标准差;偏

9、态分布:中位数、四分位数间距(2)统计推断:资料的设计类型:完全随机设计的多个样本比较分布:正态性检验和方差齐性检验:( 1)如果样本服从正态分布且方差齐,就用完全随机设计的多个样本的方差分析来作统计推断; ( 2)如果样本不服从正态分布或者方差不齐,经变量变换转换为正态分布方差齐,再用方差分析推断;(3)如果变量变换不能使样本服从正态分布且方差齐,就用秩和检验来做统计推断。4. 写出两变量之间相关关系的分析思路。 (15 分)答案:( 1)绘制散点图 :在直角坐标系内绘制散点图,看两变量之间有没有线性趋势,如果有就做相关分析。如果两变量都服从双变量正态分布,则做直线相关分析;如果不服从线性模

10、型条件要求即不服从或总体未知的资料,则作Spearman等级相关分析。或者进行曲线拟合。(2)计算直线相关系数r 或者 Spearman秩相关系数 r s 。(3)对相关系数作假设检验, 由于抽样误差的存在,即使从p=0 的总体中做随机抽样误差,所得的R 值也不一定等于零,应对样本相关系数做假设检验。根据检验目的,检验假设为:H0:P=0;H1=/0. 常用 t 检验rr, v=n-2, 拒绝 H0认为两变量间存在直线相关。t1srr 2n2(4)总体相关系数的可信区间估计,先对相关系数做Z 变换,估计Z 的可信区间,其分布服从正态分布原理,按正态分布原理100 ( 1-a ) %可信区间(

11、zu a /n3, zuan3 ),再对 Z 的可信区间上下限按r=tanh z 进行逆变换。5. 请利用下面的随机数字表将15 只小白鼠完全随机的分配到甲、乙、丙3 个实验组中,使各组例数相等。要求写出随机分配方案。(10 分)随机数字表(部分数据)编 号1-1011-2021-3031-4041-50122 17 68 65 8168 95 23 92 3587 02 22 57 516109 43 95 0658 24 82 03 47219 36 27 59 4613 79 93 37 5539 77 32 77 098552 05 30 6247 83 51 62 74316 77

12、23 02 7709 61 87 25 2128 06 24 25 931671 13 59 7823 05 47 47 25478 43 76 71 6120 44 90 32 6497 67 63 99 614638 03 93 2269 81 21 99 21503 28 28 26 0873 37 32 04 0569 30 16 09 058869 58 28 9935 07 44 75 47答案:先把十五只动物 按体重从小到大分别编号:12345678910111213 14 15 ;在随机数字表 任意指定某行某列 ,如取第三行的 1 列开始, 向下录入不重复的二位随机数字: 16

13、 77 23 02 09 61 872521280624937113;对应于十五只动物的编号,对随机数字有小到大编秩得出序号R 如下: 5 13 7 13 11 14 9 6 10 2 8 15 12 4;并规定 :一到五号分到甲试验组,六到十号分到乙组,十一到十五号分到丙组;随机分配结果是:甲实验组动物有:1 4 5 1115;乙组动物为: 3 8 9 10 12;丙组动物有: 2 6 7 13 14。6. 某试验需在 5%和 15%两种氧浓度下进行,每种氧浓度下分别使用甲、乙、丙三种药物对 K562 细胞进行抑制。此研究宜用何种试验设计,并写出设计方案;若每种实验条件下各观察 4 个独立的

14、样品, 共需多少样品 (即样本含量) ?(10分)答案:此研究宜用析因试验设计,析因设计是一种多因素多水平交叉分组进行全面试验的设计方法,可以研究两个或两个以上因素多个水平的效应,也可以检验各因素间的交互作用;因本试验中有2 个试验因素,即氧浓度和药物,一个因素有2 个水平,另一个因素有3 个水平,而且氧浓度和药物之间可能存在交互作用;因此选用析因试验设计。设计方案:该试验是一个2X3 的析因设计,共有2X3=6个试验组,用a1 表示 5%的氧浓度, a2 表示 15%的氧浓度;用b1 表示甲药物。 b2 表示乙药物, b3表示丙药物。先按随机分组的原则,将试验动物按随机化原则分配到各组,各组

15、先进行不同试验因素的处理,间隔一段时间后,再把各组之间的处理方法交换,并统计处理的结果。分析两因素之间有无交互作用及其交互作用的性质。同时分析两个因素各个水平之间的效应来评价对细胞的抑制作用。样本含量:2X3X4=247.某研究者随机测定了某地100 例健康成人血清NSE酶( ug/l)含量,请你充分利用该资料所能提供的信息,写出全面的分析思路。( 20分)答案:( 1)资料的类型,列频数表,观察分布类型和分布特征:经判断资料为数值变量资料,对该资料作正态性检验,如果资料服从正态分布,进行统计描述,用均数、标准差(方差)来描述资料;不服从正态分布,进行变量变换使其服从正态分布,若是服从对数正态

16、分布,用几何均数、几何标准差来描述资料;若资料服从偏态分布,则用中位数、四分位数间距对资料进行统计描述。统计描述:( 2)通过资料来估计制定医学参考值范围:比如估计该地健康成年人血清NSE酶含量的上双侧95%( 90%、99%)参考值范围,如果资料为正态分布资料,则 95%医学参考值范围为 ( X1.96S, X1.96 S ) ;如果资料为对数正态分布资料,则95%医学参考值范围为 lg1 ( Xlgx -1.96Slg x , Xlgx +1.96 Slg x );如果资料为偏态分布,则 95%医学参考值范围为( P2.5 P97.5 )。( 3)统计推断:参数估计包括均数的抽样误差即标准

17、误: SS 和总体xn均数的可信区间估计 未知且 n 较小:可信区间为( Xta / 2 , SX , Xta / 2, SX );未 知 但 n足 够 大 :( X ua / 2 , SX , X ua / 2, SX); 已 知 :( Xua / 2, X , X ua / 2, X )。8. 多元回归方程为: yhat=b0+b1x1+b2x2+ +bjxj+ +bpxp, 其中 bj 的名称是什么,它的意义是什么?若比较各自变量对因变量影响的大小,应通过什么统计量比较?判断多元线性回归分析的效果应看那些指标?(10 分)答案: bj 称为偏回归系数,意义是在其他自变量固定不变的条件下,

18、自变量xi每改变一个单位时所引起的因变量y 的平均改变量。比较各自变量对因变量影响的大小,应通过bj 的大小来比较。常用的多元线形回归分析的效果指标有决定系数R2(是回归平方和占总平方和的比例,值越大,回归效果越好)、复相关系数(决定系数的算术平方根,反应应变量和自变量线性组合见得相关关系的密切程度R 越就接近 1,线性关系越密切)、校正决定系数(越大回归效果越好)、剩余标准差(不能有m 个自变量的变化解释的 Y 的变异,越小回归效果越好)等。2001 级七年制临床医学专业考试试题答案1、同质:对研究指标影响较大的、可以控制得主要因素尽可能相同。变异:同质基础上各观察单位的某变量值得差异称为变

19、异。2、均数的抽样误差:由抽样研究造成的样本均数与总体均数间的差异称为均数的抽样误差。3、假设检验 P 值含义: P 值是指从所规定得总体中随机抽样时,获得等于及大(负值时为等于及小于)现有样本统计量的概率。若 ,按检验水准不拒绝,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的。若,依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝,接受;可认为从已知总体抽到现有样本得可能性很小,该样本可能来自另一总体。4、变量及其变量类型:变量:在搜集资料时,对每个观察单位得某项特征进行测量或观察,该特征称为变量。变量类型:1.数值变量其变量值是定量的, 表现为数值得大小, 通常用仪

20、器或某种尺度测定出来,多有度量衡单位。由数值变量的测定值组成的资料称为数值变量资料或计数资料。如:身高、体重、心律、住院天数、血压等。2.分类变量亦称定性变量, 表现为互不相容的类别或属性。 分类变量可分为无序与有序两类:(1)无序分类分类是指所分类别或属性之间无程序或顺序上的差别。分析无序分类变量时,应先按类别分组,计各组的观察单位数,所得资料称为无序分类变量资料或计数资料。如:性别(男、女) ,血型( O 、A、 B、 AB)等。(2)有序分类变量是指所分类别或属性之间无程序或顺序上的差别。分析有序分类变量时,应先按等级顺序分组,计各组的观察单位数,所得资料称为有序分类变量资料或等级资料。

21、如:尿糖化验结果按、±、分类,疗效按治愈、好转、无效、恶化分组。二、标准差:计算公式:sX Xn 1(1) 表示观察值的变异程度(2) 计算变异系数s100%CVX(3) 确定医学参考值范围(4) 计算标准误(5) 与样本含量没有关系标准误:计算公式:s xsn(1) 估计均数的抽样误差的大小(2) 估计总体均数可信区间:(3) 进行假设检验(4) 与样本含量成反比三、 1、 t 分布,均数的区间估计:1)未知且 n 小: X t2, sx, Xt 2, sx2)未知,但 n 足够大时( n>100 ),t 分布逼近 u 分布: Xu 2sx,X u 2 sx3)已知: X u

22、 2 x, Xu 2 x2、二项分布:当样本含量n 足够大,且样本率p 或 1-p 均不太小,如np 与 n(1-p )均大于 5 时,样本率 p 的抽样分布近似正态分布,总体率的可信区间:p u 2sp, p u 2sp3、Poisson 分布:当样本阳性数 X>50 时,可按正态近似原理先求总体平均数的 95% 或 99% 可信区间: Xu 2X, Xu 2 X四、方差分析的应用条件:1)各样本是相互独立的随机样本;2)个样本来自正态分布总体;3)各总体方差相等,即方差齐。应用: 1)两个或多个样本的均数间的比较;2)分析两个或多个因素间的交互作用; 3)回归方程的线性假设检验;4)

23、多元线性回归分析中偏回归系数的假设检验等。五、该设计是2*4 析因设计设计方案如下 ,如图所示,可将八个样品随机分为下面的八组:A1A2A3A4B1A1B1A2B1A3B1A4B1B2A1B2A2B2A3B2A4B2先为八个样品按取样先后标上1、2、3、4、5、6、7、8,再用随机数字表将其标上随机数字,(随机数字表略去)将随机数字排秩,按秩次的1 到 8,分别取从 A1B1 、 、。进行实验。六、先将受试对象编号,再利用随机列表或随机数字表或计算机软件产生的随机数字,按某一行将受试对象编上随机数字,然后将其随机数字编秩,秩次为奇数的分为一组,秩次为偶数的分为一组进行实验。这就是完全随机设计两

24、样本比较的分析思路。其检验统计量值是:X1X 2,n1 n 2 2tsX 2sX 1七、非条件 logisti 回归模型:Pexp ( 01 X12 X 2m X m),exp ( 01 X12 X21m X m)其中0 是常数项,、m为偏回归系数。122002 级临床医学七年制医学统计学期末考试题(A 卷)一、试述标准差与标准误的联系与区别。二、请以完全随机设计资料为例说明方差分析的基本思想。三、在某次假设检验中,0.05 ,所得的概率为P0.001 ,请就本例分别说明和 P 的意义?四、研究人员调查了2005 年某社区全部居民的全死因死亡及恶性肿瘤死亡人数(见表 1),根据该资料可以得出哪

25、些统计信息?(10 分)表 1 某社区居民2005 年死亡人口调查年龄人口数全死因恶性肿死亡人瘤数死亡人数08292013842046639631240281611724260937034232合计16709715900五、请解释多元线性回归分析中R2 和 sy123 m 的统计学意义。六、什么是随访资料中的截尾值?出现截尾值的原因有哪些?七、中国人民解放军总后卫生部军需装备研究所研究五种类型的军装在两种环境、两种活动状态下着装战士的主观热感觉(用评分表示),且需要进行全搭配实验,应采用何种设计?需安排几个实验组?请写出设计方案。八、今测得 101 名 3049 岁的正常成年男子的血清总胆固醇

26、(表2)。试根据此资料进行全面的统计分析。 ( 10 分)血清胆固醇频数(mmol/L)2.513.083.594.0234.5255.0175.596.066.527.07.51合 计101九、为了比较工人和农民的高血压患病率,随机调查了50 59 岁的男性工人1281 人,其中高血压患者386 人;又随机调查了 50 59岁的男性农民387 人,其中高血压患者 65人。问工人与农民的高血压患病率是否相同?十、今测得 10 名男 20 岁男青年的身高与前臂长(表3),问二者有无线性相关关系,若有相关关系,其相关关系的密切程度及方向如何。(10 分)表 310 名男 20岁男青年的身高与前臂长

27、编号12345678910身高 (cm)17171615171817181816前臂长 (cm)030538830545424441475047464943可能用到的界值:t0.05,81.860 , t 0.05,91.833, t 0.052.306 ,t 0.052.262 。2,8,922002 级临床医学七年制医学统计学期末考试试题(A)参考答案一、试述标准差与标准误的区别和联系答:区别:意义:标准差是描述数据分布离散程度的指标;标准误是样本统计量的标准差。( XX )2S公式:; SX(2 分)Sn 1n用途:标准差用于表示数据离散程度的大小;也可用于计算变异系数、估计频数分布、制

28、定参考值范围、进行质量控制;很多统计处理方法中要用到标准差。标准误用于反映抽样误差的大小;计算总体均数的可信区间;统计处理方法的基础,如t 检验。联系:标准误与标准差成正比;若标准差固定不变,可通过增加样本含量来减少抽样误差。二、请以完全随机设计为例说明方差分析的基本思想答:方差分析的基本思想就是把全部观察值间的变异- 总变异按设计和需要分解成两个或多个组成部分,产生每部分变异的来源可能不同,比较各部分变异的大小。在完全随机设计资料的方差分析中,是把总变异分解为组间变异和和组内变异:SS总 分解为 SS组间 和 SS组内 ;总 分解为 组间 和 组内 ,得组间变异和组内变异分别为SSSS组间组

29、内MS组间 =和 MS组内 =,若各组的来自同一总体,则各组间的变异与组内变异一样,均由随机误组间组内差所致, MS组间 = MS组内 , F 值( FMS组间)服从 F 分布,查 F 界值表得到相应的 P 值,然后根据所取的MS组内检验水准 做出推断结论。答案难以统一,只要基本意思表达正确,均应给分,阅卷时需灵活掌握,注意把握尺度。三、在某次假设检验中,检验水准为0.05 ,所得的概率为 P 0.001 ,请就本例分别说明和 P 的意义?答:称检验水准, 是预先给定的概率值, 它确定了小概率事件的标准; P 的含义是指从 H 0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统

30、计量值的概率,即抽样误差的概率。将获得的概率P 与检验水准进行比较可得出结论。本例0.05 , P 0.0010.05 ,拒绝 H 0,接受 H 1 ,结论具有统计学意义,可以认为不同或不等。四、研究人员调查了 2005 年某社区全部居民的全死因死亡及恶性肿瘤死亡人数(见表 1),根据该资料可以得出哪些统计信息?答:可以得到以下统计信息:各年龄组人口构成比、各年龄组全死因构成比、恶性肿瘤死因构成比和各年龄组恶性肿瘤死亡构成比、粗死亡率和年龄别死亡率、恶性肿瘤死亡率和年龄别恶性肿瘤死亡率。(不要求:肿瘤后的死亡人数占全死因死亡人数的比例、全死因寿命表死亡概率、全死因寿命表生存概率、去肿瘤死亡后的

31、生存概率、去肿瘤死亡后的尚存人数、去肿瘤死亡后的死亡人数、去肿瘤死亡后的生存人年数、去肿瘤死亡后的生存总人年数、去肿瘤死亡后各年龄尚存者的平均预期寿命。)五、请解释多元线性回归分析中R2 和 sy123m 的统计学意义。SS答: R2 为决定系数,其意义是回归平方和SSR2可定量评价在y的总变异回归 占总离均差平方和总 的比例,用中,由 x 变量组建立的线性回归方程所能解释的比例。sy 123m 为剩余标准差,可以说明估计值的精确度,剩余标准差越小,表示回归方程的估计精度越高。六、什么是随访资料中的截尾值?出现的原因有哪些?答:由于某种原因使得部分病人不能随访到底,称之为截尾,从起点至截尾点所

32、经历的时间称为截尾值。出现截尾值的原因主要有随访对象失访、治疗措施改变、研究工作结束时事件尚未发生等情况。七、研究五种类型的军装在两种环境、两种活动状态下着装战士的主观热感觉(用评分表示),且需要进行全搭配实验,应采用何种设计?需安排几个实验组?请写出设计方案。答:应采用2×2 析因设计,需安排4 个实验组。具体设计方案如下:状态 1状态 2环境 11234512345环境 21234512345八、今测得 101 名 3049 岁正常成年男子的血清总胆固醇(表2)。据此资料进行全面的统计分析。(10分)答:由频数表可看出,资料近似服从正态分布,可用均数和标准差描述其集中趋势和离散趋

33、势。fXfX2(fX ) 2fX4.74 , S0 .8816f 1f制定 95% 参考值范围:估计总体均数的可信区间: n=101>50九、为了比较工人和农民的高血压患病率,随机调查了50 59 岁的男性工人 1281 人,其中高血压患者386 人;又随机调查了50 59 岁的男性农民 387人,其中高血压患者65 人。问工人与农民的高血压患病率是否相同?答:首先将资料整理成下表形式:是否患高血压是否合计工人3868951281农民65322387合计451121716681建立检验假设,确定检验水准H 0 :H 0 :1 2 , 工人与农民的高血压患病率相同1 2 , 工人与农民的高

34、血压患病率不同2选定检验方法,计算检验统计量(可选用下列两种方法之一):2( 1)检验:( 2) u 检验:确定 P 值,作出推断结论226.803.84,(或 u5.17 1.96 ),所以 P 0.05 。拒绝 H 0 ,接受 H 1 ,可以认为工人和农民的高血压患病率不同。十、今测得 10名男 20岁男青年的身高与前臂长(表3),问二者有无线性相关关系,若有相关关系,其相关关系的密切程度及方向如何。 (10分)作散点图(略)求相关系数l xy 78541454 * 1725226 ,10l xx29852517252962.5,l yy 206904542101078.4相关系数的假设检

35、验 H 0:0, 两变量间无线性相关关系H 1:0,两变量间有线性相关关系r0.824.05t1r 21 0.82 2n28 t 1.860, 所以 P 0.05 ,拒绝 H 0 ,接受 H 1 ,可以认为两变量间存在线性相关关系,并且呈正相关,即身高越长,前臂长越长。2002级临床医学七年制医学统计学期末考试题(B 卷)一、试述t 分布与u 分布的联系与区别。二、请以完全随机设计资料为例说明方差分析的基本思想。三、什么是假设检验的检验效能?其大小与哪些因素有关系?四、某医师对一组高血压病人在治疗过程中作追踪观察,记录其死因,并与未作治疗的高血压病人组作比较,两组死因构成比见表1。有人据此提出

36、:“高血压患者经过治疗虽然可以降低充血性心力衰竭等的病死率,但却使因冠状动脉硬化性心脏病和心脏病猝死的死亡危险性增加了。”这样的认识是否正确,为什么?死亡原因治疗组未治疗组充血性心力衰竭4.323.2脑血管病23.239.6尿毒症9.812.2冠状动脉病和心脏病猝48.717.1死其它原因14.07.9合 计100.0100.0五、请分别解释 Logistic回归模型和Cox 回归模型中偏回归系数的意义。六、生存时间资料有哪些特点?生存分析常用的分析方法有哪些?七、某研究室人员为研究5 个不同剂量的甲状腺提取液对豚鼠甲状腺重的影响,考虑到豚鼠的种系和体重对观测指标可能有一定的影响,选用5 个种

37、系的豚鼠作实验,并按5 个不同的体重标准选择受试对象,根据专业知识得知,药液、豚鼠种系、体重之间不存在交互作用。本研究应采用何种设计类型?共需多少只豚鼠?请写出实验设计方案。八、今测得 101 名 3049 岁的正常成年男子的血清总胆固醇(表2)。试根据此资料进行全面的统计分析。 ( 10 分)血清胆固醇 (mmol/L)频数2.513.083.594.0234.5255.0175.596.066.527.07.51合 计101九、某医院收集了305 例手术患者的资料,其中手术时间5 小时者 242 人,感染者 13 人;手术时间 5 小时者 63 人,感染者7 人。试据此分析手术时间长短对患

38、者切口感染是否有影响?十、某地 10 名一年级女大学生的胸围(cm)与肺活量( L)数据如表3 所示,试进行直线回归分析。 ( 10分)学生编12345678910号胸围 X72.83.78.88.77.81.78.74.73.79.5934173874肺活量2.53.11.93.22.82.83.11.92.93.2Y1118366188可能有用到的界值:t0.05,81.860t1.833t2.306, t 0.05,92.262 。, 0.05 ,9, 0.05,822方差分析用 F 界值: F0.05(1,8) 5.322002 级临床医学七年制医学统计学期末考试试题参考答案(B 卷)

39、一、试述 t 分布与 u 分布的异同与联系(10 分)答:相同点: t 分布与 u 分布均为以 0为中心的单峰对称分布。不同点:( 1)t 分布是一个分布族, t 曲线的形状与自由度有关,自由度越小,t 值越分散,曲线越低平;自由度越大, t 值越往中间集中,曲线峰值越高。而u 分布即标准正态分布的图形,是唯一的一条曲线。(2 )特定自由度的t 分布曲线与 u 分布曲线相比,峰值低而尾部高翘,相应区间内曲线下的面积小于u 分布。联系: t 分布的极限形式是u 分布。随着自由度的增加,t 分布逐渐接近u 分布,当自由度时, t 分布u 分布。二、请以完全随机设计为例说明方差分析的基本思想答:方差

40、分析的基本思想就是把全部观察值间的变异- 总变异按设计和需要分解成两个或多个组成部分,产生每部分变异的来源可能不同,比较各部分变异的大小。在完全随机设计资料的方差分析中,是把总变异分解为组间变异和和组内变异:SS总 分解为 SS组间 和 SS组内 ;总 分解为组间 和组内 ,得组间变异和组内变异分别为SSSSMS组间 =组间组内和 MS组内 =,若各组的来自同一总体,则各组间的变异与组内变异一样,均由随机误组间组内差所致, MS组间 = MS组内 , F 值( FMS组间)服从 F 分布,查 F 界值表得到相应的 P 值,然后根据所取的MS组内检验水准做出推断结论。三、什么是检验效能?其大小与哪些因素有关?(10 分)答:检验效能是指,在假设检验中,当无效假设H0 不正确时,用现有统计方法能够检验出其错误的能力,其概率用 1- 表示。其中为犯第二类错误即当H0不正确但不拒绝 H0 的概率。检验效能的大小与设定的检验水准、样本含量 n 、两总体参数的差值有关。其它条件一定时,越大,检验效能越高;样本量 n 越大,检验效能越高;两总体参数的差值越大,检验效能越高。反之,检验效能越低。五、请分别解释Logistic 回归模型和 Cox 回归模型中偏回归系数的意义。答: Logistic回归模型中的偏回归系数i 的意义为,当其它协变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论