山东大学医学统计学历年考题_第1页
山东大学医学统计学历年考题_第2页
山东大学医学统计学历年考题_第3页
山东大学医学统计学历年考题_第4页
山东大学医学统计学历年考题_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学历年考题+答案 By LWW山东大学医学统计学历年考题【2011-6-8 医学院07级七年制考题】举例说明总体和样本?根据研究目的确定的、全部同质个体的某个变量值为总体。是总体中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。2就是往年题里甲地乙地出生婴儿体重的那个题,一共4问。3数值变量集中趋势指标,适用范围,公式4总体率的可信区间的含义与怎么估计 可信区间:如果重复100次样本含量相同的抽样,每个样本均按同一方法构建95%可信区间则理论上平均有9

2、5个可信区间包含了总体率。(均数)查表加公式5实验设计的原则,目的是什么?6A,B两个药治疗某疾病,疗效为二分类变量(有效为1,无效为0),A,B两药使用有两个水平(使用为1,不用为0),先得logit(P)=0.25xA+0.8XB+某常数,什么A B两药使用过程相互独立什么的。(1)是评价AB两药的疗效(2)同时使用两药与两药都不使用的优势比7完全随机设计的方差分析(1)完善方差分析表SS总和SS组间已知,k=3(2)得出结论。8一个直线回归分析,题中说明存在散点图存在线性趋势。9是一个配对四个表的题,给出了SAS配对卡方检验的结果:(1)问给的资料是什么类型?设计方案(2)所用的统计分析

3、方法,给出假设,统计量,P值与最后结论。【2010-6-28 医学院06级临七试题】一简答(8个) 1.医学参考值和可信区间的区别; 2.错用构成比代替率的一个例子; 3.方差分析的基本思想,应用条件,用途;方差分析的基本思想就是把全部观察值间的变异-总变异按设计和需要分解成两个或多个组成部分,产生每部分变异的来源可能不同,比较各部分变异的大小。在完全随机设计资料的方差分析中,是把总变异分解为组间变异和和组内变异: 分解为 和 ; 分解为 和 ,得组间变异和组内变异分别为 = 和 = ,若各组的来自同一总体,则各组间的变异与组内变异一样,均由随机误差所致, = ,F值( )服从F分布,查F界值

4、表得到相应的P值,然后根据所取的检验水准 做出推断结论。4.析因设计,计算需要多少只动物; 5.logistic回归的偏回归系数含义;Logistic 回归模型中的偏回归系数i的意义为,当其它协变量均不变时,xi每变化一个单位或一个等级时, 比数比的自然对数(lnORi) 平均变化i 个单位,可以反映xi对结局事件的作用强度。Cox 回归模型中的偏回归系数i的意义为,当其它协变量均不变时,xi每变化一个单位或一个等级时, 相对危险度的自然对数(lnRRi) 平均变化i 个单位,可以反映xi对结局事件的作用强度。 6.假设检验的两类错误的概念;1、第一类错误:当H0为真时,拒绝H0接受H1。又称

5、假阳性错误(阳性指两者总体参数有差异)。检验水准是预先规定的犯第一类错误的概率的最大值。2、第二类错误:当H0为假时,不拒绝H0。又称假阴性错误。概率大小用表示,只取单侧,一般未知。可证,越大越小,越小越越大。若要同时减少第一类错误和第二类错误,唯一方法是增大样本含量。 7.二项,Poisson,正态分布的联系; 8.r*c表的一个题,分哪几种,每一种用什么方法检验; 题中的是单向有序?这部分没看,七年制的那白皮课本上没这概念啊.不会,绿皮书上有)二计算 1.可信区间计算:两样本的均数比较,u检验 2.四格表资料 3.直线回归计算 4.完全随机设计的方差分析【2010-01-15 医学院07级

6、临八试题】1方差分析的基本思想,用途和条件 2. 什么是抽样误差?如何衡量正态分布,二项分布和poisson的抽样误差 3标准差和标准误的区别与联系 区别:意义:标准差是描述数据分布离散程度的指标;标准误是样本统计量的标准差。公式: ; (2分)用途:标准差用于表示数据离散程度的大小;也可用于计算变异系数、估计频数分布、制定参考值范围、进行质量控制;很多统计处理方法中要用到标准差。 标准误用于反映抽样误差的大小;计算总体均数的可信区间;统计处理方法的基础,如t检验。联系:标准误与标准差成正比;若标准差固定不变,可通过增加样本含量来减少抽样误差。4什么是截尾值?出现的原因?由于某种原因使得部分病

7、人不能随访到底,称之为截尾,从起点至截尾点所经历的时间称为截尾值。出现截尾值的原因主要有随访对象失访、治疗措施改变、研究工作结束时事件尚未发生等情况。5多元线性回归分析中R2和Sy123m的统计学意义 R2为决定系数,其意义是回归平方和SS(回归)占总离均差平方和SS(总)的比例,用R2可定量评价在 y的总变异中,由Sy123m变量组建立的线性回归方程所能解释的比例。 为剩余标准差,可以说明估计值的精确度,剩余标准差越小,表示回归方程的估计精度越高。6完成交叉设计的方差分析表 7根据两独立样本推断两总体率相等的方法有哪些?如何正确选用?分析思路? 8随机区组设计的分组方案 9问一例回归分析的步

8、骤和公式 10实验操作【2009-6-24 医学院05级临七考试】1举例说明参数和统计量。5分2集中趋势的指标,公式,应用范围。53假设检验的基本思想。104医学参考值范围和区间估计的题。 105多元线性回归的共线性和其诊断指标。106生存分析定义和方法。107R*C表计算,158线性回归分析计算,159拉丁方设计 5只兔子,5个注射部位,5个注射顺序,编一个方案。15分10实验 15【2011-12-1 口腔08级七年制试题】1. 举例说明总体和样本2. 数据变量资料集中趋势的指标、适用范围、公式3. 大学生身高的样本,给出均值和标准差,求一定范围内样本所占比例4. 标准差和标准误的区别5.

9、 给出两组资料,写出两样本均数t检验分析思路6. 给出三组资料,写出分析思路(方差分析)7. 完全随机四格表资料分析思路8. 直线相关和回归的区别与联系【2011-01-12 口七试题】举例说明总体和样本总体是根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。样本是按随机化原则从同质总体中随机抽取的部分观察单位的变量值的集合。例如:研究2006年某市7岁男童体重的医学参考值范围,该市2006年全体7岁男童的体重值构成总体;从这些7岁男童中随机抽取100名,其体重测量值构成样本。(6分)2如何对一组资料进行描述性分析3四格表资料的分析思路4方差分析的用途和应用条件(5分)5对一组变量进

10、行分类,并说明各分类的定义(题中给了一些变量及他们的变量值,让你进行分类)变量:在搜集资料时,对每个观察单位得某项特征进行测量或观察,该特征称为变量。变量类型:1.数值变量其变量值是定量的,表现为数值得大小,通常用仪器或某种尺度测定出来,多有度量衡单位。由数值变量的测定值组成的资料称为数值变量资料或计数资料。如:身高、体重、心律、住院天数、血压等。2.分类变量亦称定性变量,表现为互不相容的类别或属性。分类变量可分为无序与有序两类:(1)无序分类分类是指所分类别或属性之间无程序或顺序上的差别。分析无序分类变量时,应先按类别分组,计各组的观察单位数,所得资料称为无序分类变量资料或计数资料。如:性别

11、(男、女),血型(O、A、B、AB)等。(2)有序分类变量是指所分类别或属性之间无程序或顺序上的差别。分析有序分类变量时,应先按等级顺序分组,计各组的观察单位数,所得资料称为有序分类变量资料或等级资料。如:尿糖化验结果按、分类,疗效按治愈、好转、无效、恶化分组。6给了某地区血红蛋白的检测结果,给了样本含量,均数,标准差。说“有人认为,该地区的男女的血红蛋白都偏低,并且男性比女性的高”问你对不对。(1)、未设对照组,不能肯定是药物的疗效,可能会受环境、气候等很多因素的影响。(3分)(2)、没有进行假设检验,需要通过假设检验来判断而不能仅凭观察结果就下结论。7两种药甲药与乙药。给了各10个治疗前后

12、的白细胞数值。第一问:甲药乙药对白细胞数量的变化有无影响,第二问是甲药与乙药对白细胞数量变化的影响有无差别。甲药(治疗前) 甲药(治疗后) 乙药(治疗前) 乙药(治疗后) 8给了一组数据,要你计算两变量的相关回归分析。(相关跟回归都写)9医学参考值范围与可信区间的区别。【2009-01-16 口七试题】1举例说明假设检验的基本思想(5分)2正态分布,二项分布,poisson分布的95%可信区间(10分)3两个数值变量相关关系分析(5分)4卡方分布,行列表使用条件(原题是拐着弯问的)(10分)5多元共线性诊断指标(给了个例子问是怎么回事)(10分)6随机区组设计分组(实例,给了随机数字表,让你自

13、己分)(10分)7一个222析因设计,分组,分析思路(10分)8一个献血者和非献血者骨什么含量的分析,调查了200个献血者和1400个非献血者,记录其性别和年龄,问原来的资料整理方法和分析方法对不对,为什么,应该怎样(10分)9一个原始资料,问包含是哪些类型的资料,将其整理并描述(10分)【2003级临床七年制】一、问答题(每题10分)1、何谓小概率事件,小概率事件的统计学意义什么?在统计学中有哪些用途?发生概率很小(如P=0.05,或P=0.01)的事件称谓小概率事件(3分),在统计学中常认为一次抽样获一次观察小概率事件不会发生(3分),统计学中小概率事件常用于假设检验和参数估计(4分)。2

14、、在多元线性回归模型中,偏回归系数的意义是什么?如果判断各自变量对因变量影响的大小?偏回归系数反映的是当其他自变量都固定不变的情况下(3分),某自变量X,每增加或减少一个单位,应变量平均增加或减少Bj个单位(4分),不能根据偏回归系数的大小判断各自变量对因变量影响的大小,需根据标准偏回归系数判断各变量对因变量影响的大小(3分)。3、描述数值变量资料的指标有哪些,其适用条件是什么?描述正态分布资料的集中趋势和离散趋势可以用均数和标准差(4分);对数正态分布或等比级数资料用几何均数描述集中趋势(3分);偏态分布资料用中位数和四分位数间距描述集中趋势和离散趋势(3分)。4、以数值变量为例说明参考值范

15、围与总体参数置信区间的区别。在意义上,前者是大部分(如95%)变量值的所在范围(1分),后者反映的是总体参数在某在的范围的概率(95%)(1分);计算方法不同,以数值变量为例前者为均数加减u倍的标准差(2分),后者为均数加减t倍的标准误(2分);用途不同,前者可用于临床上辅助诊断的依据(2分),后者用于估计总体参数(2分)。5、在假设检验中与P值的意义有何不同?前者为检验水准(4分),后者为假设检验中由于抽样误差的原因所致的概率(4分),后者根据与前者比较做出统计推断(2分)。6、某研究者分别对A、B两份资料做统计推断,检验水准均定为0.05.分别得P=0.03、P=0.07.试问,这两次推断

16、的结果分别可能所犯何种错误,犯错误概率分别为多少?采取何种措施可以减少犯这类错误的概率?对A资料的检验犯第一类错误(2分)的概率为0.05(2分),对B资料的检验犯第一类错误(2分)的概率为0.05(2分);增加样本含量可以减少样本含量(1分),也可以调整检验水准(1分)。7、二项分布对资料有何要求?每个个体只具有两种相互对立的结果中的一种(3分),发生某事件的概率固定不变得(3分),每个试验是相对独立的。【2002级临床医学七年制期末考试题】试述t分布与u分布的联系与区别。t分布与u分布均为以0为中心的单峰对称分布。不同点:(1)t分布是一个分布族,t曲线的形状与自由度有关,自由度越小,t值

17、越分散,曲线越低平;自由度越大,t值越往中间集中,曲线峰值越高。而u分布即标准正态分布的图形,是唯一的一条曲线。(2)特定自由度的t分布曲线与u分布曲线相比,峰值低而尾部高翘,相应区间内曲线下的面积小于u分布。联系:t分布的极限形式是u分布。随着自由度的增加,t分布逐渐接近u分布,当自由度趋近于无穷时,t分布u分布。2.请以完全随机设计资料为例说明方差分析的基本思想。3.什么是假设检验的检验效能?其大小与哪些因素有关系?检验效能是指,在假设检验中,当无效假设H0不正确时,用现有统计方法能够检验出其错误的能力,其概率用1-表示。其中为犯第二类错误即当H0不正确但不拒绝H0的概率。检验效能的大小与

18、设定的检验水准、样本含量n、两总体参数的差值有关。其它条件一定时,越大,检验效能越高;样本量n越大,检验效能越高;两总体参数的差值越大,检验效能越高。反之,检验效能越低。4.某医师对一组高血压病人在治疗过程中作追踪观察,记录其死因,并与未作治疗的高血压病人组作比较,两组死因构成比见表1。有人据此提出:“高血压患者经过治疗虽然可以降低充血性心力衰竭等的病死率,但却使因冠状动脉硬化性心脏病和心脏病猝死的死亡危险性增加了。”这样的认识是否正确,为什么?死 亡 原 因治疗组未治疗组充血性心力衰竭4.323.2脑血管病23.239.6尿毒症9.812.2冠状动脉病和心脏病猝死48.717.1其它原因14

19、.07.9合 计100.0100.0这种认识不正确。错在以构成比代替率作分析。表中两列数据分别为治疗组和非治疗组中,高血压患者死亡病例中各种死亡原因的构成比,说明治疗组的死亡病例中,主要死因为冠状动脉病和心脏病猝死,其次为脑血管病;而非治疗组的死亡病例中,主要死因为脑血管病,其次为充血性心力衰竭。 至于两组的病死率,孰高孰低,仅根据本表无法分析。5.请分别解释Logistic回归模型和Cox回归模型中偏回归系数的意义。6.生存时间资料有哪些特点?生存分析常用的分析方法有哪些?特点:(1)分布类型不易确定。一般不服从正态分布,少数情况下近似服从指数分布、Weibull分布、Gompertz分布等

20、,多数情况下往往不服从任何规则的分布类型。(2)生存时间的影响因素多而复杂且不易控制。(3)根据研究对象的结局,生存时间数据可分为两种类型:完全数据和截尾数据。常用的分析方法:(1)非参数法:非参数法的特点是不论资料是什么样的分布形式,只根据样本提供的顺序统计量对生存率进行估计,常用的方法有乘积极限法和寿命表法。对于两个及多个生存率的比较,其无效假设只是假定两组或多组总体生存时间分布相同,而不对其具体的分布形式及参数进行推断。(2)参数法:参数法的特点是假定生存时间服从于特定的参数分布,然后根据已知分布的特点对影响生存的时间进行分析,常用的方法有指数分布法、Weibull分布法、对数正态回归分析法和对数logistic回归分析法等。参数法通过估计的参数得到生存率的估计值。对于两组及以上的样本,可根据参数估计对其进行统计推断。(3)半参数法:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论