卫生统计总复习课件_第1页
卫生统计总复习课件_第2页
卫生统计总复习课件_第3页
卫生统计总复习课件_第4页
卫生统计总复习课件_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卫生统计学总复习 医学研究的特点:研究的是样本,要对总体作出推断需进行参数估计和假设检验 抽样研究 抽样误差利用“小概率原则”进行统计推断医学科研工作特点决定了统计研究的一般步骤 准确的收集数据; 准确的录入数据; 正确的选用统计分析方法、调用统计分析程序; 对输出的结果作出合理的解释。统计学学习的重点是掌握如何:统计描述抽样分布参数估计:点估计、区间估计定量资料算术均数、 中位数等集中趋势:离散趋势:极差、 四分位数间距、方差、标准差、变异系数定性资料:频率型指标、强度型指标、比 统计表和统计图统计推断变量概率分布:二项分布、Possion分布、正态分布假设检验多变量:多重线性回归、logi

2、stic回归两变量:简单线性相关和回归分析单变量非参数检验秩和参数检验:t 检验、 方差分析等定性资料实验设计分组数定量资料科研应用实验设计:三要素、四原则、实验设计方案、样本含量估算调查设计:抽样方法、调查表的考评、样本含量估算知识框架:科研设计寿命表 定义通过测量得到数据资料一、数值变量分布类型离散程度指标集中趋势指标集中趋势指标算术均数:用于正态分布资料几何均数:用于等比数列和等级资料公式:小样本(直接法) 大样本(频数表法)百分位数法: 中位数:适用偏态资料 1.直接法:小样本(奇数和偶数)2.频数表法:大样本公式同百分位数法 M=P50正态分布和抽样分布均数;标准差N(,2 )抽出n

3、个的样本随机抽样原总体X1, X2, X3Xn样本均数X1, X2, X3Xn正态分布与抽样分布均数;标准误 N(, 2 ) XsXs = 50 =10X总体分布抽样分布X50=xmn =162.5=xs原变量样本均数二、分类变量 定义通过计数得到数据资料二项分布Poisson分布总体参数的估计 参数估计:已知数据分布类型非参数估计:分布类型不清,不规律数据。数据资料的差异性比较定量资料数据类型设计类型单样本定性资料设计类型两独立样本配对样本多独立样本随机区组t / Z检验方差分析单样本两、多独立样本配对样本等级资料进入条件不满足进入条件秩和检验四格表RC列联表配对RCx2检验设计类型配对四格

4、表重复测量变量变换或秩和检验t 检验变量变换或秩和检验例数n 50例数正态偏态n 50方差齐t 检验方差不齐方差齐变量变换或秩和检验t 检验非参数统计秩和检验:用于分布不清和等级资料。方法:配对、两样本和多样本秩和检验。重点:掌握原理,与参数统计相比的区别?该法既能分析定量变量资料,又能分析有序变量或等级变量资料,在不符合参数统计方法条件时,用秩和检验;对有序变量或等级变量资料,如果是疗效检验,用秩和检验,不用 检验,这种情况实际中容易误用。列联表 检验用于两个率(两个构成比)或多个率(多个构成比)比较1.基本方法:2.每种方法的使用条件:3.判断结果:=(R-1)(C-1)4.四格表法:5.

5、 行乘列表法:对于四格表资料的假设检验: n40且所有T5 n40但有1T5 n40或有T1 定性资料的假设检验-12. 对于配对分类数据的 22 表: 1. b+c 40 2. b+c 40 cbcb+-=22)(c)(cbcb+-=221c定性资料的假设检验-2 自变量X因变量Y 统计方法单因单果1个1个简单相关simple correlation简单回归simple regression多因单果多个1个多重相关multiple correlation多重回归multiple regression多因多果多个多个典则相关cononical correlation多元回归multivaria

6、te regression单因单果(扣除其它变量影响)1个1个部分偏相关partial correlation相关和回归分析简单相关:01 绪论1. 掌握6组基本概念: 总体与样本 同质与变异、 参数和统计量 变量与变量分类、 抽样研究与抽样误差 随机事件与概率2. 掌握什么是抽样误差,它产生的原因及主要特征。 3. 掌握随机事件、概率和小概率事件的基本含义。02、03、04 统计描述掌握定量资料集中趋势的指标:算术均数、几何均数、中位数的概念、计算和适用条件;掌握定量资料离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数的概念、计算和适用条件掌握率、构成比的概念和区别,掌握相对数的注

7、意事项;掌握常用统计图表的适用范围和制作方法,根据资料的类型选择合适的统计图对资料进行描述。 05 概率分布熟悉Poisson分布、二项分布的概念、参数与图形特征。 掌握掌握正态分布的概念,图形特征两个参数及面积规律。 掌握标准正态分布的概念,标准化方法及意义。 掌握正态分布和应用参考值范围的定义,计算方法。06 参数估计基础 熟悉抽样误差的概念及产生原因 掌握抽样误差的概念以及标准误的计算; t 分布的图形特征; 参数估计的概念和参数估计的基本方法。07 假设检验基础掌握假设检验中P 值的含义及其与的区别。掌握假设检验的基本思想和步骤;掌握型错误和型错误的概念,及二者的关系假设检验的功效,单

8、样本t检验、两独立样本t检验和校正t 检验以及配对设计t检验的模型假设;掌握假设检验的注意事项。08 方差分析掌握方差分析的基本思想及模型假设;掌握各种设计方案(完全随机设计、随机区组设计、重复测量数据的方差分析)的概念、变异和自由度的分解方法及结果解释方法。熟悉多个样本均数的两两比较。09 检验了解四格表概念及四格表中4个基本数据的含义;掌握四格表资料检验的基本公式及各公式的适用条件;掌握配对四格表检验的基本公式及各公式的适用条件;掌握四格表的确切概率法的适用条件;掌握检验的注意事项。10 基于秩次的非参数检验秩和检验掌握两独立样本定量资料的统计分析思路:两样本均来自正态总体且总体方差齐时用

9、t 检验,两样本来自正态总体但总体方差不齐时用检验或秩和检验,当数据来自偏态分布总体时,首先考虑采用变量变换,再考虑选用秩和检验;掌握非参数检验的概念及优缺点;掌握不同设计类型秩和检验的应用范围及结果报告方式。11 两变量关联性分析 利用散点图分析样本相关系数可能出现的各种假象,并作出合理解释。 掌握各种两变量资料类型的关联性分析方法,及应用的前提条件。熟悉线性相关分析的基本步骤。掌握 Pearson积矩相关系数、 Spearman秩相关系数、关联系数的概念、计算方法及解释意义。4. 掌握关联性分析的结果解释意义。 12 简单回归分析1. 掌握线性回归适用资料类型、应用前提假设。2. 熟悉线性

10、回归的基本步骤,模型公式、求解回归方程中参数估计量和值所遵循的最小二乘原则;3. 掌握回归系数的含义、计算方法及解释意义;4.掌握相关与回归分析的区别与联系。13 多重线性回归与相关掌握多重线性回归分析的适用资料类型、应用前提条件诊断和多重共线性。熟悉多重线性回归分析的模型公式、基本步骤;掌握多重线性回归分析中偏回归系数、标化的回归系数的概念和解释意义。掌握确定系数、复相关系数、调整确定系数、调整复相关系数的概念和意义。14 实验设计 熟悉配对、随机区组、析因、交叉、重复测量实验设计方法及其优缺点; 掌握样本含量估算的意义和4个主要影响因素。15 调查设计 掌握调查研究的特点(与实验研究比较)

11、; 四种基本的抽样方法的概念及优缺点;19 寿命表了解简略现时寿命表的编制过程。掌握年龄组死亡概率、年龄组死亡率、尚存人数、生存人年数、期望寿命的概念。掌握生存率和生存概率的区别与联系。20 logistic回归分析掌握logistic回归分析的适用资料类型、应用前提条件及注意事项。熟悉logistic回归分析的函数公式及建模基本步骤。掌握 logistic回归模型中偏回归系数、优势比或相对危险度的概念、解释意义及相互关系。 21 生存分析熟悉生存资料的特点。掌握生存时间、删失、生存率、生存概率的定义掌握log-rank检验及适用条件;笔试题型(80%)平时成绩(20%) 名词解释 单项选择题

12、 简答题 计算分析题考试题型:总体总体是指特定研究对象中所有观察单位的测量值。 2. 统计推断通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。 3. 可信区间按预先给定的概率确定的包含未知总体参数的可能范围。I型和II型错误 I型错误指拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用表示;II型错误,指接受了实际上不成立的H0,这类“存伪”的错误称为II型错误,其概率大小用表示。 一、名词解释5. 回归系数 为直线的斜率,其统计学意义是自变量x改变一个单位时, 应变量y平均变化个单位。 生存人年数 生存人年数是指假想的同时出生的一代人中,X岁尚存

13、者在 今后i年内的平均生存人年数。7. 灵敏度 是诊断试验将实际有病的人正确诊断为病人的百分率。 一、名词解释1. 对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P0.05),则( )A. b无统计学意义 B. b有高度统计学意义C. b有统计学意义 D. 不能肯定b有无统计学意义关于基于秩次的非参数检验,下列说法错误的是( )A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检 验大D.当样本足够大时,秩和分布近似正态二、单项选择题CB3. 两样本均数比较,经t检验得出差别有统计

14、学意义的结论时,P越小,说明( )A. 两样本均数差别越大 B.两总体均数差别越大C. 越有理由认为两总体均数不同 D. 越有理由认为两样本均数不同4. 下面说法中不正确的是( ) A. 没有个体差异就不会有抽样误差 B. 抽样误差的大小一般用标准误来表示 C. 好的抽样设计方法,可避免抽样误差的产生 D. 医学统计资料主要来自统计报表、医疗工作记录、专题调查 或实验等二、单项选择题CC5. 用最小二乘法确定直线回归方程的原则是各观察点( )。 A距直线的纵向距离相等 B距直线的纵向距离的平方和最小 C与直线的垂直距离相等 D与直线的垂直距离的平方和最小6比较身高和体重两组数据变异度大小宜采用

15、( )。 A变异系数 B方差 C极差 D标准差7在均数为 ,标准差为 的正态总体中随机抽样, ( )的概率为5%。 A B C D. 二、单项选择题BAB8. 实验设计的三个基本要素是( )A. 受试对象、实验效应、观察指标 B .随机化、重复、设置对照C. 齐同对比、均衡性、随机化 D.处理因素、受试对象、实验效应9 实验设计和调查设计的根本区别是( )A实验设计以动物为对象 B调查设计以人为对象C实验设计可随机分组 D实验设计可人为设置处理因素10. 关于多重线性相关与回归说法错误的有( )A. 进行相关与回归分析时资料需满足LINE条件B. 确定系数是复相关系数的平方C. 进入方程的变量

16、数目越多,复相关系数越大D. 复相关系数的假设检验与部分(偏)相关系数的假设检验等价 二、单项选择题DDD欲研究广州市正常成年男子的血糖情况,在广州市随机抽取了200名正常成年男子进行调查,以此为例说明(叙述)同质、变异、变量、变量值、总体与样本这几个概念。答:同质是指具有某些相同的特征,如本例中广州市、正常成年、男子等几个特征;这些同质个体的全部就构成了总体;每个个体间的差异如身高、血糖值不同就是变异;从总体中随机抽取的个体组成一个样本,如本例中的200人;他们的测量指标是变量,如血糖;每个个体的测量值叫变量值,如张三的血糖值。三、简答题2. 简述医学中参考值范围的涵义及制定参考值范围的一般

17、步骤。答:医学中常把绝大多数正常人的某资料范围称为该资料的参考值范围,也叫正常值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究资料的疾病和有关因素的同质人群。制定参考值范围的一般步骤:(1)定义“正常人”,不同的资料“正常人”的定义也不同。(2)选定足够数量的正常人作为研究对象。(3)用统一和准确的方法测定相应的资料。(4)根据不同的用途选定适当的百分界限,常用95%。(5)根据此资料的实际意义,决定用单侧范围还是双侧范围。(6)根据此资料的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。三、简答题3. 为什么不能以构成比代率?请联系实际加以说明。 答:率和构成比所说明的

18、问题不同,因而绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,5060岁年龄组的高血压病例占52.24%,所占比重最大,60岁组则只占到6.74%。这是因为60岁以上受检人数少,造成患病数低于5060岁组,因而构成比相对较低。但不能认为年龄在5060岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。 三、简答题4. 应用直线回归和相关分析时应注意哪些问题?答: 作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认

19、识。 在进行回归分析和相关分析之前,应绘制散点图。但观察点的分布有直线趋势时,才适宜作回归、相关分析。如果散点图呈明显曲线趋势,应使之直线化再行分析。散点图还能提示资料有无可疑异常点。 直线回归方程的应用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外还是直线,应避免外延。 双变量的小样本经t检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。 相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。三、简答题3. 调查设计包含哪些内容?答:一个完整的调查设计应包括以下内容:确定明确的调查

20、目的;确定调查对象和观察单位;确定调查方法;确定调查指标和变量;确定调查工具和设计调查表;确定样本含量;调查员的选择和培训;调查的组织计划;涉及伦理道德方面问题的处理。三、简答题 1. 假定正常成年女性红细胞数近似服从均值为4.18,标准差为0.29的正态分布。令X代表随机抽取的一名正常成年女性的红细胞数,求:(1)变量X落在区间(4.00,4.50)内的概率;(2)正常成年女性的红细胞数95%参考值范围解:(1)根据题意,变量X近似服从正态分布,求变量X落在区间(4.00,4.50)内的概率,即是求此区间内正态曲线下的面积问题,因此,可以把变量进行标准化变换后,借助标准正态分布表求其面积,具体做法如下: 四、计算分析题 变量落在区间(4.00,4.50)内的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论