卫生统计学重点整理-预防医学_第1页
卫生统计学重点整理-预防医学_第2页
卫生统计学重点整理-预防医学_第3页
卫生统计学重点整理-预防医学_第4页
卫生统计学重点整理-预防医学_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1. 卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生 服务领域中数据的收集、整理和分析的一门科学。2. 同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。 否则称为异质(heterogeneity)的或者间杂的。3. 变异(variation):同质事物之间的差别称为变异。没有个体变异,就没有统计学!4. 总体(populatio n):根据研究目的所确定的同质观察单位的全体。5. 样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。6. 样本含量(sample size):样本中包含的观察单位个数。

2、7. 参数(parameter):反映总体特征的指标。特点:未知、唯一,希腊字母表示,如总体均数、总体率等。8. 统计量(statistic):根据样本观察值计算出来的指标。特点:已知、不唯一,拉丁字母表示,如样本均数、样本率等。9. 变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特 征或属性称为变量。10. 变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observedvalue)。11. 资料(data):变量值的集合称之为资料。12. 定量资料(quantitative data):变量值是定量的,表现为数值

3、大小。特点:一般有度、量、衡单位,一般属连续性资料。13. 定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。特点:一般无度、量、衡单位,一般属于离散型资料。可进一步分为计数资料和等级资料。14. 计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所 得的资料。可进一步分为二项分类资料和无序多项分类资料。15. 等级资料(ordinaldata):将观察单位按照某种特质或属性的程度或等级顺序分组,清点各组观察单位所得的资料。各属性之间互不相容且有程度的差别。16. 抽样研究(sampling research):从总

4、体中随机抽取样本,通过样本信息推断总体特征的 研究方法。17. 抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量 之间的差异。18. 概率(probability):概率是随机事件发生可能性大小的数值度量。通常用 P表示。大小 介于0与1之间,即Ow P < 1。19. 小概率事件:医学研究中,将概率小于等于 0.05或0.01的事件称为小概率事件。20. 小概率原理:并不表示不可能发生,但在某一次试验中,是不会发生的。21. 单纯随机抽样(simple random sampling):先将调查总体的全部观察单位统一编号,然后采用随机数字表

5、、统计软件或抽签等方法之一随机抽取n (样本大小)个编号,由这n个编号所对应的n个观察单位构成研究样本。22. 系统抽样(systematic sampling):又称机械抽样或等距抽样。事先将总体内全部观察单位按某一顺序号等距分隔成n (样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔 m机械地在第2部分、第 3部分直至第n部分内各抽出一个观察单位组成样本。23. 分层抽样(stratified sampling) :是先按对观察指标影响较大的某项或某几项特征,将 总体分成若干层,该特征的测定值在层内变异较小、层间变异较大,然后分别从

6、每一层内 随机抽取一定数量的观察单位结合起来组成样本。24. 整群抽样(cluster sampling):是将总体划分为群(初级观察单位),各群由次级观察单 位组成。随机抽取一部分群,调查抽中群的全部次级观察单位。25. 信度(reliability):测量工具的可靠性,它是指采用相同测量工具(如问卷)对同一对象进行重复测量时,各次测量值与其均值接近的程度。26. 效度(validity):是指测量工具、指标或观测结果在多大程度上反映了事物的客观真实性,即指观测结果与试图达到的目标之间的接近程度,是对测量工具(如问卷)有效性的检验。27. 实验研究(experimental study):是

7、指研究者根据研究目的人为地对受试对象(包括人或 动物)施加处理因素,控制混杂因素,观察、总结处理因素的效应的一种研究方法。28. 处理因素(study factor ,treatment):是指研究者施加于受试对象的因素。29. 水平(level):是指同一处理因素在数量上或强度上的不同程度。30. 受试对象(study subjects):是处理因素作用的客体或对象。31. 实验效应(effect):是处理因素作用于受试对象后出现的反应和结局,它通过指标的选择 和指标的观察来体现。32. 偏倚(bias):研究误差中的系统误差部分称为偏倚。33. 平均数(average):表达了一组同质定量

8、数据的平均水平或集中位置。常用的平均数包括 算术均数、几何均数、中位数、众数、调和均数等。34. 算术均数(mean):常简称均数,是用一组观察值相加除以观察值的个数所得。常用x表示样本均数,表示卩总体均数。35. 几何均数(geometric mean):用G表示,是n个观察值乘积的n次方根,又称倍数均数。适用于:对数对称分布,等比级数资料,如血抗体浓度。观察之中不能有036. 中位数(median):用M表示,是将一组观察值由小到大排序后,居于中间位置的数值即为 中位数。中位数是一种位置平均数。37. 百分位数(percentile):用表示,是指将一组观察值由小到大排序后,将其平均分成1

9、00等份,对应于每一分割位置上的数值就称为一个百分位数。38. 医学参考值范围:亦称正常值范围,是指绝大多数“正常人”的解剖、生理、生化等指标 的波动范围。39. 率(rate):是说明某现象发生的频率或强度的指标,不会大于1。40. 构成比(proportion):表示事物内部各组成部分所占的比重,常以百分数表示,因此也称 为百分比。41. 相对比(ratio):是两个指标A、B之比。A、B可以是绝对数,A B也可以是相对数,A、 B可以是性质相同的两个指标,A、B的单位可以相同,也可以不同。42. 动态数列(dynamic series):是一系列按时间顺序排列起来的统计指标,用以说明事物

10、在 时间上的变化和发展趋势。43. 率的标准化:是在一个指定的标准构成条件下进行率的对比的方法。意义:当两个率要进 行比较大小时,若要对比的两组对象内部构成的差别足以影响结论时,可以应用率的标准 化法消除这种影响,使两个率具备可比性。44. 标准误(standard error ,SE):通常将样本统计量的标准差称为标准误。45. 可信区间(con fide nee in terval ,Cl):按一定的概率或可信度(1-:)用一个区间估计总体参数所在范围,这个范围称作可信度为1-:的可信区间,又称置信区间。46. Poisson分布:Poisson分布是二项分布的极限形式,二项分布中,当n很

11、小(<0.05 ),n很大,二项分布Poisson分布。47. I型错误(type I error) : H0实际上是成立的,但由于抽样的原因,拒绝了H0,这类“弃真”的错误称为I型错误,其最大概率为a。48. U型错误(type U error) : H)实际上不成立,但假设检验没有拒绝它,这类“取伪”的错误称为u型错误,其概率大小用B表示。49. 检验效能(power of a test) : 1- B,是指当两总体参数确有差别时,按 a水准能够发现这种差别的能力。即对实际上成立的H作出肯定结论的把握程度。50. P值:指从所规定的总体中随机抽样,获得等于或大于现有统计量值的概率。5

12、1. 参数检验(parametric test):在总体分布类型已知的条件下,在此基础上对未知的参数进行估计或检验,称为参数统计或参数检验。52. 非参数检验(nonparametric test):不依赖于总体的分布类型,不对总体参数进行推断,只是通过样本观察值比较总体的分布或分布位置,因此又称为任意分布检验。53. 直线相关(linear correlation): 又称简单相关(simple correlation),是用来描述具有直线关系的两变量x、y的相互关系的统计方法。54. 直线相关系数(li near correlati on coefficie nt) :亦称 Pears o

13、n 积矩相关系数,是定量描述两个变量间直线关系的方向和密切程度的指标。总体相关系数用p表示,样本相关系数用r表示。55. 死亡事件(death eve nt):又称失效事件/重点事件,指标志某种处理措施失败或失效的特征事件56. 生存时间(survival time):指观察到的存活时间,可用天、周、月、年等时间单位记录, 常用符号t表示。57. 完全数据(complete data):从观察起点至发生死亡事件所经历的时间。58. 结尾数据(censored data):简称结尾值,又称删失数据或终检值。生存时间观察过程的 截止不是由于死亡事件,而是由于其他原因因引起的,称为结尾。主要原因有三

14、种:失访、 退出、终止。59. 生存曲线(survival curve):以观察(随访)时间为横轴,以生存率为纵,将各个时间点 所对应的生存率连接在一起的曲线图,用以描述生存过程。60. 寿命表(life table):是根据特定人群的年龄组死亡率编制出的一种统计表,用以说明在 特定人群年龄组死亡率的条件下人的生命过程。111. 卫生统计学的主要内容:统计设计;统计分析;生命统计;常用统计分析软件简介。2. 统计分析包括: 统计描述:定量资料和定性资料的统计描述,统计表和统计图。统计推断:主要包括参数估计和假设检验。3. 统计工作的基本步骤:设计;收集资料;整理资料;分析资料。4. 参数V统计

15、量:参数是反应总体特征的指标;统计量是样本指标。5. 资料类型:定量资料定性资料:计数资料;等级资料。6. 产生抽样误差的根源:个体差异7. 医学研究方法主要有:调查研究;实验研究;文献研究。8. 常用抽样方法:单纯随机抽样;系统抽样;分层抽样;整群抽样。9. 抽样误差从小到大:分层抽样 系统抽样 单纯随机抽样 整群抽样10. 实验设计的基本原则:对照原则;随机原则;重复原则;均衡原则。11. 常用的实验设计方案:完全随机设计;配对设计;随机区组设计;交叉设计; 析因设计;重复测量设计。12. 实验设计的三要素:处理因素;受试对象;实验效应。13. 中位数适用于:偏态分布资料、一端或两端无确切

16、数据的资料、总体分布不明资料的资料14. 描述离散趋势常用的变异程度指标:极差、四分位数间距、方差、标准差、变异系数15.正态分布的参数:均数U :标准差(To卩是位置参数,T一定时,卩越大,曲线越向右移动;T是形状参数,卩一定时,T越大,曲线越平阔。标准正态分布:口 =0,T =1 o16. 标准差VS标准误: 标准差表示个体差异的大小,描述资料的频数分布状况,可用于制定医学参考值范围。 标准误描述样本均数的变异程度, 说明抽样误差的大小,用于总体均数的区间估计和假 设检验。17. 用正态近似法进行总体率的区间估计的条件:n足够大;(2) p和1-p均不太小;(3) np 和 n(1-p)均

17、大于 5。18. Poisson分布特点:方差与均数相同。19. 产生抽样误差的原因:抽样误差;个体变异(本质差别)20. x2检验校正后的变化:x2值偏小,P值偏大。21. 等级资料进行统计比较时:用秩和检验或Ridit分析。22. 老资料满足参数检验,却选用非参数检验的结果:降低检验效能,增大犯U型错误的概率。23. 生存曲线的特点:为一条下降的曲线。平缓表示生存率高或较长生存期,陡峭表示生存率低或较短生存期。24. 比较贡献大小米用:标准化的偏回归系数。25. 样本含量估计:接近0.5 若要求相同的检验标准,两组例数相等时所需样本含量较少。a可以取双侧,也可以取单侧;B只能取单侧。26.

18、 影响检验效能的要素 :样本含量;客观事物差异的大小;个体间变异的大小;(4)a值。27. 如何增大检验效能:增大a ;增加样本含量。【正态分布的特征】1. 正态曲线在横轴上方均数处最高,向两侧逐渐下降,并以均数为中心,左右对称,但两端 与横轴永不相交,呈钟形曲线。2. 正态分布有两个参数,即均数和标准差。卩是位置参数,(T 定时,卩越大,曲线越向右移动;C是形状参数,卩一定时,C越大,曲线越平阔。3. 正态曲线下面积的分布有一定的规律:正态分布曲线下一定区间内的面积代表了取值于相应区间内的观察值个数在全部观察值总数中所占的比例(频率),或者是观察值落在该区间内的概率: 正态曲线与横轴之间的面

19、积恒等于 1或100% 正态分布为对称分布,其对称轴两侧的面积各为50%; 区间(卩-(T,卩+ c)面积为68.27%;区间(卩-1.96(T,卩+1.96(T )面积为95%区间(卩-2.58(T,卩+2.58(T )面积为99%【制定医学参考值的原则、常用方法和适用条件】1. 原则:要确定一批样本含量足够大的“正常人”;根据研究目的和使用要求选定适当 的百分界值,如80% 90% 95唏口 99%常用95%根据专业知识确定单侧或双侧界值; 根据资料的分布特点,选用恰当的计算方法。2. 常用方法和适用条件: 正态分布法:适用于正态或近似正态分布的资料双侧界值:单侧上界:单侧下界: 百分位数

20、法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料双侧95%参考值范围为:P2.5P97.5单侧上界为:P95或单侧下界为:P5【I型错误VSU型错误】1. 重点减少I型错误:a可取小,如0.01 ;重点减少U型错误:a可取大,如0.2。2. a越大,U型错误越小,检验效能1- B越大。3. P Wa拒绝H)时,只犯I型错误;P>a不拒绝H)时,只犯U型错误。4. 双侧检验P< a,单侧必得P< a ;单侧检验P> a,双侧必得P> a。5. 单侧检验易犯I型错误,双侧检验易犯U型错误,单侧效能高于双侧。【假设检验】前提条件总体具有同质性;样本具有代表性和

21、组间可比性。基本步骤 建立检验假设,确定检验水准; 选疋检验方法和计算检验统计里; 确定P值,做出推断结论。注意事项1. 应有严密的研究设计:总体中的每个研究个体应具有同质性;样本资料应具有代表性;比较 的组间应具有可比性。2. 正确理解a水准和P值的意义3. 正确理解结论的统计学意义4. 假设检验的结论不能绝对化【t检验】含义一种以t分布为基础,以t值为检验统计量的计量资料的假设检验方法。基本思想假设在H0成立的条件下做随机抽样,按照t分布的规律获得现有样本检验统计 量t值的概率为P,将P值与事先设定检验水准a进行比较,判断是否拒绝H0应用条件独立性;正态性(可用正态性检验来确认);方差齐性

22、(可由方差齐性检 验来认定)。主要用途 单个样本均数与总体均数的比较; 配对设计资料的差值均数与总体均数的比较; 成组设计的两样本均数差异的比较。【方差分析】含义一种以数据分析的变异为基础,以 F值为统计量的计量资料的假设检验方法。基本思想将全部观察值之间的总变异按设计类型分解为两个或多个组成部分,通过比较 不同变异来源的均方,借助F分布做出统计推断。应用条件独立性;正态性(可用正态性检验来确认);方差齐性(可由方差齐性检 验来认定)。主要用途多个样本均数的比较(三个及三个以上)【X2检验】含义一种以x2分布为基础,以x2值为检验统计量的计数资料的假设检验方法。基本思想通过X2值的大小反映实际

23、频数(A)和理论频数(T)的符合程度,在H0成立时,实 际频数(A)和理论频数(T)的相差不应该很大,果实际频数(A)和理论频数(T)的 相差很大,则H0成立的可能性很小。应用条件独立性;正态性(可用正态性检验来确认);方差齐性(可由方差齐性检 验来认定)。主要用途 推断两个或两个以上总体率(或构成比)之间有无差别; 两变量间有无相互关系;检验频数分布的拟合优度。2X2表的 x2检验的 注意事项 当n40且所有T>5时,用2X2表x2检验的基本公式或专用公式计算 x2 值; 当n40但有 K TV 5时,需要用校正公式计算x2值; 当nv40或有TV 1时,不宜计算x2值,需米用Fish

24、er确切概率法直接计算 概率。RX C表的 x2检验的 注意事项 允许有不超过1/5的基本格子理论频数大于1小于5,但不能有理论频数小 于1 ; 如果有1/5以上格子的理论频数大于1小于5,或有1个格子的理论频数小 于1,可增加样本含量。【非参数检验的优、缺点】优点:适用于任何分布的资料; 不受总体方差一致的限制; 可用于等级资料的统计分析; 有些问题本身没有适当的参数检验方法而非参数检验则恰能处理。缺点:由于它没有充分利用原始数据中所提供的信息故检验效能低;其效果有一定近似性。【秩和检验】含义亦称符号秩和检验或 Wilcox on配对法,属于非参数检验(不依赖于总体分布类 型,不对总体参数进

25、行推断,只是通过样本观察值推断总体的分布或分布位置 是否有差别)。基本思想在H)成立的前提下,差值(配对差值、样本各测量值和已知总体中位数 M的差 值)的总体分布是对称的,总体中位数应为 0,T+与T-应接近n(n+1)/4。若正负 秩和相差悬殊,则有理由怀疑 H>的成立。适用条件 不满足参数检验条件的资料及无法经变量变换满足参数检验条件的资料; 未加精确测量的资料,如一端或两端为不确定数值的资料; 分布类型未知的资料。主要用途 推断配对设计资料差值的总体中位数是否为 0; 推断样本所来自总体的中位数与已知总体中位数是否相等。【等级相关适用范围】1. 不服从双变量正态分布的资料;2. 总体分布类型未知的资料;3.等级资料。【直线回归分析】含义直线回归是研究两个连续性变量间线性依存关系的一种统计分析方法,用直线

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论