卫生统计学-重点整理资料东大_第1页
卫生统计学-重点整理资料东大_第2页
卫生统计学-重点整理资料东大_第3页
卫生统计学-重点整理资料东大_第4页
卫生统计学-重点整理资料东大_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卫生统计学第一章 绪论卫生统计学得概念(Pl)卫生统计学就是应用概率论与数理统计学得基本原理与方法,研究居民 卫生状况以及卫生服务领域中数据得收集、整理与分析得一门科学,就是卫 生及其相关领域研究中不可缺少得分析问题。2、卫生统计学得4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学得儿个基本概念(P4):(1) 同质:在统计学中,若某些观察对象具有相同得特征或属性,我们就称之为同质,或具有同质性。变异:同质个体得某项特征或属性得观察值或测量值之间得差异。总体:同质得所有观察单位某种特征或属性得观察值或测量值得集合。样本:从总体中随机抽取得具有代表性得部分观察单位得集合。样

2、本中包含得观察单位个数成为样本含量。参数:反映总体特征得指标,一般就是未知得,常用希腊字母表示,如总体均数口、总体率n等。统计量:根据样本观察值计算出来得指标,常用拉丁字母表示,如样本均数X 、样本率P等。(7)变量与资料:对每个观察单位进行观察或测量得某项特征或属性称为变量;变量值得集合成为资料。定量资料:亦称计量资料,其变量值就是定量得,表现为数值大小,一般有度、量、衡单位。定性资料:亦称分类资料,其观察值就是定性得,表现为互不相容得类别或属性,一般无度、量.衡单位。可细分为:计数资料;等级资料第二章 调査研究设计lx调査研究得特点(P7): 不能人为施加干预措施;不能随机分组;很难控制干

3、扰因素;一般不能下因果结论2、常用抽样方法(名称、原理):单纯随机抽样:先将调査总体得全部观察单位统一编号,然后采用随机数字 表、统讣软件或抽签方法之一随机抽取n(样本大小)个编号,山这n个编号 所对应得n个观察单位构成研究样本。系统抽样:乂称机械抽样或等距抽样。事先将总体内全部观察单位按某一 顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从 第一部分开始,从中随机抽出第1号观察单位,依此用相等间隔m机械地在 第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。分层抽样:先按对观察指标影响较大得某项或某儿项特征,将总体分成若干 层,该特征得测定值在层内变异较小,层间

4、变异较大,然后分别从每一层内 随机抽取一定数量得观察单位结合起来组成样本。整群抽样:将总体划分为群(初级观察单位),各群山次级观察单位组成,随 机抽取一部分群,调査抽中群得全部次级观察单位。第三章实验设计1、实验设计得特点(注意与调査研究得特点得区别):研丸者可人为设置处理因素;受试对象接受何种处理因素或处理因素得何种水平就是随机得。2.实验设计得三要素、四原则:基本要素:处理因素受试对象实验效应基本原则:对照原则随机原则重复原则均衡原则4、实验设计得基本步骤:(1)明确实验U得;确定研究对象;确定可比得实验组与对照组;(4)确定把受试对象分配到各处理组中得原则;确定样本含量;确定方法与指标;

5、偏倚及其控制5、常用得实验设计方案:主要掌握完全随机设计与配对设计。第四章 定量资料得统计描述K频数表得编制:求极差确定组数与组距(一般815组)确定组段(上限=下限+组距)归组计数,整理成表2.频数表得用途:揭示资料得频数分布特征与频数分布类型 频数分布得特征:集中趋势与离散趋势; 频数分布得类型:对称分布与偏态分布(尚峰位置偏向数值小得一侧一-正/右偏态分布;高峰位置偏向数值大得一侧一-负/左偏态分布) 便于发现某些特大或特小得可疑值 便于进一步计算指标与统计处理3、连续型得定量资料,其频数图中各长方形就是相连得,乂称直方图;离散型得 定量资料,其频数图就是非连续得,其频数图中各长方形就是

6、乂间隔得,称直 条图。4、定量资料集中趋势得描述,常用平均数一表达一组同质定量数据得平均水 平或集中位置。(结合书本得例题加深理解)(1)算术均数:适用于对称分布特别就是正态分布资料;儿何均数:适用于对数正态分布 等比级数资料;观察值中不能有0中位数:就是一种位置平均数,适用于偏态分布资料、一端或两端无确切 值、总体分布不明得资料;百分位数:一组数据某一百分位置得水平;确定非正态分布资料得医学参 考值范意:义平均数 应用场合均数布,尤其正态分布平均数量水平对称分儿何均数对数正态分布平均增减倍数等比、中位数位次居中得观察值水平偏态、分布不明确、分布末端无确定值5、离散趋势就是频数分布得另一特征,

7、反映了观察值之间得变异悄况。应用离散若势指标意义6、布得特笈映一组数据的变异范围资料不限(咽舷横裁廉衣曲*象徵満站锄側 心,左右对複刪苗横轴钟形观察值之间的变异程度适用于对称分布,尤正态变异系数标准差相对于均数的大小适用于单位不同或均数 差别较大的变fi之间的 比较 正态分布有两个参数,即位置参数U与形状参数0 : 0固定不变时,P越大, 曲线沿横轴越向右移动;P固定不变时,。越大,曲线越平阔。 正态曲线下面积得分布有一定得规律: 正态曲线与横轴之间得面积恒等于1或100%; 对称分布,对称轴两侧得面积各为50%; 在(U-0 , U + O )区间得面积为68、27%;在(u-l 96 0,

8、 g+K 96 a)区间得面积为 95. 00%;在(y-2. 58JP+2、580)区间得面积为 99. 00%7、医学参考值范W:正态分布法:适用于正态或近似正态分布得资料双侧界值:单侧界值:元+ ZaS常用N值表参考值范H (%)单侧双侧800、8421、282901、2821、64595 1、6451、960992、3262、576白分位数法:偏态分布资料以及资料中一端或两端无确切数值单侧界值:上界为:凡下界为:A第五章定性资料得统计描述1、常用相对数:率就是指某现象实际发生数与可能发生某现象总数之比,用以说明某现 象发生得频率或强度。常以白分率,千分率,万分率,十万分率等表示。构成比

9、就是事物内部某一观察单位数与事物内部各组成部分观察单位得 总数Z比,说明事物内部各部分所占得比磴。常以白分数表示。相对比就是两个有关得指标之比,用以描述两者得对比水平。两个指标 可以就是绝对数、相对数或平均数;可以性质相同,也可以性质不同。2.应用相对数注意得事项:(1)计算相对数分母不宜过小; 不能以构成比代替率。率反映爭物发生得频率,构成比表示事物内部各 组分所占得比重,二者性质不同。各个组成部分得构成比之与应为100%, 事物内部各组成部分之间呈此消彼长得关系; 计算合计率时,不能简单地相加求平均; 率得比较时应注意可比性。3、标准化法就是在一个指定得标准构成条件下进行率得对比得方法。意

10、义:用 统一得“标准”消除资料山于内部构成不同而对所比较得总率产 生得影 响。标准化法得基本思想:确定一个标准得人口年龄构成,男、女人口都按 该标准得人口年龄构成JI算年龄别发病悄况,最后计算出男、女得合计发病 率。4、应用标准化法应注意得问题:标准化率便于比较,但不能反映实际水平;比较儿个标准化率时,应在采用同一标准标化得悄况下进行;若各组间得率出现明显交义时,不宜采用标准化法比较,可直接比较各组得率;两样本标化率得比较应作假设检验。第六章总体均数与总体率得估计1、抽样误差:山抽样引起得样本统计量与总体参数间得差异称抽样误差。不可 避免、可以控制。表现:样本统il量与总体参数之间得差异样本统

11、计量之间 得差异。产生原因:个体变异+抽样。2、标准误:样本统il量得标准差称为标准误;样本均数得标准差称为均数得标准 误。均数得标准误表示样本均数得变异度:b总体标准差未知时,用样本标准差代替:-傀3.标准差与标准误得区别:标准差表示个体差异得大小;标准误描述样本均数得变异程度,说明抽 样误差得大小。(2) 标准差描述资料得频数分布状况,可用于制定医学参考值范围;而标准 误用于总体均数得区间估计与假设检验。4、t分布得特征:以0为中心,左右对称;自山度A越小,f值越分散,曲线越平阔,尾部越高;当y趋于8时,分布逼近标准正态分布;t分布曲线下面积为1、5、从界值表可瞧出:(1)自山度y相同时,

12、界值越大其对应得P值越小(2)概率P(或尾部面积)相等时,A越大,界值越小(3) t值相等时,双侧概率为单侧概率得两倍(4) y = 8时,t界值即为Z界值6、总体均数可信区间得计算:服从标蚀t於砌布当。已知, 无-“ 体均数得双测f b/JJT_知但n足够大U50):可信区间为:元+旳)(xZa/zS, X+Za/2Sj 匕分布法:当0未恥较小(元7昭尼,元+滋込)7、常用单双侧U值Q单侧双侧0、106451、2821、0、059601、6451、0、023262、0542、0、015782、3262、8、可信区间得涵义:从总体中作随机抽样,每个样本可以算得一个可信区间。如 95%可信区间意

13、味着做100次抽样,算得100个可信区间,平均有95个估计正 确。可信区间得两个要素:一就是准确度:反映在可信度得大小二就是精密度:反映在区间得长度第七章假设检验K假设检验得基本思想:应用反证法与小概率原理,先对总体得参数或分布作出某种假设,再用适当得方法根据样本对总体提供得信息,推断此假设 应当拒绝或不拒绝。2.假设检验得基本步骤:建立检验假设,确定检验水准 选定检验方法与计算检验统计fi 确定P值,作出推断结论3. I型错误与n型错误:I型错误:拒绝了实际上成立得,犯“弃真”得错误。其概率大小 用a表示,a可取单侧亦可取双侧。n型错误:不拒绝了实际上不成立得弘犯“存伪”得错误。其概率大小

14、用0表示。P只取单侧,其大小一般未知,只有在已知两总体差 值爲a及力时,才能估算出来。推断结论与两类错误实际情况-检验结果拒绝不拒绝成立第一类错误(a)结论正确(一。)不成立结论正确(-0)第二类错误(0)注:当样本含董固定时,a增大,B减小;反之亦然。若欲同时减小a与B ,则只有增加样本含量。若点减小I型错误,a可取小一些,如a =0. 01;若重点减小n型错误,a可取大一些,如anx 1或24.检验效能:若两总体确有差别,按照a水准能够发现这种差别得能力。 它得大小用(1-B)表示。检验效能得影响因素:容许误差5.总体标准差O. I型错误a.样本含 量n5x假设检验应注意得事项:(1)应有

15、严密得研究设计:总体中得每个研究个体应具有同质性、样本得获 取必须遵循随机化原则.比较得组间应具有可比性。正确理解a水准与P值得意义:a就是人为预先设定得一个概率值,可有 多个;P就驟定成立,得到实际观测数据得可能性得大小,一个样本按某一方法貝能得出一个。正确理解结论得统计学意义。假设检验得结论不能绝对化。第八章 t检验K上检验得适用条件:(1) 0未知;n较小S6S;(3)样本来自正态总体;两样本所来自得总体方差齐,即/二处2、配对设计主要悄况:(瞧书本例题) 配对得两个受试对象分别接受两种处理 同一样品用两种不同方法测量同一指标,或接受不同处理 同一受试对象处理前后得结果进比较 同一对象得

16、两个部位给予不同得处理a 0.05步骤:建立检验假设,确定检验水准(差值得总体均数)Hq S =0 H 坨 M 0 计算检验统计量y 确定尸值,作出统计推断Z3、两样本均数得比较:(瞧书本例题)步骤:建立检验假设,确定检验水准-a = 0.05V = “丿 + 川2 - 2Hq “ “2 H 计算检验统计量t = 确定F值,作出统il推断(5( + )两独立样本资料得t检盛,乂称能组r检验,适用于完全随机设计得两样 本均数得比较。第九章方差分析1、方差分析得基本思想:根据资料得设计类型(即变异得不同来源),将全部观察 值之间得变异(总变异)分解为两个或多个部分,除随机误差外其余每个部分 得变异

17、都可山某个因素得作用加以解释,通过比较不同变异来源得均方,借助 尸分布作出统讣推断,以了解某因素对观察指标就是否有影响或某因素就是 否有效应。2.方差分析得应用条件:各样本须就是相互独立得随机样本(独立性) 各样本来自正态分布总体(正态性)各总体方差相等(方差齐性)3、完全随机设计:乂称成组设汁。在实验研究中,按随机化原则将受试对象随机 分配到某一研究因素得多个水平中去,然后观察实验效应;在调查研究中,按 一个研究因素得不同水平分组,比较各组得效应。U得都就是推断不同水平 下各组均数之间得差别就是否有统计学意义。注:方差分析常用于三个及以上均数得比较,当用于两个均数得比较时,同一资 料所得结果

18、与t检验等价,即F = t r4、随机区组设计:乂称配伍组设计,就是配对设il得扩展。其设计方法就是将全 部受试对象按某种或某些特征分为若干个区组,使每个区组内研究对象得特 征尽可能接近,然后分别使每个区组内得观察对象随机地接受研究因素某一 水平得处理。随机区组设计得方差分析:总变异=处理组间变异+区组间变异+误差;与完全随机设计得方差分析相比,误差减小了,检验效率提高了。5、多个样本均数得两两比较:SNK-q检验,适用于探索性研究,对任诡两个样本均数都进行检验。LSD-r检验,最小显著性差异检验,适用于某一对或某儿对在专业上有特 殊意义得均数间得比较,如多个处理组与对照组得比较,或某儿个处理

19、组间 得比较,一般在设计阶段确定哪些均数需进行多巫比较。第十章 /检验1、/检验主要用途:推断两个或两个以上总体率(或构成比)之间有无差别 两变量间有无相关关系(有无关联) 检验频数分布得拟合优度2、2X2表得卡方检验(会列表)完全随机设计才检验得注意事项:当n40且所有T5时:基本 护- T广专用公3 - hc) n当虑40但有1ST5时:(a + b)(c + d)(a + ch + d)校正得基本公巒i(IA-7I-0.5)2校正得基本公醪 当*40或TV时,采用四格表确切概畢锥) + )(d + c)e + )7(ad bcn/2)n配对四格表资料/检验得计算公式:当卄cM40时:b+

20、c校正z讣算公式为;2 (-小-1)2Z =3、行X列(RXC)表资料得/检验:b+c注意事项:允许有不超过1/5得基本格子理论频数大于1小于5,但不 能有理论频数小于1;如果有1/5以上格子得理论频数大于1小于5,或有1个格子得理论 频数小于1,可釆用以下处理方法:增加样本含量,可以增大理论频数;将理论频数太小得行或列与性质相近得邻行或邻列中得实际频数合并;删去理论频数太小得格子所对应得行或列。第十一章非参数检验K参数检验与非参数检验得区别:参数检验:已知总体分布类型,对未知参数(u K)进行统计推断;依赖于特 定分布类型,比较得就是参数。非参数检验:不依赖总体分布类型,不针对总体参数;不受

21、总体参数影响,比 较分布或分布位置.2、非参数检验得检验效率没有参数检验高,犯第二类错误得概率P较大。3、非参数检验应用范ffl:总体分布形式未知或分布类型不明;偏态分布得资料;等级资料:不能精确测定,只能以严重程度优劣等级、次序先后等表示不满足参数检验条件资料:各组方差明显不齐;数据得一端或两端就是不确定数值,如50mg O4、Wilcoxon符号秩与检验:编秩:按照差值得绝对值从小到大编秩差值为0者不参加编秩 绝对值相等,符号相同时顺次编秩 绝对值相等,符号相反时取平均秩次5、两样本比较得秩与检验:编秩原则:将两组数据混合起来从小到大统一编秩数值相等且组别相同时顺次编秩 数值相等但组别不同

22、时取平均秩次第十二章双变量关联性分析 1、直线相关,乂称简单相关,就是用来描述具有直线关系得两变量丫、y得相 互关系得统计方法。要求两变量均来自于双变量正态总体得随机变量。相关系数r没有单位,取值介于T与1之间。r0,表示正相关;X0,表示负相 关;上=0,表示零相关。I r I 0. 7时,两变量有高度相关关系;0. I r I 0. 7时,两变量有中度相关关系;I r |0. 4时,两变量有低度相关关系;I r I =1表示完全相关;I r I =0表示无直线相关,但不一定没有关联性。2.等级相关应用范围:(1)不服从双变量正态分布得资料(2) 总体分布类型未知得资料(3) 等级资料第十三

23、章宜线回归分析 1、直线回归(注意与直线相关得区别):又称简单回归,用于研究一个变量随 另一个变量变化而变化得依存关系(回归关系),从而预测或控制未知变量得一 种统计分析方法,通过拟合线性方程来描述两变*间得回归关系。应用条件:要求因变量Y呈正态分布;自变量X就是可以精确测量与控制得变 量。2、直线回归方程式:bo+bX b为样本回归系数(直线得斜率)其统计学意义就是*每增加/减小1个 单位,Y平均改变b个卑位。与y之间没有直线关系。3、最小二乘法原理:各实测点至回归直线得纵向距离得平方与最小。4、为剩余标准差,表示应变量y在扣除自变量X得线性影响后得离散程度, 反映实际观察值在回归直线周围得

24、分散状况。5、对同一资料,相关系数上检验与回归系数上检验结果相同,t .= t b;同一资料,有z = 6、直线回归与相关区别与联系:区别(1)资料要求不同:回归要求因变量y服从正态分布;X就是可以精确测量与严格控制得变 量;相关要求X与y均呈正态分布。变童地位不同:回归得变量y称为因变量,处在被解释得地位,X称为自变量,用于预测因 变量得变化; 相关中变量才变量y处于平等得地位,彼此相关关系用途不同:说明两变量间依存变化得数量关系用回归;说明变量间得相关关系用相关0联系:r与b得方向一致;r与b得假设检验等价;r与b可相互换算;用回归解释相关。第十四章生存分析K生存资料得特点:(1)蕴涵有结

25、局与时间两个方面得信息;(2)结局为两分类互斥事件:(3)般就是通过随访收集得到,随访观察往往就是从某统一时间点开始,观 察到某规定时间点截止;(4) 常因失访等原因造成某些研究对象得生存时间数据不完整.分布类型复杂, 不能简单地套用前面介绍过得统计方法,如t检验.方差分析、检验、四格表 资料确切概率法或秩与检验进行分析。2、生存分析中得儿个基本概念:死亡事件乂称失效事件,不单就是指通常意义下得生物体死亡,而就是泛指标 志某种处理描施失败或失效得特征事件。生存时间:指观察到得存活时间,不单就是指通常意义下生物体得存活时间,而 就是泛指研究者所关心得某现象得持续时间。(广义概念)生存时间根据其特

26、点,可分为以下两种类型:完全数据:指从观察起点到发生死亡事件所经历得时间;截尾数据:从起点至截尾点所经历得时间,观察过程得截止不就是山于死亡事 件,而就是山于其她原因引起得,称为截尾(censored),常用t 表示。截尾原因:失访、退出(死于其它原因)、终止(观察结束时病人尚存活)死亡概率:指在某单位时段开始时存活得个体在该时段内死亡得可能性大小, 记为6生存概率:表示在某单位时段开始时存活得个体到该时段结束时仍存活得可能 性大小,记为4 生存率:记为5(4),指观察对象活过$2时刻得概率。 第十六章 Meta分析1、Meta分析得概念:Meta分析就是对具有共同研究U得得多个研究进行综合分 析得一系列过程。2、Meta分析得U得:提高检验效能、解决若干单个研究结论不一致问题、改善效应量得佔计、提出新得研究问题与研究方向3、Meta分析得基本方法:固定效应模型,统讣方法有Mentel-Haenszel法、 Peto法与General Variance-based法;随机效应模型,方法有Dersimonianand Laird 法(D-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论