版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、复习2009 康晓平医学预防医学1综合复习综合复习北京大学公共卫生学院北京大学公共卫生学院流行病与卫生统计学系流行病与卫生统计学系康晓平康晓平2009.11.24复习2009 康晓平医学预防医学1复习2009 康晓平医学预防医学1 “学习学习” 统计的步骤:统计的步骤: 统计方法统计方法 计量资料计量资料 计数资料计数资料 统计描述统计描述 统计推断统计推断 统计描述统计描述 统计推断统计推断统计指标统计指标 假设检验假设检验 统计指标统计指标 假设检验假设检验- 平均数平均数 - t 检验检验 - 频率指标频率指标 - 卡方检验卡方检验- 变异指标变异指标 - 方差分析方差分析 - 构成指标
2、构成指标 - 秩和检验秩和检验- 指标的应用指标的应用 - 秩和检验秩和检验 -指标的应用指标的应用 -相关分析相关分析 -线性回归线性回归 注意事项注意事项 - 可比性(分层、标化)可比性(分层、标化) - 适用条件适用条件 - 结果解释结果解释复习2009 康晓平医学预防医学1“应用应用” 统计的步骤:统计的步骤: 样本数据样本数据 (数值变量、分类变量)(数值变量、分类变量) 确定分组变量、结局变量确定分组变量、结局变量 两组或两组或多组数据对比分析多组数据对比分析 两变量关联性分析两变量关联性分析 t t 检验检验 线性相关回归线性相关回归 F F 检验检验 秩和秩和 2检验检验 2检
3、验检验 论文论文 复习2009 康晓平医学预防医学1 三种常用平均数三种常用平均数 平均数平均数 适用资料适用资料 计算方法计算方法 算术均数算术均数 变量值呈对称分布变量值呈对称分布, 直接法直接法 (未分组资料未分组资料) 尤其正态分布尤其正态分布 加权法加权法 (分组资料分组资料) 几何均数几何均数 等比级资料,等比级资料, 直接法直接法 (未分组资料未分组资料) 对数正态分布对数正态分布 加权法加权法 (分组资料分组资料) 中位数中位数 呈偏态分布,分布不清楚,呈偏态分布,分布不清楚, 直接法(未分组资料)直接法(未分组资料) 分布一端(或两端)分布一端(或两端) 位次居中的数值位次居
4、中的数值 无确定值无确定值 频数表法(分组资料)频数表法(分组资料)复习2009 康晓平医学预防医学122()1XXsn2()1XXsn100%sCVX指标指标计算公式计算公式适用条件适用条件极差极差R最大值最大值-最小值最小值任何分布任何分布四分位数间距四分位数间距Q Q=P75-P25偏态分布,偏态分布,末端无确定末端无确定值值方差方差 2、s2 对称分布,尤其正态分布对称分布,尤其正态分布标准差标准差 、s对称分布,尤其正态分布对称分布,尤其正态分布变异系数变异系数CV 量纲不同的资料量纲不同的资料均数相均数相差悬殊的资料差悬殊的资料常用描述离散趋势的指标常用描述离散趋势的指标复习200
5、9 康晓平医学预防医学1XzXXzs正态分布及正态曲线下面积的分布规律正态分布及正态曲线下面积的分布规律 标准正态分布:标准正态分布: 当正态分布当正态分布和和已知时,已知时,2. 估计观察值所在范围(估计观察值所在范围(95%参考值范围)参考值范围) / 2XzsXz s若若和和未知,未知, 复习2009 康晓平医学预防医学1 标准差与标准误的区别标准差与标准误的区别 比较内容比较内容 标准差标准差 标准误标准误 意义意义 表示个体观察值间的变异表示个体观察值间的变异 表示样本均数间的变异表示样本均数间的变异 程度,说明观察值程度,说明观察值x围绕样本围绕样本 程度,程度, 说说明样本均数明
6、样本均数 x 均数均数 x分散程分散程 度的指标度的指标 围绕总体均数围绕总体均数 的分散的分散 程度,或者样本率程度,或者样本率p与与 总体率总体率 分散程度的指标分散程度的指标计算方法计算方法 直接法直接法 均数的标准误均数的标准误 加权法加权法 率的标准误率的标准误Xssn(1)pppsn复习2009 康晓平医学预防医学1应用应用 * 表示一组观察值之间的表示一组观察值之间的 * 表示抽样误差的大小,表示抽样误差的大小, 变异程度说明均数的变异程度说明均数的 说明样本均数或样本说明样本均数或样本 代表性代表性 率的可靠率的可靠 * 计算变异系数计算变异系数 * 估计总体参数的估计总体参数
7、的95%或或99% * 计算均数的标准误计算均数的标准误 的置信区间的置信区间 * 当原始数据的分布近似当原始数据的分布近似 大样本资料:大样本资料: 正态分布时,正态分布时, 结合结合 估计估计95%或或99%的观察值的观察值 小样本资料:小样本资料: 所在范围所在范围 * 总体参数的假设检验总体参数的假设检验 (例如,均数的(例如,均数的t检验和检验和z 检检 验;验; 率的率的z 检验)检验)X/ 2XXzs/2ppzs/ 2,XXts复习2009 康晓平医学预防医学1均数的假设检验均数的假设检验 假设检验的基本概念假设检验的基本概念所比较的两个样本均数所比较的两个样本均数 x1 x2
8、两种可能性两种可能性: 两样本均数来自两个相同的总体两样本均数来自两个相同的总体 两样本均数来自两个不同的总体两样本均数来自两个不同的总体复习2009 康晓平医学预防医学1 假设检验的一般步骤假设检验的一般步骤1建立假设,确定检验水准建立假设,确定检验水准 无效假设无效假设H0, 1 = 2, (x1 x2) 备择假设备择假设H1 1 2, = 0.052选定检验方法和计算统计量选定检验方法和计算统计量3确定概率确定概率P值,作出推断结论值,作出推断结论 t t0.05,v , P 0.05,差别无统计学意义。,差别无统计学意义。 t t0.05,v ,P 0.05,差别有统计学意义。,差别有
9、统计学意义。 t t0.01,v ,P 0.01,差别有统计学意义。,差别有统计学意义。复习2009 康晓平医学预防医学1 均数的均数的t检验检验 t检验检验 设计类型设计类型 计算方法计算方法 样本均数与总样本均数与总 有一个随机样本均数和有一个随机样本均数和 体均数比较体均数比较 一个标准值一个标准值(经验值经验值) 配对资料或同一配对资料或同一 配对设计,计算一组样配对设计,计算一组样 批对象试验前批对象试验前 本数据差值的均数本数据差值的均数 后比较的后比较的t检验检验 两个样本均数比较两个样本均数比较 成组设计,有两个随机成组设计,有两个随机 样本均数样本均数 0XXtsdddts1
10、212XXXXts2212Fss复习2009 康晓平医学预防医学1 假设检验的注意事项假设检验的注意事项1. 样本可比性样本可比性 2. 选用的假设检验方法应符合其应用条件选用的假设检验方法应符合其应用条件 3. 正确理解差别有无显著性的统计意义正确理解差别有无显著性的统计意义4. 均数的区间估计与假设检验均数的区间估计与假设检验5. 正确理解假设检验过程中样本均数与总体均数正确理解假设检验过程中样本均数与总体均数 间的关系间的关系 6. 单,双侧检验的选择单,双侧检验的选择 7. 两类错误与检验功效两类错误与检验功效复习2009 康晓平医学预防医学1假设检验的结论可能发生的两类错误假设检验的
11、结论可能发生的两类错误客观实际客观实际假设检验的结论假设检验的结论拒绝拒绝H0不拒绝不拒绝H H0 0H0成立成立型错误(型错误( )推断正确(推断正确(1- )H0不成立,不成立,H H1 1成立成立推断正确(推断正确(1- )型错误(型错误( )当当 P P 0.05时,可能发生时,可能发生 错误错误检验功效检验功效 = 1-= 1- 复习2009 康晓平医学预防医学1方差分析方差分析 方差分析的基本思想方差分析的基本思想- 多个样本均数的比较用方差分析多个样本均数的比较用方差分析(analysis of variance,简称为简称为ANOVA),),- 其目的是检验多个总体均数是否相等
12、。其目的是检验多个总体均数是否相等。SS总总=SS组间组间+SS组内组内 总总= 组间组间+ 组内组内复习2009 康晓平医学预防医学1完全随机设计方差分析的计算公式完全随机设计方差分析的计算公式变异来源变异来源 SS MSF总变异总变异 N - 1组间变异组间变异 a - 1SS组间组间/ 组间组间MS组间组间/ MS组内组内组内变异组内变异SS总总 SS组间组间N - aSS组内组内/ 组内组内211()inaijijyy21()aiiinyy复习2009 康晓平医学预防医学1随机区组设计方差分析的计算公式随机区组设计方差分析的计算公式变异来源变异来源 SS MS F总总SS总总N - 1
13、处理组间处理组间 SS处理处理 a-1SS处理处理/ 处理处理MS处理处理/ MS误差误差区组间区组间SS区组区组n - 1SS区组区组/ 区组区组MS区组区组/ MS误差误差误差误差SS总总SS处理处理组组SS区组区组(a-1)(n-1)SS误差误差/ 误差误差复习2009 康晓平医学预防医学1协方差分析协方差分析(analysis of covariance, ANCOVA) 基本思想基本思想 将那些数值变量将那些数值变量(x)对对 y 的影响看作协变量,的影响看作协变量,建立应变量建立应变量y随协变量随协变量x变化的线性回归关系,变化的线性回归关系,并利用这种回归关系把并利用这种回归关系
14、把x值化为相等后再进行值化为相等后再进行各组各组y的修正均数间比较的假设检验。的修正均数间比较的假设检验。 应用条件应用条件 独立性、正态性、等方差、独立性、正态性、等方差、x与与y存在线性关存在线性关系,且回归线平行。系,且回归线平行。 复习2009 康晓平医学预防医学1均数间的两两比较均数间的两两比较 均数间任意两组比较均数间任意两组比较 - SNK法法 - Bonferroni法法 - Tukey法法 一个对照组与其它组的比较一个对照组与其它组的比较 - Dunnett-t检验检验复习2009 康晓平医学预防医学1常用相对数常用相对数比率比率 (proportion)频率指标频率指标构成
15、指标构成指标2. 速率速率(rate)死亡率死亡率发病率发病率 3. 比比(ratio)定基比定基比1. 环基比环基比 复习2009 康晓平医学预防医学1 应用相对数应注意的问题应用相对数应注意的问题 计算相对数的分母一般不宜过小计算相对数的分母一般不宜过小 分析时不能误将构成比代替率分析时不能误将构成比代替率 正确计算总率正确计算总率 进行率或构成比的比较时应注意资料的可比性进行率或构成比的比较时应注意资料的可比性 - 率的标准化率的标准化 对样本率对样本率(或构成比或构成比)的比较应遵循随机化抽样原则并的比较应遵循随机化抽样原则并 作假设检验作假设检验复习2009 康晓平医学预防医学1标准
16、化法标准化法1. 标准化法的基本思想标准化法的基本思想 2. 标准化率的计算标准化率的计算3. 应用标准化法的注意事项应用标准化法的注意事项动态数列动态数列 发展速度发展速度 变化速度变化速度 平均发展速度和平均变化速度平均发展速度和平均变化速度复习2009 康晓平医学预防医学1健康统计指标健康统计指标人口学特征人口学特征, 6个指标个指标生育指标生育指标, 4 + 4 个指标个指标死亡统计指标死亡统计指标 , 8个指标个指标疾病统计指标疾病统计指标, 三类指标三类指标1. (P.177-188)复习2009 康晓平医学预防医学1二项分布及其应用二项分布及其应用 二项分布的概念二项分布的概念
17、概率函数概率函数 二项分布的均数和标准差二项分布的均数和标准差2. 二项分布的应用二项分布的应用 率的标准误率的标准误 总体率的区间估计总体率的区间估计 假设检验假设检验 (1) 样本与总体率比较的直接概率法样本与总体率比较的直接概率法 (2) 两个样本率比较的两个样本率比较的z检验检验复习2009 康晓平医学预防医学1poisson分布及其应用分布及其应用 1. poisson分布的概念分布的概念 概率函数概率函数 poisson分布的性质分布的性质 (5个个)2. poisson分布的应用分布的应用 总体均数的区间估计总体均数的区间估计 假设检验假设检验 (1) 样本与总体率比较的直接概率
18、法样本与总体率比较的直接概率法 (2) 两个样本计数两个样本计数(均数均数)比较的比较的z检验检验复习2009 康晓平医学预防医学1 2 检验检验 检验两个样本率或两个构成比之间差别的显著性;检验两个样本率或两个构成比之间差别的显著性; 检验多个率或多个构成比之间差别的显著性;检验多个率或多个构成比之间差别的显著性;(3) 检验两种属性或特征之间是否有关系。检验两种属性或特征之间是否有关系。(4) 配对设计的两个样本率的比较配对设计的两个样本率的比较 成组设计四格表成组设计四格表 2 检验检验 的条件及公式的条件及公式 RC列联表列联表 2 检验检验 的注意事项的注意事项 配对设计四格表配对设
19、计四格表 2 检验检验 的条件及公式的条件及公式复习2009 康晓平医学预防医学1 秩和检验秩和检验 (非参数检验非参数检验) 总体分布类型总体分布类型: 非正态分布资料非正态分布资料 用于检验的数据:用于检验的数据: 由原始记录转化的由原始记录转化的“秩次秩次” 用于检验的指标:用于检验的指标: 求秩和求秩和 总体参数:总体参数: 无无 检验资料的类型:检验资料的类型: 配对比较的符号秩和检验配对比较的符号秩和检验 两样本成组比较的秩和检验两样本成组比较的秩和检验 多个样本比较的秩和检验多个样本比较的秩和检验 等级资料比较的秩和检验等级资料比较的秩和检验 检验假设:检验假设: 假设总体分布是
20、否不同假设总体分布是否不同 复习2009 康晓平医学预防医学1 直线相关与回归直线相关与回归 相关分析:定量的描述及分析两变量间的相互关系,相关分析:定量的描述及分析两变量间的相互关系, 即研究变量与变量之间有无直线关系及即研究变量与变量之间有无直线关系及 确定关系的密切程度。确定关系的密切程度。回归分析:定量的描述及分析两变量间的依存关系,回归分析:定量的描述及分析两变量间的依存关系, 并用回归方程的形式将两变量间的依存并用回归方程的形式将两变量间的依存 关系表达出来。关系表达出来。复习2009 康晓平医学预防医学1 相关系数及相关系数的假设检验相关系数及相关系数的假设检验xyxxyylrl
21、 l 回归系数、回归方程及回归系数的假设检验回归系数、回归方程及回归系数的假设检验x yx xlbl 线性回归的应用线性回归的应用 P.171复习2009 康晓平医学预防医学1应用直线相关与回归的注意事项应用直线相关与回归的注意事项1. 相关相关 , 4条条 (P165)2. 回归回归, 4条条 (P176)3. 秩相关秩相关复习2009 康晓平医学预防医学14. 相关关系的显著性程度和密切程度相关关系的显著性程度和密切程度 是有区别的。相关关系的显著性程是有区别的。相关关系的显著性程 度越高(例如,度越高(例如,P 0.01比比 P 0.05 的显著性程度高),表明样本相关的显著性程度高),
22、表明样本相关 系数来自相关系数系数来自相关系数 为零的总体的为零的总体的 可能性越小。可能性越小。 而相关的密切程度高低,是指样本而相关的密切程度高低,是指样本 相关系数相关系数 r 值的大小。值的大小。复习2009 康晓平医学预防医学15直线相关与回归的区别和联系。直线相关与回归的区别和联系。 区别:直线相关分析要求两变量是随机区别:直线相关分析要求两变量是随机 测量得到测量得到, 且服从正态分布且服从正态分布 直线回归分析的自变量可随机直线回归分析的自变量可随机 也可人为取值也可人为取值 联系:(联系:(1)用同一资料计算的)用同一资料计算的r和和b, 它们的正负号是一致的。它们的正负号是
23、一致的。 (2)对同一资料,)对同一资料,r和和b的假设的假设 检验结果(检验结果(t值)总是一样的。值)总是一样的。 (3) R2可用于解释两变量的关系可用于解释两变量的关系复习2009 康晓平医学预防医学1应按资料性质和分析目的选用适合的统计图形应按资料性质和分析目的选用适合的统计图形图形图形资料性质资料性质分析目的分析目的普通线图普通线图连续性资料连续性资料用线段的升降表达事物的动态(差用线段的升降表达事物的动态(差值)变化值)变化半对数线图半对数线图连续性资料连续性资料用线段的升降表达事物的发展速度用线段的升降表达事物的发展速度直条图直条图相互独立资料相互独立资料用直条长短表达数值大小
24、用直条长短表达数值大小直方图直方图连续性变量的频数表连续性变量的频数表资料资料用矩形面积表达各组段的频数(或用矩形面积表达各组段的频数(或频率)频率)圆图及百分条圆图及百分条图图构成比资料构成比资料用圆的扇形面积或直条各段的长度用圆的扇形面积或直条各段的长度表达内部构成比表达内部构成比散点图散点图双变量资料双变量资料用点的密集度和趋势表达两变量间用点的密集度和趋势表达两变量间相关关系相关关系复习2009 康晓平医学预防医学1实验设计实验设计 三要素三要素 四原则四原则 样本含量估计的样本含量估计的4个条件个条件 设计方法设计方法 - 完全随机设计完全随机设计 - 随机区组设计随机区组设计 -
25、析因设计析因设计复习2009 康晓平医学预防医学1调查设计调查设计 调查设计与实验设计的主要区别调查设计与实验设计的主要区别 调查研究的种类调查研究的种类 调查研究的一般步骤调查研究的一般步骤 调查设计的一般内容调查设计的一般内容 常用的几种抽样方法常用的几种抽样方法 - 概率抽样概率抽样 - 非概率抽样非概率抽样复习2009 康晓平医学预防医学1寿命表及其应用寿命表及其应用一、寿命表的种类一、寿命表的种类 现时寿命表与定群寿命表现时寿命表与定群寿命表 完全寿命表与简略寿命表完全寿命表与简略寿命表复习2009 康晓平医学预防医学1 二、寿命表指标的含义及联系寿命表指标的含义及联系 nmx :
26、年龄别死亡率年龄别死亡率 nqx :年龄别死亡概率:年龄别死亡概率(age specific probability of death) lx :尚存人数(:尚存人数(number of survivors)Ndx :死亡人数(:死亡人数(number of dying)nLx : 生存人年数(生存人年数(person-year of survival) Tx : 生存总人年数生存总人年数(total person-year of survival) ex: 预期寿命或期望寿命(预期寿命或期望寿命(life expectancy) 复习2009 康晓平医学预防医学1三、三、 寿命表指标的应用寿命表指标的应用 4个寿命表指标个寿命表指标 平均寿命与平均死亡年龄两个指标加以区别平均寿命与平均死亡年龄两个指标加以区别 复习2009 康晓平医学预防医学1 去死因寿命表去死因寿命表基本思想基本思想: 如
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安塞腰鼓听评课记录
- 陕西省宝鸡市太白县2024年一级造价工程师《土建计量》全真模拟试卷含解析
- 山东省聊城市临清市2024年一级造价工程师《土建计量》预测密卷含解析
- 四川省宜宾市江安县2024-2025学年七年级上学期期中道德与法治试题(含答案)
- 党课课件含讲稿:加强海洋生态环境科技创新 支撑海洋强国建设
- 理解与应用民法模板
- 《财务报表课程》课件
- 吉林橡胶水坝施工方案
- 北京春节树木亮化施工方案
- 五年级数学下册冀教版教学计划
- 电解原理的应用-公开课
- 《中国联通VI手册》
- 两校区化粪池清理、管道疏通承包协议书
- TSZSSA 0002-2023 证券公司重要信息系统容量管理标准
- 小学美术-快乐刮画教学设计学情分析教材分析课后反思
- 代理记账业务规范代理记账业务内部规范制度
- 中国传统文化(英文版)
- 厨房排油烟不锈钢风管施工方案
- 南京大学在校学生校史知识认知情况调查问卷
- 道德与法治中考备考建议课件
- 财产保险退保申请范文推荐6篇
评论
0/150
提交评论