卫生统计学基本概念及其应用课件_第1页
卫生统计学基本概念及其应用课件_第2页
卫生统计学基本概念及其应用课件_第3页
卫生统计学基本概念及其应用课件_第4页
卫生统计学基本概念及其应用课件_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1本资料来源1本资料来源2卫生统计学基本概念及应用中国中医研究院胡镜清2002/03/202卫生统计学基本概念及应用3Y=36-1.28e2x3.16,…..0.13,36.78…...,36.8,0.32,0.28,…..…....3Y=36-1.28e2x3.16,…..4

总体统计描述和推断样本抽样4总体统计描述和推断样本抽样5一、卫生统计学基本模块统计的步骤设计(design)资料收集(collectionofdata)资料整理(sortingdata)统计分析(analysisofdata)5一、卫生统计学基本模块6卫生统计学基本模块统计研究研究设计统计资料的收集、整理、表达与描述定量和定性资料的统计分析相关与回归分析生存分析其他多元统计分析6卫生统计学基本模块7二、统计学基本概念样本与总体总体(population)是指性质相同的研究对象中所有观察单位某种变量值的集合从总体中随机抽取部分观察单位,某变量的实测值构成样本(sample)7二、统计学基本概念8变量(variable)及其分类数值性变量:又称连续性变量、计量资料如身高:158.2cm165cm178.0cm…...体重:54.0kg62kg75.2kg…...8变量(variable)及其分类9分类变量:计数资料无序分类二项分类阴性/阳性;存活/死亡多项分类9分类变量:计数资料10

年龄<20岁20-29岁30-39岁>39岁

治疗组 5 24 56 2

对照组 6 13 54 11 1011有序分类又称等级资料如:-、+、++、+++;无效、有效、显效、痊愈11有序分类12参数(parameter)和统计量(statistic)总体——参数希腊字母表示样本——统计量拉丁字母表示12参数(parameter)和统计量(statistic)13抽样误差(samplingerror)由于个体间的差异,随机抽样后,样本所测得的指标(统计量)往往与总体指标(参数)之间存在差异,这种由于随机抽样所造成的样本统计量和总体参数的差异,即为抽样误差。13抽样误差(samplingerror)14表1疗效比较组别例数有效无效合计有效率X2P甲试验(%)对照组1552075

治疗组19120951.7650.05乙试验对照组30104075

治疗组38240956.2750.05丙试验对照组45156075

治疗组57360959.4120.0114表1疗效比较15Ⅰ型错误(typeⅠerror)和Ⅱ型错误(typeⅡerror)的水平Ⅰ型错误:统计推断拒绝了实际上成立的无效假设(H0),即假阳性。I型错误的概率用α表示,故又称α错误。15Ⅰ型错误(typeⅠerror)和Ⅱ型错误(type16Ⅱ型错误:统计推断不拒绝实际上是不成立的无效假设(H0),即假阴性。II型错误的概率用β表示,故又称β错误。16Ⅱ型错误:统计推断不拒绝实际上是不成立的无效假设(H0)17概率(probability)事件发生的可能性大小。用p表示,取值范围在0-1之间。0为不可能发生,1为必然发生。习惯将P≤0.05的事件称为小概率事件,可以认为在一次抽样中不会发生17概率(probability)18三、统计分析的基本作用1、统计描述(descriptivestatistics)对资料的数量特征及其分布规律进行测定和描述。统计学指标统计表统计图数学模型18三、统计分析的基本作用1919202、统计推断(inferentialstatistics)如何抽样,以及如何由样本信息推断总体特征问题参数估计(parameterestimation)假设检验(hypothesistest)先确定无效假设(H0),如果能拒绝,再接受备择假设(H1

)202、统计推断(inferentialstatistic21μ-2.58σμ-1.96σμμ+1.96σμ+2.58σ0.5%2.5%2122三、计量资料的统计描述集中趋势的统计描述均数(average)算术均数几何均数加权均数中位数(median)和百分位数(percentile)22三、计量资料的统计描述23离散程度的统计描述全距(range,极差)四分位数间距(quartile)23离散程度的统计描述24例如:2,6,7,10,36Range=34Q=QU-QL=424例如:25方差离均差:每一观察值与总体均数的差值(X-μ)为离均差,由于Σ(X-μ)=0,故不能反映数据的变异。例如,2,6,7,10,36均数=12.2离均差的和=(2-12.2)+(6-12.2)+(7-12.2)+(10-12.2)+(36-12.2)

=25方差26离均差平方和:Σ(X-μ)2则能反映数据变异的大小离均差平方的和=(2-12.2)2+(6-12.2)2+(7-12.2)2

+(10-12.2)2+(36-12.2)2

=740.826离均差平方和:Σ(X-μ)2则能反映数据变27离均差平方的均数,总体方差(σ2)

Σ(X-μ)2n样本方差(S2)

Σ(X—X)2n-127离均差平方的均数,总体方差(σ2)28标准差(standarddeviation):将方差开方后即得总体标准差(σ)和样本标准差(s)

Σ(X-μ)2σ=n28标准差(standarddeviation):将方差开29

Σ(X-X)2s

=n-1标准差越大,反映数据的离散程度越大。即数据离平均数越远29303031变异系数(coefficientofvariation,CV)可用于度量不同单位资料之间的变异度

sCV=×100%X例如,某地20岁男子100人,身高平均166.06cm,标准差为4.95cm,体重均数为53.7kg,标准差为4.96kg,问身高和体重的变异度相似吗?31变异系数(coefficientofvariatio32四、计量资料的假设检验t检验又称studentt检验其基本思路是均值之差与抽样误差之比32四、计量资料的假设检验33

3334样本均数与总体均数比较的t检验配对差值比较的t检验成组设计比较的t检验34样本均数与总体均数比较的t检验35u

检验成组设计的大样本均数比较n虽小而总体标准差已知的均数比较35u检验36t检验和u

检验的应用条件样本的总体正态分布两样本的总体方差相等36t检验和u检验的应用条件37方差分析(F检验)又称变异分析,其指标为均方MS(meansquare),由组间离均差平方的和SS除以自由度v而得37方差分析(F检验)38基本思想先求出组间均方(MS组间)与组内均方(MS组内)组间均方(MS组间)与组内均方(MS组内)之比作为统计量(F值),与临界值比较所有数据的变异分解为组间变异和组内变异两部分,当几种治疗方案作用相同时,F值约为1;作用不同时,F值大于1MS组间F=MS组内38基本思想39例如:例题见倪宗瓒编《医学统计学》第82-83页21例儿童接受三种不同的疗法,1月后观察其血红蛋白的总量,问三组的治疗效果有无差异。39例如:例题见倪宗瓒编《医学统计学》第82-83页40计算结果SS总=2271.81SS组间=1523.81SS组内=SS总-SS组间=748.00ν组间=κ-1=3-1=2,ν组内=n-κ=21-3=18MS组间=SS组间/ν组间=1523.81/2=761.91MS组内=SS组内/ν组内=748/18=41.56F=MS组间/SS组内=761.91/41.56=18.3340计算结果41表2方差分析表来源SSvMSFP组间1526.812761.9118.33<0.05组内748.001841.56总2271.812041表2方差分析表42多样本均数的两两比较q检验(Student-Newman-Keulsmultiplerangetest,SNK)用于几个样本均数的两两比较Dunnettt检验几个处理组的样本均数与一个对照组的样本均数的比较42多样本均数的两两比较43五、计数资料的统计描述常用相对数比(ratio)是两个指标的相对比,说明A为B的若干倍或百分之几构成比(proportion)说明一事物内部各组成部分所占的比重或分布,常以百分数表示43五、计数资料的统计描述44率又称频率指标,它说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)等表示发生某现象的观察单位数率=×100%

可能发生某现象的观察单位总数44率45应用相对数时注意事项计算相对数的分母不宜过小分析时不能以构成比代替率对观察单位数不等的几个率,不能直接相加求其平均率资料的对比应注意可比性对样本率(或构成比)的比较应遵循随机抽样,要进行假设检验45应用相对数时注意事项46例如,某工厂医务室1979年门诊病人的统计汇总表心血管疾病3267.8%呼吸系统疾病258061.9%

消化道疾病41710.0%其他84520.3%合计4168100%46例如,某工厂医务室1979年门诊病人的统计汇总表47结论:本厂呼吸系统疾病患病率较高。他们的结论对吗?为什么?47结论:本厂呼吸系统疾病患病率较高。484849六、计数资料的假设检验Χ2检验秩和检验49六、计数资料的假设检验50Χ2检验基本原理假设样本组间的率没有差别,计算其理论频数实际频数(A)与理论频数(T)吻合的程度用Χ2值表示Χ2值越大,P值越小,当P≤α(检验水准),拒绝假设50Χ2检验51四格表资料的Χ2检验(两样本率的比较)校正Χ2检验:1<T<5,andn>40确切概率计算法:T<0orn<40行×列表资料的Χ2检验(多个样本率或构成比的比较)不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于151四格表资料的Χ2检验(两样本率的比较)52秩和检验配对组间的符号秩和检验(Wilcoxon配对法)成组设计两样本比较的秩和检验(Wilcoxon两样本比较法)成组设计多个样本比较的秩和检验(Kruskal-Wallis法)多个样本两两比较的秩和检验(Nemenyi法)52秩和检验53七、直线回归与相关直线回归建立两变量间依存关系的直线回归方程由直线回归方差通过已知变量估计未知变量如:∧

Y=47.78-10.32X53七、直线回归与相关54直线相关了解两变量是否有相关关系存在,密切程度如何,是正相关,还是负相关。相关系数r及其显著性检验54直线相关55八、多元统计分析多元回归与相关分析因子分析55八、多元统计分析56聚类分析判别分析56聚类分析57本资料来源1本资料来源58卫生统计学基本概念及应用中国中医研究院胡镜清2002/03/202卫生统计学基本概念及应用59Y=36-1.28e2x3.16,…..0.13,36.78…...,36.8,0.32,0.28,…..…....3Y=36-1.28e2x3.16,…..60

总体统计描述和推断样本抽样4总体统计描述和推断样本抽样61一、卫生统计学基本模块统计的步骤设计(design)资料收集(collectionofdata)资料整理(sortingdata)统计分析(analysisofdata)5一、卫生统计学基本模块62卫生统计学基本模块统计研究研究设计统计资料的收集、整理、表达与描述定量和定性资料的统计分析相关与回归分析生存分析其他多元统计分析6卫生统计学基本模块63二、统计学基本概念样本与总体总体(population)是指性质相同的研究对象中所有观察单位某种变量值的集合从总体中随机抽取部分观察单位,某变量的实测值构成样本(sample)7二、统计学基本概念64变量(variable)及其分类数值性变量:又称连续性变量、计量资料如身高:158.2cm165cm178.0cm…...体重:54.0kg62kg75.2kg…...8变量(variable)及其分类65分类变量:计数资料无序分类二项分类阴性/阳性;存活/死亡多项分类9分类变量:计数资料66

年龄<20岁20-29岁30-39岁>39岁

治疗组 5 24 56 2

对照组 6 13 54 11 1067有序分类又称等级资料如:-、+、++、+++;无效、有效、显效、痊愈11有序分类68参数(parameter)和统计量(statistic)总体——参数希腊字母表示样本——统计量拉丁字母表示12参数(parameter)和统计量(statistic)69抽样误差(samplingerror)由于个体间的差异,随机抽样后,样本所测得的指标(统计量)往往与总体指标(参数)之间存在差异,这种由于随机抽样所造成的样本统计量和总体参数的差异,即为抽样误差。13抽样误差(samplingerror)70表1疗效比较组别例数有效无效合计有效率X2P甲试验(%)对照组1552075

治疗组19120951.7650.05乙试验对照组30104075

治疗组38240956.2750.05丙试验对照组45156075

治疗组57360959.4120.0114表1疗效比较71Ⅰ型错误(typeⅠerror)和Ⅱ型错误(typeⅡerror)的水平Ⅰ型错误:统计推断拒绝了实际上成立的无效假设(H0),即假阳性。I型错误的概率用α表示,故又称α错误。15Ⅰ型错误(typeⅠerror)和Ⅱ型错误(type72Ⅱ型错误:统计推断不拒绝实际上是不成立的无效假设(H0),即假阴性。II型错误的概率用β表示,故又称β错误。16Ⅱ型错误:统计推断不拒绝实际上是不成立的无效假设(H0)73概率(probability)事件发生的可能性大小。用p表示,取值范围在0-1之间。0为不可能发生,1为必然发生。习惯将P≤0.05的事件称为小概率事件,可以认为在一次抽样中不会发生17概率(probability)74三、统计分析的基本作用1、统计描述(descriptivestatistics)对资料的数量特征及其分布规律进行测定和描述。统计学指标统计表统计图数学模型18三、统计分析的基本作用7519762、统计推断(inferentialstatistics)如何抽样,以及如何由样本信息推断总体特征问题参数估计(parameterestimation)假设检验(hypothesistest)先确定无效假设(H0),如果能拒绝,再接受备择假设(H1

)202、统计推断(inferentialstatistic77μ-2.58σμ-1.96σμμ+1.96σμ+2.58σ0.5%2.5%2178三、计量资料的统计描述集中趋势的统计描述均数(average)算术均数几何均数加权均数中位数(median)和百分位数(percentile)22三、计量资料的统计描述79离散程度的统计描述全距(range,极差)四分位数间距(quartile)23离散程度的统计描述80例如:2,6,7,10,36Range=34Q=QU-QL=424例如:81方差离均差:每一观察值与总体均数的差值(X-μ)为离均差,由于Σ(X-μ)=0,故不能反映数据的变异。例如,2,6,7,10,36均数=12.2离均差的和=(2-12.2)+(6-12.2)+(7-12.2)+(10-12.2)+(36-12.2)

=25方差82离均差平方和:Σ(X-μ)2则能反映数据变异的大小离均差平方的和=(2-12.2)2+(6-12.2)2+(7-12.2)2

+(10-12.2)2+(36-12.2)2

=740.826离均差平方和:Σ(X-μ)2则能反映数据变83离均差平方的均数,总体方差(σ2)

Σ(X-μ)2n样本方差(S2)

Σ(X—X)2n-127离均差平方的均数,总体方差(σ2)84标准差(standarddeviation):将方差开方后即得总体标准差(σ)和样本标准差(s)

Σ(X-μ)2σ=n28标准差(standarddeviation):将方差开85

Σ(X-X)2s

=n-1标准差越大,反映数据的离散程度越大。即数据离平均数越远29863087变异系数(coefficientofvariation,CV)可用于度量不同单位资料之间的变异度

sCV=×100%X例如,某地20岁男子100人,身高平均166.06cm,标准差为4.95cm,体重均数为53.7kg,标准差为4.96kg,问身高和体重的变异度相似吗?31变异系数(coefficientofvariatio88四、计量资料的假设检验t检验又称studentt检验其基本思路是均值之差与抽样误差之比32四、计量资料的假设检验89

3390样本均数与总体均数比较的t检验配对差值比较的t检验成组设计比较的t检验34样本均数与总体均数比较的t检验91u

检验成组设计的大样本均数比较n虽小而总体标准差已知的均数比较35u检验92t检验和u

检验的应用条件样本的总体正态分布两样本的总体方差相等36t检验和u检验的应用条件93方差分析(F检验)又称变异分析,其指标为均方MS(meansquare),由组间离均差平方的和SS除以自由度v而得37方差分析(F检验)94基本思想先求出组间均方(MS组间)与组内均方(MS组内)组间均方(MS组间)与组内均方(MS组内)之比作为统计量(F值),与临界值比较所有数据的变异分解为组间变异和组内变异两部分,当几种治疗方案作用相同时,F值约为1;作用不同时,F值大于1MS组间F=MS组内38基本思想95例如:例题见倪宗瓒编《医学统计学》第82-83页21例儿童接受三种不同的疗法,1月后观察其血红蛋白的总量,问三组的治疗效果有无差异。39例如:例题见倪宗瓒编《医学统计学》第82-83页96计算结果SS总=2271.81SS组间=1523.81SS组内=SS总-SS组间=748.00ν组间=κ-1=3-1=2,ν组内=n-κ=21-3=18MS组间=SS组间/ν组间=1523.81/2=761.91MS组内=SS组内/ν组内=748/18=41.56F=MS组间/SS组内=761.91/41.56=18.3340计算结果97表2方差分析表来源SSvMSFP组间1526.812761.9118.33<0.05组内748.001841.56总2271.812041表2方差分析表98多样本均数的两两比较q检验(Student-Newman-Keulsmultiplerangetest,SNK)用于几个样本均数的两两比较Dunnettt检验几个处理组的样本均数与一个对照组的样本均数的比较42多样本均数的两两比较99五、计数资料的统计描述常用相对数比(ratio)是两个指标的相对比,说明A为B的若干倍或百分之几构成比(proportion)说明一事物内部各组成部分所占的比重或分布,常以百分数表示43五、计数资料的统计描述100率又称频率指标,它说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)等表示发生某现象的观察单位数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论