统计学基本概念及应用_第1页
统计学基本概念及应用_第2页
统计学基本概念及应用_第3页
统计学基本概念及应用_第4页
统计学基本概念及应用_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 卫生统计学基本概念及应用卫生统计学基本概念及应用 中国中医研究院 胡镜清 2002/03/20 2 d d c c e e h h d d d c c d o c a p i 2 24 56 6 6 6 5 53 2 1 5 51 2 0 0 h u j i 3 47 5 5 6 4 2 5 5 5 5 43 24 5 2 g g h 5 56 7 7 5 5 5 5 88 8 5 3 3 2 9 0 9 3.16,. 0.13,36.78., 36.8,0.32,0.28,. . 3 总体总体统计描述和推断统计描述和推断 样本样本 抽抽 样样 4 一、卫生统计学基本模块 统计的步骤 设计

2、(design) 资料收集(collection of data) 资料整理(sorting data) 统计分析(analysis of data) 5 卫生统计学基本模块 统计研究研究设计 统计资料的收集、整理、表达与描述 定量和定性资料的统计分析 相关与回归分析 生存分析 其他多元统计分析 6 二、统计学基本概念 样本与总体 总体(population)是指性质相同的研究 对象中所有观察单位某种变量值的集合 从总体中随机抽取部分观察单位,某变量 的实测值构成样本(sample) 7 变量(variable)及其分类 数值性变量:又称连续性变量、计量 资料 如身高:158.2cm 165c

3、m 178.0cm. 体重:54.0kg 62kg 75.2kg. 8 分类变量:计数资料 无序分类 二项分类 阴性/阳性; 存活/死亡 多项分类 9 年龄 39岁 治疗组5 24 56 2 对照组6 13 54 11 10 有序分类 又称等级资料 如: -、+、+、+; 无效、有效、显效、痊愈 11 参数(parameter)和统计量 (statistic) 总体参数 希腊字母表示 样本统计量 拉丁字母表示 12 抽样误差(sampling error) 由于个体间的差异,随机抽样后,样 本所测得的指标(统计量)往往与总 体指标(参数)之间存在差异,这种 由于随机抽样所造成的样本统计量和 总

4、体参数的差异,即为抽样误差。 13 表1 疗效比较 组别 例数 有效 无效 合计 有效率 x2 p 甲试验 (%) 对照组 15 5 20 75 治疗组 19 1 20 95 1.765 0.05 乙试验 对照组 30 10 40 75 治疗组 38 2 40 95 6.275 0.05 丙试验 对照组 45 15 60 75 治疗组 57 3 60 95 9.412 0.01 14 型错误(type error)和型错误 (type error)的水平 型错误:统计推断拒绝了实际上成 立的无效假设(h0),即假阳性。i型 错误的概率用表示,故又称错误。 15 型错误:统计推断不拒绝实际上是

5、不成立的无效假设(h0),即假阴性。 ii型错误的概率用表示,故又称 错误。 16 概率(probability) 事件发生的可能性大小。用p表示,取 值范围在0-1之间。0为不可能发生,1 为必然发生。 习惯将p0.05的事件称为小概率事件, 可以认为在一次抽样中不会发生 17 三、统计分析的基本作用 1、统计描述(descriptive statistics) 对资料的数量特征及其分布规律进行测定和 描述。 统计学指标 统计表 统计图 数学模型 18 59% 21% 9% 11% 0 200 400 600 800 1000 1 12 23 34 45 5 系列系列1对数对数 (系列系列1

6、) 19 2、统计推断(inferential statistics) 如何抽样,以及如何由样本信息推断总体特征 问题 参数估计(parameter estimation) 假设检验(hypothesis test) 先确定无效假设(h0),如果能拒绝,再接受备 择假设( h1 ) 20 -2.58 -1.96 +1.96 +2.58 0.5% 2.5% 21 三、计量资料的统计描述 集中趋势的统计描述 均数(average) 算术均数 几何均数 加权均数 中位数(median)和百分位数 (percentile) 22 离散程度的统计描述 全距(range, 极差) 四分位数间距(quart

7、ile) 23 例如: 2,6,7,10,36 range = 34 q=qu-ql= 4 24 方差 离均差:每一观察值与总体均数的差值 (x-)为离均差,由于( x- )=0,故 不能反映数据的变异。 例如,2,6,7,10,36 均数=12.2 离均差的和=(2-12.2)+(6-12.2)+(7-12.2)+(10-12.2)+(36-12.2) = 25 离均差平方和: ( x- )2 则能反映 数据变异的大小 离均差平方的和=(2-12.2)2+(6-12.2)2+(7-12.2)2 +(10-12.2)2+(36-12.2)2 =740.8 26 离均差平方的均数,总体方差(2)

8、 ( x- )2 n 样本方差(s2) ( x x )2 n-1 27 标准差(standard deviation):将方差开 方后即得总体标准差( )和样本标准差 (s) ( x- )2 = n 28 ( x - x )2 s = n-1 标准差越大,反映数据的离散程度越大。 即数据离平均数越远 29 30 变异系数(coefficient of variation, cv) 可用于度量不同单位资料之间的变异度 s cv= 100% x 例如,某地20岁男子100人,身高平均 166.06cm,标准差为4.95cm,体重均数为 53.7kg,标准差为4.96kg,问身高和体重 的变异度相似

9、吗? 31 四、计量资料的假设检验 t 检验 又称student t 检验 其基本思路是均值之差与抽样误差之比 32 33 样本均数与总体均数比较的 t 检验 配对差值比较的 t 检验 成组设计比较的 t 检验 34 u 检验 成组设计的大样本均数比较 n虽小而总体标准差已知的均数比较 35 t 检验和u 检验的应用条件 样本的总体正态分布 两样本的总体方差相等 36 方差分析(f 检验) 又称变异分析,其指标为均方ms(mean square),由组间离均差平方的和ss除以 自由度 v 而得 37 基本思想 先求出组间均方(ms组间)与组内均方(ms组内) 组间均方(ms组间)与组内均方(m

10、s组内)之比作 为统计量(f值),与临界值比较 所有数据的变异分解为组间变异和组内变异两部 分,当几种治疗方案作用相同时,f值约为1;作 用不同时,f值大于1 ms组间 f = ms组内 38 例如:例题见倪宗瓒编医学统计 学第82-83页 21例儿童接受三种不同的疗法,1月后 观察其血红蛋白的总量,问三组的治 疗效果有无差异。 39 计算结果 ss总=2271.81 ss组间=1523.81 ss组内= ss总- ss组间=748.00 组间=-1=3-1=2, 组内=n- =21-3=18 ms组间=ss组间/ 组间= 1523.81/2=761.91 ms组内=ss组内/ 组内= 748

11、/18=41.56 f= ms组间/ ss组内=761.91/41.56=18.33 40 表2 方差分析表 来源 ss v ms f p 组间 1526.81 2 761.91 18.33 0.05 组内 748.00 18 41.56 总 2271.81 20 41 多样本均数的两两比较 q 检验(student-newman-keuls multiple range test,snk) 用于几个样本均数的两两比较 dunnett t 检验 几个处理组的样本均数与一个对照组的样 本均数的比较 42 五、计数资料的统计描述 常用相对数 比(ratio) 是两个指标的相对比,说明a为b的若干倍

12、或 百分之几 构成比(proportion) 说明一事物内部各组成部分所占的比重或分 布,常以百分数表示 43 率 又称频率指标,它说明某现象发生的频率或强度。 常以百分率(%)、千分率()等表示 发生某现象的观察单位数 率= 100% 可能发生某现象的观察单位总数 44 应用相对数时注意事项 计算相对数的分母不宜过小 分析时不能以构成比代替率 对观察单位数不等的几个率,不能直接相 加求其平均率 资料的对比应注意可比性 对样本率(或构成比)的比较应遵循随机 抽样,要进行假设检验 45 例如,某工厂医务室1979年门诊病人 的统计汇总表 心血管疾病 326 7.8% 呼吸系统疾病 2580 61

13、.9% 消化道疾病 417 10.0% 其他 845 20.3% 合计 4168 100% 46 结论:本厂呼吸系统疾病患病率较高。 他们的结论对吗?为什么?他们的结论对吗?为什么? 47 8% 62% 10% 20% 1 2 3 4 48 六、计数资料的假设检验 2 检验 秩和检验 49 2 检验 基本原理 假设样本组间的率没有差别,计算其理论频 数 实际频数(a)与理论频数(t)吻合的程度 用2 值表示 2 值越大,p值越小,当p(检验水准), 拒绝假设 50 四格表资料的2 检验(两样本率的比较) 校正2 检验:1t 40 确切概率计算法: t 0 or n 4 0 行列表资料的2 检验(多个样本率或 构成比的比较) 不宜有1/5以上格子的理论频数小于5,或有 一个理论频数小于1 51 秩和检验 配对组间的符号秩和检验(wilcoxon配对法) 成组设计两样本比较的秩和检验(wilcoxon 两样本比较法) 成组设计多个样本比较的秩和检验 (kr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论