医学统计学傻瓜教程_3.doc_第1页
医学统计学傻瓜教程_3.doc_第2页
医学统计学傻瓜教程_3.doc_第3页
医学统计学傻瓜教程_3.doc_第4页
医学统计学傻瓜教程_3.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-最新资料推荐- 医学统计学傻瓜教程 医学统计学傻瓜教程 作为一名临床医师, 不管你愿意不愿意, 某些时候必须撰写医学论文。 这时, 大多数人会遇到一个难题, 医学论文的数据都必须进行统计学处理, 早些年学过的医学统计学 早已忘得差不多了, 重新翻开统计学书本, 看得基本上是云里雾里。 医学统计学傻瓜教程 有别于其他任何的统计学教程, 其特点是略去一些高深难懂的统计学原理及计算公式, 直奔解决实际问题的方法。 本教程的学习时间约需要 23 小时, 前提是你必须曾经学过医学统计学 , 不管学得好或学得差, 或是否已忘记, 只要有一点印象即可, 同时还需要下载一个简明统计学处理软件临床医师统计学助手 V4. 0 , 因为作数据统计学处理时最令人头痛的问题是烦琐的计算, 则由预存在本软件内的计算公式来完成。 临床医师统计学助手 V4. 0 下载地址: http: /www. onlinedown. net/soft/63895. htm 这是一个全傻瓜化 的教程, 由 4 个实例组成, 只要认真看完这 4 个实例, 将实际中碰到的问题对号入座, 就足以解决绝大多数问题了。 接下来我们开始轻松愉快的学习过程。 一、 均数与标准差 【例 1】 本组 105 例, 男 55 例, 女 50 例; 平均年龄: 62. 36. 1 岁, 所有入选病例均符合 1999 年 WHO 高血压诊断标准。 举这个例子是为了 说明均数 与标准差 的概念。 我实在不愿意多花时间阐述一些概念性的东西, 但是由于标准差实在太重要了 。 【例 1】 中的数据62. 36. 1 , 62. 3 就是年龄的均数, 均数的概念大家都懂, 那么后面的6. 1 是什么呢?它就是标准差。 有人可能会问, 表达一组人的平均年龄, 用均数就够了 , 为什么还要加一个标准差呢? 先看下面的一个例子: 有两组人, 第 1 组身高(cm) : 98、 99、 100、 101、 102; 第 2 组身高(cm) : 80、 90、 100、 110、 120, 这两组人虽然身高的均数都是100cm, 但是, 仔细观察, 第 1 组的身高很接近, 第 2 组的身高差别很大, 故仅仅用一个平均数表达一组数据的特征是不完整的,还需要用另一个指标来表达其参差不齐的程度, 这就是标准差。 统计学上对一组测量结果的数据都要用均数标准差 表示, 习惯表达代号是: , 具体例子如: 平均收缩压 12010. 2mmHg。 我想现在大家都已知道标准差是什么东东了, 那么, 标准差是怎样得到的呢? 有一个比较复杂的计算公式, 我们不必去深究这个公式是怎么样的, 只需知道标准差越小, 说明数据越集中, 标准差越大, 说明数据越分散。 撰写医学论文的第一步是收集原始数据, 如: 第 1 组身高(cm) : 98、 99、 100、 101、 102; 第 2 组身高(cm) : 80、 90、 100、 110、 120。 在论文中并不是直接给出原始数据, 而是要以方式表示。 利用软件临床医师统计学助手 V3. 0 , 只要输入原始数据,就能自动计算出均数及标准差, 即第 1 组平均身高: 1001. 58cm; 第 2 组平均身高: 10015. 81cm, 如下图。 二、 两样本均数差别 T 检验 【例 2】 目的 研究中药板兰根对非典 疗效。 方法 将 36 例非典 患者随机分为治疗组 19 例, 采用常规治疗+板兰根口服, 对照组 17 例, 仅采用常规治疗。 结果 治疗组平均退热时间 3. 281. 51d; 对照组平均退热时间 5. 651. 96d, 两组间对照差别有极显著意义(p0. 01 ) 结论 中药板兰根对非典 有显效疗效, 实为国之瑰宝。 这是最常见的一种统计学数据处理类型, 统计学述语叫做两样本均数差别 T 检验 , 说得通俗易懂一些, 就是检验两组方法所得到的数据到底有没有差异, 或者说, 差异是否有意义。 我们平时的思维习惯是, 数据的大小还用得着检验吗? 这是小学生都会的问题。 可是别忘记了现在是在搞科研, 科学方法看问题可不一定这么简单。 可能还没有说明白这个问题, 下面举一个简单的例子。 我们的目的是得出这样一个结论: 北京出产的西瓜比上海出产的西瓜大 。 最可靠的方法是把所有北京的西瓜和上海的西瓜都测量重量, 得到两个均数, 然后比大小即可, 可是智商正常的人并不会这样去做, 通常的做法是, 随机选一部分北京的西瓜和一部分上海的西瓜, 先让这两部分西瓜比大小, 然后推断到底那里的西瓜大。 这种方法是窥一斑可见全豹 , 统计学述语叫做由样本推断总体 , 事实上, 我们所做的医学科研都是基于这种方法。 再回到上面的例子, 假如我们有二种做法: A、 随机选 2 个北京西瓜, 平均重量是 5. 60. 3kg; 再随机选 2 个上海西瓜, 平均重量是 4. 30. 25kg; B、 随机选 1000 个北京西瓜, 平均重量是 5. 60. 3kg; 再随机选 1000 个上海西瓜, 平均重量是 4. 30. 25kg。 凭生活常识, 由 B 推出北京的西瓜比上海西瓜大 这个结论的把握性就非常的大, 而 A 则基本上推不出这个结论。 现在, 终于可以引出我们的主题了, 统计学处理本质是考查由样本差异推断总体差异的把握性有多大, 这种把握性在统计学上由 P 值表示。 如 P0. 05 或 P0. 01, 可以理解为由样本差异推断总体差异的把握性达 95%或 99%以上, 两组数据差异有显著意义; 如 P0. 05,可以理解为这种把握性在 95%以下, 两组数据差异没有显著意义。 上面所讲的实已为统计学之精髓, 建议多看几遍, 如果天生愚鲁, 还是看不太懂, 也没有关系, 现在进一步傻瓜化 , 即所谓统计学处理,只要求得 P 值即可。 P0. 05 或 P0. 01, 表示阳性结果, 两组数据差异有显著意义; P0. 05, 表示阴性结果, 两组数据差异没有显著意义。 所以, 统计学处理的中心任务是求 P 值。 下面讲解遇到【例 2】 这样的问题, 如何求 P 值。 【例 2】 中一共有 6 个数据: 第一组均数(X1) 、 标准差(S1) 、 例数(N1)与第二组均数(X2) 、 标准差(S2) 、 例数(N2) , 就是根据这 6 个数据, 先通过复杂计算, 求出T 值(如果没有想成为统计学专家, 就不必去理解T 是什么了, 知道T 是为了求P 用的就可以了 ) , 求出T 值后, 再查T 界值表 , 就知道P值 了。 具体解法步骤如下: 通过计算(这里略去计算公式, 可由软件求出) , T=4. 088 计算自由度: 自由度=N1+N2-2=19+17-2=34(计算自由度是为了查 T 界值表用的, 自由度即两组例数之和减去 2, 不要问我为什么不减去 3 或减去 1 这样的问题了。 ) 查 T 界值表, 对应自由度 34, T0. 05=2. 032, T0. 01=2. 728, 今 T=4. 088T0. 01, 即 P0. 01, 差别有高度显著意义。 T=4. 088 是如何求出的呢? 我们再回到软件临床医师统计学助手 V3. 0 , 只要把第一组均数(X1) 、 标准差(S1) 、 例数(N1) 与第二组均数(X2) 、 标准差(S2) 、 例数(N2) 这 6 个数据输入对应的框内, 该软件就会利用预先存储的公式自动计算 T值, 并查 T 界值表, 得到 P 值, 如图: 三、 配对计量资料 T 检验 【例 3】 目的 研究音乐胎教对胎儿运动技能培养的效果。 方法 10 例 2832 周孕妇, 分别记录听音乐(水浒传主题曲) 前每小时的胎动次数及听音乐后每小时的胎动次数, 结果 数据如表 1 所示, 音乐胎教后胎动次数增多, 差别有显著意义(p0. 05 )结论 音乐胎教可增强胎儿运动技能, 对培养我国运动天才有现实意义。 显然【例 3】 与【例 2】 有所不同, 主要是【例 3】 两组间的数据可以前后配对的。 我们经常碰到这种情况, 即同一个体做两次处理, 如治疗前检测某一指标, 治疗后再检测某一指标, 而后做治疗前后配对比较, 以判断疗效, 正如【例 3】 。 这种情况如何进行统计学处理呢? 同样也是先计算 T 值, 然后按自由度(这时自由度=对子数-1, 如本例自由度是 9。 ) 查 T 界值表, 求得 P 值。 但是配对 T 检验 计算 T 值的方法与两样本均数 T 检验 有所不同, 这里不再作介绍, 由软件 临床医师统计学助手 V4. 0自动完成即可, 如下图。 本例 T=2. 47, 自由度=10-1=9, 查 T 界值表, 对应自由度 9, T0. 05=2. 26, T0. 01=3. 25, 今 T=2. 47T0. 05, 即 P0. 05, 差别有显著意义。 可能有人会问, 【例 3】 的情况, 也可以把胎教前视为对照组, 求得平均胎动次数是: 21. 85. 31, 胎教后视为治疗组, 求得平均胎动次数是: 24. 06. 31, 然后套用【例 2】 的方法, 用两样本均数 T 检验 行不行? 这样虽无大错误, 但是将会导致检验效率的下降, 就是说, 如果数据差异较大时, 两种方法均可, 如果数据差异较小时, 用配对 T 检验 会显示出差异有意义, 而用两样本均数 T 检验 时, 可能差异无意义。 切记, 非配对资料误用配对 T 检验, 则是错误的。 四、 计数资料卡方检验 【例 4】目的 研究医患关系对重症病人死亡率的影响。 方法 根据问卷调查对收住重症监护病房的病人分为医患关系良好组与医患关系紧张组 , 比较两组间的住院死亡率。 结果 医患关系良好组 25 例, 住院间死亡 3 例, 死亡率 13. 6%, 医患关系紧张组 23 例, 住院间死亡 9 例, 死亡率 39. 1%, 两组间差别有显著意义(p0. 05 ) 结论 医患关系紧张增加重症病人的住院死亡率, 可能与医师害怕被病人告而治疗方案趋向保守有关。 【例 4】 又是一个非常常见的一种统计学数据处理类型。 【例 4】 中所提供的数据是比例 , 或百分数, 与前面三个例子不同,前面三个例子所提供的数据则是直接在病人身上测量到的数据, 如收缩压 12010. 2mmHg、 身高 10015. 81cm 等, 我们把【例 4】中的数据叫做计数资料, 而【例 1、 2、 3】 中的数据叫做计量资料。 计数资料无法用形式表示, 只能用比例表示, 如: 死亡率13. 6%、 30 例中显效 10 例(10/30) 等。 显然, 对于计数资料, 再用 T 检是不适合了, 必须用卡方检验。 卡方检验的步骤是: 先求出 X2(类似于 T 检验时先求 T 值) 值,然后进行判断: 如果 X23. 84, 则 P0. 05; 如果 X23. 84, 则 P0. 05; 如果 X26. 63, 则 P0. 01。 解释一下, 上面的两个数字3. 84 与6. 63 是查X2界值表 得来的, 只要记住即可。 所以, 卡方检验的关键是求出 X2值。 为了求出 X2值, 必须先介绍四表格 概念。 四表格 的形式如下, 关键数据是 a、 b、c、 d 四个数, X2值就是通过这四个数据计算出来的(这里仍不介绍公式, 由软件计算。 ) 。 现将【例 4】 中的数据填入四表格 即如下图。 当你学会了填四表格 数据之后, 就能利用软件临床医师统计学助手 V4. 0 非常容易的进行卡方检验了, 本软件提供与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论