统计学超简易教程,三个小时搞掂统计学_第1页
统计学超简易教程,三个小时搞掂统计学_第2页
统计学超简易教程,三个小时搞掂统计学_第3页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、仅供个人参考For personal use only in study and research; not forcommercial use医学统计学超级简易教程作为一名临床医师,有时为了完成一些小科研,或晋升职称,都必须撰写医学论文。大多数人会碰到一个难题,医学论文的数据都必须进行统计学处理,上大学时学过的医学统计学早已忘得差不多了,重新翻开统计学书本,花上十天半个月的时间,还是看得不知所云。医学统计学傻瓜教程有别于其他任何的统计学教程,其特点是略去一些高深难懂的统计学原理及计算公式,直奔解决实际问题的方法。本教程的学习时间约需要2 3 小时,但你必须曾经学过医学统计学,不管学得好或学得

2、差,或是否已忘记,只要有一点印象即可,同时还需要下载一个简明统计学处理软件临床医师统计学助手V3.0 ,因为作数据统计学处理时最令人头痛的问题是烦琐的计算,则由预存在本软件内的计算公式来完成。临床医师统计学助手V3.0 下载地址 :这是一个全“傻瓜化”的教程,由4 个实例组成,只要认真看完这4 个实例,将实际中碰到的问题对号入座,就足以解决绝大多数问题了。接下来我们开始轻松愉快的学习过程。一、均数与标准差【例 1】本组 105 例, 男 55 例, 女 50 例; 平均年龄: 62.3 ± 6.1 岁,所有入选病例均符合 1999 年 WHO高血压诊断标准。举这个例子是为了说明“均数

3、”与“标准差”的概念。我实在不愿意多花时间阐述一些概念性的东西,但是由于“标准差”实在太重要了。【例1】中的数据“ 62.3±6.1 ”,“ 62.3 ”就是年龄的均数,均数的概念大家都懂,那么后面的“ 6.1 ”是什么呢?它就是标准差。有人可能会问,表达一组人的平均年龄,用均数就够了,为什么还要加一个标准差呢?先看下面的一个例子:有两组人,第 1 组身高( cm):98、99、100、101、 102;第 2 组身高( cm): 80、 90、 100、 110、 120,这两组人虽然身高的均数都是 100cm,但是,仔细观察,第 1 组的身高很接近,第 2 组的身高差别很大,故仅

4、仅用一个平均数表达一组数据的特征是不完整的, 还需要用另一个指标来表达其参差不齐的程度,这就是标准差。统计学上对一组测量结果的数据都要用“均数±标准差”表示,习惯表达代号是:,具体例子如:平均收缩压120± 10.2mmHg。我想现在大家都已知道标准差是什么东东了,那么,标准差是怎样得到的呢?有一个比较复杂的计算公式, 我们不必去深究这个公式是怎么样的,只需知道标准差越小,说明数据越集中,标准差越大,说明数据越分散。撰写医学论文的第一步是收集原始数据,如:不得用于商业用途仅供个人参考第 1 组身高( cm): 98、99、100、101、102;第 2 组身高( cm):

5、80、90、100、110、120。在论文中并不是直接给出原始数据,而是要以方式表示。 利用软件 临床医师统计学助手V3.0 ,只要输入原始数据,就能自动计算出均数及标准差,即第1组平均身高: 100± 1.58cm;第 2 组平均身高: 100± 15.81cm,如下图。二、两样本均数差别T 检验【例 2】目的研究中药板兰根对“非典”疗效。方法 将 36 例“非典”患者随机分为治疗组19 例,采用常规治疗+板兰根口服,对照组17 例,仅采用常规治疗。结果治疗组平均退热时间3.28 ± 1.51d ;对照组平均退热时间5.65 ± 1.96d ,两组间对

6、照差别有极显著意义(p 0.01 )结论中药板兰根对“非典”有显效疗效,实为国之瑰宝。这是最常见的一种统计学数据处理类型,统计学述语叫做“两样本均数差别T检验”,说得通俗易懂一些, 就是检验两组方法所得到的数据到底有没有差异,或者说,差异是否有意义。 我们平时的思维习惯是,数据的大小还用得着检验吗?这是小学生都会的问题。可是别忘记了现在是在搞科研,科学方法看问题可不一定这么简单。可能还没有说明白这个问题,下面举一个简单的例子。我们的目的是得出这样一个结论: “北京出产的西瓜比上海出产的西瓜大”。最可靠的方法是把所有北京的西瓜和上海的西瓜都测量重量,得到两个均数,然后比大小即可,可是智商正常的人

7、并不会这样去做,通常的做法是,随机选一部分北京的西瓜和一部分上海的西瓜,先让这两部分西瓜比大小,然后推断到底那里的西瓜大。这种方法是“窥一斑可见全豹”,统计学述语叫做“由样本推断总体”,事实上,我们所做的医学科研都是基于这种方法。再回到上面的例子,假如我们有二种做法:A、随机选 2 个北京西瓜,平均重量是5.6 ±0.3kg ;再随机选2 个上海西瓜,平均重量是4.3 ± 0.25kg ;B、随机选 1000 个北京西瓜,平均重量是5.6 ±0.3kg ;再随机选1000 个上海西瓜,平均重量是4.3 ± 0.25kg 。凭生活常识,由B 推出“北京的西

8、瓜比上海西瓜大”这个结论的把握性就非常的大,而 A 则基本上推不出这个结论。现在,终于可以引出我们的主题了,统计学处理本质是考查由样本差异推断总体差异的把握性有多大,这种把握性在统计学上由P 值表不得用于商业用途仅供个人参考示。如 P 0.05 或 P 0.01 ,可以理解为由样本差异推断总体差异的把握性达95%或 99%以上,两组数据差异有显著意义;如P 0.05 ,可以理解为这种把握性在95%以下,两组数据差异没有显著意义。上面所讲的实已为统计学之精髓,建议多看几遍,如果天生愚鲁,还是看不太懂,也没有关系,现在进一步“傻瓜化”,即所谓统计学处理,只要求得P 值即可。 P0.05 或 P 0

9、.01 ,表示阳性结果, 两组数据差异有显著意义;P>0.05 ,表示阴性结果,两组数据差异没有显著意义。所以,统计学处理的中心任务是求P 值。下面讲解遇到 【例 2】这样的问题,如何求P 值。【例 2】中一共有 6 个数据:第一组均数( X1)、标准差( S1)、例数( N1)与第二组均数(X2)、标准差( S2)、例数( N2),就是根据这6 个数据,先通过复杂计算,求出“T”值(如果没有想成为统计学专家,就不必去理解“T”是什么了,知道“ T”是为了求“ P”用的就可以了),求出“ T”值后,再查“T 界值表”,就知道“P 值”了。具体解法步骤如下:通过计算(这里略去计算公式,可由

10、软件求出),T=4.088计算自由度:自由度=N1+N2-2=19+17-2=34(计算自由度是为了查T 界值表用的,自由度即两组例数之和减去2,不要问我为什么不减去3 或减去 1 这样的问题了。) 查 T 界值表,对应自由度34,T0.05=2.032 ,T0.01=2.728, 今 T=4.088 T0.01 ,即 P 0.01, 差别有高度显著意义。不得用于商业用途仅供个人参考T=4.088 是如何求出的呢?我们再回到软件临床医师统计学助手V3.0 ,只要把第一组均数 (X1)、标准差(S1)、例数( N1)与第二组均数 (X2)、标准差( S2)、例数(N2)这 6 个数据输入对应的框

11、内, 该软件就会利用预先存储的公式自动计算T 值,并查 T 界值表,得到P 值,如图:三、配对计量资料T 检验【例 3】目的 研究音乐胎教对胎儿运动技能培养的效果。方法 10 例 2832周孕妇,分别记录听音乐(水浒传主题曲)前每小时的胎动次数及听音乐后每小时的胎动次数, 结果数据如表1 所示,音乐胎教后胎动次数增多,差别有显著意义(p0.05)结论音乐胎教可增强胎儿运动技能,对培养我国运动天才有现实意义。不得用于商业用途仅供个人参考显然【例 3】与【例 2】有所不同,主要是【例3】两组间的数据可以前后配对的。我们经常碰到这种情况,即同一个体做两次处理,如治疗前检测某一指标,治疗后再检测某一指

12、标,而后做治疗前后配对比较,以判断疗效,正如【例3】。这种情况如何进行统计学处理呢?同样也是先计算T 值,然后按自由度(这时自由度=对子数 -1 ,如本例自由度是 9。)查 T 界值表,求得 P 值。但是“配对 T 检验”计算 T 值的方法与“两样本均数 T 检验”有所不同,这里不再作介绍, 由软件临床医师统计学助手 V3.0 自动完成即可,如下图。本例T=2.47 ,自由度 =10-1=9 ,查 T 界值表,对应自由度 9,T0.05=2.26 , T0.01=3.25,今 T=2.47 T0.05 , 即 P 0.05,差别有显著意义。不得用于商业用途仅供个人参考可能有人会问 , 【例 3

13、】的情况,也可以把胎教前视为对照组,求得平均胎动次数是: 21.8 ± 5.31 ,胎教后视为治疗组,求得平均胎动次数是:24.0 ±6.31 ,然后套用【例 2】的方法,用“两样本均数T 检验”行不行?这样虽无大错误,但是将会导致检验效率的下降,就是说,如果数据差异较大时,两种方法均可,如果数据差异较小时,用“配对 T 检验”会显示出差异有意义,而用“两样本均数T 检验”时,可能差异无意义。切记,非配对资料误用配对T 检验,则是错误的。四、计数资料卡方检验【例 4】目的 研究医患关系对重症病人死亡率的影响。方法 根据问卷调查对收住重症监护病房的病人分为“医患关系良好组”与

14、“医患关系紧张组”,比较两组间的住院死亡率。 结果“医患关系良好组” 25 例,住院间死亡3 例,死亡率13.6%,“医患关系紧张组” 23例,住院间死亡9 例,死亡率 39.1%,两组间差别有显著意义( 0.05 )结论医患关系紧张增加重症病人的住院死亡率,可能与医师害p怕被病人告而治疗方案趋向保守有关。【例 4】又是一个非常常见的一种统计学数据处理类型。【例 4】中所提供的数据是“比例”,或百分数,与前面三个例子不同,前面三个例子所提供的数据则是直接在病人身上测量到的数据,如收缩压120±10.2mmHg、身高 100± 15.81cm 等,我们把【例4】中的数据叫做计

15、数资料,而【例1、2、3】中的数据叫做计量资料。计数资料无法用形式表示,只能用比例表示,如:死亡率 13.6%、30 例中显效10 例( 10/30 )等。显然,对于计数资料,再用T检是不适合了,必须用卡方检验。卡方检验的步骤是:先求出X2(类似于 T 检验时先不得用于商业用途仅供个人参考求 T 值)值,然后进行判断: 如果 X2 3.84 ,则 P 0.05 ; 如果 X23.84 ,则 P0.05 ; 如果 X2 6.63 ,则 P 0.01 。解释一下,上面的两个数字“3.84 ”与“ 6.63 ”是查“ X2 界值表”得来的,只要记住即可。所以,卡方检验的关键是求出X2 值。为了求出

16、X2 值,必须先介绍“四表格”概念。“四表格”的形式如下,关键数据是a 、b、c 、d 四个数, X2值就是通过这四个数据计算出来的(这里仍不介绍公式,由软件计算。)。现 将【例4】中的数据填入“四表格”即如下图。当 你学会了填“四表格”数据之后,就能利用软件临床医师统计学助手V3.0 非常容易的进行卡方检验了,本软件提供与“四表格”完全相同的界面,把数据填写正确之后,就自动计算X2 值并判断结果,【例4】 X2=4.702 3.84 ,故P 0.05 ,如下图:不得用于商业用途仅供个人参考在此说明一下,大家可能已注意到本软件中出现的“理论数(T)”,在此不解释“理论数(T)”是什么,只要记住

17、,当例数(n) 40 或 T 1 时,应采用“精确概率法”,这个方法太复杂,在此不作介绍。现在已经讲完了4 个实例,掌握本教程的诀窍是将实际中碰的的情况,对照实例,“对号入座”即可,而具体计算过程,可由软件去完成。不得用于商业用途仅供个人参考仅供个人用于学习、研究;不得用于商业用途。For personal use only in study and research; not for commercial use.Nur f ü r den pers?nlichen fü r Studien, Forschung, zu kommerziellen Zwecken verwendet werden.Pour l 'é tude et la recherche uniquementà des fins personnelles; pasà des fins commerciales. , .以下无正文For personal use only in study andresearch; not for commercial use不得用于商业用途仅供个人参考仅供个人用于学习、研究;不得用于商业用途。For personal use onl

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论