数理统计在医学中的应用_第1页
数理统计在医学中的应用_第2页
数理统计在医学中的应用_第3页
数理统计在医学中的应用_第4页
数理统计在医学中的应用_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、谈数理统计在医学中的应用摘要:目前数理统计在医学方面的应用越来越广泛。本文首先论述了其研究内容和特点,再通过举例说明,表明数理统计这门学科在疾病的治疗、药物的研究等方面发挥着不可替代的作用,最后是对该学科的展望,数理统计这门学科有广阔的发展空间,并且越来越多地应用到实际生活中。关键词:数理统计 医学 贝叶斯公式 药物 疾病第一章 概述数理统计是研究现实世界中大量现象的客观规律性的科学。也即从实际资料出发,来研究大量现象的规律性。具体来说,数理统计是研究从被研究对象的总体中抽出的一部分的某些性质,从而推断分析所研究的总体的性质。医用数理统计方法是研究医学随机现象变异规律性的一门科学方法,它运用数

2、理统计的基本知识,研究如何科学地搜集原始数据资料,建立有效的数据处理方法,进行统计分析,通过被研究问题作出估计和检验,从而指出事物变异的统计规律性。在实际生活中,医学随机现象的变异性是普遍存在的,如同一地区内性别、年龄在不同时间段的构成比不同;同一疾病用同一种方法治疗,不同人群会有不同的治疗效果等。医学随机事件直接表现为一;定数量,这些数量的取值不能事先确定,而是受偶然因素的影响而改变的。这种随着偶然因素而改变的变量,称为随机变量。例如治愈数、死亡数、测量身高、体重所产生的误差等。通过数理统计研究使我们对于随机变量的特征及其变化规律获得一个总的认识,即通常所说的统计规律性就是随机变量概率分布特

3、征的规律性。统计学原理中要求抽样调查必须遵循的原则是抽样随机化。随机变量一般分为连续型随机变量和离散型随机变量,连续型随机变量是指随机变量取值充满某一个区间,如人的身高和血压的测定值等,它符合正态分布; 离散型随机变量是指随机变量只能取有限个或可数个值,如同一疾病中的治愈人数等,它符合二项分布。在医疗实践中,数理统计就是对大量随机事件进行科学的搜集整理统计资料并根据概率理论,以样本资料对总体的某些性质作出估计和判断第二章 实际应用1、药物疗效的研究与判断例1 某研究机构要对药物的疗效进行研究,假定这种药物对某种疾病的治愈率是0.8,现在患此病的10 人同时服用此药,求其中至少有6个人被治愈的概

4、率。说明此概率的实际含义。解由于此药对每个病员有效与否是相互独立的,且每个病员服药后只有治愈或没有治愈两种结果,因此可根据公式求其概率:P = P10(6) + P10(7) + P10(8)+ P10(9) + P10(10)= C106 ×0.86 ×0.24 + C710 ×0.87 ×0.23+ C810 ×0.88 ×0.22 + C910 ×0.89 ×0.21+ C1010 ×0.810 ×0.200.97所以,至少有6个病人被治愈的概率是0.97。这个结果表示,如果将10个病员服

5、药看作一次试验,那么在100 次这样的试验中,大约有97 次使得10人中至少有6 人被治愈。换句话说,在10 个病员服用后治愈人数少于6人这一事件是很少出现的(概率为0.03)。在数理统计中,利用这一结果,若在100 次实际服用此药试验中,10病员中被治愈不少于6 人的次数小于97次,我们就要对治愈率是0. 8表示怀疑,这说明实际上治愈率低于0.8。例2 一个医生知道某种疾病的自然痊病愈率为0. 25。为了试验一种新药是否有效;把它给10个病人服用,他事先规定了一个决策规则:若这10个病人中至少有4人被治好,则认为这种新药有效,提高了治愈率;反之,则认为无效。求: 1) 虽然新药有效,并把痊愈

6、率提高到0. 35,但通过试验却被否定的概率;2) 新药完全无效,但通过试验却被判断为有效的概率。解1) 实际上是说新药是有效的,并且把痊愈率提高到0. 35 (包括自然痊愈率在内) ,但经10 人服用后,痊愈人数不多于3 个。因此按决策规则,只好认为此药无效,这显然是做了错误的判断(按数理统计的语言来说,犯了弃真错误) 。要计算犯这错误的概率,可以将10 个病人服用此药视为10 次贝努里试验,在每次试验中,此人痊愈的概率p = 0. 35。不痊愈的概率是1 - 0. 35 = 0. 65。而且10 个人的痊愈与否可以认为彼此不受影响(即使是传染病,也是隔离治疗的)。于是“否定新药”这一事件等

7、价于“10 个人中最多只有3 个治好”这一事件,故所求的概率为P(否定新药)= 0.6510 + 10 ×0.35 ×0.659 + 45 ×0.352 ×0.658 + 120 ×0.353 ×0.6570.5136.2) 所求的是“新药完全无效却判断为它有效”这一事件的概率(在数理统计上叫做犯了取伪错误)。因为新药实际上是无效的,因而痊愈率是自然痊愈率0.25,此时有P(判断新药有效) =1 - (0.7510 + 10 ×0.25 ×0.759+ 45 ×0.252 ×0.758 + 12

8、0 ×0.253 ×0.757 )0. 224.注:如果把决策规则中的4人改为3人,则P(否定新药) = 0.6510 + 10 ×0.35 ×0.659 + 45 ×0.352 ×0.6580. 2615.P(判断新药有效) = 1 - (0.7510 + 10 ×0.25 ×0.759 + 45 ×0.252 ×0.7580.474可见,若把决策规则修改为“10 个病人吃了新药后,至少有3 人被治好,则认为这种药有效,提高了治愈率;反之,则认为无效。”那么犯弃真错误的概率就减少到0.2165

9、,而犯取伪错误的概率就增加到0.474。我们知道药品的效用关系到人命安全问题,因此,我们说如果新药有效而被否定(犯了弃真错误)。则会造成经济上的损失,但不会危机人命安全;如果新药无效而肯定(犯了取伪错误),则可能危机到人命安全,由此我们可以认为修改的决策规则较为稳妥。 事实上,犯两类错误所造成的影响虽不一样,但都会给工作带来损失,所以,我们希望作出的判断能使犯这两类错误的概率尽可能地小,但一般情况下,两种错判的概率不能同时减小。因此,实际的做法是,限制1)的概率后,再通过一些办法使2)的概率尽可能的小。2、化验方案的确定为了普查某地流行的某种疾病,需要对该地区全区居民(设共有N个人) 进行抽血

10、检验,检验方式有两种:1) 对两种人分别检验,逐一断定是否呈阳性,需检N次;2) 把k( k < N) 个人分为一组,将每人所抽的血取出一半,同一组的k 个人的血样混在一起进行检验。如果混合血样呈阴性,则表明这些人都无病,对这k个人只作一次检验就够了;如果混合血样呈阳性,则表明这k个人中至少有一人患病,这时,必须对这k个人的血样逐个地进行检验,共需检验k + 1次,假设普查的疾病不是传染病,而且发病率较低时,试说明第二种检验方案能减少检验的次数。解设某种疾病的发病率(呈阳性)为p(p较小),则不发病(呈阴性)的概率q = 1 p。第二种检验方案,每个人的血样需检验的次数是随机变量,其可能

11、取值只有两个:1/k或(k + 1)/k。k个人混合成的血呈阴性的概率是qk ,呈阳性的概率是1 - qk。于是概率分布为每个人需检验次数的数学期望为E() =1/k×qk + (1 +1/k) (1 - qk ) = 1 - qk +1/kN 个人需要检验次数的数学期望为N·(1 - qk+1/k),由于p 很小,从而q 接近于1。不难看出,当k2 时,qk >1/k,故E () < 1,这说明能减少检验次数。例如,当N = 1000,p = 0.01,取k = 4,此时需要检验的次数为1000 ×(1 - 0.94 +1/4) 594 (次)能减少

12、约40%的工作量。当N = 1000,p = 0. 1,取k = 3 时,此时需要检验的次数为1000 ×(1 - 0.993 +1/3) 363 (次)能减少约64%的工作量。通过以上分析可知:发病率p越小,方案2)越能减少检验的次数;当p给定后,可取适当的k使E()达到最小是最好的方法。3、疾病影响因素的确定惠晓萍等在老年痴呆各危险因素发病贡献权重的测量方法研究应用贝叶斯计算公式来研究单个因素对于老年痴呆患者发病贡献大小的权重测算方法。结论如下:表1各危险因素对老年痴呆发生贡献权重计算结果危险因素RR值发病贡献比#权重估计(%)AR(%)年龄1.091.004.238.26文化程

13、度低1.879.6740.8546.52ApoE4基因1.687.5631.9240.48糖尿病1.495.442332.89注:各因素与年龄因素发病贡献权重比。利用贝叶斯公式对老年痴呆各危险因素的发病权重进行计算,克服了以往方法的不足。以往常用的AR评价仅在人群研究中应用,只能表明暴露后人群所增加的发病超额危险比例。如上述对危险因素的分析,年龄、文化程度、ApoE4等位基因、糖尿病对于人群老年痴呆的危险分别为8.26%、46.52%、40.48%、32.89%,合计值超过100%,无法合理解释危险因素在发病中贡献大小,也不能直接用于在个体发病中的比较。而根据上述算法,在无法确定其他未知危险因

14、素的情况下,通过计算因素间的发病贡献比,可对因素进行比较并排出顺序,文化程度低 ApoE4基因糖尿病年龄,即受教育水平低对于痴呆的发病贡献最大,是年龄因素的9.67倍。假定其他未知因素影响不大,可得出它们对老年痴呆影响权重的具体数值的估计,如ApoE4基因为31.92%,而年龄为8.26%,能更加直观地进行比较。通过对各因素发病贡献权重进行排序可知,受教育情况对老年痴呆的影响很大。上海市的痴呆流行病学调查中发现,文盲者发生痴呆的风险是接受过小学教育和中学教育者的2倍,提示社会提高人生早期文化教育程度可降低或延迟老年痴呆发病的危险性。此外年龄与ApoE4基因在痴呆发病中的作用已被证实。有研究者认

15、为,ApoE4基因与海马、杏仁核的萎缩存在一定的关系,通过评价4位点对于正常老年人的痴呆检测有预测价值。相比于年龄和遗传因素,糖尿病是可干预的危险因素,可通过改变生活方式和积极的治疗加以控制,从而阻止或延缓认知功能的减退,防止患者发展为AD及血管性痴呆。将贝叶斯公式应用于老年痴呆的研究,有助于病因的寻找和预防措施的有效开展。但是老年痴呆的发病原因比较复杂,部分危险因素仍不明确,因而在发病贡献权重的计算和比较时还需慎重。第三章 展望数理统计方法越来越广泛应用于医学的各个领域,诸如环境因素对人体健康影响的分析,疾病诊断、病因分析和流行病学预测,药物的近远期疗效分析比较,医学科研的课题实验设计和调查设计,数据处理和结果评价,卫生防疫措施的效果评价等。运用数理统计方法可以使我们提出问题,分析问题和解决问题。随着数学理论,尤其是概率论和高等数学向统计学科的渗透,数理统计方法在医学领域的应用也必将日益广泛。参考文献1 姜岚.浅谈数理统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论