卫生统计学知识复习:第一章_第1页
卫生统计学知识复习:第一章_第2页
卫生统计学知识复习:第一章_第3页
卫生统计学知识复习:第一章_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卫生统计学知识复习:第一章卫生统计学(medicalstatistics)是应用概率论和数理统计的基原理和方法,结合医学实际,研究资料和信息的搜集?整理与分析的一门学科?近代医学发展十分迅速,许多新的问题需要人们去研究解决,认识其内在的联系?卫生统计学正是一门帮助人们透过许多偶然现象分析和判断事物的内在规律的科学?而电子计算机技术的普及和发展,为大量统计资料和信息的贮存?整理和分析?提供了有利的条件?许多供医学统计设计和整理分析专用的统计程序,既便于医务工作者应用医学统计方法解决医学科学中的实际问题,又增加了应用一些复杂的统计法(如多变量分析等)进行医学科学研究的可行性?可以说,卫生统计学已成

2、为促进医学发展的一门重要的应用科学,成为临床医生应具有的一种分析和解决问题的重要手段?因此,临床医生不仅必要应学习卫生统计学的基本知识,而且完全可以掌握常用的统计学方法?什么是统计学,统计学和统计数字在英语中共用statistics一词,作为复数名词,意指统计数字,作为单数名词,表示统计学?这个词来源于state,可见早期的统计数字是指官方所要求的信息?现在仍然如此,但不限于此,各行各业都有大量的统计数字,其中蕴含着丰富的信息?统计学是和这类信息有关的一门学问?首先,统计学是处理资料中变异性的科学和艺术?将科学和艺术两顶桂冠同时授予一门学问,这是很不寻常的,可能是资料中的变异性太普遍,太棘手的

3、缘故;第二,统计学的目的在于取得可靠的结果,其求实性毫不含糊,既不为装点门面,也不为自欺欺人;第三,统计学是在搜集?归类?分析和解释大量数据的过程中完成其使命的,这一点,统计学的顾客们并非都很了解,许多人到了分析数据阶段才想起统计学,不免发生悔之晚矣的憾事?学习统计学,一是要把握基本概念?弄清统计术语的含义,二是掌握常用统计方法,要做好这一点,我们提出两条要求:把握统计处理的粗线条?而不必花精力去死背各种统计公式;充分利用计算机这种现代计算工具,从繁锁的运算中解脱出来,始终把注意力放在统计公式的理解?正确选择及结果分析上?数据计算方面我们将重点介绍spss统计软件?1.一些基本概念1.1统计工

4、作的步骤统计工作和一般科研工作类似,可分为四个步骤:即先要有一个全过程的设计,然后按照设计的要求去搜集资料?整理资料和分析资料?这四个步骤是互相联系,不可分割的,任何步骤的缺陷,都会影响统计分析的结果?设计(design)这是最关节键的一步?首先要明确研究目的,要对被研究的事物有一定的了解,可根据以往工作的经验和参考文献,或通过试查和预备试验,掌握较多的信息?对工作的全过程有一个全面的设想?例如根据研究目的需要搜集哪些资料?人力?财力和客观条件是否可能办到?用什么方式和方法来取得原始资料(包括拟定适当的调查表格和实验记录等)?怎样对取得的原始资料作进一步的整理汇总(包括提出分组要示和拟定整理表

5、等)?怎样对汇总后资料作进一步加工,计算有关统计指标?预期会得到什么结果?凡此种种,都要经过周密地考虑,明确地回答,结合实际情况,作出科学的?细致的安排,才能用较少的人力?财力取得较大的效果,特别是要用电子计算机来整理?分折资料,这个全过程的设计,显得更为重要?现在我们列举两个实例,帮助读者感受医学研究中统计学是如何发挥作用的?(1)麻醉剂氟烷的一场风波美国于1958年开始在外科手术中采用麻醉剂氟烷(Halothane)?以其不易燃?不易爆?副作用小等优点,到1962年时大约普及到了一半手术?不料,突然有报告称数例病人术后恢复的同时突然恶化?发烧?死亡,尸解显示肝脏大片坏死,一时间疑云四起?氟

6、烷是否损害肝脏?是否应禁止用于手术?为回答这些问题,自然需要与其他常用麻醉剂比较?其他麻醉剂对肝脏损害如何?是否氟烷有其特殊的副作用?查书?专家咨询均不得要领?急性动物实验随时可做,但与病人的外科手术相去甚远?为此,卫生当局决定进行调查?当时使用氟烷的手术病例已逾千万,不可能也不必全数调查?于是,决定在有较完整病案资料的34家医院中抽取1960-64年间的85万例手术病例,其中记有所需个体信息,如性别?年龄?使用何种麻醉剂,是否死于术后6周内?术前状况?手术方式等等?不分死因,其中共有17000例死于术后6周内,粗死亡率为2%?按所用麻醉剂区分,与氟烷?喷妥撒(pentothal)?环丙烷(c

7、yclopropane)?乙醚(ether)和其他麻醉剂相应的粗死亡率分别为1.7%,1.7%,3.4%,1.9%和3.0%?是否由此可以认为氟烷的死亡威胁小于其他麻醉剂的死亡威胁呢?显然,死亡威胁与术前状况有关,病情轻者死亡率仅0.25%,重者可达30%;也与手术本身的危险性有关,各种手术死亡率低者仅0.25%,高者达14%;还与年龄有关,病情和手术相同时青少年死亡率低,老年死亡率高;此外,死亡危险还与性别?医院等有关?各种麻醉剂使用对象不同,直接比较上述粗死亡率便毫无意义?这时,必须借助各种统计方法加以校正?假定各种麻醉剂的使用对象具有相同的术前状况,采用相同的手术?同年龄?同性别和同一所

8、医院,相应的死亡率会如何?经过校正,与氟烷?喷妥撒?环丙烷?乙醚和其他麻醉剂相应的死亡率分别为2.1%,2.0%,2.6%,2.0%,2.5%?从而说明:所有的麻醉剂都可能导致一部分病人术后6周内死亡,不同麻醉剂相应的死亡率水平不甚悬殊,氟烷的死亡威胁并无特殊?统计学对这场风波的平息是有贡献的,其中抽样调查?粗死亡率概念和统计学校正等使得不确实的印象得到科学的澄清,也使人们对各种麻醉剂的死亡威胁增进了认识?(2)吸烟危害健康的论争吸烟危害健康,如今已成国际共识?回顾历史,从科学角度论证这一命题浸透了统计学家的心血?人们不可能象药物研究那样,随机地安排一部份人去吸烟,安排另一部人不吸烟,追踪观察

9、其结局,从而需要特殊的统计学设计和分析?Muller(1939)采用病例-对照设计搜集一组肺癌患者,并配置一组其他特点与之相仿的非肺癌患者作为对照组,逐一询问吸烟否?吸烟量和时间,发现肺癌组吸烟者比率高,对照组吸烟比率低?Pearl(1938)调查了数百个家庭,形成了吸烟多?吸烟少和不吸烟三个组,根据各人的寿命,编制了三份寿命表,相应地绘制了三条生存曲线,反映各组随年龄增长减员的过程?发现吸烟多的一组几乎以直线下降的趋势减员,不吸烟的一组以先凸后凹的曲线趋势缓慢减员,而吸烟少的一组减员趋势则介于以上两组之间?较之这类回顾性研究更进一步的是DollandHill(1964)的一项出色的前瞻性研究

10、?他们向60000名英国医生发出关于吸烟的问卷,其中40000名应答,据此将他们分成吸烟组和不吸烟组?借助英国良好的死亡登记系统追踪他们的结局,发现吸烟组肺癌的年发病率为1.66,心脏病年发作率为5.99,而不吸烟组肺癌的年发病率为0.07,心脏病年发作率为4.22?类似于以上的研究还有很多,但相反的意见仍很强盛?烟草公司和相关的行业以及政府财税部门反对禁烟,不足为怪?岂料,有两位在别的问题上常有分歧的统计学权威SirRonaldFisher和Prof.JosephBerkson对吸烟有害的研究却一致提出挑战?Berkson认为,据称吸烟能提高许多种死因下的死亡率,这一点不可理解?除非有证据说

11、明吸烟对整体健康有害或加速老化,不然,可认为类似上述的研究中对照组的选择以及吸烟状况的资料搜集方式等的偏倚导致了吸烟提高多种死亡率的假象?Fisher认为,已有的大量研究不能排除遗传因素?也许具有某种遗传因素者既爱吸烟,又易得癌,而无此因素者既厌吸烟,又难得癌?若果真如此,戒烟并不能摆脱癌症?两位统计学权威的挑战促进了吸烟有害研究的深入?瑞典国家双生研究即为一例?他们调查了一方吸烟?另一方不吸烟的双生对,其中,同卵双生男274对,女264对,异卵双生男733对,女653对,发现慢性支气管炎患病率在同卵双生的吸烟者中男女分别为14.6%和13.6%,而不吸烟者中男女分别为7.7%和7.6%;在异

12、卵双生的吸烟者中男女分别为5.5%和5.7%?吸烟与不吸烟相比,慢性支气管炎患病的相对危险度约为1.82.5倍?此外,还有更多的间接证据?例如,狗的模拟吸烟导致与人类肺癌相似的结局?吸烟有损动脉血管?吸烟与死亡率有剂量反应关系?戒烟时间长短对死亡率有不同影响等等?鉴于吸烟与禁烟已非单纯的生物医学问题,有的统计学家建议当局利用统计决策理论权衡公众行动起来禁烟的代价和由此给社会带来的得与失,从而作出合理的决策?目前,许多发达国家已经断然采取了种种限制吸烟的措施,此中融有统计学家的贡献?他们在吸烟有害问题的研究中所创造的方法学也为其他公害的研究提供了借鉴?搜集资料(collectionofdata)

13、它的任务是按研究设计的要求,及时取得准确?完整的原始数据?当然只有原始数据可靠,才能得出可靠的结论?因此,这一步骤具有极重要的基础意义?整理资料(sortingdata)它的任务是按研究设计的要求,使原始数据系统化?条理化,便于进一步的计算指标和分析?分析资料(analysisofdata)它的任务是按研究设计的要求,计算有关指标,阐明事物的内在联系和规律?为此,必须对整理出的基础数据,作进一步的计算分析和统计处理,并用适当的统计图表陈示资料,最后结合专业作出恰如其分的结论?1.2统计资料的类型卫生统计资料一般分为计量资料与计数资料两大类,介于其中的还有等级资料,不同类型的资料应采用不同的分析

14、方法?因此,搞清楚下面的定义对以后学习具体的统计方法很重要?计量资料(measurementdata)对每个观察单位的各样项指标用定量的方法,通过测量得到的数值,我们把这样的资料称为计量资料,一般有度量衡等单位?如调查某地10岁女童的身体发育状况,以人为观察单位,每个人的身高(cm)?体重(kg)和血压(mmHg)等;又如以每个采样点为观察单位,测得不同采样点的二氧化碳浓度(mg/L)?计数资料(enumerationdata)先将观察单位按某种属性或类别分组,然后清点所得各组的观察单位数,称为计数资料?例如对某小学全体学生进行蛔虫卵粪检,每个学生是一个观察单位,将每个学生按粪检结果阳性与阴性

15、分组,得每组人数;又如调查某人群的血型分布,按A?B?AB?O四型分组,得各血型组的人数?等级资料(rankeddata)将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料?例如用某药治疗若干痢疾病人,其中治愈?显效?有效?无效人数;测定某项血清反应的-?+?艹人数?这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半计量资料?对分辨计量资料和计数资料,原则上并不困难.通常凡是用仪器测得的数据都是计量资料,如身高?体重?肺活量?红细胞数?白细胞数?等属计量资料?通常按性质?类别分组后清点得到的数目,如

16、男性人数?女性人数,阳性人数,阴性人数,对动物实验的各种结果的例数等都是计数资料?按等级分组资料不难确认,凡是按程度不同分多个组后清点数目,一般都属等级资料了?在医学统计资料中,还有一种较为特殊的数据就是具有“周期性”,测量值有单位,但不能分定量,因而称为半计量资料?等级资料可用第11章的统计分析方法?出大小,例如,血流图的主峰角,心电图的电轴,产妇分娩时间的分布,人口出生日期的分布资料等?我们称这类资料为循环资料或角度资料?故名思义,它是用昼夜时间或季节的月日表示的资料,或是用角度表示的资料?这类资料的处理本此不再赘述?根据分析研究的目的,计量资料?等级资料可以互相转化?例如,白细胞总数属于

17、计量资料;如果按白细胞总数正常与不正常分为两组,然后清点各组人数,便成为计数资料了;如果按白细胞总数过高?正常?低下分为3组,然后清点务组人数,就成为等级资料了?又如在多变量分析中,定性指标数量化时,将性别男与女分别取为0,1;或将不咳嗽?轻度咳嗽?中度咳嗽?重度咳嗽的4个等级分别取为0?1?2?3?这时计数资料或等级资料就转化为计量资料?计量资料转化为计数资料或等级资料比较容易些,但计数资料或等级资料转化为计量资料就有一定的局限性?最后,我们还的提醒一下那些初学者,在进行数据处理和资料分析时,必须明确统计资料的类型,要记住,不同类型的资料,所用的统计方法亦不同?1.3统计中的几个常用术语同质

18、与变异我们称具有相同性质的一类事物为同质,而在同质条件下,就同一观察指标来说,各观察单位表现出来的数量间存在着差异,这种客观存在的差异性称为变异(variation)?例如,研究儿童的身体发育,同性别?同年龄儿童(统计上称为“同质”观察单位)的身高,有高有低,各不相同,称为身高的变异.日常生活中,有时也可以看到,同性别中,有的低年龄儿童的身高,高于高年龄儿童,但总的说来,儿童的身高总是随年龄而增加,这是客观规律?同理,同种属?同性别?年龄相近的小白鼠,喂以同种饲料,其所增体重(g)亦各不相同,亦称为变异,但客观规律是饲料所含营养成分愈多,所增体重愈多?上例中的个体变异表现为定量,如身高的高低,

19、所增体重的多少;有时亦可表现为定性的,如用某药治疗某种病人后的痊愈?好转?恶化等?同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现,是由于生物体内外环境中,多种因素的综合影响造成的,其中许多因素是未知的,也是难于控制的?统计研究的是有变异的事物,统计的任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律?总体(population)与样本(sample)总体是根据研究目的确定的同质的研究对象的全体?更确切地说,是性质相同的所有观察单位(obserredunit)某种变量值的集合?例如研究某地1990年正常成人的血压值,则研究对象是该地1990

20、年的正常成人,观察单位是每个人,变量是血压,变量值是测得的血压值,该地1990年全部正常成人的血压值就构成一个总体?它的同质基础是同一地区,同一年份,同为正常成人?这里的总体只包括有限个观察单位,称为有限总体(finitepopulation)?有时总体是设想的,如研究高血压患者用某药治疗后的血压,这里总体同质基础是同为高血压患者,同用某药治疗,包括设想用该药治疗的所有高血压患者,其观察单位数显然是不确定的,无限的,称为无限总体?医学研究中,很多是无限总体,要直接研究总体的情况是不可能的?即使对有限总体来说,若包括的观察单位数过多,直接研究总体也是耗费人力?财力很大的,有时也是不可能和不必要的

21、,但总体是我们想根本去认识,去了解的?它具有的指标值是客观存在的,如某地空气中的SO2的含量,是客观存在的某个值?但我们不可能把所有的空气都抽到实验室来检测,这是办不到的?上面提到的一个例子,研究1990年某地正常成年人的血压值,虽然说,原则上可对该地每一个成年人的血压进行测量,但我们想这样作的因难会有多大,实际上凭我们的经验也可知道这样作的意义并不大?因此我们可以理解,统计所涉及的具体对象通常都是样本?所谓样本,是指从总体中随机抽取的有代表性的一部分?统计分析正是通过对具体样本值的分析?研究,从而正确地推断出总体所具有的特性来?这也正是统计的重要任务之一?正因为如此,对样本的来源有一定的要求

22、,具体方法称为抽样研究?本此讲义也不作详细介绍?参数(parameter)和统计量(statistics)统计学中把总体的指标统称为参数?而由样本算得的相应的总体指标称为统计量?如研究某地成年男子的平均脉搏数(次/分),并从该地抽取1000名成年男子进行测量,所得的样本平均数即称为统计量?习惯上用希腊字母表示总体参数,例如表示总体均数,表示总体率,表示总体标准差等?以拉丁字母表示统计量,x-表示样本均数,p表示样本率,s表示样本标准差等?抽样误差(samplingerror)由于总体中各观察单位间存在在个体变异,抽样研究中抽取的样本,只包含总体的一部分观察单位,因而样本指标不一定恰好等于相应的总体指标?例如从某市1992年7岁男童的总体中随机抽取110名儿童,调查得此样本的身高均数为119.95cm,这个数值不一定恰好等于该市7岁男童的总体均数?又如从某地随机抽取500人,查出乙型肝炎病毒携带率为10%,这个数字不一定恰好等于该地人群乙型肝炎病毒携带率?这种由抽样引起的样本指标值与总体指标值之间的差异性,称为抽样误差,前面已经提到,统计的任务之一就是通过对样本的分析研究,推断出总体所具有的特性来,而样本指标值是我们可以获得的数据,若样本指标与总体指标之间的差异规律

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论