全国高等学校医学规划教材医学统计学主编倪宗瓒市公开课一等奖省赛课微课金奖课件_第1页
全国高等学校医学规划教材医学统计学主编倪宗瓒市公开课一等奖省赛课微课金奖课件_第2页
全国高等学校医学规划教材医学统计学主编倪宗瓒市公开课一等奖省赛课微课金奖课件_第3页
全国高等学校医学规划教材医学统计学主编倪宗瓒市公开课一等奖省赛课微课金奖课件_第4页
全国高等学校医学规划教材医学统计学主编倪宗瓒市公开课一等奖省赛课微课金奖课件_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

全国高等学校医学规划教材

医学统计学

主编倪宗瓒

主讲教师:中国医科大学卫生统计教研室刘嵘1/45第一章绪论2/45“统计”一词,对普通人来说并不陌生。在报刊上常见用来说明我们工作、事业成绩数字、表、图,称为统计数字、统计表和统计图。

在西方,统计学(statistics)一词,源出于state(国家、情况),专指相关“国情”学问,最初多用于文字记叙,后发展为数量比较,伴随概率论思想与方法引入,逐步形成今天在理论与应用方面都已相当完备独立学科。3/45第一节医学统计学定义统计学(statistics):是研究数据搜集、整理、分析一门学科。医学统计学(medicalstatistics):是应用概率论和数理统计基本原理和方法,研究医学数据搜集、整理、分析一门应用学科。4/45例:治疗某病新疗法新法:(100例)有效20例,有效率20%;旧法:(100例)有效15例,有效率15%;这两个百分数就是统计描述指标,现在问题是,这两种疗法有效率会稳定不变吗?假如说不会,是什么原因?那么,两种疗法真实有效率会是多少?我们能依据统计描述(20%与15%)就去正式采用还有较大副作用新疗法?对这么差5/45异问题,你能再凭直觉去作“否定”?在作任何回答之前,必须判断20%与15%之间差异是真实差异,或是仅仅因为“机遇”所致。这里,统计推断可提供帮助。学过统计学,将会了解不但可判断新疗法是否很好?而且,假如判断它是很好,还能预计判断是错误可能性有多大。6/45统计分析是科研工作中一个有力工具。它从科研总体设计、资料采集、资料整理、资料分析直到最终作出结论都有亲密关系。掌握了这个工具能够使用较少人力、物力和时间取得比较可靠结果。需要利用统计方法场所而不去利用它可能造成不应有缺点或得犯错误结论。7/45例1:北京某医院某大夫使用“乌贝散”(乌贼骨3钱,白芨3钱,川贝3钱,甘草3钱,共研细末过120目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为94.4%。那么假如别医院,其它大夫使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4%吗?显然,不一定恰为94.4%,那么是多少呢?比它高还是比它低?这就是一个求可信区间问题。8/45例2:某杂志中一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为78%,平均疗程为三周左右。问此药治疗玫瑰糠疹确实有效吗?因为玫瑰糠疹含有自然治愈情况,普通不服药,多喝水,到三周左右有些患者也会自愈。所以,此药78%疗效有待探讨。这就要求设置含有可比性对照组。9/45再譬如,用某药治某病,治一例有效,能说100%有效吗?治疗二例有效,能说明100%有效吗?治十例,其中九例有效,能说90%有效吗?显然,观察例数将是个重要原因,例数太少不足以说明问题。观察例数太多,将费时,加重科研经济负担。那么观察多少例能说明问题?这是一个样本可靠性问题。

10/45第二节医学统计学主要内容(一)统计研究设计

1.试验设计2.调查设计11/45

在基础,临床和预防医学研究中,经常碰到科研设计问题。比如,在临床药品研究中,我们要了解某降压药疗效。普通地,药品疗效要受许多原因影响:药品本身性质,给药路径,给药时间,病人病情以及病人心理状态等。这些原因有些是能够控制,有些是不能控制。所以,我们在做研究前,要有一个全方面合理计划,以排除试验中影响原因,使研究原因效应突出地表现出来,从中得出准确结论。12/45医学统计中讲研究设计就是设计医学试验或调查研究过程,使从试验或调查得来数据适适用统计方法分析,得出有效和客观结论。13/45比如:现有两种抗肿瘤药,欲探索其对肿瘤细胞敏感作用。当我们考虑这么试验时,有许多问题要加以认真思索,如:1)当前抗肿瘤药效果怎样?该两种药优于其它抗肿瘤药可能特点是什么?2)在这个试验中要用多少种癌细胞?用什么方式把两种药作用到每种癌细胞?3)要观察试验指标是什么?怎样搜集试验数据?14/454)在这个试验中,可能影响试验结果非试验原因有哪些?应该怎样控制?5)应该用什么统计方法分析该试验数据?怎样评价两种药品效果?

全部这些问题或者还有许多问题,都必须在进行试验之前充分考虑,作到心中有数,然后决定怎样作这个试验,既作出实施试验步骤计划,这个过程就是试验设计(designofexperiment)。

15/45(二)惯用基本统计方法1.统计描述2.统计推断3.二项分布和Poisson分布4.直线回归和相关、协方差分析等16/45(三)临床医学中惯用统计方法

1.随机对照试验、交叉设计、配对设计、配伍组设计、析因设计及诊疗与筛检试验设计2.随访资料生存分析3.信度与效度分析4.Meta分析17/45(四)惯用医学人口和疾病统计指标及其应用;寿命表编制原理及其在医学上应用。(五)多原因分析统计方法:1.多重线性相关与回归2.Logistic回归3.Cox百分比风险模型

18/45第三节统计工作基本步骤(一)设计1.确定研究目标2.确定研究对象及其数量3.确定观察指标4.设置适当对照组及随机化分组5.制订很好原始统计表6.考虑好统计分析方法7.预期会有何结果8.人员组织及经费预算19/45(二)搜集资料搜集资料就是依据研究目标,试验设计要求,搜集准确完整充满信息原始资料(rawdata)。资料起源:

1.临床试验中病例观察表。2.国家法定报表:卫生工作报表、传染病报表、职业病报表、医院工作报表。3.大规模流行病调查获取现场调查资料。

20/45这些资料搜集过程,必须进行质量控制。包含它统一性,确切性,可重复性。对这些原始数据精度(precision)和偏性(bias)应有明确控制范围。

21/45(三)整理资料整理资料就是把搜集到原始资料,有目标地进行科学加工,使资料系统化、条理化,方便进行统计分析。1.专业检验:男性患者调查表中不应出现妇科疾病等;从专业角度对资料一致性进行检验,比如诊疗和疗效评定标准是否统一,胃镜下萎缩性胃炎严重程度评定标准是否一致等。

2.逻辑检验:比如退休时年纪不应出现小于20岁;六岁孩子不应有大学文化程度。

22/453.统计检验:检验报表(或汇报卡)纵向,横向累计和总累计是否吻合。体重8.50(千克),身高69.0(cm),头围44.0(cm),胸围42.5(cm),坐高43.0(cm)。理论上算,这五个数据都是以0或5结尾可能性0.032%

23/45(四)分析资料分析资料就是把经过统计整理资料,作一系列统计描述和统计推断,说明事物规律性。应该注意,不一样资料使用统计描述和统计推断方法是不一样,必须加以区分。

1.统计描述:指用统计指标、统计表、统计图对资料数量特征及其分布规律进行测定和描述。

2.统计推断:指怎样抽样及由样本信息推断总体特征。24/45第四节医学统计中基本概念及医学资料分类一、基本概念(一)变异(variation):同质基础上个体值之间差异,称为变异。医学研究对象是有机生命体,其机能是十分复杂。不一样个体在相同条件下,对外界环境原因能够发生不一样反应。比如,同种族、同年纪、同性别健康人,在相同条件下测其脉搏、呼吸、体温等生理指标能够有很大差异。在临床治疗中,用一样药品治疗病情相同病人,疗效也不尽相同。即使在试验室里,动物与动物之间也有显著差异。这种现象称为个体差异或称为变异。变异是由众多、偶然、次要原因造成。

25/45因为医学统计研究对象是有变异事物,所以,用观察1~2例结果来推论出普通规律是不恰当。比如,我们不能用某一健康成人红细胞数作为普通健康成人红细胞数;也不能因为用青木香治疗一例高血压患者有效,而断定青木香治疗高血压有效率为100%,因为观察例数太少,受个别偶然原因影响太大。科学研究工作,主要任务之一就是要从表现为偶然性大量数据中,分析出其中必定性规律。而概率论和数理统计就是要经过这种偶然性去寻找隐藏在其内部必定规律性。26/45(二)总体和样本1.总体(population):是依据研究目确实定同质全部观察单位某种变量值集合。有限总体:指明确了特定时间、空间范围有限个观察单位所组成总体。无限总体:没有时间和空间范围限制无限个观察单位所组成总体。

27/452.样本(sample):是总体中随机抽取部分观察单位,其实测值集合。样本含量(samplesize):是指样本中所包含观察单位数。28/45譬如,我们要研究华北地域成年人血液红细胞数正常值,那么,华北地域全部健康成年人血液都是我们研究对象,这称为总体。不过,我们不可能把华北地域全部健康成年人都进行血液检验,而只能按照一定科学方法从中抽取一部分人来进行血液检验。然后,依据检验结果来推论华北地域成年人血液正常值。这种从总体中抽取部分个体过程称为抽样(sampling),所抽得部分成为样本,怎样正确从样本观察到情况来推测总体,这就是医学统计学要处理问题之一。29/45从总体中抽取样本,一定要遵照科学标准。普通来说,一个样本应含有“代表性(representative)”、“随机性(randomization)”和“可靠性(reliability)”。代表性:就是要求样本中每一个个体必须符合总体要求。这就要求对总体有一个明确要求。这种要求是依据研究目标而详细确定。

30/45比如,要调查华北地域成年男子红细胞数正常值,则我们能够要求研究对象为体温正常、无急性病、无血液消耗性疾病,肝在肋缘下0.5cm以内,血红蛋白在12.5克以上,血小板在10万以上华北地域18岁以上男子。必须做肝功、X线胸透及一些血项检验……等,那么所抽取样本中每个个体都必须做上述检验,并符合上述要求。31/45随机性就是要确保总体中每个个体有相同几率被抽作样本。主要是要防止主客观“偏因”。必须指出,随机化抽样绝不等于随意抽样。比如,将40只小鼠分为两组。假如闭上眼睛,随意抓取20只作为第一组,留下作为第二组。表面上看来是随机,实际上是不随机。因为体壮、活泼性强小鼠难于抓到,故大部分留在第二组,两组活泼性是不一样。32/45可靠性即对试验结果要含有可重复性,即由科研课题样本结果所推测总体结论有较大可信度。因为个体之间存在差异,只有观察一定数量个体方能表达出其客观规律性。假如依据少数几例就下结论,这种结论可靠性差,表达不了规律,可能被后人所否定,这种先例是曾经发生过。诚然,每个样本含量越多,可靠性会越大,不过例数增加,人力、物力都会发生困难,所以应以“足够”为准,这就包括到样本含量预计问题。33/45总体随机抽样编号性别年纪红细胞数血红蛋白1…n

A1…An

B1…Bn

C1…Cn……D1…Dn随机样本

统计推断和总体与样本基本关系统计推断34/45(三)参数和统计量

1.参数(parametric):总体指标。2.统计量(statistics):样本指标。(四)抽样误差1.定义:在统计学上把由抽样造成样本统计量和总体参数之间差异或者是各个样本统计量之间差异统称为抽样误差(samplingerror)。

35/45(五)概率概率(probability):是描述随机事件发生可能性大小数值。(1)必定事件:P(A)=1(2)不可能事件:P(A)=0(3)随机事件(偶然事件):0<P(A)<1(4)小概率事件:P≤0.05或P≤0.0136/45频率和概率区分和联络1.频率(frequency):设在n次随机试验中,事件A出现m次,比值称为事件A在n次试验中出现频率。

医疗工作中所说发病率、死亡率、治愈率等都是频率。显然,频率含有以下性质:37/452.频率稳定性

实例1:掷一枚质量均匀硬币试验实例2:某年出生男婴及女婴人数在大量试验中,一个随机事件出现频率常在某个固定常数附近摆动,这是一个统计规律,称为频率稳定性。频率含有稳定性说明随机事件发生可能性大小是其本身固有一个客观属性,所以能够对它进行度量。

38/453.概率统计学定义在大量重复试验中,若事件A频率稳定地在某一常数附近摆动,则称此常数为事件A概率。注意:频率是变动,而概率则为常数。当试验次数足够多,频率相当稳定时,可把频率作为概率近似值,即当时,39/45二、资料类型1.计量资料2.计数资料可相互转化3.等级资料

1.定量资料(计量资料)2.定性资料(分类资料)(1)二项分类(计数资料)(2)多项分类无序多分类有序多分类(等级资料)40/451.定量资料是对每个观察对象观察指标用定量方法测定该项指标数值大小所得资料,普通有度量衡单位。如身高(cm)、体重(kg)、浓度(mg/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论