医学统计学医学知识讲座专家讲座_第1页
医学统计学医学知识讲座专家讲座_第2页
医学统计学医学知识讲座专家讲座_第3页
医学统计学医学知识讲座专家讲座_第4页
医学统计学医学知识讲座专家讲座_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学

(medicalstatistics)温州医学院环境与公共卫生学院叶晓蕾1医学统计学医学知识讲座第1页学习要求1、掌握常见统计分析方法适用范围和注意事项,了解其分析思想,能熟练利用统计学知识处理科研工作中一些常见统计学问题。2、能针对资料特点,选取恰当、高效统计分析方法,而且能比较熟练利用统计软件(如SPSS等)对数据进行统计分析,从而得到可靠结果和科学结论。3、学会在搜集、整理、分析统计资料过程中提出系统处理方案能力。2医学统计学医学知识讲座第2页理论教学内容(共32课时)课时数1绪论、计量资料统计描述42总体均数预计与假设检验43多个样本均数比较方差分析44多原因试验方差分析、重复测量设计方差分析45计数资料统计描述、二项分布、X2检验46秩和检验、双变量回归与相关47多元线性回归、Logistic回归48生存分析、统计总结43医学统计学医学知识讲座第3页第一章

绪论4医学统计学医学知识讲座第4页一、什么叫统计学?利用概率论和数理统计原理研究(随机)事物或现象群体数量特征,从而揭示其内在规律一门学科。是正确认识世界一个主要伎俩。5医学统计学医学知识讲座第5页统计学地位生物医学试验室研究临床研究流行病学研究公共卫生管理……寻求统计学家合作美国国立卫生研究院(NIH)基金申请要求合作者有统计学家,并必须有统计设计与分析内容。统计学——是一门方法学6医学统计学医学知识讲座第6页依据对国内外公开发表医药卫生论文中统计错误调查:

粗略预计,70%左右文章有统计学错误,其中70%错误出现在基本统计学方法,30%错误出现在高级、复杂统计学方法。论文中统计学错误是学习统计学极好反面教材7医学统计学医学知识讲座第7页观察单位特征—变量

变量测定值—变量值(资料)

定量资料(计量资料)(quantitativedata)

分类资料(categoricaldata)无序分类(unorderedcategories)(计数资料)二项分类

多项分类

有序分类(orderedcategories)(等级资料)二、统计资料类型8医学统计学医学知识讲座第8页定量资料(计量资料)(quantitativedata)用定量方法测定得到,有大小之分,有度量衡单位。例某年某市抽样调查120名5岁女孩身高(cm),资料以下:105.5118.6110.5104.2110.9107.9108.199.1104.8116.5110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6109.1108.1109.4118.2103.9116.0110.199.6109.3107.5108.6100.6108.8103.895.3104.4102.7101.0112.1118.7…………………………104.1109.1108.8111.0106.8120.2105.8103.1105.0115.09医学统计学医学知识讲座第9页分类资料(categoricaldata)

将观察单位按属性或类型分组计数所得资料。其观察值是定性,表现为互不相容类别或属性。无序分类(unorderedcategories)

(计数资料)

二项分类10医学统计学医学知识讲座第10页

多项分类11医学统计学医学知识讲座第11页有序分类(orderedcategories)(等级资料)12医学统计学医学知识讲座第12页表100例高血压患者治疗后临床统计患者年纪性别治疗组舒张压体温疗效编号

X1

X2

X3

X4X5

X6137男A11.2737.5显效245女B12.5337.0有效343男A10.9336.5有效459女B14.6737.8无效

┆10054男B16.8037.6无效13医学统计学医学知识讲座第13页案例:大学生伤害调查研究casevariable14医学统计学医学知识讲座第14页资料间相互转化例:以人为单位,测得一群人Hb值(g/L),此资料为

;按Hb量多少分为:<60(重度贫血),60~(中度贫血),90~(轻度贫血),120~160(正常)及>160(Hb增高)。此时资料为

。按Hb正常和异常分为两类,此资料为

;分类资料数量化:性别:男—0女—1贫血程度:Hb增高—1,正常—2,轻度贫血—3,中度贫血—4,重度贫血—5。15医学统计学医学知识讲座第15页三、统计工作步骤设计搜集资料整理资料分析资料1)专业设计2)统计设计1)统计报表2)医疗卫生工作统计3)专题调查和试验1)对数据检验、查对2)按分析要求分组、汇总1)统计描述2)统计推断16医学统计学医学知识讲座第16页第二章

定量资料统计描述17医学统计学医学知识讲座第17页例2.2某年某市抽样调查120名5岁女孩身高(cm),资料以下105.5118.6110.5104.2110.9107.9108.199.1104.8116.5110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6109.1108.1109.4118.2103.9116.0110.199.6109.3107.5108.6100.6108.8103.895.3104.4102.7101.0112.1118.7……………………………………124.0……………104.1109.1108.8111.0106.8120.2105.8103.1105.0115.0第一节频数分布18医学统计学医学知识讲座第18页定量资料频数表和频数图(直方图)图2.1某市城区120名5岁女孩身高频数分布表2.2某市120名5岁女孩身高频数表组段(cm)频数(f)95-198-7101-10104-18107-25110-21113-15116-15119-7122-1251累计12019医学统计学医学知识讲座第19页1、频数分布特征(1)集中趋势(centraltendency)(2)离散趋势(dispersion)20医学统计学医学知识讲座第20页(1)对称分布其中一个常见类型为正态分布。(2)偏态分布有正(左)偏态、负(右)偏态之分。2、频数分布类型21医学统计学医学知识讲座第21页表2.2某市120名5岁女孩身高频数表组段(cm)频数(f)95-198-7101-10104-18107-25110-21113-15116-15119-7122-1251累计12022医学统计学医学知识讲座第22页23医学统计学医学知识讲座第23页第二节集中趋势描述——平均数24医学统计学医学知识讲座第24页惯用平均数意义及其应用场所平均数意义应用场所均数平均数量水平应用甚广,最适适用于对称分布,尤其是正态分布几何均数平均增减倍数①等比资料;②对数正态分布资料中位数位次居中观察值水平①偏态资料;②分布不明资料;③分布一端或两端出现不确定值25医学统计学医学知识讲座第25页1.均数(mean):应用:正态分布或近似正态分布定量资料。

计算:1)直接法:2)加权法:式中:f—各组段频数(相同观察值个数)X—各组段组中值=(下限值+上限值)/2SPSS26医学统计学医学知识讲座第26页2.几何均数(geometricmean):G计算:(1)直接法:(2)加权法27医学统计学医学知识讲座第27页例:6份血清抗体效价为1:10,1:20,1:40,1:80,1:80,1:160,求其平均效价。

先求平均效价倒数:该6份血清抗体平均效价为1:45。SPSS28医学统计学医学知识讲座第28页(2)加权法:例SPSS29医学统计学医学知识讲座第29页

应用:(1)变量值呈倍数关系(2)对数正态分布何谓对数正态分布?已知:X1,X2,……Xn呈偏态分布。设:Y1=lgX1,Y2=lgX2,……Yn=lgXn。则:Y1,Y2,……Yn呈正态分布。

此时,将对数值还原为原始数值,则:30医学统计学医学知识讲座第30页3.中位数(median):M概念:是一组由小到大按次序排列观察值中位次居中数值。计算:(1)直接法:某病患者发病潜伏期为2、3、3、3、4、5、6、9、16天,求中位数。若在第20天又发觉1例患者呢?n为奇数时,n为偶数时,31医学统计学医学知识讲座第31页(2)频数表法:

利用百分位数计算公式进行计算.

百分位数(PX)是一个位置指标,PX将一组观察值分为两部分, 有X%观察值比它小,有(1-X)%观察值比它大。中位数是一个特定百分位数,即M=P50。

32医学统计学医学知识讲座第32页百分位数计算公式:33医学统计学医学知识讲座第33页例2.5某市大气中SO2日平均浓度(μg/m3),求M、P25、P75、P95。M=P50=104.17P25=69.12P75=145.97P95=258.12求M:同理:34医学统计学医学知识讲座第34页应用:(1)偏态分布资料;(2)资料分布一端或两端有未确定值。集中趋势描述35医学统计学医学知识讲座第35页例:SPSS36医学统计学医学知识讲座第36页第三节离散趋势描述37医学统计学医学知识讲座第37页描述离散程度惯用指标全距(极差)(R)2、四分位数间距(Q)3、方差(

2S2)和标准差(、S)4、变异系数(CV)意义指标数值越小,说明观察值变异度越小,平均数代表性越好。38医学统计学医学知识讲座第38页1.全距(极差)(range,R)意义:

反应一组同质观察值个体差异范围。计算:R=Xmax-XminR甲=8;R乙=12;R丙=8。缺点:(1)不能反应组内其它观察值变异度。(2)样本含量越大,则全距可能也越大。39医学统计学医学知识讲座第39页2.四分位数间距(interquartilerange,IQR)

即P75-P25四分位数可看作是一组同质观察值居中50%变量值变异范围。与全距比较有何优点?不受极值影响,较稳定。应用:(1)偏态分布;(2)资料一端或两端有未确定值。第三节离散趋势描述40医学统计学医学知识讲座第40页3.方差(variance,

2,

S2)和标准差(standarddeviation,S)

41医学统计学医学知识讲座第41页4.标准差:

标准差或方差越大,说明个体差异越大,则均数代表性越差。•应用:

对称分布,尤其是正态分布第三节离散趋势描述42医学统计学医学知识讲座第42页样本标准差(S)直接法:加权法:

S2称为——样本方差

式中n-1称为自由度,用希腊字母表示。SPSS43医学统计学医学知识讲座第43页•应用:(1)比较单位不一样几组资料变异程度(2)比较均数相差悬殊几组资料变异程度5.变异系数(CV)44医学统计学医学知识讲座第44页例某地调查120名5岁女孩,其身高均数为110.15cm,标准差为5.86cm;其体重均数为17.71kg,标准差为1.44kg,试比较二者变异度。说明体重变异程度较身高大。45医学统计学医学知识讲座第45页第四节

正态分布及其应用46医学统计学医学知识讲座第46页一、正态分布概念47医学统计学医学知识讲座第47页(1)在横轴上方,均数处最高,为单峰分布(2)以均数为中心,左右对称(3)有两个参数,µ和σ。X~N(μ,σ)(4)正态曲线下面积分布有一定规律二、正态分布图形与特征48医学统计学医学知识讲座第48页49医学统计学医学知识讲座第49页三、正态曲线下面积分布规律正态曲线下某一区间面积占总面积百分数有何意义?即该区间例数占总例数百分数(频数分布)或观察值落在该区间概率。50医学统计学医学知识讲座第50页51医学统计学医学知识讲座第51页四、标准正态分布X~N(0,1)——标准正态分布标准化变换:u~N(0,1)标准正态曲线下面积,φ(u)值(P.695附表1)u=z52医学统计学医学知识讲座第52页五、正态分布应用1.预计频数分布2.制订参考值范围3.质量控制4.统计处理方法基础53医学统计学医学知识讲座第53页预计频数分布例2.2出生体重低于2500克为低体重儿。若由某项研究得某地婴儿出生体重均数为3100克,标准差为300克,预计该地当年出生低体重儿所占百分比。出生体重X~N(3100,300)查附表1得:φ(-2.00)=0.0228即X≤2500百分比为2.28%。54医学统计学医学知识讲座第54页制订参考值范围1)一定数量(n>100)符合条件观察对象2)选定适当百分界限;

如80%、90%、95%和99%,惯用为95%。3)确定单侧或双侧55医学统计学医学知识讲座第55页若取95%界限,双侧:P2.5~P97.5单侧:若高不正常,则<P95若低不正常,则>P54)方法:a:正态分布法若取95%界限,双侧:单侧:若高不正常,则<若低不正常,则>b:百分位数法56医学统计学医学知识讲座第56页57医学统计学医学知识讲座第57页怎样判断资料是否呈正态分布?频数表和频数图P-P图或Q-Q图正态性检验58医学统计学医学知识讲座第58页1.区分计量资料与计数资料

实例1:“小儿皮肤血管瘤雌、孕激素受体研究”(中华××××杂志×年×月第3期)。该研究采取免疫组化方法对毛细血管瘤、混合型血管瘤、海绵状血管瘤、淋巴管瘤及正常皮肤组织雌激素受体ER、孕激素受体PR进行检测。全部标本经10%福尔马林固定,常规石蜡包埋。每例选一经典蜡块,4-6切片,进行免疫组化染色,高倍镜下每例肿瘤区内计数500个细胞,计数ER、PR阳性细胞百分率,资料见表1。计量资料统计描述实例医学统计学医学知识讲座第59页作者采取卡方检验比较各组间差异。医学统计学医学知识讲座第60页分析:普通认为带有“率”资料就是定性资料,似应判断为定性资料。然而问题关键在于,原作者观察单位并不是细胞本身,而是每一个病例标本,作者关心是4种疾病病例标本和一组正常人标本ER、PR阳性细胞率之均值是否相同,从每一个病例标本中得到是ER和PR阳性细胞率,他们是详细数值,因而应属于定量资料。医学统计学医学知识讲座第61页结论:判断资料性质关键是把资料还原为基本观察单位详细取值形式,而不要被资料表现所迷惑。本资料受试对象为病例标本,测量指标为“阳性细胞百分率”,因而应为定量资料。

医学统计学医学知识讲座第62页实例2:某研究人员为了评价一项新治疗方法效果,将8个病人随机等分为两组,分别接收两种治疗方法(传统方法、新方法)。因为疗效不适适用客观指标直接测量,所以,研究者请教授为不一样组病人治疗效果进行评分,最低为0分,最高为4分,分数越高说明治疗效果越好。各组得分结果原始统计以下,见表2:63医学统计学医学知识讲座第63页作者将上述试验结果表示以下:

传统方法组:1.05±0.19(n=4)

新方法治疗组:2.15±0.44(n=4)64医学统计学医学知识讲座第64页分析:评分普通情况下是能够看成计量资料,比如学生考试成绩就是一个评分,能够用来表示。但本例中评分严格来说是一个等级资料。看成计数资料进行统计描述和处理更为适当。65医学统计学医学知识讲座第65页66医学统计学医学知识讲座第66页2.判断资料是否服从正态分布实例3:“血清肿瘤标志在结直肠癌诊疗中应用”(中华检验医学杂志年1月第1期)。该研究探讨4种血清肿瘤标志在结直肠癌诊疗、手术效果评价、转移复发监测中应用价值。文章研究CEA、CA19-9、CA72-4和CA242四项肿瘤标志在患者手术前、手术后及转移复发方面差异有没有显著意义,分别检测了58例手术前患者,30例手术后患者及19例转移复发患者,测量其4项指标,资料见表4。作者采取了方差分析和t检验进行统计学处理。医学统计学医学知识讲座第67页表4手术前后4项肿瘤标志检测结果项目术前(n=58)术后(n=30)转移复发(n=19)CEA(μg/L)34.0±79.02.0±1.288.0±107.0CA1929(×103u/L)209.0±739.011.0±10.9212.0±529.0CA7224(×103u/L)7.2±4.84.3±2.89.8±3.2CA242(×103u/L)111.0±179.010.8±17.5148.0±240.068医学统计学医学知识讲座第68页

分析:对于正态资料,普通来说,应大于3S,放宽一点最少也应大于2S。假如S太大,甚至大于均数,则提醒资料为非正态分布。本例中若干个单元中标准差数值是均值2倍以上,基本上能够认为此资料服从偏态分布。描述偏态分布资料集中趋势应该选取中位数,描述其离散程度应该选取四分位数间距,其形式为“M(QR)”。医学统计学医学知识讲座第69页第十章统计表与统计图一、统计表

statisticaltable二、统计图

statisticalchart70医学统计学医学知识讲座第70页一、统计表statisticaltable(一)统计表结构(二)制表基本要求(三)统计表种类71医学统计学医学知识讲座第71页表号标题纵标目 横标目合计顶线标目线累计线底线*(一)统计表结构统计表由5个部分组成:

标题、标目、线条、数字、备注72医学统计学医学知识讲座第72页

某年某地不一样型流脑病死率比较

病型病人数死亡人数病死率(%)菌血型5946.78脑型778486.17混合型784394.97累计1621915.6173医学统计学医学知识讲座第73页(二)制表基本要求1.标题概括说明表内容,必要时包含时间地点。位于表正上方。

某年某地不一样型流脑病死率比较

病型病人数死亡人数病死率(%)菌血型5946.78脑型778486.17混合型784394.97累计1621915.6174医学统计学医学知识讲座第74页2.标目有横标目、纵标目之分。

横标目:是统计表主语部分,位于左侧;

纵标目:是统计表谓语部分,位于上侧。

某年某地不一样型流脑病死率比较

病型病人数

死亡人数病死率(%)菌血型5946.78

脑型778486.17混合型784394.97累计1621915.6175医学统计学医学知识讲座第75页3.线条普通为3~4条横线,不能出现竖线或斜线。

某年某地不一样型流脑病死率比较

病型病人数死亡人数病死率(%)菌血型5946.78脑型778486.17混合型784394.97累计1621915.6176医学统计学医学知识讲座第76页4.数字注意同一指标小数位数要一致,位次对齐。表内不宜留空格。暂缺用“…”表示,无数字用“——”表示。

某年某地不一样型流脑病死率比较

病型病人数死亡人数病死率(%)菌血型5946.78脑型778486.17混合型784394.97累计1621915.6177医学统计学医学知识讲座第77页5.备注必要是可用符号如“*”引出,写在表下方,但不宜过多。某年某地不一样型流脑病死率比较

病型病人数死亡人数病死率(%)菌血型5946.78脑型778486.17混合型784394.97累计1621915.61*:各型流脑病死率比较:P>0.0578医学统计学医学知识讲座第78页(三)统计表种类1、简单表simpletable按一个特征或标志分组统计表。2、复合表combinativetable按两个或两个以上特征或标志分组统计表。79医学统计学医学知识讲座第79页某年某地不一样型流脑病死率比较

病型病人数死亡人数病死率(%)菌血型5946.78脑型778486.17混合型784394.97累计1621915.611、简单表80医学统计学医学知识讲座第80页某年某地不一样型及不一样病情流脑病死率比较

轻中重病型病人数死亡病死率病人数死亡病死率病人数死亡病死率人数(%)人数(%)人数(%)菌血型2500.002700.007454.14脑型42820.4722411

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论