医学统计学绪论2014-9-11_第1页
医学统计学绪论2014-9-11_第2页
医学统计学绪论2014-9-11_第3页
医学统计学绪论2014-9-11_第4页
医学统计学绪论2014-9-11_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学-绪论

杨土保医学博士流行病与卫生统计学系教授/博导1064960669@2014.9.11研究生规划教材《医学统计学》(第3版)卫生部教材办和全国高等医药教材建设研究会规划教材教育部推荐本教材为全国“研究生教学用书”国内第一本研究生规划教材。主编孙振球教授,副主编徐勇勇教授。21所兄弟院校参编使用教材目录第一章绪论第一篇基本统计方法第二章计量资料的统计描述第三章总体均数的估计与假设检验第四章多个样本均数比较的方差分析第五章计数资料的统计描述第六章几种离散型变量的分布及其应用第七章检验第八章秩转换的非参数检验第九章双变量回归与相关第十章统计表与统计图第十一章多因素试验资料的方差分析第十二章重复测量设计资料的方差分析第十三章协方差分析第十四章多变量数据的统计描述与统计推断第十五章多元线性回归分析第十六章logistic回归分析第十七章生存分析第十八章判别分析第十九章聚类分析第二十章主成分分析与因子分析第二十一章典型相关分析第二十二章常用统计预测方法第二十三章常用综合评价方法第二十四章量表研制与量表资料的统计分析方法第二篇高级统计方法第三篇医学科学研究设计第二十五章多水平模型第二十六章结构方程模型第二十七章医学科学研究设计概述第二十八章观察性研究设计第二十九章实验研究设计第三十章临床试验研究设计

第四篇数据处理与统计软件应用第三十一章数据预处理与统计方法的选择第三十二章SPSS统计软件第三十三章SAS统计软件第三十四章Stata统计软件第三十五章数据处理的其他统计方法附录一医学人口统计与疾病统计常用指标附录二统计用表附录三英汉名词对照MedicalStatisticsACommonsenseApproachThirdEditionMchaelJ.CampbellDavidMachinMEDICALSTATISTICS(3rd)CONTENTSCHAPTER1:UsesandAbusesofMSWhyusestatistics?StatisticsisaboutCommonsense&gooddesign,Howastatisticiancanhelp?Furtherreading

MEDICALSTATISTICS(3rd)CHAPTER2:DesignDefiningtheobjectivesTypesofstudyTherandomizedclinicaltrialNon-randomizedstudycohort\case-control\cross-sectional\studyStudiesofdiagnosistestsMethodsofrandomised;Qustionnaire(form)MEDICALSTATISTICS(3rd)CHAPTER3:Probability&DecisionMakingTypesofProbabilityDiagnostictestsBayes’theoremROCcurvesMEDICALSTATISTICS(3rd)Chapter4:DataDescriptionTypesofdataDisplayingandsummarizingcontinuousdataDisplayingandsummarizingcategoricaldataPresentationVariabilityMEDICALSTATISTICS(3rd)Chapter5:FromsampletoPopulationNormaldistributionStandarderrorConfidenceintervalsBinomialdistributionPoissondistributionMEDICALSTATISTICS(3rd)Chapter6StatisticalInferenceThenullhypothesisTheP-valueStatisticalInferenceSmallsampleofcontinuousdataTheChi-squaredTestStatisticalpowerDegreesofFreedom,One(two)sidedtestsMEDICALSTATISTICS(3rd)Chapter7:Correlation&RegressionCorrelationRegressionMultipleregressionLogisticregressionCorrelationisnotcausationMEDICALSTATISTICS(3rd)Chapter8:Therandomizedcontrolledtrial(RCT)Chapter9:DesignedobservationalstudiesCohortstudycasecontrolstudyStandardizationAssociation&causalityMEDICALSTATISTICS(3rd)Chapter10:StatisitcaltechniquesCalculationofMean&interquartilerangeCalculationofMean&standarddeviationz-test,t-test,Chi-squaredtest,Fisher’sexacttest,RCtables,Mcnemar’stest,Non-parametrictestSamplesize,Survivalanalysis主要内容★统计学的几个基本概念★医学统计工作的基本步骤★统计学发展简史

第一章绪论统计思维进化与概念统计思维的进化(发展简史)时期科学家发明与应用1749-1827Pierre-SimonLaplace研究概率(probability)。1745-1826PhilippePinel应用概率研究疗效1787-1872Louis临床疗效,对照1822-1911FrancisGalton分布与变异统计思维进化与概念时期科学家发明与应用1857-1936KarlPearson现代统计学之父相关分析,x21880-1949MajorGreenwood抽样误差1879-1940RaymondPearl医院统计,生物统计(1890-1962RonaldA.Fisher现代统计学奠基误差理论极大似然《实验设计》随机化做实验,F检验1897-1991Hill爵士现代临床试验(clinicaltrial)统计思维进化与概念一些重要的临床试验

★英国临床医学研究理事会(1946年):链霉素治疗肺结核的临床试验(随机化分组、方法有链霉素加卧床休息或单纯卧床休息。独立评价X光片子结果,链霉素组病人的生存和两方面的放射学改善都有较好)统计思维进化与概念★

美国(1954年):评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎的效果(干预试验、现场试验;样本:180万儿童;花费:500多万美元。随机化分组,最后约有1/4参与者得到了随机化。这项试验最终肯定了索尔克疫苗的效果)

统计思维进化与概念

★德国(1960年代初),药物酞胺哌啶酮(Thalidomide,又称反应停)事件(曾引起一次胎儿畸形(四肢体短缺)的暴发,经过病例对照研究和干预研究发现危险因素是反应停)。美国从这一事件促使有关法律文件的产生,FDA为临床试验规定了一整套制度,使之成为确定药物疗效验的标准方法。

一门研究数据(data)的搜集(collection)、整理(sorting)、分析(analysis)的科学。统计学(Statistics)统计学的英文statistics最早是源于现代拉丁文statisticumcollegium(国会)以及意大利文statista(国民或政治家)。德文Statistik,最早是由GottfriedAchenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。收集数据:实验设计、调查设计分析数据:统计学描述、统计学推断解释数据:根据专业等解释统计结果呈现结果:向杂志社、上级部门发表结果Webster'sInternationalDictionary:Asciencedealingwiththecollection,analysis,interpretation,andpresentationofmassesofnumericaldata”JohnM.Last,ADictionaryofEpidemiology:Thescienceandartofdealingwithvariationindatathroughcollection,classification,andanalysisinsuchawayastoobtainreliableresults”DavidFreedman:统计学是对令人困惑费解的问题做出数学设想的艺术医学统计学是处理医学资料中的同质性(homogeneity)和变异性(variation)的科学与艺术

定义:是研究医学数据的搜集、整理、分析的科学。特点:1、资料的数字化,数量反映质量2、由偶然性(不确定性)的剖析中,发现事物的必然性(确定性)医学统计学(medicalstatistics)

医学统计学学习内容:1、统计学的基本原理、方法(basicprinciplesandmethods)——基础

(学习重点)

2、业务统计——应用(如:临床医学、预防医学、卫生事业管理)医学统计学目的:医学科研的数学工具核心:计算和比较反映群体综合数量特征的统计指标(statisticalindex)。

例如:期望寿命(expectancylife)——反映人群健康状况(healthstatus)的指标

婴儿死亡率(infantdeathrate)——反映卫生服务(healthservices)质量的指标第一节统计学的几个基本概念

Somebasicstatisticalconcepts

一、个体(individual)与变量(variable)总体(population)与样本(sample)个体(individual)与变量(variable)Individual:apersonVariable:gender,age,weight,high,educationyears,bloodpressure个体(观察单位等):统计研究中的基本单位——据研究目的而定变量(观察指标等):要研究的个体特征

例如:身高、体重、性别、血型、反应、疗效等变量值(variablevalues):变量的取值

例如:身高(variable):1.65米(variablevalues)体重52公斤性别女血型“O”型反应阴性疗效好转资料(data):由多个变量值构成

例如:血糖的样本资料同质(homogeneity)

:各个体之间的一些相同性质(使研究变量的已知影响因素齐同)

如:变量为身高,长沙市2006年7岁正常男童即为同质异质性(heterogeneity):各个体之间的一些性质有差异变异(variation)

:同质个体的变量值的差异

如:长沙市2006年7岁正常男童的身高值各不相同

特点:生物个体变异较大(原因:难于掌握的因素造成。如:影响身高的有遗传、营养等因素)定义:根据研究目的确定的同质个体(变量值)的全体。例如:长沙市2006年7岁正常男童(身高值)的全体有限总体(finitepopulation):明确规定了空间、时间、人群范围内有限个观察单位的总体。无限总体(infinitepopulation):没有时间和空间范围的限制,其观察单位的全体数只是理论上存在,因而可视为“无限”的总体。总体(population)总体与样本样本总体sampling定义:从总体中随机抽得的部分观察单位,其实测值的集合

例如:长沙市2006年7岁正常男童中随机抽取200名,其身高值构成一个样本样本(sample)抽样研究(samplingstudy)样本信息(样本统计指标、统计量(statistic),均数,标准差等)总体特征(总体统计指标、参数(parameter),如均数,标准差等)推断注意:获取样本信息是手段,推断(inference)总体特征是目的。(inference)二、变量与资料(variableanddata)变量分类是资料分类的基础

计量资料:(measurementdata)又称定量资料或数值变量资料。为测定每个观察单位某项指标的大小而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。

例如:身高资料、体重资料

计数资料(enumerationdata)又称定性资料或无序分类变量资料。为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。其变量值是定性的,表现为互不相容的属性或类别。

二分类(binaryvariable):如性别、生死、疾病有无;多分类(multiplyvariable):如A、B、O、AB血型。等级资料(rankeddata)又称半定量资料或有序分类变量资料。为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。例如:观察用某药治疗某病患者的疗效,以每名患者为观察单位,结果可分为治愈、显效、好转、无效四级。统计分析方法的选用,是与资料类型密切联系的。

住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesQuantitativedata计量资料Qualitativedata计数资料MEDICALSTATISTICSTYPESOFDATAQualitativedatanominaldata:female/maleorderedcategoricalorrankeddataQuantitativeornumericaldatanumericaldiscretenumericalcontinuous

资料分类可互相转换定量

半定量(多分类)二分类三类资料间关系

例:一组20

40岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数

<8低血压8

正常血压12

轻度高血压15

中度高血压17

重度高血压计量资料等级资料计数资料

例如:测得5人的WBC(个/m3)数如下:

300060005000800012000数值变量过低正常正常正常异常分类变量

若按正常3人,异常2人分组→二分类变量若按过低1人,正常3人,过高1人分组→等级资料正确选择统计分析方法不同类型的资料采用不同的统计分析方法计量资料的统计分析方法:t检验、u检验、方差分析、相关与回归分析

计数(人时、纯计数)资料的统计分析方法:

χ2检验、秩和检验、二项分布和Poission分布、相关与回归分析

等级资料的统计分析方法:秩和检验

多元统计分析方法医学多元分析数学模型Ⅰ.分析事物间相依关系Ⅱ.对资料进行概括综合压缩紧凑;通过降维技术以减少变量数目Ⅲ.研究事物分类1.多元线性回归2.多元线性相关3.逐步回归4.典型相关分析5.岭回归分析6.logistic回归7.COX回归8.对数线性模型9.判别分析.主成分分析.因子分析.典型相关分析.判别分析,逐步判别技术.聚类分析Ⅳ.其他1.时间序列分析(有八种)2.随机过程3.MC-MC法MarckowMonte-carlo4.趋势面分析定义:实测值与真值之差。1、随机误差(randomerror):不恒定的、随机变化的误差,由多种尚无法控制的因素引起。无方向性。主要指重复测量产生的测量误差(measurementerror)和抽样过程产生的抽样误差(samplingerror)

通常,测量误差远小于抽样误差,因此统计学主要考虑抽样误差。三、误差(error)非随机误差又可分为系统误差(systematicerror)和非系统误差(non-systematicerror)两类:2、系统误差:实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可能掌握的,大小变化有方向性。3、非系统误差(过失误差):研究者偶然失误而造成的误差。四、频率与概率

(frequencyandprobability)

频率,假设在相同条件下,独立地重复做n次试验,A在n次试验中出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率。当试验重复很多次时,有

四、频率(frequency)与概率(probability)

概率:概率是度量随机事件发生可能性大小的一个数值。

设在相同条件下,独立地重复n次试验,随机事件A出现

次,则称为随机事件A出现的频率。当n逐渐增大时,频率

趋向于一个常数,则称该常数为随机事件A的概率,可记为,简记为。取值:频率是就样本而言的,而概率从总体的意义上说的,m/n是概率的估计值。试验次数越多,估计越可靠。频率与概率间的关系:样本频率总是围绕概率上下波动样本含量n越大,波动幅度越小,频率越接近概率。小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为很可能不发生。

第二节

医学统计工作的基本步骤Themainstepsorcontentsofmedicalstatistics主要指统计设计(statisticaldesign),是影响研究能否成功的最关键环节,是提高观察或实验质量的重要保证。

分类:实验研究设计,观察性研究设计

内容:包括对资料搜集、整理和分析全过程的设想与安排。一、设计(design)

MEDICALSTATISTICSAwelldesignedstudy,poorlyanalyzed,canberescuedbyareanalysisbutpoorlydesignedstudyisbeyondtheredemptionofevensophisticatedstatistics.Afarmoreimportanttaskformedicalstatisticianistoensurethatresultsarecomparableandgeneralizable.■效应(experimentaleffect,outcome)实验设计的三个基本要素■研究对象(studysubject)■处理因素(treatment)3.对照(control)实验设计的三个基本原则1.随机化(randomizedsampling)2.重复(replication)目的:取得准确可靠的原始数据。

资料来源:①统计报表。

②经常性工作记录。

③专题调查或实验研究。

④统计年鉴和统计数据专辑。

要求:1、随机性

2、样本含量足够大二、搜集资料(collectionofdata)

三.整理资料(sortingdata)

是将原始数据净化,系统化和条理化,以便为下一步计算和分析打好基础的过程。包括:数据录入

数据核查

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论