版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2024/11/61授课内容及特点本课程主要介绍统计学的基本概念,并着重讲解统计学方法在医学科研中的应用。本课程的特点是通过书中的实例,分析讲解本课程的统计方法,并掌握统计软件SPSS基本操作过程,以及理解其分析结果。密码:123456789课件下载地址:“医学统计学”2024/11/622024/11/63授课目的最终能应用SPSS统计软件,将学过的各种统计分析方法结合具体实际问题或有关的数据指标进行分析,领会各种统计数量分析过程和应用中的意义,合理地解释各种分析结果。能看懂医学文献中常见的统计分析方法、结果及其意义。毕业论文及发表的文章无明显统计缺陷和错误2024/11/64据统计:我国的医学期刊大约有1000多种,其中绝大多数论文都要用到统计学知识,统计学知识应用得正确与否关系到论文的科学性与严谨性。60年代到80年代,国外医学杂志调查结果:有统计错误的论文20%~72%。1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。这一严峻的现象值得科研工作者重视。2024/11/65医学统计学的定义与内容统计方法的几个基本概念统计工作的基本步骤学习中应注意的问题第一章绪论2024/11/66第一节医学统计学的
定义与内容1.统计的基本含义
统计是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。2.统计的基本特点:数量性3.统计的目的:探索客观事物的数量规律性,以便达到对客观事物的认识。
2024/11/67
统计学:是研究如何收集准确可靠的资料和选择正确方法进行整理分析的科学。
医学统计学:根据统计学的原理和方法,研究医学数据的收集、表达和分析的一门应用学科。2024/11/68Statistics:
“asciencedealingwiththecollection,analysis,interpretationandpresentationofmassesofnumericaldata”
----Webster国际大辞典统计学是收集、分析、解释与呈现数据资料的一门科学。收集数据:实验设计、调查设计分析数据:统计学描述、统计学推断解释数据:根据专业等解释统计结果(穿插各个章节)呈现结果:向杂志社、上级部门发表结果2024/11/610Statistics:Thescienceandartofdealingwithvariationindatathroughcollection,classificationandanalysisinsuchawayastoobtainreliableresults(JMLast).Thedisciplineconcernedwiththetreatmentofnumericaldataderivedfromgroupsofindividuals(P.Armitage).
2024/11/6111.采用统计学方法,发现不确定现象背后隐藏的规律。
变异(variation)是社会和生物医学中的普遍现象。变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。医学研究的对象是人或生物体,具有较大的生物变异性,并受许多社会心理因素的影响。借助统计分析,可透过偶然现象认识其内在的规律性。一个科学结论,除了理论机制的阐述外,还要有一定数量的重复观察结果和合理的对照等。
为什么要学习医学统计学?2024/11/612最大值=6.18,最小值=3.29,极差=2.89算术均数=4.72,标准差=0.57。2024/11/6132.
用统计学思维方式考虑有关医学研究中的问题
“阳性”结果是否是虚假联系?
某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效?
“阴性”结果是否是样本含量不足?
有人曾对发表在Lancet,NEnglJMed,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇(93%)可能是由于样本含量不足造成的假阴性。
2024/11/614乙药是否比甲药有效?2024/11/615要求设立具有可比性的对照组某文献报道:用某种中草药治疗玫瑰糠疹,有效率为78%,平均疗程为3周左右。问此药治疗玫瑰糠疹的确有效吗?玫瑰糠疹具有自然治愈的情况,一般不服药,多喝水,到3周左右有些患者也会自愈。2024/11/616某处报导:“据统计,城市人的寿命要比农村少5年。湖北地区曾调查了90岁以上的长寿者125人,其中住在城市的占24%,农村占76%。可能城市的紧张生活及噪音对寿命均有影响”。你认为这个结论对不对,并说明理由。用某药治疗某病,治疗10例,其中9人有效,能说90%有效吗?有关统计的其他问题2024/11/6173.
保证你的研究论文能通过统计学审查
据国外60~80年代对不同医学杂志发表论文的调查结果显示,有统计错误的论文所占比例高达72%,最低也有20%。国内1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。2024/11/6
JAMA,新英格兰医学杂志(NEJM)、英国医学杂志、中华医学会杂志对来稿都有统计学要求或统计学指导。国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包含了统计学要求。
UniformRequirementsforManuscriptsSubmittedtoBiomedicalJournals
http://2024/11/6194.
获得循证医学证据的主要手段“良好愿望的医学”(well-meaningmedicine)转入“以证据为基础的医学”(evidence-basedmedicine,EBM)需要有统计学方法的支持。
全世界的医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。2024/11/620学习医学统计学的用途累计和表达经验:将积累的经验从感性认识上升到理性认识(如阑尾根部化脓及穿孔手术50例分析)。完成科研工作:如何分组?分组是否有可比性?样本含量是否足够?实验结果的误差有多大?研究结果是否可推广?研究报告如何撰写?阅读医学书刊:继续教育的需要;识别他人研究结果的可靠性。2024/11/621第二节医学统计的基本概念同质与变异总体与样本抽样误差及种类变量及其分类概率与频率2024/11/6222024/11/6232024/11/624一、同质和变异
(homogeneity,variation)观察单位:observationunit。由根据研究目的而确定,是统计研究中最基本的单位。同质:是指被研究指标的可控制影响因素相同或基本相同。
例:研究儿童的身高:易控制的因素(性别、年龄、地区,等)、不易控制的因素(遗传、营养,等)变异:同质的基础上的个体差异。如某年某地7岁男孩的身高。2024/11/625医学研究中同质的重要性组间具有可比性是指对比组之间除对比因素外,其他特征基本相同,即所谓组间均衡。组间均衡,则差异有统计学意义的结果可解释为对比因素的作用;否则,差异有统计学意义的结果不能解释为对比因素的作用,因为其他因素也可能造成组间差异。2024/11/626二、总体与样本(populationandsample)总体:根据研究目的确定全部同质个体,这些个体的某项变量值。研究1999年某农村地区14岁女孩身高研究糖尿病人的血压测量值总体有三大特点:
①同质性②大量性③差异性
2024/11/627样本sample样本:根据随机化原则从总体中抽出有代表性的一部分观察单位。样本含量:样本包含的观察单位数统计推断:用样本推断总体的特征2024/11/628有限总体finitepopulation
在确定的时间、空间范围内有限个观察单位的总体。如:调查某地1999年正常成年男子的红细胞数。观察对象:该地1999年的正常成年男子;观察单位:每个人;同质:同一地区、同一年份、同一性别、同为正常人、同为男性。观察值(变量值):每个人测得的红细胞数;总体:该地1999年的正常成年男子的红细胞数。又如:暨南大学大学生近视发病率2024/11/629无限总体infinitepopulation无时间和空间范围限制的总体,此总体是抽象的,观察单位数是无限的。
如:研究用某药治疗缺铁性贫血的疗效。同质:贫血患者、同时使用某药治疗;总体:使用该药治疗的所有贫血患者的治疗效果,无时间和空间的限制。2024/11/630Targetpopulationandaccessiblepopulation:Targetpopulation:研究者最想推论的真正的群体(称为目标总体),常常是不可得,是研究者理想上的选择。Accessiblepopulation:研究者真正能将研究结果推论到的群体(称为可及总体),是研究者实际拥有的选择。targetpopulation:wellsuitedtotheresearchquestionaccessiblepopulation:representativeofthetargetpopulationandeasytostudy2024/11/631Targetpopulationandaccessiblepopulation:例如:计算机辅助教学对于广州地区小学一、二年级(targetpopulation)学生阅读成就的影响。而暨南大学附属小学的一二年级学生是accessiblepopulation;一二年级中10%的学生是样本。2024/11/632总体与样本的关系2024/11/633推论与外部效度推论(generalize):将某个研究的发现应用在该研究的人物或情境之外。外部效度(externalvalidity):研究结果能推论到怎样的程度,就是该研究的外部效度。总体可推论性(populationgeneralizability):样本可以代表总体的程度,若研究结果只适用该研究所使用的样本(如样本太小),则研究发现的用处受到限制。生态可推论性(ecologicalgeneralizability):研究结果可以被延用到其它的情境或状况的程度。2024/11/634抽样:从总体中抽取样本的过程。代表性:样本中的每一个个体必须符合总体的规定。如研究1999年某农村地区14岁女孩身高。随机性:保证总体中的每个个体有相同的机会被抽作样本。方法有:抽签、机械抽样、分层抽样、随机数字表。可靠性:实验的结果要具有可重复性。由于个体之间存在差异,只有观察一定数量的个体才能揭示客观规律性。2024/11/635非随机抽样法(非概率抽样)方便抽样:依赖于可以纳入样本的可获得性的研究对象。速度快、简单。通常不能很好的代表总体目标人群。定额抽样:对人群要素的特征做了规定,并从满足这些特征的人群中抽取合适比例作为样本。花费少,简单,方便。缺乏代表行。目的抽样:基于对总体的了解以及研究的特殊目的,研究者根据对人群要素的代表性或者主要特征的判断和研究目的选择样本。滚雪球抽样:依赖于一些能将其他相关的研究对象纳入研究的信息。例如,感染HIV/AIDS的人或者吸毒的人。三、参数与统计量
parameterandstatistic参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数
总体样本抽取部分观察单位
统计量
参数
推断inference统计量:样本的统计指标,如样本均数、标准差,采用英文字母分别记为。参数附近波动的随机变量。2024/11/637四、误差:观察值与真实值之差随机误差:过失误差(非系统误差)随机测量误差:抽样误差系统误差非随机误差:系统误差
systematicerror在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为偏倚(bias)。特点:观察值有系统性、方向性、周期性的偏离真值。可以通过严格的实验设计和技术措施消除。2024/11/639过失误差:grosserror由于观察过程中不仔细造成的错误判断或记录。应认真检查核对,否则将会影响研究结果的准确性。2024/11/640随机测量误差:randommeasurementerror各种偶然因素(电压、环境温度等)的影响造成同一对象多次测定的结果不完全一样。或同一样品不同观察者之间的差异。该误差不可避免,但要控制在容许范围内。提高操作者熟练程度可以减少这种误差2024/11/641抽样误差:randomsamplingerror在排除了系统误差,控制了随机测量误差后,由于抽样过程造成的样本指标与总体指标之间的差异。该误差不可避免,但有一定的分布规律,可估计。原因:个体差异的存在。2024/11/642准确度与可靠度准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(常用指标:如灵敏度、特异度)。可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响(常用指标:一致百分率、Kappa值)。2024/11/6432024/11/644五、概率与频率随机现象与随机事件随机现象:在相同的条件下,重复进行试验,每次的结果未必相同,且将来的结果事前不能完全肯定。随机事件:随机现象发生的结果。随机事件的特征:①随机性;②规律性:每次发生的可能性的大小是确定的。产生随机现象的原因:随机误差所致(包括个体差异和偶然测量误差)2024/11/645概率probability:是描述随机事件(可能发生也可能不发生的事件)发生可能大小的量。用大写的P表示;取值[0,1]。
确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。必然事件P=1不可能事件P=0随机事件0<P<1
P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。频率与概率间的关系:样本频率总是围绕概率上下波动样本含量n越大,波动幅度越小,频率越接近概率。频率frequency2024/11/648频率与概率的关系:抛掷硬币的历史试验记录当样本含量较大时,可将频率作为概率的估计值2024/11/649第三节统计资料的类型统计资料的类型分为三种1、数值变量资料2、分类变量资料二项分类多项分类3、等级资料(一)数据类型1.计量资料2.计数资料3.等级资料
1.计量资料用仪器、工具等测量(measure)方法获得的数据,即为计量资料measurmentdata。也叫定量数据Quantitativedata特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)2.计数资料
按某种属性分类,然后清点每类的数据,称计数资料(countdata)或enumerationdata。也叫定性数据Qualitativedata
特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女)3.等级资料Rankdata半定性或半定量的观察结果。有大小顺序,所以也叫有序分类资料(ordinalcategorydata)。
①癌症分期:早、中、晚。
②药物疗效:治愈、好转、无效、死亡。
③尿蛋白:、
、
、++、+++及以上观察单位observations个体individuals变量variablesQuantitativedata计量资料Qualitativedata计数资料Units;elements2024/11/655(二)变量与随机变量
Variableandrandomvariable变量——可以测量的任何特征或属性
Anycharacteristicorattributethatcanbemeasured。(不同个体结果可能不同)随机变量——在概率论中称变量为随机变量2024/11/656
随机变量的分类连续性变量(continuousvariable)相当于计量资料离散型变量(discretevariable)相当于计数资料有序变量(ordinalvariable)相当于等级资料
根据观察数据之间有无缝隙(gap),常将数据分类为离散型(discrete)变量(有缝隙)与连续型(continuous)变量(无缝隙)两大类。虽然如脉搏、白细胞计数等测量值只能是正整数,但为研究方便习惯上也视为连续变量。2024/11/6572024/11/658各类变量间的互相转化有序分类变量转化为数值变量:如:治愈3、显效2、好转l、无效0数值变量也可转化为分类变量:如:按血压测量值大小将血压分为:低血压、正常、高血压或正常、异常2024/11/659第四节统计工作的基本步骤设计搜集资料整理资料分析资料2024/11/660一、设计(design)医学科研设计按是否对研究对象施加干预分为:实验设计和调查设计。所谓设计就是关于研究计划方案的制定,任一项研究,除专业设计之外,还应包括统计设计,如果设计出现错误,那么,不论用什么统计分析方法进行数据处理都无法得到正确的结论。2024/11/661实验设计必须遵循的基本原则:随机化原则(randomization)对照原则(control)重复原则(replication)2024/11/662医学论文统计设计方面存在的常见问题组间的可比性问题对照的设立问题
只有设立除处理因素之外其他实验条件相同(或基本相同)的对照组,才能说明处理组的干预措施有无作用。样本含量的问题:样本代表性问题:对象的选择与标准?医学伦理学问题:世界医学大会赫尔辛基宣言2024/11/663二、搜集资料(datacollection)(一)统计数据来源渠道1.统计数据的直接来源
(1)来源于为管理和研究需要而专门组织调查(2)来源于科学实验方法2.统计数据的间接来源
(1)内部资料的收集业务资料:统计资料:疾病分类报表财务资料:内部积累的其他资料:如病历,X光片
(2)外部资料的收集:年鉴,政府报告等2024/11/664SourceofdataPrimarycollectoriginaldatabytheresearcherhimorherselfSecondaryuseexistingdataTertiaryuseexistingstudies2024/11/665(二)统计数据的收集组织形式1.统计报表制度2.普查3.典型调查4.重点调查5.抽样调查2024/11/666(三)数据资料的收集方法1.直接观察法2.报告法3.采访法4.邮寄法5.电话访问6.网上调查:电子邮件法视讯会议法站点法7.计算机辅助调查(ComputerAssistedInterviewing):计算机辅助的电话调查(CATI)计算机辅助的个人访问调查(CAPI)计算机辅助的填报调查(CASI)2024/11/667三、整理资料(datasorting)
使原始数据条理化,便于进一步的计算和分析。对资料进行检查、核对设计分组:质量分组、数量分组按分组要求设计整理表。2024/11/668四、分析资料(dataanalysis)
按设计的要求,根据研究目的和资料的类型,对整理出的基础数据作进一步的计算分析和统计处理,并用适当的统计图表表达出来,最后结合专业做出结论。2024/11/669国际通用统计软件包SAS(StatisticalAnalysisSystem)SPSS(StatisticalPackagefortheSocialScience)BMDP(BiomedicalComputerPrograms)GLIM(GeneralisedLinearInteractiveModelling)Genstat(GeneralStatisticalProgram)EpilogMinitab2024/11/670学习中应注意的问题应多联系实际,结合专业,分析评价实际工作、医学文献和医学科研中的统计问题,才能学好医学统计学。要能够应用恰当的统计方法处理各种数据,对统计公式主要了解其意义、用途和应用条件,不必深究其数学推导。2024/11/671不能仅凭表面数字上的差异就下结论掌握医学统计学的基本知识、基本技能、基本概念和基本方法。建立逻辑思维方法和提高分析问题的能力。懂得假设检验的逻辑推理,理解统计结论的概率性。2024/11/672反对伪造和篡改统计数字掌握调查设计和实验设计的原则,培养收集、整理、分析统计资料的系统工作能力。重视原始资料的完整性和准确性,对数据处理持严肃、认真、实事求是的科学态度,反对伪造和篡改统计数字。伪造统计数据违反科学道德1976年NewScience杂志关于科研舞弊行为的调查(1)74%的调查表反映有不正当修改数据的情况(2)17%拼凑实验结果(3)7%凭空捏造数据(4)2%故意曲解结果2024/11/674统计学发展简史古典统计学、近代统计学、现代统计学统计学发展过程中出现过几次重大的争论:
“政治算术”与“国势学”的争论,明确了统计学的学科性质;“描述统计学”与“推断统计学”的争论,构筑了统计学的完整体系;“经典统计学”与“贝叶斯统计学”的争论,带来了统计哲学观的新变化;信念统计学与经典统计学、贝叶斯统计学的争论,使统计推断科学化问题的研究日趋深入。正是通过这些争论完善了现代统计学的思想和方法体系。2024/11/675“政治算术”与“国势学”之争17世纪中叶,以英国的配第(EPetty)和格朗特(JGrant)为代表创立的“政治算术”,标志着统计学的诞生。首次出现了有意识地用大量的数字资料说话,注重从数量角度探讨社会经济现象规律的活动。与“政治算术”产生的时期差不多,在德国也出现了一门“统计学”———“国势学”。“国势学”主要研究“国家的有关显著事项”,其主要特征是对问题的研究和阐述,基本上采用文字记述和逻辑比较,那么它之所以也被认为是统计学,在很大程度上是因为“国势学”发展到顶峰时期的代表性人物阿肯瓦尔(GAchenwall)给它起了一个新名称“STATISTIK”2024/11/676到1850年,德国人克尼斯(GAKnies)根据当时统计学发展的实践,概括大多数人的意见,认为“国势学”尽管有统计学之名但没有统计学之实,应该仍叫“国势学”,而“政治算术”虽然没有统计学之名但有统计学之实,所以“政治算术”才称得上是统计学的真正起源。统计史上,一般把克尼斯“独立科学之统计学”一文的发表,作为“政治算术”和“国势学”争论的结束。2024/11/677“描述统计学”与“推断统计学”之争从19
世纪中后期到20
世纪前半叶,是统计学发展过程中一个非常重要的时期。一方面是兴起于生物遗传学、农业田间试验等领域的“生物统计学”的发展,另一方面是建立在“小样本”观察基础上的统计推断方法的发展。2024/11/678生物统计学的创立是英国人高尔顿(FGalton)最早创立的,为了研究人的智力遗传和进化规律,高尔顿在伦敦开设了“人体测量研究所”,广泛招募志愿人员,采集到大量的有关人的自然属性的资料。先后出版了两本著作,一本是《关于人的能力及其发展问题》,另一本是《遗传的自然规律》。在这两本书及相关的论文中,高尔顿提出了诸如“相关”、“回归”、“中位数”、“四分位数”、“四分位数差”、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度物流园区运营采购合同范本3篇
- 昆明2025年云南昆明市盘龙区妇幼保健院招聘编外口腔医师笔试历年参考题库附带答案详解
- 2025年度个人股权估值及评估服务合同(投资决策)4篇
- 2025年外研版2024八年级地理上册阶段测试试卷
- 2025年粤教沪科版八年级历史下册月考试卷含答案
- 2025年华师大新版九年级历史下册月考试卷
- 2025年外研版2024九年级历史下册阶段测试试卷含答案
- 2025年湘教新版选修化学上册月考试卷
- 2025年鲁教版九年级地理下册阶段测试试卷
- 2025年粤人版高一地理下册阶段测试试卷含答案
- 三年级下册口算天天100题
- 国家中英文名称及代码缩写(三位)
- 人员密集场所消防安全培训
- 液晶高压芯片去保护方法
- 使用AVF血液透析患者的护理查房
- 拜太岁科仪文档
- 2021年高考山东卷化学试题(含答案解析)
- 2020新译林版高中英语选择性必修一重点短语归纳小结
- GB/T 19668.7-2022信息技术服务监理第7部分:监理工作量度量要求
- 品管圈活动提高氧气雾化吸入注意事项知晓率
- 连续铸轧机的工作原理及各主要参数
评论
0/150
提交评论