中医药统计学中医药统计学_第1页
中医药统计学中医药统计学_第2页
中医药统计学中医药统计学_第3页
中医药统计学中医药统计学_第4页
中医药统计学中医药统计学_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中医药统计学

2020/12/191引子:概率应用示例

随机50个人聚在一起,其中有两个人生日是同一天的概率在97%以上,几乎可以说50个人中一定有两个人是同一天的生日。神奇吧!计算如下:2020/12/192统计应用示例

李颖同学的《中医基础理论》与《伤寒论》成绩分别为87分与80分,李颖同学所在班的这两门课程的平均成绩分别为80分和65分,标准差分别为7分和10分。那么,在班里,李颖同学擅长《中医基础理论》还是《伤寒论》的学习?标准正态分布下:2020/12/193

李颖同学在班里《中医基础理论》成绩排在前16%,《伤寒论》成绩排在前7%,可见李颖同学比较擅长《伤寒论》的学习。耐人寻味吧!2020/12/194医药统计应用示例

小儿麻痹症在没有研制出疫苗之前是一种瘫痪或死亡率很高的疾病。在疫苗人体试验的过程中,科学家随机抽取了400000名儿童并随机分成两组,试验组注射疫苗,对照组注射安慰剂。结果发现试验组和对照组分别有56、138名儿童患上该病。56与138的差别是由随机抽样造成的,还是由疫苗的免疫作用所致的?统计推断分析结论是二者的差别超出了随机性本身所能解释的范围,疫苗有效。从此以后,这种疫苗普遍接种,在许多国家根除了小儿麻痹症。这是统计学为医学研究提供有力支持的代表实例之一。2020/12/195脊髓灰质炎病毒是引起脊髓灰质炎的病毒。该疾病传播广泛,是一种急性传染病。病毒常侵犯中枢神经系统,损害脊髓前角运动神经细胞,导致肢体松弛性麻痹,多见于儿童,故又名小儿麻痹症。2020/12/196

统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。(至理名言)—H.G.Wells

赫伯特·乔治·威尔斯(HerbertGeorgeWells1866-1946),英国著名小说家,尤以科幻小说创作闻名于世。1895年出版《时间机器》一举成名,随后又发表了《莫洛博士岛》、《隐身人》、《星际战争》等多部科幻小说。

谨与同学们共享共勉!

2020/12/197第一节概述中医药统计学的概念

统计学的发展简史

统计学的研究对象

中医药统计学的主要内容

统计学的特点和基本思想

2020/12/198三类现象2020/12/199数学研究方法2020/12/19102020/12/1911统计学(statistics)

是研究随机现象数量规律性的应用数学,是从随机现象数据中提取信息、知识的一门科学与艺术,是一门方法性学科。它分为理论统计学和应用统计学两大类。2020/12/1912理论统计学(theoretical

statistics)

即数理统计学(mathematicalstatistics),是以概率论为基础,从纯理论的角度,对统计方法加以推导论证,中心的内容是统计推断问题,实质是以归纳方法研究随机现象的一般规律。2020/12/1913应用统计学(applied

statistics)

是数理统计学的原理方法在不同学科领域的具体应用。数理统计学在生物学中的应用形成了生物统计学(biostatistics);在医学中的应用形成医学统计学(medicalstatistics)、卫生统计学(healthstatistics)和中医药统计学(statisticsfortraditionalchinesemedicine)等。2020/12/1914中医药统计学(statisticsfortraditionalchinesemedicine)是研究中医药领域中随机现象客观规律的一门方法性学科,它运用数理统计学的基本原理与方法,结合医药实际,阐述中医药领域研究设计、收集资料、整理资料、分析资料、结果报告与结论表达。它属于应用统计学,是医药科学研究的重要工具与手段。2020/12/19152020/12/1916统计学的发展简史

人类实践是统计学产生的源泉,人类认识是统计学发展的动力。远古时代,人类利用手指、石子、贝壳、小木棍以及绳索等工具进行的计数活动就蕴藏着统计萌芽,但是,人类由统计实践上升到统计学,却只有300多年的历史。2020/12/191717世纪中叶至18世纪初期为古典统计学的发展时期。统计学一词源于state,统计学意指国家国情的叙述,其研究方法主要采用文字记述和形式逻辑比较法,用于人口、国力等情况的统计和分析。2020/12/191818世纪后叶至20世纪初期为近代统计学的发展时期。误差理论和大数法则得到了应用和发展,其研究方法主要是建立在大样本上的大量观察法,重视运用统计指标和统计图表对数字资料进行统计描述。2020/12/191920世纪初期至今为现代统计学的发展时期。1908年,英国统计学家戈赛特(W.S.Gosset,1876-1937)在生物统计杂志“Biometrika”上以笔名student发表了t分布,开创了小样本的研究,从而使统计学由“描述统计”向“推断统计”发展,开创了现代统计学的新纪元。20世纪50年代,电子计算机技术的发展和应用,促进了统计方法的应用与发展。2020/12/1920当今,现代统计学的发展有如下几个明显趋势:随着数学的发展,统计学依赖和吸收的数学方法越来越多;统计方法与计算机技术相结合,已渗透到了所有学科部门,以统计学为基础的边缘学科不断形成;统计与实质性学科(如社会、经济、生物、医学等)、统计软件、现代信息相结合,所发挥的功效日益增强;统计学的作用与功能已从描述事物现状、反映事物规律,向抽样推断、预测未来变化方向发展,已成为具有方法论性质的综合性学科。2020/12/1921统计学的研究对象

统计学所研究的对象是具有变异的事物,其变异为同质基础上的变异。同质(homogeneity)指观察单位间被研究指标的影响因素相同。(可控因素)变异(variation)指在同质基础上各观察单位间某观察指标的差异。统计学是处理变异数据的科学,没有变异就无需统计学。2020/12/1922医药事物(现象)大多数都是具有变异的事物(现象),概率论称具有变异的事物(现象)为随机事件。中医药统计学可将医药随机事件通过一定数量的观察、对比、分析与推断,由偶然性(不确定性)现象的剖析,发现事物内在的必然性(确定性)规律。2020/12/1923中医药统计学的主要内容

中医药统计学以研究统计设计和统计方法为主要内容。研究统计设计:实验设计、临床试验设计以及调查设计等统计方法包括:统计描述、统计推断和关系分析等。2020/12/1924统计学的特点和基本思想

统计学认识事物现象有如下特点:数量性、群体性、具体性和概率性等。统计学的基本思想可归纳为:变异、随机抽样研究和概率的思想。统计结论中没有“证明”,只有在一定概率水平上的推论。2020/12/1925第二节统计学几个基本概念总体与样本

参数与统计量

误差

概率

2020/12/1926总体与样本

总体(population)是根据研究目的所确定的同质观察单位的全体。有限总体与无限总体样本(sample)是从总体中随机抽取的具有代表性的个体的集合。抽样研究(samplingstudy)是从总体中抽取样本,通过对样本的定量或定性测量结果来推断总体。2020/12/1927抽样研究的目的是用样本的特征正确可靠地推断总体的特征,所以样本必须对总体具有良好的代表性,抽样研究应注意如下几点:样本含量足够大

遵循随机抽样原则

样本的构成分布应基本上与总体构成分布保持一致

2020/12/1928参数与统计量

反映总体的统计指标称为参数(parameter),用希腊字母表示,如:反映样本的统计指标称为统计量(statistics),用拉丁字母或英文字母表示,如:2020/12/1929对某一事物而言,总体参数是该事物本身固有的、不变的,而统计量则随着实验不同而不同,但统计量的分布是有规律的,如小样本均数服从t分布,大样本均数服从正态分布等,这些规律是统计推断的理论基础。2020/12/1930误差

误差(error)泛指观测值与真实值之差以及样本统计量与总体参数之差。主要分为非随机误差与随机误差,非随机误差包括系统误差和过失误差,随机误差包括随机测量误差和随机抽样误差。2020/12/1931系统误差(systematicerror)是指在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。如仪器初始状态未调整到零、标准试剂未经校正所致误差。其特点为:观察值有系统性、方向性、周期性的偏离真值。这类错误可以通过严格的实验设计和技术措施消除。2020/12/1932过失误差(grosserror)由于观察过程中不仔细造成的错误判断或记录。应认真检查核对,否则将会影响研究结果的准确性。2020/12/1933随机测量误差(randommeasurementerror)是指各种偶然因素(如电压、环境温度等)的影响造成对同一对象多次测定的结果不完全一样,或同一样品不同观察者之间的差异。该误差不可避免,但要控制在容许范围内。提高操作者熟练程度可以减少这种误差。2020/12/1934随机抽样误差(randomsamplingerror)简称抽样误差(samplingerror),是由于随机抽样所引起的样本统计量与总体参数间的差异以及各样本统计量之间的差异。医学现象的变异总是客观存在的,因而在抽样研究中,抽样误差总是不可避免的,它虽无方向性,但有一定的分布规律,是可估计、可控制的,其大小可通过计算标准误间接地反映出来。样本对总体的代表性越好,抽样误差越小,反之,抽样误差越大。抽样误差揭示样本距总体的实际值可能有多远。2020/12/1935准确度、精确度、效度、信度2020/12/19362020/12/1937概率

频率(frequency)概率(probability)在《概率论》上称频率收敛于概率。

概率是反映随机事件发生的可能性大小的度量,用P表示,取值范围为[0,1]。随机事件的概率为0-1;必然事件的概率等于1;不可能事件的概率等于0。2020/12/1938统计学通常把等于小于0.05或0.01的随机事件称为小概率事件。(人为规定)一般认为小概率事件在一次试验中是不大可能发生的,这就是小概率原理,它是统计推断的重要原理。2020/12/1939第三节资料类型数值资料分类资料相互转换2020/12/1940资料(data)又称数据,由变量及其变量值组成。资料类型与变量类型相对应。变量(variable)是指观察单位的某种特征或属性,即研究的项目或指标。变量的测定结果称为变量值(valueofvariable)或观察值(observedvalue)。2020/12/1941数值资料(numericaldata)又称定量资料(quantitativedata)或计量资料(measurement

data),是由仪器、工具或其它定量方法测定的某项指标量的大小所得到的资料。例如:测量100名男大学生的身高所获得的资料就是数值资料。2020/12/1942分类资料(categoricaldata)又称定性资料(qualitativedata)或计数资料(countdata),是将事物按不同的属性归类,清点每一类的数量多少所得到的资料。根据类别数的不同,计数资料分为二分类资料(binarydata)、无序多分类资料(unorderedcategoricaldata)和有序多分类资料(orderedcategoricaldata),后者也称等级资料。例如将100名大学生按性别分组:男53例,女47例,此资料就是二分类资料;按ABO血型分组:A型39例、B型20例、O型17例、AB型24例,此资料就是无序多分类资料。2020/12/1943等级资料(ordinaldata)又称半定量资料(semi-quantitativedata)或有序多分类资料(orderedcategoricaldata),是将事物属性按组别之间有程度或等级差别进行归类所得到的资料。例如用某中药治疗某种疾病患者50名,按临床疗效等级分为痊愈26例、显效12例、好转7例、无效5例,此资料就为等级资料或有序多分类资料。2020/12/1944根据分析的需要,各种资料可进行相互转化。可将数值资料转化为分类资料或等级资料,反过来,分类资料和等级资料可通过数字编码或赋值,即数值化方式,转化为数值资料。需要注意的是:数值资料变为分类资料或等级资料时信息量将减少,因此在收集数据阶段应尽量收集数值数据,并用原始数值资料建立数据集。2020/12/1945连续型随机变量是指在某一区间可取任何值的变量,如身高(cm)、体重(kg)、血压(KPa)等;离散型随机变量是指在某一区间只可取有限的几个值的变量:如家庭人口数、脉搏(次/分)等。数值资料对应的数值变量可以是连续型随机变量,也可以是离散型随机变量;分类资料和等级资料对应的分类变量和等级变量只能是离散型随机变量。2020/12/1946无序多分类变量又称名义变量(nominalvariable),意指各种被命好的分类,在各种分类中没有隐含的顺序,这与等级变量不同。但是,等级变量中各分类之间的差异不能被认为是相等的。2020/12/1947第四节基本步骤研究设计收集资料整理资料分析资料结果报告与结论表达2020/12/1948第四节基本步骤

医药研究中的统计工作步骤包括:研究设计、收集资料、整理资料、分析资料、结果报告与结论表达等。这几个步骤是密切联系不可分割的,任何一个环节发生缺陷都会影响研究结果的质量和认证。2020/12/1949研究设计

研究设计(researchdesign)就是拟订一份合理的实验计划,将有关的研究方法与步骤的纲目拟订出来,用以保证取得一个较为客观的研究结果。根据对研究对象是否施加干预措施,可将研究分为观察研究和实验研究两大类。2020/12/1950专业设计(specializeddesign)是指用什么方式、方法验证假说或回答有关专业问题。目的在于保证成果的实用性、可行性和创新性。做好专业设计一般需要具有过硬的专业知识、较强的查阅文献能力和善于多学科交流与合作的能力。2020/12/1951统计设计(statisticaldesign)是指如何合理地安排实验内容,选择实验对象,计算样本含量,对实验结果进行有效的分析。目的在于保证结果的经济性、重复性、可靠性和科学性。实验统计设计,应遵循随机、对照、重复和均衡四个基本原则。临床试验研究还要遵从盲法的原则。2020/12/1952研究者一定要树立“设计优先”的思想,只有缜密完善的研究设计,才能获得真实可靠的研究结果。中医药统计学用于医药科学研究,应从研究设计阶段开始,而不是在需要数据处理时。实验完成后再找统计学家无异于请统计学家为实验进行“尸体解剖”,统计学家或许只能告诉你失败的原因。2020/12/1953收集资料

收集资料(datacollection)是指根据研究目的,按照设计要求去准确、及时和完整地收集原始资料。医药研究资料来源大致有:日常医疗工作记录和报告卡,统计报表,专题调查与实验或试验研究资料,公共或共享的其它资料。2020/12/1954收集资料的过程实际上是具体调查或实验实施的过程,要有科学的态度,实事求是的精神,如实收集资料,并应用通用或共享的数据库软件(如Excel,Access,SQL,Epidata等)将收集到的资料及时建立电子数据库。2020/12/1955整理资料

整理资料(sortingdata)是把收集到的原始资料,有目的、有计划地进行科学的加工(如分组或汇总),使其系统化、条理化,以便更好地揭示所研究事物的规律性,有利于统计分析。整理资料包括资料核查和设计分组与汇总等。首先检查原始记录,及时纠错补漏;其次是标记可疑值,必要时对可疑值重新观测。根据资料的性质或数量特征,对资料进行分组,需要时按不同组段对原始资料进行归纳计数。2020/12/1956分析资料

分析资料(analysisdata)就是对资料进行统计分析。主要包括统计描述(statisticaldescription)与统计推断(statisticalinference)。统计描述是指用适合资料性质的统计指标、统计图表等,对资料的数量特征及其分布规律进行表达,以反映变量值的水平、频率、联系强度。统计推断是通过抽样研究,根据样本资料所提供的信息,对未知总体做出具有一定概率性的估计和推断,它包括参数估计和假设检验两方面。2020/12/1957结果报告与结论表达

信息时代,医药科研设计、资料数据库的建立与管理、统计分析的大多数任务可以交给计算机完成,正确领悟统计思想以及统计软件所输出的结果,并在研究报告和论文中作出适当的解释与表达显得越来越重要。2020/12/1958统计学既是一门科学又是一门艺术,其艺术性是通过表达来体现的。医学研究性论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成,而每一部分或多或少都涉及统计表达,需要明确指出所使用的统计设计与分析方法,观察对象的纳入与剔除标准,是否随机抽样与随机分组,使用的何种统计软件及其版本,样本统计量、总体参数可信区间,检验统计量、值,并结合各学科专业知识对统计分析结果作出合理的解释,进而得出可信赖的专业结论。另外,可借助统计图表直观、形象表达统计结果。统计结果的规范化报告和结论的正确表达,能提高研究的认证度,也便于各层次的学术交流与研究。2020/12/1959第五节作用与学习方法中医药统计学的作用学习方法2020/12/1960中医药统计学的作用医学统计学是医学科学研究的重要工具与手段,为医学科学研究提供统计思维、统计设计和统计分析方法。其思维和方法已渗透到医药研究和管理决策的方方面面。2020/12/1961①中医学基础

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论