医学统计专业知识专家讲座_第1页
医学统计专业知识专家讲座_第2页
医学统计专业知识专家讲座_第3页
医学统计专业知识专家讲座_第4页
医学统计专业知识专家讲座_第5页
已阅读5页,还剩661页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学本科生用

医学统计学主讲程琮泰山医学院预防医学教研室zcheng@1第1章绪论医学统计专业知识专家讲座第1页Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege2第1章绪论绪论医学统计专业知识专家讲座第2页预防医学教授,硕士生导师。男,1959年6月出生。汉族,无党派。1982年12月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。1994年7月,上海医科大学公共卫生学院硕士毕业,获医学硕士学位。12月晋升教授。现任预防医学教研室副主任。主要从事《医学统计学》、《预防医学》,《医学人口统计学》等课程教学及科研工作,每年听课学生500-800人。自起连续六年,为硕士硕士开设《医学统计学》、《SPSS统计分析简明教程》、《卫生经济学》等课程,同时指导硕士科研设计、开题汇报及科研资料统计处理与分析。发表医学统计学及预防医学科研论文30多篇。代表作有“锌对乳癌细胞生长、增殖与基因表示影响”,,“行列相关测度”等。主编、副主编各类教材及专著8部,代表作有《医学统计学》、《SPSS统计分析简明教程》取得院级科研论文及科技进步奖8项,院第四届教学能手比赛二等奖一项,院教学评建先进工作者一项。获泰山医学院首届十大教学名师奖。程琮教授介绍3第1章绪论绪论医学统计专业知识专家讲座第3页医学统计学总目录第1章绪论第2章定量资料统计描述第3章总体均数区间预计和假设检验第4章方差分析第5章定性资料统计描述第6章总体率区间预计和假设检验第7章二项分布与泊松分布第8章秩和检验第9章直线相关与回归第10章试验设计第11章调查设计第12章统计表与统计图4第1章绪论绪论医学统计专业知识专家讲座第4页第1章绪论目录第五节学习统计学应注意几个问题第二节统计工作基本步骤第三节统计资料类型第四节统计学中几个基本概念第一节医学统计学定义和内容5第1章绪论绪论医学统计专业知识专家讲座第5页第一章绪论

第一节医学统计学定义和内容医学统计学(medicalstatistics)---是以医学理论为指导,利用数理统计学原理和方法研究医学资料搜集、整理与分析,从而掌握事物内在客观规律一门学科。6第1章绪论绪论医学统计专业知识专家讲座第6页医学研究对象----主要是人以及与其健康相关各种影响原因。医学统计学主要内容:1.统计设计包含试验设计和调查设计,它能够合理地、科学地安排试验和调查工作,使之能较少地花费人力、物力和时间,取得较满意和可靠结果。2.资料统计描述和总体指标预计经过计算各种统计指标和统计图表来描述资料集中趋势、离散趋势和分布特征况(如正态分布或偏态分布);利用样本指标来预计总体指标大小。

7第1章绪论绪论医学统计专业知识专家讲座第7页3.假设检验是经过统计检验方法(如t检验、u检验、F检验、卡方检验、秩和检验等)来推断两组或多组统计指标差异是抽样误差造成还是有本质差异。4.相关与回归医学中存在许多相互联络、相互制约现象。如儿童身高与体重、胸围与肺活量、血糖与尿糖等,都需要利用相关与回归来分析。8第1章绪论绪论医学统计专业知识专家讲座第8页5.多原因分析如多元回归、判别分析、聚类分析、正交设计分析、主成份分析、因子分析、logistic回归、Cox百分比风险回归等,都是分析医学中多原因有效方法(本书不包括,请参考相关统计书籍)。这些方法计算复杂,大部分需借助计算机来完成。6.健康统计研究人群健康指标与统计方法,除了用上述一些方法外,他还有其特有方法,如寿命表、生存分析、死因分析、人口预测等方法9第1章绪论绪论医学统计专业知识专家讲座第9页医学统计工作可分为四个步骤:统计设计、搜集资料、整理资料和分析资料。这四个步骤亲密联络,缺一不可,任何一个步骤缺点和失误,都会影响统计结果正确性。第二节统计工作基本步骤10第1章绪论绪论医学统计专业知识专家讲座第10页设计(design)是统计工作第一步,也是关键一步,是对统计工作全过程构想和计划安排。统计设计---就是依据研究目确实定试验原因、受试对象和观察指标,并在现有客观条件下决定用什么方式和方法来获取原始资料,并对原始资料怎样进行整理,以及整理后资料应该计算什么统计指标和统计分析预期结果怎样等。一、统计设计11第1章绪论绪论医学统计专业知识专家讲座第11页搜集资料(collectionofdate)——是依据设计要求,获取准确可靠原始资料,是统计分析结果可靠主要确保。医学统计资料起源主要有以下三个方面:1.统计报表统计报表是医疗卫生机构依据国家要求汇报制度,定时逐层上报相关报表。如法定传染病报表、出生死亡报表、医院工作报表等,报表要完整、准确、及时。

二、搜集资料12第1章绪论绪论医学统计专业知识专家讲座第12页2.医疗卫生工作统计如病历、医学检验统计、卫生监测统计等。3.专题调查或试验研究它是依据研究目标选定专题调查或试验研究,搜集资料有明确目标与针对性。它是医学科研资料主要起源。13第1章绪论绪论医学统计专业知识专家讲座第13页整理资料(sortingdata)目标就是将搜集到原始资料进行重复查对和认真检验,纠正错误,分类汇总,使其系统化、条理化,便于深入计算和分析。整理资料过程以下:1.审核:认真检验查对,确保资料准确性和完整性。2.分组:归纳分组,分组方法有两种:①质量分组,即将观察单位按其类别或属性分组,如按性别、职业、阳性和阴性等分组。②数量分组,即将观察单位按其数值大小分组,如按年纪大小、药品剂量大小等分组。三、整理资料

14第1章绪论绪论医学统计专业知识专家讲座第14页3.汇总:分组后资料要按照设计要求进行汇总,整理成统计表。原始资料较少时用手工汇总,当原始资料较多时,可使用计算机汇总。四、分析资料

分析资料(analysisofdata)——是依据设计要求,对整理后数据进行统计学分析,结合专业知识,作出科学合理解释。15第1章绪论绪论医学统计专业知识专家讲座第15页1.统计描述(descriptivestatistics)将计算出统计指标与统计表、统计图相结合,全方面描述资料数量特征及分布规律。2.统计推断(inferentialstatistics)

使用样本信息推断总体特征。经过样本统计量进行总体参数预计和假设检验,以到达了解总体数量特征及其分布规律,才是最终研究目标。统计分析包含以下两大内容:16第1章绪论绪论医学统计专业知识专家讲座第16页医学统计资料按研究指标性质普通分为定量资料、定性资料和等级资料三大类。一、定量资料定量资料(quantitativedata)亦称计量资料(measurementdata),是用定量方法测定观察单位(个体)某项指标数值大小,所得资料称定量资料。如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa)等为数值变量,其组成资料为定量资料。第三节统计资料类型17第1章绪论绪论医学统计专业知识专家讲座第17页定性资料(qualitativedata)亦称计数资料(enumerationdata)或分类资料(categoricaldata),是将观察单位按某种属性或类别分组,清点各组观察单位数,所得资料称定性资料。定性资料观察指标为分类变量(categoricalvariable)。如人性别按男、女分组;化验结果按阳性、阴性分组;动物试验按生存、死亡分组;调查某人群血型按A、B、O、AB分组等,观察单位出现结果为分类变量,分类变量没有量差异,只有质不一样,其组成资料为定性资料。二、定性资料18第1章绪论绪论医学统计专业知识专家讲座第18页三、等级资料等级资料(rankeddata)亦称有序分类资料(ordinalcategoricaldata),是将观察单位按属性等级分组,清点各组观察单位数,所得资料为等级资料。如治疗结果分为治愈、显效、好转、无效四个等级。

19第1章绪论绪论医学统计专业知识专家讲座第19页依据需要,各类变量能够相互转化。若按贫血诊疗标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。有时亦可将定性资料或等级资料数量化,如将等级资料治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。如调查某人群尿糖情况,以人为观察单位,结果可分—、±、+、++、+++五个等级。20第1章绪论绪论医学统计专业知识专家讲座第20页同质(homogeneity)是指观察单位或研究个体间被研究指标主要影响原因相同或基本相同。如研究儿童生长发育,同性别、同年纪、同地域、同民族、健康儿童即为同质儿童。变异(variation)因为生物个体各种指标所受影响原因极为复杂,同质个体间各种指标存在差异,这种差异称为变异。如同质儿童身高、体重、血压、脉搏等指标会有一定差异。第四节统计学中几个基本概念

一、同质与变异21第1章绪论绪论医学统计专业知识专家讲座第21页二、总体与样本样本(sample):是从总体中随机抽取部分观察单位变量值集合。样本例数称为样本含量(samplesize)。注意:1。总体是相正确,总体大小是依据研究目标而确定。2。样本应有代表性,即应该随机抽样并有足够样本含量。

22第1章绪论绪论医学统计专业知识专家讲座第22页图示:总体与样本populationsample2sample1sample3sample4sample523第1章绪论绪论医学统计专业知识专家讲座第23页三、参数与统计量参数(parameter):由总体计算或得到统计指标称为参数。总体参数含有很主要参考价值。如总体均数μ,总体标准差σ等。统计量(statistic):由样本计算指标称为统计量。如样本均数,样本标准差s等。注意:普通不轻易得到参数,而轻易取得样本统计量。24第1章绪论绪论医学统计专业知识专家讲座第24页四、抽样误差抽样误差(sampleerror):因为随机抽样所引发样本统计量与总体参数之间差异以及样本统计量之间差异称为抽样误差。如样本均数与总体均数之间差异,样本率与总体率差异等。注意:抽样误差是不可防止。不论抽样抽得多么好,也会存在抽样误差。25第1章绪论绪论医学统计专业知识专家讲座第25页五、概率概率(probability):是描述随机事件发生可能性大小量值。用英文大写字母P来表示。概率取值范围在0~1之间。当P=0时,称为不可能事件;当P=1时,称为必定事件。小概率事件:统计学上普通把P≤0.05或P≤0.01事件称为小概率事件。小概率原理:小概率事件在一次试验中几乎不可能发生。利用该原理可对科研资料进行假设检验。26第1章绪论绪论医学统计专业知识专家讲座第26页第五节学习医学统计学应注意问题1.重点掌握医学统计学基本知识、基本技能、基本概念和基本方法,掌握使用范围和注意事项。2.要培养科学统计思维方法,提升分析问题、处理问题能力。3.掌握调查设计和试验设计标准,培养搜集、整理、分析统计资料系统工作能力。27第1章绪论绪论医学统计专业知识专家讲座第27页课后作业列举出计量资料、分类资料、等级资料各10个实例。列举出可能事件、必定事件、不可能事件及小概率事件各10个。认真复习本章已学过基本概念2-3遍。28第1章绪论绪论医学统计专业知识专家讲座第28页BestWishestoAllofYou!ThankYouforListening!THEEND29第1章绪论绪论医学统计专业知识专家讲座第29页医学本科生用主讲程琮泰山医学院预防医学教研室zcheng@医学统计学30第1章绪论医学统计专业知识专家讲座第30页Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege31第1章绪论医学统计专业知识专家讲座第31页第2章定量资料统计描述目录第二节集中趋势描述第三节离散趋势描述第四节正态分布第一节频数分布表32第1章绪论医学统计专业知识专家讲座第32页统计描述:是用统计图表、统计指标来描述资料分布规律及其数量特征。频数分布表(frequencydistributiontable):主要由组段和频数两部分组成表格。第一节频数分布表第二章定量资料统计描述33第1章绪论医学统计专业知识专家讲座第33页二、频数分布表编制

编制步骤:1.计算全距(range):一组变量值最大值和最小值之差称为全距(range),亦称极差,惯用R表示。2.确定组距(classinterval):组距用i表示;3.划分组段:每个组段起点称组下限,终点称组上限。普通分为8~15组。;4.统计频数:将全部变量值经过划记逐一归入对应组段;5.频率与累计频率:将各组频数除以n所得比值被称为频率。累计频率等于累计频数除以总例数。

34第1章绪论医学统计专业知识专家讲座第34页表2-2某年某市120名12岁健康男孩身高(cm)频数分布

身高组段(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)125~10.8310.83129~43.3354.17133~108.341512.50…………………………累计120100.0035第1章绪论医学统计专业知识专家讲座第35页36第1章绪论医学统计专业知识专家讲座第36页二、频数分布表用途1.揭示资料分布类型2.观察资料集中趋势和离散趋势3.便于发觉一些特大或特小可疑值4.便于深入计算统计指标和作统计处理37第1章绪论医学统计专业知识专家讲座第37页38第1章绪论医学统计专业知识专家讲座第38页第二节集中趋势描述集中趋势:代表一组同质变量值集中趋势或平均水平。惯用平均数有算术均数、几何均数和中位数。另外不惯用有:众数,调和平均数和调整均数等。39第1章绪论医学统计专业知识专家讲座第39页一、算术均数

算术均数(arithmeticmean):简称均数。适用条件:对称分布或近似对称分布资料。习惯上以希腊字母μ表示总体均数(populationmean),以英文字母表示样本均数(samplemean)40第1章绪论医学统计专业知识专家讲座第40页1.直接法:用于观察值个数不多时

计算方法41第1章绪论医学统计专业知识专家讲座第41页2.加权法(weightingmethod):用于变量值个数

较多时。注意:权数即频数f,为权重权衡之意。42第1章绪论医学统计专业知识专家讲座第42页

身高(1)组中值X(2)频数f(3)fX(4)=(2)(3)fX2(5)=(2)(4)125~127112716129129~131452468644133~135101350182250…………………………累计120171682460040表2-4120名12岁健康男孩身高(cm)均数和标准差加权法计算表

43第1章绪论医学统计专业知识专家讲座第43页44第1章绪论医学统计专业知识专家讲座第44页120名12岁健康男孩身高均数为143.07cm。

计算结果45第1章绪论医学统计专业知识专家讲座第45页几何均数(geometricmean,简记为G):表示其平均水平。适用条件:对于变量值呈倍数关系或呈对数正态分布(正偏态分布),如抗体效价及抗体滴度,一些传染病潜伏期,细菌计数等。计算公式:有直接法和加权法。

二、几何均数46第1章绪论医学统计专业知识专家讲座第46页1.直接法:用于变量值个数n较少时47第1章绪论医学统计专业知识专家讲座第47页直接法计算实例48第1章绪论医学统计专业知识专家讲座第48页2.加权法:用于资料中相同变量值个数f(即频数)较多时。49第1章绪论医学统计专业知识专家讲座第49页

抗体滴度(1)频数f

(2)滴度倒数X

(3)lgX

(4)flgX(5)=(2)(4)1:4240.60201.20401:8680.90315.41861:167161.20418.4287…………………………累计50--89.1045表2-550名儿童麻疹疫苗接种后血凝抑制抗体滴度几何均数计算表50第1章绪论医学统计专业知识专家讲座第50页51第1章绪论医学统计专业知识专家讲座第51页50名儿童麻疹疫苗接种后平均血凝抑制抗体滴度为1:60.55。计算结果:将相关已知数据代入公式有52第1章绪论医学统计专业知识专家讲座第52页①变量值中不能有0;

②不能同时有正值和负值;

③若全是负值,计算时可先把负号去掉,得出结果后再加上负号。计算几何均数注意事项:53第1章绪论医学统计专业知识专家讲座第53页㈠中位数

定义:将一组变量值从小到大按次序排列,位次居中变量值称为中位数(median,简记为M)。适用条件:①变量值中出现个别特小或特大数值;②资料分布呈显著偏态,即大部分变量值偏向一侧;③变量值分布一端或两端无确定数值,只有小于或大于某个数值;④资料分布不清。

三、中位数及百分位数54第1章绪论医学统计专业知识专家讲座第54页定义:百分位数(percentile)是一个位置指标,以Px表示。百分位数是将频数等分为一百分位数。一组观察值从小到大按次序排列,理论上有x%变量值比Px小,有(100-x)%变量值比Px大。故P50分位数也就是中位数,即P50=M

。㈡百分位数55第1章绪论医学统计专业知识专家讲座第55页①描述一组资料在某百分位置上水平;②用于确定正常值范围;③计算四分位数间距。百分位数应用条件:56第1章绪论医学统计专业知识专家讲座第56页计算方法:有直接法和加权法1.直接法:用于例数较少时n为奇数时n为偶数时

57第1章绪论医学统计专业知识专家讲座第57页2.频数表法:用于例数较多时中位数百分位数58第1章绪论医学统计专业知识专家讲座第58页

潜伏期(小时)(1)频数f

(2)累计频数(3)累计频率(%)(4)0~171711.76~466343.412~3810169.9……………………累计145--表2-6145例食物中毒病人潜伏期分布表59第1章绪论医学统计专业知识专家讲座第59页60第1章绪论医学统计专业知识专家讲座第60页先找到包含Px最小累计频率;该累计频率同行左边组段值为L;L同行右边频数为fx(或fm);L前一行累计频数为∑fL;将上述已知条件代入公式计算Px或P50。计算中位数及百分位数步骤:61第1章绪论医学统计专业知识专家讲座第61页计算结果:62第1章绪论医学统计专业知识专家讲座第62页定义:用来说明变量值离散程度或变异程度。注意:仅用集中趋势尚不能完全反应一组数据特征。故应将集中趋势和离散趋势结合起来才能更加好地反应一组数据特征。惯用离散指标有:极差、四分位数间距、标准差、方差、变异系数。第三节离散趋势描述63第1章绪论医学统计专业知识专家讲座第63页甲组:184186188190192乙组:180184188192196两组球员平均身高都是188cm,但甲组球员身高比较集中,乙组球员身高比较分散。为了说明离散趋势,就要用离散指标。实例分析64第1章绪论医学统计专业知识专家讲座第64页㈠极差

极差(range,简记为R)亦称全距,即一组变量值中最大值与最小值之差。特点:计算简单,不稳定,不全方面,易改变;可用于各种分布资料。一、极差和四分位数间距65第1章绪论医学统计专业知识专家讲座第65页㈡四分位数间距公式:

Q=P75-P25

特点:比极差稳定,只反应中间两端值差异。计算不太方便。可用于各种分布资料。66第1章绪论医学统计专业知识专家讲座第66页二、方差和标准差㈠方差(variance)总体方差样本方差67第1章绪论医学统计专业知识专家讲座第67页自由度(degreeoffreedom)概念n-1是自由度,用希腊小写字母ν表示,读作[nju:]。定义:在N维或N度空间中能够自由选择维数或度数。例:A+B=C,共有n=3个元素,其中只能任选2个元素值,故自由度ν=n-1=3-1=2。68第1章绪论医学统计专业知识专家讲座第68页方差特点充分反应每个数据间离散情况,意义深刻;指标稳定,应用广泛,但计算较为复杂,不易了解;方差单位与原数据不一样,有时使用时不太方便;在方差分析中应用甚广而极为主要。69第1章绪论医学统计专业知识专家讲座第69页(二)标准差(standarddeviation)总体标准差样本标准差70第1章绪论医学统计专业知识专家讲座第70页切记:离均差平方和展开式:71第1章绪论医学统计专业知识专家讲座第71页标准差特点:意义同方差,是方差开平方;标准差单位与原数据相同,使用方便,意义深刻,应用广泛;故普通已作为医学生物学领域中反应变异标准,故称标准差。72第1章绪论医学统计专业知识专家讲座第72页标准差计算方法:可分为直接法和加权法。

1.直接法

2.加权法73第1章绪论医学统计专业知识专家讲座第73页直接法:标准差计算实例:例2.12例2.2中7名正常男子红细胞数(1012/L)以下:4.67,4.74,4.77,4.88,4.76,4.72,4.92,计算其标准差。∑x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46

∑x2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99

74第1章绪论医学统计专业知识专家讲座第74页计算结果:75第1章绪论医学统计专业知识专家讲座第75页例2.13对表2-4资料用加权法计算120名12岁健康男孩身高值标准差。加权法:标准差计算实例:在表2-4中已算得∑fx=17168,∑fx2=2460040,代入公式76第1章绪论医学统计专业知识专家讲座第76页变异系数(coefficientofvariation):简记为CV;特征:①变异系数为无量纲单位,能够比较不一样单位指标间变异度;②变异系数消除了均数大小对标准差影响,所以能够比较两均数相差较大时指标间变异度。三、变异系数77第1章绪论医学统计专业知识专家讲座第77页例2.14某地20岁男子160人,身高均数为166.06cm,标准差为4.95cm;体重均数为53.72kg,标准差为4.96kg。试比较身高与体重变异程度。变异系数计算实例78第1章绪论医学统计专业知识专家讲座第78页身高体重变异系数计算结果79第1章绪论医学统计专业知识专家讲座第79页第四节正态分布一、正态分布概念和特征正态分布(normaldistribution):也称高斯分布,是医学和生物学最常见连续性分布。如身高、体重、红细胞数、血红蛋白等。80第1章绪论医学统计专业知识专家讲座第80页图2-1120名12岁健康男孩身高频数分布81第1章绪论医学统计专业知识专家讲座第81页㈠正态分布函数和图形正态分布密度函数,即正态曲线方程为:82第1章绪论医学统计专业知识专家讲座第82页图2-2频数分布逐步靠近正态分布示意83第1章绪论医学统计专业知识专家讲座第83页为了应用方便,常按公式(2.19)作变量变换u值称为标准正态变量或标准正态离差,有参考书也将u值称为z值。84第1章绪论医学统计专业知识专家讲座第84页这么将正态分布变换为标准正态分布

(standardnormaldistribution)85第1章绪论医学统计专业知识专家讲座第85页图2-3正态分布面积与纵高

86第1章绪论医学统计专业知识专家讲座第86页㈡正态分布特征1.集中性正态曲线高峰位于正中央,即均数所在位置。对称性正态曲线以均数为中心,左右对称,3.正态分布有两个参数,即均数和标准差。4.正态曲线下面积有一定分布规律

87第1章绪论医学统计专业知识专家讲座第87页图2-4不一样标准差正态分布示意88第1章绪论医学统计专业知识专家讲座第88页二、正态曲线下面积分布规律89第1章绪论医学统计专业知识专家讲座第89页标准正态分布表(u值表)标准正态分布曲线下面积,由此表可查出曲线下某区间面积。查表时应注意:①表中曲线下面积为-∞到u下侧累计面积;②当已知μ、σ、和X时,先按公式(2.19)求得u值,再查表;当和未知时,而且样本例数在100例以上,惯用样本均数和标准差S分别代替μ和σ,按公式(2.19)求得u值;③曲线下横轴上总面积为100%或190第1章绪论医学统计专业知识专家讲座第90页

例2.16前例2.1中,某年某市120名12岁健康男孩身高,已知均数=143.07cm,标准差S=5.70cm,①预计该地12岁健康男孩身高在135cm以下者占该地12岁男孩总数百分数;②预计身高界于135cm~150cm范围内12岁男孩百分比;③分别求出均数±1S、均数±1.96S、均数±2.58S范围内12岁男孩人数占该120名男孩总数实际百分数,说明与理论百分数是否靠近。

91第1章绪论医学统计专业知识专家讲座第91页依据题意,按公式(2.19)作u变换92第1章绪论医学统计专业知识专家讲座第92页身高范围所占面积故预计该地12男孩身高在135cm以下者约占7.78%;身高界于135cm~150cm范围内者约占81.10%。

93第1章绪论医学统计专业知识专家讲座第93页三、正态分布应用㈠制订医学参考值范围参考值范围也称为正常值范围。医学上常把绝大数正常人某指标范围称为该指标正常值范围。这里“绝大多数”能够是90%、95%、99%,最惯用是95%。㈡质量控制

常以均数±2S作为上、下警戒值,以均数±3S作为上、下控制值。

㈢正态分布是很多统计方法理论基础94第1章绪论医学统计专业知识专家讲座第94页THEENDTHANKYOUFORLISTENING95第1章绪论医学统计专业知识专家讲座第95页本科生用

医学统计学教案主讲程琮泰山医学院预防医学教研室Zcheng@96第1章绪论医学统计专业知识专家讲座第96页Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege97第1章绪论医学统计专业知识专家讲座第97页第3章总体均数区间预计和假设检验目录第五节均数u检验第二节t分布第三节总体均数区间预计第四节假设检验意义和基本步骤第一节均数抽样误差与标准误第六节均数t检验第七节两个方差齐性检验和t’检验第八节Ⅰ型错误和Ⅱ型错误第九节应用假设检验应注意问题98第1章绪论医学统计专业知识专家讲座第98页图示:总体与样本Populationμsample2sample1sample3sample4sample599第1章绪论医学统计专业知识专家讲座第99页一、标准误意义及其计算统计推断(statisticalinference):依据样本信息来推论总体特征。均数抽样误差:由抽样引发样本均数与总体均数差异称为均数抽样误差。标准误(standarderror):反应均数抽样误差大小指标。

第一节均数抽样误差与标准误100第1章绪论医学统计专业知识专家讲座第100页σ已知:标准误计算公式σ未知:101第1章绪论医学统计专业知识专家讲座第101页

实例:如某年某市120名12岁健康男孩,已求得均数为143.07cm,标准差为5.70cm,按公式计算,则标准误为:102第1章绪论医学统计专业知识专家讲座第102页1.表示抽样误差大小;2.进行总体均数区间预计;

3.进行均数假设检验等。二、标准误应用103第1章绪论医学统计专业知识专家讲座第103页正态变量X采取u=(X-μ)/σ变换,则普通正态分布N(μ,σ)即变换为标准正态分布N(0,1)。又因从正态总体抽取样本均数服从正态分布N(μ,),一样可作正态变量u变换,即第二节t分布

一、t分布概念104第1章绪论医学统计专业知识专家讲座第104页实际工作中因为理论标准误往往未知,而用样本标准误作为预计值,此时就不是u变换而是t变换了,即下式:105第1章绪论医学统计专业知识专家讲座第105页t分布于19由英国统计学家W.S.Gosset以“Student”笔名发表,故又称Studentt分布(Students’t-distribution)。106第1章绪论医学统计专业知识专家讲座第106页二、t分布曲线特征t分布曲线是单峰分布,以0为中心,左右两侧对称,曲线中间比标准正态曲线(u分布曲线)低,两侧翘得比标准正态曲线略高。t分布曲线随自由度υ而改变,当样本含量越小(严格地说是自由度υ=n-1越小),t分布与u分布差异越大;当逐步增大时,t分布逐步迫近于u分布,当υ=∞时,t分布就完全成正态分布。t分布曲线是一簇曲线,而不是一条曲线。t分布下面积分布规律:查t分布表。107第1章绪论医学统计专业知识专家讲座第107页t分布示意图108第1章绪论医学统计专业知识专家讲座第108页t分布曲线下双侧或单侧尾部累计面积我们常把自由度为υt分布曲线下双侧尾部累计面积或单侧尾部面积为指定值α时,则横轴上对应t界值记为tα,υ。如当υ=20,α=0.05时,记为t0.05,20;当υ=22,α=0.01时,记为t0.01,22。对于tα,υ值,可依据α和υ值,查附表2,t界值表。109第1章绪论医学统计专业知识专家讲座第109页t分布是t检验理论基础。由公式(3.4)可知,│t│值与样本均数和总体均数之差成正比,与标准误成反比。在t分布中│t│值越大,其两侧或单侧以外面积所占曲线下总面积比重就越小,说明在抽样中取得此│t│值以及更大│t│值机会就越小,这种机会大小是用概率P来表示。│t│值越大,则P值越小;反之,│t│值越小,P值越大。依据上述意义,在同一自由度下,│t│≥tα,则P≤α;反之,│t│<tα,则P>α。110第1章绪论医学统计专业知识专家讲座第110页第三节总体均数区间预计参数预计:用样本指标(统计量)预计总体指标(参数)称为参数预计。预计总体均数方法有两种,即:点值预计(pointestimation)区间预计(intervalestimation)。111第1章绪论医学统计专业知识专家讲座第111页一、点值预计点值预计:是直接用样本均数作为总体均数预计值。此法计算简便,但因为存在抽样误差,经过样本均数不可能准确地预计出总体均数大小,也无法确知总体均数可靠程度。112第1章绪论医学统计专业知识专家讲座第112页二、区间预计区间预计是按一定概率(1-α)预计包含总体均数可能范围,该范围亦称总体均数可信区间(confidenceinterval,缩写为CI)。1-α称为可信度,常取1-α为0.95和0.99,即总体均数95%可信区间和99%可信区间。1-α(如95%)可信区间含义是:总体均数被包含在该区间内可能性是1-α,即(95%),没有被包含可能性为α,即(5%)。113第1章绪论医学统计专业知识专家讲座第113页总体均数可信区间计算1.未知σ且n较小(n<100)按t分布原理2.已知σ或n较大(n≥100)按u分布原理114第1章绪论医学统计专业知识专家讲座第114页95%可信区间为123.7±2.064×2.38,即(118.79,128.61)。故该地1岁婴儿血红蛋白平均值95%可信区间为118.7~128.61(g/L)。例3.1为了了解某地1岁婴儿血红蛋白浓度,从该地随机抽取了1岁婴儿25人,测得其血红蛋白平均数为123.7g/L,标准差为11.9g/L。试求该地1岁婴儿血红蛋白平均值95%可信区间。115第1章绪论医学统计专业知识专家讲座第115页例3.2上述某市120名12岁健康男孩身高均数为143.07cm,标准误为0.52cm,试预计该市12岁康男孩身高均数95%和99%可信区间。95%可信区间为143.07±1.96×0.52,即(142.05,144.09)。99%可信区间为143.07±2.58×0.52,即(141.73,144.41)。116第1章绪论医学统计专业知识专家讲座第116页注意点标准误愈小,预计总体均数可信区间范围也愈窄,说明样本均数与总体均数愈靠近,对总体均数预计也愈准确;反之,标准误愈大,预计总体均数可信区间范围也愈宽,说明样本均数距总体均数愈远,对总体均数预计也愈差。117第1章绪论医学统计专业知识专家讲座第117页表3-1标准差和标准误区分

118第1章绪论医学统计专业知识专家讲座第118页第四节假设检验意义和基本步骤假设检验(hypothesistest):亦称显著性检验(significancetest),是统计推断主要内容。它是指先对总体参数或分布作出某种假设,再用适当统计方法依据样本对总体提供信息,推断此假设应该拒绝或不拒绝。119第1章绪论医学统计专业知识专家讲座第119页例3.3依据大量调查,已知健康成年男子脉搏均数为72次/分钟,某医生在一山区随机测量了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次/分钟,能否定为该山区成年男子脉搏数与普通健康成年男子脉搏数不一样?

本例两个均数不等有两种可能性:①山区成年男子脉搏总体均数与普通健康成年男子脉搏总体均数是相同,差异仅仅因为抽样误差所致;②受山区一些原因影响,两个总体均数是不相同。怎样作出判断呢?按照逻辑推理,假如第一个可能性较大时,能够接收它,统计上称差异无统计学意义(nostatisticalsignificance);假如第一个可能性较小时,能够拒绝它而接收后者,统计上称差异有统计学意义(statisticalsignificance)。

120第1章绪论医学统计专业知识专家讲座第120页假设检验普通步骤以下:1.建立检验假设一个是无效假设(nullhypothesis),符号为H0;一个是备择假设(alternativehypothesis)符号为H1。H0:

H1:121第1章绪论医学统计专业知识专家讲座第121页表3-2样本均数所代表未知总体均数

与已知总体均数比较122第1章绪论医学统计专业知识专家讲座第122页表3-3两样本均数所代表未知总体均数比较123第1章绪论医学统计专业知识专家讲座第123页2.确定检验水准

检验水准(sizeofatest)亦称显著性水准(significancelevel),符号为α。它是判别差异有没有统计意义概率水准,其大小应依据分析要求确定。通常取α

α=0.05。3.选定检验方法和计算统计量依据研究设计类型和统计推断目标要求选取不一样检验方法。如完全随机设计中,两样本均数比较可用t检验,样本含量较大时(n>100),可用u检验。不一样统计检验方法,可得到不一样统计量,如t值和u值。124第1章绪论医学统计专业知识专家讲座第124页4.确定概率P值

P值是指在H0所要求总体中作随机抽样,取得等于及大于(或小于)现有统计量概率。│t│≥tα,υ,则P≤α;│t│<tα,υ,则P>α。

125第1章绪论医学统计专业知识专家讲座第125页5.作出推断结论

①当P≤α时,表示在H0成立条件下,出现等于及大于现有统计量概率是小概率,依据小概率事件原理,现有样本信息不支持H0,因而拒绝H0,结论为按所取检验水准拒绝H0,接收H1,即差异有统计学意义,如例3.3可认为两总体脉搏均数有差异;②当P>α时,表示在H0成立条件下,出现等于及大于现有统计量概率不是小概率,现有样本信息还不能拒绝H0,结论为按所取检验水准不拒绝H0,即差异无统计意义,如例3.3尚不能认为两总体脉搏均数有差异。126第1章绪论医学统计专业知识专家讲座第126页下结论时注意点:P≤α,拒绝H0,不能认为H0必定不成立,因为即使在H0成立条件下出现等于及大于现有统计量概率虽小,但仍有可能出现;同理,P>α,不拒绝H0,更不能认为H0必定成立。由此可见,假设检验结论是含有概率性,不论拒绝H0或不拒绝H0,都有可能发生错误,即第一类错误或第二类错误127第1章绪论医学统计专业知识专家讲座第127页第五节均数u检验国外统计书籍及统计软件亦称为单样本u检验(onesampleu-test)。样本均数与总体均数比较u检验适合用于:①总体标准差σ已知情况;②样本含量较大时,比如n>100时。对于后者,是因为n较大,υ也较大,则t分布很靠近u分布缘故。一、样本均数与总体均数比较u检验128第1章绪论医学统计专业知识专家讲座第128页u

值计算公式为:总体标准差σ已知时,不论n大小。总体标准差σ未知时,但n>100时。129第1章绪论医学统计专业知识专家讲座第129页例3.4某托儿所三年来测得21~24月龄47名男婴平均体重11kg。查得近期全国九城市城区大量调查同龄男婴平均体重11.18kg,标准差为1.23kg。问该托儿所男婴体重发育情况与全国九城市同期水平有没有不一样?(全国九城市调查结果可作为总体指标)实例130第1章绪论医学统计专业知识专家讲座第130页(1)建立检验假设H0:μ=μ0,即该托儿所男婴体重发育情况与全国九城市同期水平相同,α=0.05(双侧)H1:μ≠μ0,即该托儿所男婴体重发育情况与全国九城市同期水平不一样。(2)计算u值本例因总体标准差σ已知,故可用u检验。本例n=47,样本均数=11,总体均数=11.18,总体标准差=1.23,代入公式(3.7)131第1章绪论医学统计专业知识专家讲座第131页(3)确定P值,作出推断结论查u界值表(附表2,t界值表中为∞一行),得u0.05=1.96,u=1.003<u0.05=1.96,故P>0.05。按α=0.05水准,不拒绝H0,差异无统计学意义。结论:可认为该托儿所男婴体重发育情况与全国九城市同期水平相同。132第1章绪论医学统计专业知识专家讲座第132页二、两样本均数比较u检验该检验也称为独立样本u检验(independentsampleu-test),适合用于两样本含量较大(如n1>50且n2>50)时,u值可按下式计算:133第1章绪论医学统计专业知识专家讲座第133页

例3.5测得某地20~24岁健康女子100人收缩压均数为15.27kPa,标准差为1.16kPa;又测得该地20~24岁健康男子100人收缩压均数为16.11kPa,标准差为1.41kPa。问该地20~24岁健康女子和男子之间收缩压均数有没有差异?实例134第1章绪论医学统计专业知识专家讲座第134页(1)建立检验假设

H0:μ1=μ2,即该地20~24岁健康女子和男子之间收缩压均数相同;

H1:μ1≠μ2,即该地20~24岁健康女子和男子之间收缩压均数不一样。α=0.05(双侧)(2)计算u值

本例n1=100,均数1=15.27,S1=1.16

n2=100,均数2=16.11,S2=1.41135第1章绪论医学统计专业知识专家讲座第135页(3)确定P值,作出推断结论查u界值表(附表2,t界值表中为∞一行),得u0.05=1.96,现u>u0.05=1.96,故P<0.05。按水准α=0.05,拒绝H0,接收H1,差异有统计学意义。结论:可认为该地20~24岁健康人收缩压均数男性高于女性。136第1章绪论医学统计专业知识专家讲座第136页第六节均数t检验当样本含量较小(如n<50)时,t分布和u分布有较大出入,所以小样本样本均数与总体均数比较以及两个样本均数比较要用t检验。t检验适用条件:①样原来自正态总体或近似正态总体;②两样本总体方差相等。137第1章绪论医学统计专业知识专家讲座第137页一、样本均数与总体均数比较t检验亦称为单样本t检验(onesamplet-test)。即样本均数代表未知总体均数与已知总体均数(普通为理论值、标准值或经过大量观察所得稳定值等)进行比较。这时检验统计量t值计算在H0成立前提条件下由公式(3.4)变为:138第1章绪论医学统计专业知识专家讲座第138页例3.6对例3.3资料进行t检验。(1)建立检验假设

H0:μ=μ0,即该山区健康成年男子脉搏均数与普通健康成年男子脉搏均数相同;H1:μ≠μ0,即该山区健康成年男子脉搏均数与普通健康成年男子脉搏均数不一样。α=0.05(双侧)

(2)计算t值本例n=25,s=6.5,样本均数=74.2,总体均数=72,代入公式(3.10)139第1章绪论医学统计专业知识专家讲座第139页(3)确定P值,作出推断结论

本例υ=25-1=24,查附表2,t界值表,得t0.05,24=2.064,现t=1.692<t0.05,24=2.064,故P>0.05。按α=0.05水准,不拒绝H0,差异无统计学意义。结论:即依据本资料还不能认为此山区健康成年男子脉搏数与普通健康成年男子不一样。140第1章绪论医学统计专业知识专家讲座第140页二、配对资料t检验医学科研中配对资料三种主要类型:同一批受试对象治疗前后一些生理、生化指标比较;同一个样品,采取两种不一样方法进行测定,来比较两种方法有没有不一样;配对动物试验,各对动物试验结果比较等。配对试验设计得到资料称为配对资料。141第1章绪论医学统计专业知识专家讲座第141页先求出各对子差值d均值,若两种处理效应无差异,理论上差值d总体均数应为0。

所以这类资料比较可看作是样本均数与总体均数为0比较。

要求差值总体分布为正态分布。t检验公式为:配对资料t检验(pairedsamplest-test)142第1章绪论医学统计专业知识专家讲座第142页例3.7设有12名志愿受试者服用某减肥药,服药前和服药后一个疗程各测量一次体重(kg),数据如表3-4所表示。问此减肥药是否有效?(1)建立检验假设H0:μd=0,即该减肥药无效;H1:μd≠0,即该减肥药有效。单侧α=0.05143第1章绪论医学统计专业知识专家讲座第143页表3-4某减肥药研究体重(kg)观察值144第1章绪论医学统计专业知识专家讲座第144页(2)计算t值本例n=12,Σd=-16,Σd2

=710,差值均数=Σd/n=-16/12=-1.33(kg)145第1章绪论医学统计专业知识专家讲座第145页(3)确定P值,作出推断结论自由度=n-1=12-1=11,查附表2,t界值表,得单侧t0.05,11=2.201,现t=0.58<t0.05,11=2.201,故P>0.05。按α=0.05水准,不拒绝H0,差异无统计学意义。结论:故尚不能认为该减肥药有减肥效果。146第1章绪论医学统计专业知识专家讲座第146页例3.8某单位研究饮食中缺乏维生素E与肝中维生素A含量关系,将同种属大白鼠按性别相同,年纪、体重相近配成8对,并将每对中两头动物随机分到正常饲料组和维生素E缺乏组,然后定时将大白鼠杀死,测得其肝中维生素A含量如表3-5。

问不一样饲料组大白鼠肝中维生素A含量有没有差异?

(自学内容)147第1章绪论医学统计专业知识专家讲座第147页三、两样本均数比较t检验两本均数比较t检验亦称为成组t检验,又称为独立样本t检验(independentsamplest-test)。适合用于比较按完全随机设计而得到两组资料,比较目标是推断它们各自所代表总体均数和是否相等。148第1章绪论医学统计专业知识专家讲座第148页样本预计值为:总体方差已知:标准误计算公式149第1章绪论医学统计专业知识专家讲座第149页若n1=n2时:已知S1和S2时:150第1章绪论医学统计专业知识专家讲座第150页例3.9测得14名慢性支气管炎病人与11名健康人尿中17酮类固醇(mol/24h)排出量以下,试比较两组人尿中17酮类固醇排出量有没有不一样。原始调查数据以下:病人X1:n=14;10.0518.7518.9915.9413.9617.6720.5117.2214.6915.109.428.217.2424.60健康人X2:n=11;17.9530.4610.8822.3812.8923.0113.8919.4015.8326.7217.29151第1章绪论医学统计专业知识专家讲座第151页(1)建立检验假设

H0:μ1=μ2,即病人与健康人尿中17酮类固醇排出量相同H1:μ1≠μ2,即病人与健康人尿中17酮类固醇排出量不一样α=0.05

152第1章绪论医学统计专业知识专家讲座第152页(2)计算t值本例n1=14,ΣX1=212.35,ΣX12=3549.0919

n2=11,ΣX2=210.70,ΣX22=4397.64153第1章绪论医学统计专业知识专家讲座第153页(3)确定P值作出推断结论υ=14+11-2=23,查t界值表,得t0.05,23=2.069,现t=1.8035<t0.05,23=2.069,故P>0.05。按α=0.05水准,不拒绝H0,差异无统计学意义。结论:尚不能认为慢性支气管炎病人与健康人尿中17酮类固醇排出量不一样。154第1章绪论医学统计专业知识专家讲座第154页四、两样本几何均数t检验比较两样本几何均数目标是推断它们各自代表总体几何均数有没有差异。适合用于:①观察值呈等比关系,如血清滴度;②观察值呈对数正态分布,如人体血铅含量等。。两样本几何均数比较t检验公式与两样本均数比较t检验公式相同。只需将观察X用lgX来代替就行了

155第1章绪论医学统计专业知识专家讲座第155页例3.10将20名钩端螺旋体病人血清随机分为两组,分别用标准株和水生株作凝溶试验,抗体滴度倒数(即稀释度)结果以下。问两组抗体平均效价有没有差异?标准株(11人):1002004004004004008001600160016003200水生株(9人):1001001002002002002004001600将两组数据分别取对数,记为x1,x2。

x1:2.0002.3012.6022.6022.6022.6022.9033.2043.2043.2043.505x2:2.0002.0002.0002.3012.3012.3012.3012.6023.204156第1章绪论医学统计专业知识专家讲座第156页一、两样本方差齐性检验用较大样本方差S2比较小样本方差S2

第七节两总体方差齐性检验和t'检验υ1为分子自由度,υ2为分母自由度157第1章绪论医学统计专业知识专家讲座第157页注意:①方差齐性检验本为双侧检验,但因为公式(3.18)要求以较大方差作分子,F值必定大于1,故附表3单侧0.025界值,实对应双侧检验P=0.05;②当样本含量较大时(如n1和n2均大于50),可无须作方差齐性检验。158第1章绪论医学统计专业知识专家讲座第158页深层水:n1=8,样本均数=1.781(mg/L),S1=1.899(mg/L)表层水:n2=10,样本均数=0.247(mg/L),S2=0.210(mg/L)例3.11某研究所为了了解水体中汞含量垂直改变,对某氯碱厂附近一河流表层水和深层水作了汞含量测定,结果以下。试检验两个方差是否齐性。159第1章绪论医学统计专业知识专家讲座第159页确定P值作出推断结论本例υ1=8-1=7,υ2=10-1=9,查附表3,F界值表(方差齐性检验用),得F0.05,7,9=4.20,本例F=80.97>F0.05,7,9=4.20;故P<0.05,按α=0.05水准,拒绝H0,接收H1,结论:故可认为两总体方差不齐。160第1章绪论医学统计专业知识专家讲座第160页方差不齐时,两小样本均数比较,可选取以下方法:①采取适当变量变换,使到达方差齐要求;②采取秩和检验;③采取近似法t'检验。二、t'检验161第1章绪论医学统计专业知识专家讲座第161页计算统计量t'

162第1章绪论医学统计专业知识专家讲座第162页例3.12由例3.11已知表层水和深层水含汞量方差不齐,试比较其均数有没有差异?自学内容163第1章绪论医学统计专业知识专家讲座第163页假设检验中作出推断结论可能发生两种错误:①拒绝了实际上是成立H0,这叫Ⅰ型错误(typeⅠerror)或第一类错误,也称为α错误。②不拒绝实际上是不成立H0,这叫Ⅱ型错误(typeⅡerror)或第二类错误,也称为β错误。第八节Ⅰ型错误和Ⅱ型错误164第1章绪论医学统计专业知识专家讲座第164页表3-6可能发生两类错误165第1章绪论医学统计专业知识专家讲座第165页166第1章绪论医学统计专业知识专家讲座第166页联络:普通α增大,则β减小;α减小,则β增大;区分:(1)普通α为已知,可取单侧或双侧,如0.05,或0.01。(2)普通β为未知,只取单侧,如取0.1或0.2。1-β(把握度)≮0.75。两类错误联络与区分167第1章绪论医学统计专业知识专家讲座第167页1-β称为检验效能(poweroftest)或把握度,其意义是两总体确有差异,按α水准能发觉它们有差异能力。α与β大小应依据实际情况适当取值。168第1章绪论医学统计专业知识专家讲座第168页1.资料要来自严密抽样研究设计2.选取假设检验方法应符合其应用条件3.正确了解差异有没有显著性统计涵义正确了解差异有统计学意义及临床上差异统计学意义。4.假设检验推断结论不能绝对化5.要依据资料性质事先确定采取双侧检验或单侧检验第九节应用假设检验注意问题169第1章绪论医学统计专业知识专家讲座第169页THANKYOUFORLISTENINGTHEEND170第1章绪论医学统计专业知识专家讲座第170页医学本科生用泰山医学院预防医学教研室Email:zcheng@主讲程琮医学统计学171第1章绪论医学统计专业知识专家讲座第171页TeachingPlan

forMedicalStudentsMedicalStatisticsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege172第1章绪论医学统计专业知识专家讲座第172页第4章方差分析目录第五节多个方差齐性检验第二节单原因方差分析第三节双原因方差分析第四节多个样本均数间两两比较第一节方差分析基本思想第六节变量变换173第1章绪论医学统计专业知识专家讲座第173页第四章方差分析学习要求:1。掌握方差分析基本思想;2。掌握单原因、双原因方差分析应用条件、意义及计算方法;3。熟悉多个均数间两两比较意义及方法;4。了解方差齐性检验和t’检验意义及方法;5。熟悉变量变换意义和方法。174第1章绪论医学统计专业知识专家讲座第174页第一节方差分析基本思想一、方差分析用途及应用条件方差分析(analysisofvariance,缩写为ANOVA)是惯用统计分析方法之一。其应用广泛,分析效率高,节约样本含量。主要用途有:①进行两个或两个以上样本均数比较;②能够同时分析一个、两个或多个原因对试验结果作用和影响;③分析多个原因独立作用及多个原因之间交互作用;④进行两个或多个样本方差齐性检验等。方差分析对分析数据要求及条件比较严格,即要求各样本为随机样本,各样原来自正态总体,各样本所代表总体方差齐性或相等。175第1章绪论医学统计专业知识专家讲座第175页

二、方差分析基本思想处理原因可分为若干个等级或不一样类型,通常称为水平。在不一样水平下进行若干次试验并取得多个数据,能够将在每个水平下取得这些数据看作一个样本。若某个原因有四个水平,每个水平数据代表一个样本,则取得四个样本数据。

设有k个相互独立样本,分别来自k个正态总体X1,X2,…Xk,且方差相等,即要求检验假设为此假设意义为,在某处理原因不一样水平下,各样本总体均数相等。

176第1章绪论医学统计专业知识专家讲座第176页1。设某原因有多个水平,即试验数据产生多个样本。由多个样本全部数据能够计算出总变异,称为总离均差平方和。即SS总。2。数理统计证实,SS总能够由几个部分组成。单原因方差分析中,SS总由组间变异和组内变异组成。

SS总=SS组间+SS组内。3。组间变异主要受到处理原因和个体误差两方面影响,组内变异主要受个体误差影响。当H0为真时,因为处理原因不起作用,组间变异只受个体误差影响。此时,组间变异与组内变异相差不能太大。177第1章绪论医学统计专业知识专家讲座第177页表4-2PCNA在三种不一样胃组织中表示结果标本Xj不一样胃组织XiABC156302124637143392027…………∑Xj553221100874(∑X)ni109827(N)均数55.3024.5612.532.37(总均值)∑Xj2312916273167239236(∑X2)178第1章绪论医学统计专业知识专家讲座第178页4。各种变异除以对应自由度,称为均方,用MS表示,也就是方差。当H0为真时,组间均方与组内均方相差不大,二者比值F值约靠近于1。即F=组间均方/组内均方≈1。5。当H0不成立时,处理原因产生了作用,使得组间均方增大,此时,F>>1,当大于等于F临界值时,则P≤0.05。可认为H0不成立,各样本均数不全相等。179第1章绪论医学统计专业知识专家讲座第179页三、方差分析类型1。单原因方差分析(one-wayANOVA)也称为完全随机设计(completelyrandomdesign)方差分析。该设计只能分析一个原因下多个水平对试验结果影响。2。双原因方差分析(two-wayANOVA)称为随机区组设计(randomizedblockdesign)方差分析。该设计能够分析两个原因。一个为处理原因,也称为列原因;一个为区组原因,也称为行原因。180第1章绪论医学统计专业知识专家讲座第180页3。三原因方差分析也称为拉丁方设计(Latinsquaredesign)方差分析。该设计特点是,能够同时分析三个原因对试验结果作用,且三个原因之间相互独立,不能有交互作用。4。析因设计(factorialdesign)方差分析当两个原因或多个原因之间存在相互影响或交互作用时,可用该设计来进行分析。该设计不但能够分析多个原因独立作用,也能够分析多个原因间交互作用,是一个高效率方差分析方法。181第1章绪论医学统计专业知识专家讲座第181页5。正交试验设计方差分析假如要分析原因有三个或三个以上,可进行正交试验设计(orthogonalexperimentaldesign)方差分析。当分析原因较多时,试验次数会急剧增加,用此设计进行分析则更能表达出其优越性。该设计利用正交表来安排各次试验,以最少试验次数,得到更多分析结果。182第1章绪论医学统计专业知识专家讲座第182页四、方差分析基本步骤1。计算总变异:指全部试验数据离均差平方和。2。计算各部分变异:单原因方差分析中,能够分出组间变异(SS组间)和组内变异(SS组内);双原因方差分析中,能够分出处理组变异(SS处理),区组变异(SS区组)或称为配伍组变异(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论