基本流行病统计分析方法及统计分析软件的应用_第1页
基本流行病统计分析方法及统计分析软件的应用_第2页
基本流行病统计分析方法及统计分析软件的应用_第3页
基本流行病统计分析方法及统计分析软件的应用_第4页
基本流行病统计分析方法及统计分析软件的应用_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基本流行病统计分析方法及统计分析软件的应用1第一页,共一百零二页,2022年,8月28日课程提纲SPSS统计分析软件应用Part7第二页,共一百零二页,2022年,8月28日变量的分类及其统计描述变量(variable)观察单位的某项特征称为变量。变量值(valueofvariable)变量的观察结果(测得值)称为变量值。

概念身高、体重、血型……3第三页,共一百零二页,2022年,8月28日变量的分类及其统计描述

变量的分类(一)定量变量(quantitativevariable)也称为数值变量,其变量值是定量的,所获资料为计量资料。即对每一个观察对象用定量的方法测定某项指标量的大小。有度量衡单位。1.连续型变量(continuousvariable):即连续变化的变量,其取值是数轴上某一区间内的一切数值,理论上它们是无限可分的。如身高、体重。2.离散型变量(discretevariable):其取值是0,1,2等不连续的量,是数轴上有限或无限的可数的值,两个数之间没有小数。如年新生儿数、家庭人口数。4第四页,共一百零二页,2022年,8月28日变量的分类及其统计描述(一)定性变量(qualitativevariable)1.分类变量(categoricalvariable):也称为计数资料,将观察单位按某种属性或类别分组,然后清点数目所得各组的观察单位数。可分为:二项分类:两类观察结果互相对立。(性别:男、女)多项分类:观察结果表现为互不相容的多个属性或类别。(血型:A、B、O、AB)2.有序变量(ordinalvariable):也称为等级资料,将观察单位按某种属性的不同程度分组,然后清点各组数目,但所分各组之间有等级顺序。如满意程度(极不满意、有点满意、中度满意、很满意、级满意)、实验室检验结果(-、±、+、++、+++)。

变量的分类5第五页,共一百零二页,2022年,8月28日变量的分类及其统计描述

变量的分类变量间的转化

血红蛋白量(计量资料)<60(重度贫血)60~(中度贫血)90~(轻度贫血)120~160(正常)>160(增高)等级资料正常异常计数资料连续型资料有序资料分类资料6第六页,共一百零二页,2022年,8月28日变量的分类及其统计描述定量变量定性变量

(分类变量)二分类:性别多分类:血型无序分类有序分类(等级变量):下等、中下等、一般、中上等、上等变量类型连续型变量:体重、身高离散型变量:家庭人口数无序分类-二分类有序分类(等级)定量-离散型定量-连续型精确程度性别:男健康状况:良好家庭人口数:3身高:226cm无序分类-多分类血型:A型定性变量定量变量7第七页,共一百零二页,2022年,8月28日1.下面的变量中,属于分类变量的是()A脉搏B血型C肺活量D红细胞计数2.下面的变量中,属于定量变量的是()A性别B体重C血型D职业3.某人记录了50名病人体重的测定结果:小于50Kg的13人,介于50Kg和70Kg间的20人,大于70Kg的17人,此时资料属于()A定量资料B分类资料C有序资料D二分类资料变量的分类及其统计描述8第八页,共一百零二页,2022年,8月28日变量的分类及其统计描述

定量资料的统计描述定量资料的统计描述统计图表:频数分布表(图)统计指标:集中趋势指标离散趋势指标统计表:对数据进行概括;统计图:对分布形态及分布间的关系做直观的表达。9第九页,共一百零二页,2022年,8月28日?变量的分类及其统计描述用何种统计图?10第十页,共一百零二页,2022年,8月28日变量的分类及其统计描述?用何种统计图?11第十一页,共一百零二页,2022年,8月28日变量的分类及其统计描述

离散型变量的频数(率)分布图直条图

横坐标为产前检查次数;纵坐标为频率,即产前检查K次的妇女在被统计妇女中所占的比例%。图中等宽矩形长条的高度与相应检查次数的频率呈正比。12第十二页,共一百零二页,2022年,8月28日变量的分类及其统计描述

连续型变量的频数(率)分布图直方图

等距分组。以横轴表示被观察变量,纵轴表示频率密度(频率/组距),以各矩形(宽度为组距)的面积代表各组段的频率。频率直方图的纵坐标为频率密度,所以直方图的总面积是100%。若以频数为纵坐标,直方图面积不等于1。13第十三页,共一百零二页,2022年,8月28日变量的分类及其统计描述

集中趋势:血清铁含量向中央部分集中,即中等含量者居多,集中在18μmol/L这个组段,这种现象为集中趋势。离散趋势:从中央部分到两侧的频数分布逐渐减少,而且血清铁含量的值参差不齐,最低的接近6μmol/L,最高的接近30μmol/L,这种现象称为离散趋势。

频数分布的两个特征:由于同质性,所有实测值趋向同一数值的趋势称为集中趋势。离散趋势或变异程度是指观察值之间参差不齐的程度。14第十四页,共一百零二页,2022年,8月28日变量的分类及其统计描述一、描述集中趋势的统计指标(一)算术平局数(mean)总体均数用希腊字母µ表示,样本均数用拉丁字母表示。直接法:加权法:15第十五页,共一百零二页,2022年,8月28日变量的分类及其统计描述一、描述集中趋势的统计指标(二)算术平均数(geometricmean)也称为倍数均数,用G表示。直接法:加权法:16第十六页,共一百零二页,2022年,8月28日变量的分类及其统计描述一、描述集中趋势的统计指标(三)中位数和百分位数

中位数(median,M):将一组变量值从小到大按顺序排列,位次居中的那个变量值就是中位数。

n为奇数:n为偶数:百分位数(percentile,Px):指把数据从小到大排列后位于第X%位置的数值。有n个观察值X1,X2…Xn,把他们由小到大按顺序排列成X1≤X2≤X3…≤Xn,将这n个观察值平均的分为100等份,对应于每一等份的数值就是一个百分位数,对应于前面X%个位置的数值称为第X百分位数,用Px表示。

一个百分位数Px将总体或样本的全部观察值分为两部分,理论上,在不包括Px的全部数据中有X%的观察值比它小,有(100-X)%的观察值比它大。17第十七页,共一百零二页,2022年,8月28日变量的分类及其统计描述二、描述离散趋势的统计指标(一)极差(range,R)也称为全距,用R表示,即一组资料中,最大值与最小值之差。(二)四分位数间距(quartilerange,Q)P25表示全部观察值中有25%(1/4)的观察值比它小,记为下四分位数QL;P75表示全部观察值中有25%(1/4)的观察值比它大,记为上四分位数QU。Q适用于各种类型的连续型变量,特别是偏态分布的资料。18第十八页,共一百零二页,2022年,8月28日变量的分类及其统计描述二、描述离散趋势的统计指标(三)方差和标准差

方差只取正值。同类资料比较时,方差越大意味着数据间变异越大。(四)变异系数(coefficientofvariation,CV)1)比较度量衡单位不同的多组资料的变异度。2)比较均数相差悬殊的几组资料的变异度。19第十九页,共一百零二页,2022年,8月28日1.反映定量变量观察数据集中位置的指标是()A标准差B标准误C频率D均数2.在正态分布条件下,表示变量值变异情况的指标最常用的是()A标准差B标准误C变异系数D百分位数3.变异系数越大说明()A标准差越大B标准差、平均数都大C以均数为准变异程度大D平均数小4.已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>12,其潜伏期的平均水平约为()A9天B9.5天C10天D11天变量的分类及其统计描述20第二十页,共一百零二页,2022年,8月28日变量的分类及其统计描述

定性资料的统计描述一、定性资料的频数分布构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。构成比=

某一组成部分的观察单位数同一事物内部各组成部分的观察单位总数×100%常用来表示疾病或死亡的顺位、位次或所占比重。

21第二十一页,共一百零二页,2022年,8月28日变量的分类及其统计描述

定性资料的统计描述二、常用相对数指标(一)频率型指标:近似的反映某一事件出现的机会大小,如发病概率、死亡概率。

某事件发生的个体数

可能发生某事件的个体数频率=×KK:比例基数选择K的原则:使算得的率至少保留1—2位整数。22第二十二页,共一百零二页,2022年,8月28日变量的分类及其统计描述

定性资料的统计描述二、常用相对数指标(二)强度型指标:指一段时间内的平均概率。多用于大人群、长时间随访的资料。强度是单位时间段内某现象发生的频率。如发病率、死亡率。K:比例基数选择K的原则:使算得的率至少保留1—2位整数。23第二十三页,共一百零二页,2022年,8月28日变量的分类及其统计描述

定性资料的统计描述二、常用相对数指标(三)相对比型指标相对比型指标是A、B两个有联系的指标之比。对比的两个指标可以性质相同,也可以性质不同。公式为:相对比型指标=A指标/B指标

注意:在计算相对比中,甲、乙两个指标可以是绝对数,也可以是相对数或平均数。24第二十四页,共一百零二页,2022年,8月28日变量的分类及其统计描述1.某医院某年住院病人中胃癌患者占5%,则()A5%是强度指标B5%是频率指标C5%是相对比指标D5%说明胃癌在人群中的严重性2.计算麻疹疫苗接种后血清检查的阳转率,分母为()A麻疹易感人群B麻疹患者数C麻疹疫苗接种人数D麻疹疫苗接种后的阳转人数25第二十五页,共一百零二页,2022年,8月28日课程提纲SPSS统计分析软件应用Part726第二十六页,共一百零二页,2022年,8月28日常用概率分布

正态分布

二项分布Poisson分布27第二十七页,共一百零二页,2022年,8月28日常用概率分布

正态分布

正态分布是自然界最常见的一种分布,若指标X的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。28第二十八页,共一百零二页,2022年,8月28日常用概率分布29第二十九页,共一百零二页,2022年,8月28日常用概率分布30第三十页,共一百零二页,2022年,8月28日常用概率分布31第三十一页,共一百零二页,2022年,8月28日常用概率分布均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。对于任意一个服从正态分布N(μ,σ2)的随机变量,可作如下的标准化变换,也称Z变换:

正态分布32第三十二页,共一百零二页,2022年,8月28日常用概率分布

正态分布应用:1.制定医学参考值范围2.质量控制33第三十三页,共一百零二页,2022年,8月28日常用概率分布二项分布是指在只能产生两种可能结果(如“阳性”或“阴性”)之一的n次独立重复实验中,当每次试验的“阳性”概率保持不变时,出现“阳性”的次数X=0,1,2,…,n的一种概率分布。若从阳性率为π的总体中随机抽取大小为n的样本,则出现“阳性”数为X的概率分布即呈现二项分布,记作B(X;n,π)或B(n,π)。

二项分布34第三十四页,共一百零二页,2022年,8月28日常用概率分布Poisson分布Poisson分布也是一种离散型分布,用以描述罕见事件发生次数的概率分布。Poisson分布也可用于研究单位时间内(或单位空间、容积内)某罕见事件发生次数的分布,如分析在单位面积或容积内细菌数的分布,在单位空间中某种昆虫或野生动物数的分布,粉尘在观察容积内的分布,放射性物质在单位时间内放射出质点数的分布等。35第三十五页,共一百零二页,2022年,8月28日常用概率分布1.标准正态分布的均数与标准差是()A0,1B1,0C0,0D1,12.正态分布的两个参数μ与σ,()对应的正态曲线愈趋扁平。Aμ愈大Bμ愈小Cσ愈大Dσ愈小36第三十六页,共一百零二页,2022年,8月28日课程提纲SPSS统计分析软件应用Part737第三十七页,共一百零二页,2022年,8月28日参数估计和假设检验

参数估计概念:参数估计就是用样本指标(统计量)来估计总体指标(参数)。参数估计点估计(pointestimation)区间估计(intervalestimation)38第三十八页,共一百零二页,2022年,8月28日参数估计和假设检验

参数估计点估计:用样本统计量直接作为总体参数的估计值。例如于2000年测得某地27例健康成年男性血红蛋白量的样本均数为125g/L,试估计其总体均数。

即认为2000年该地所有健康成年男性血红蛋白量的总体均数为125g/L。39第三十九页,共一百零二页,2022年,8月28日参数估计和假设检验

参数估计区间估计:按预先给定的概率(1-α)估计总体参数的可能范围,该范围就称为总体参数的1-α置信区间(confidenceintervalCI)。预先给定的概率(1-α)称为置信度,常取95%或99%。如无特别说明,一般取双侧95%。40第四十页,共一百零二页,2022年,8月28日参数估计和假设检验

假设检验概念:假设检验亦称为显著性检验,是判断样本指标与总体指标或样本指标与样本指标之间的差异有无显著性意义的一种统计方法。预先给定的概率(1-α)称为置信度,常取95%或99%。如无特别说明,一般取双侧95%。41第四十一页,共一百零二页,2022年,8月28日

假设检验的原理:假设检验的基本思想是反证法和小概率的思想。反证法思想:首先提出假设(由于未经检验是否成立,所以称为无效假设),用适当的统计方法确定假设成立的可能性大小,如果可能性小,则认为假设不成立,拒绝它;如果可能性大,还不能认为它不成立。小概率思想:是指小概率事件在一次随机试验中认为基本上不会发生。概率小于多少算小概率是相对的,在进行统计分析时要事先规定,即检验水准。参数估计和假设检验

假设检验42第四十二页,共一百零二页,2022年,8月28日参数估计和假设检验

假设检验例1:已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?从统计学角度考虑东北某县与北方儿童前囟门闭合月龄有差别有两种可能:1.差别是由于抽样误差引起的,统计学上称为差异无显著性。2.差异是本质上的差异,即二者来自不同总体。统计学上称为差异有显著性。43第四十三页,共一百零二页,2022年,8月28日参数估计和假设检验

假设检验造成两者不等的原因:①同一总体,即但有抽样误差存在;②非同一总体,即存在本质上的差别,同时有抽样误差存在。44第四十四页,共一百零二页,2022年,8月28日参数估计和假设检验

假设检验的步骤1.建立检验假设与单双侧单双侧的确定:1.根据专业知识,已知东北某县囱门月龄闭合值不会低于一般值;2.研究者只关心东北某县值是否高于一般人群值,应当用单侧检验。3.一般认为双侧检验较为稳妥,故较为常用。45第四十五页,共一百零二页,2022年,8月28日参数估计和假设检验

假设检验的步骤2.确定检验水准亦称为显著性水准,符号为α,是预先给定的概率值。α常取0.05。α可根据不同的研究目的给予不同的设置,如方差齐性检验,正态性检验α常取0.1或0.2。3.选择检验方法并计算统计量根据所分析资料的类型和统计推断的目的要求选用不同的检验方法。单样本t检验46第四十六页,共一百零二页,2022年,8月28日参数估计和假设检验

假设检验的步骤4.确定P值

P值的意义:指从H0规定的总体中随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。47第四十七页,共一百零二页,2022年,8月28日参数估计和假设检验

假设检验的步骤5.做推断结论(包括统计结论和专业结论)按α=0.05水准,不拒绝H0,差别无统计学意义,故还不能认为该县儿童前囟门闭合月龄的均数大于一般儿童。48第四十八页,共一百零二页,2022年,8月28日参数估计和假设检验

两组独立样本资料的t检验例2:某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?患者:0.84、1.05、1.20、1.20、1.39、1.53、1.67、1.80、1.87、2.07、2.11健康人:0.54、0.64、0.64、0.75、0.76、0.81、1.16、1.20、1.34、1.35、1.48、1.56、1.87

适用条件

两样本相互独立

样本来自的两个总体服从正态分布

方差齐性49第四十九页,共一百零二页,2022年,8月28日参数估计和假设检验

两组独立样本资料的t检验当H0成立时,检验统计量:t=-2.524,P=0.019<0.05,按α=0.05检验水平,拒绝H0,可以认为两组血磷值不同,从描述性结果看,患者血磷值高于健康人。50第五十页,共一百零二页,2022年,8月28日课程提纲SPSS统计分析软件应用Part751第五十一页,共一百零二页,2022年,8月28日卡方检验主要应用:1.推断两个或多个样本率及构成比之间有无差别;2.分类变量配对设计下的卡方检验;3.频数分布的拟合优度检验。52第五十二页,共一百零二页,2022年,8月28日完全随机设计下两组频数分布的χ2检验卡方检验例3:监测发现某学校发生甲型肝炎暴发,经现场调查,共发现19例甲肝确诊病例。开展以下病例对照研究:以19例甲肝确诊病例为病例组,选取该校53名无任何临床症状且HAVIgM抗体阴性的学生作为对照组,比较两组饮水类型和洗手习惯有无差异?两组饮水类型比较组别是否饮用过某井生水合计饮用未饮用病例组14519对照组213153合计363672两组洗手习惯比较组别是否经常洗手(>3次/d)合计饮用未饮用病例组14519对照组401353合计54367253第五十三页,共一百零二页,2022年,8月28日卡方检验完全随机设计下两组频数分布的χ2检验1.建立检验假设并确定检验水准H0:两组饮水类型构成相同,π1=π2H1:两组饮水类型构成不同,π1≠π2α=0.052.计算检验统计量四格表专用公式(T≥5,且n≥40):校正公式(1≤T<5,且n≥40):3.确定P值4.做统计推断54第五十四页,共一百零二页,2022年,8月28日课程提纲SPSS统计分析软件应用Part755第五十五页,共一百零二页,2022年,8月28日单因素方差分析

适用条件

多组间(≥3组)均数比较

各样本相互独立

样本来自的总体均服从正态分布方差齐性56第五十六页,共一百零二页,2022年,8月28日课程提纲SPSS统计分析软件应用Part757第五十七页,共一百零二页,2022年,8月28日两独立样本非参数检验如果两样本是非正态分布,该如何分析?58第五十八页,共一百零二页,2022年,8月28日两独立样本非参数检验例41.比较2014年六安市金安区和裕安区在流行性腮腺炎报卡审核时间(从报告到审核)上有无差异?2.比较2014年六安市县级以上综合医院与乡镇卫生院在流行性腮腺炎报卡报告时间(从诊断到报告)上有无差异?59第五十九页,共一百零二页,2022年,8月28日两独立样本非参数检验

适用条件

非参数检验

不依赖于总体的分布形式

对两个分布进行比较

对两组间参数进行比较时,不服从正态分布[偏态分布(M,Q)]60第六十页,共一百零二页,2022年,8月28日课程提纲SPSS统计分析软件应用Part761第六十一页,共一百零二页,2022年,8月28日世界上最早的统计分析软件1968年斯坦福大学三位研究生创建世界公认的三大数据分析软件之一SAS(StatisticalAnalysisSystem)S+(Splus)最高版本已达21.0SPSS统计分析软件应用62第六十二页,共一百零二页,2022年,8月28日

发展史美国斯坦福大学三位研究生(NormanH.Nie、C.Hadlai(Tex)Hull和DaleH.Bent)创建SPSS“StatisticalPackage

fortheSocialSciences”。在芝加哥成立SPSS总部推出Windows版本,同时全球自SPSS11.0起,SPSS全称为“StatisticalProduct

andServiceSolutions”,即“统计产品和服务解决方案”。(11.0+)

SPSS公司宣布重新包装旗下的SPSS产品线,定位为“预测统计分析软件”(PredictiveAnalyticsSoftware)PASW。(17.0+)

SPSS公司被IBM公司并购,各子产品家族名称前面不再以PASW为名,修改为统一加上IBMSPSS字样。(19.0+)19681975199220092010SPSS统计分析软件应用63第六十三页,共一百零二页,2022年,8月28日应用领域广泛通信、医疗、银行、证券、保险、制造、商业…目前已推出9个语种版本国内外著名大学一般把SPSS统计软件应用作为学生的公共必修课SPSS统计分析软件应用64第六十四页,共一百零二页,2022年,8月28日引例:某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地克山病患者与健康人的血磷值是否不同?患者:0.84、1.05、1.20、1.20、1.39、1.53、1.67、1.80、1.87、2.07、2.11健康人:0.54、0.64、0.64、0.75、0.76、0.81、1.16、1.20、1.34、1.35、1.48、1.56、1.87工作流程:一、将数据输入SPSS,并存盘。二、进行必要的预分析(分布图、均数标准差的描述等),

以确定应采用的检验方法。三、按题目要求进行统计分析。四、保存和导出分析结果。SPSS统计分析软件应用65第六十五页,共一百零二页,2022年,8月28日

打开SPSS19.0软件步骤:开始→所有程序→IBMSPSSStatistics→IBMSPSSstatistics19.0,或在破解后的软件包里直接打开stats.exe选中,点击确定或直接点击取消SPSS统计分析软件应用66第六十六页,共一百零二页,2022年,8月28日SPSS19.0主界面标题栏菜单栏工具栏数据输入栏变量名栏数据编辑区窗口切换标签状态栏观测序号当前数据栏SPSS统计分析软件应用67第六十七页,共一百零二页,2022年,8月28日

变量视图窗口变量名命名规则变量名必须以字母、汉字或字符@开头,其他字符可以是任何字母、数字或_、@、#、$等符号。变量最后一个字符不能是句号。变量名总长度不能超过64个字符(即32个汉字)。不能使用空白字符或其他特殊字符(如“!”、“?”等)。变量命名必须唯一,不能有两个相同的变量名。在SPSS中变量名不区分大小写。SPSS的保留字(ReservedKeywords)不能作为变量的名称,如ALL、AND、WITH、OR等。一行表示一个变量中英文变量名都行SPSS统计分析软件应用68第六十八页,共一百零二页,2022年,8月28日

变量视图窗口两种常见变量类型数值型(Numeric),如身高、体重字符串型(String),如家庭住址SPSS统计分析软件应用69第六十九页,共一百零二页,2022年,8月28日

变量视图窗口宽度:默认为8,可根据自己的需要调整。小数:默认为2,可根据自己的需要调整。便于在结果中展示SPSS统计分析软件应用70第七十页,共一百零二页,2022年,8月28日

数据导入方式手工录入外部文件导入Excel文件EpiData文件TXT文件……SPSS统计分析软件应用71第七十一页,共一百零二页,2022年,8月28日

定义变量点击数据视图,切换为数据视图SPSS统计分析软件应用72第七十二页,共一百零二页,2022年,8月28日

录入和保存数据数据录入数据保存文件-保存SPSS统计分析软件应用73第七十三页,共一百零二页,2022年,8月28日再看引例引例:某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?患者:0.84、1.05、1.20、1.20、1.39、1.53、1.67、1.80、1.87、2.07、2.11健康人:0.54、0.64、0.64、0.75、0.76、0.81、1.16、1.20、1.34、1.35、1.48、1.56、1.87数据类型:定量数据(血磷值)设计类型:两样本(克山病患者和健康人)均数比较可供参考的检验方法有哪些呢?SPSS统计分析软件应用t检验74第七十四页,共一百零二页,2022年,8月28日u检验秩和检验t检验用于总体标准差σ已知或σ未知但n足够大(n>30,实际操作中多采用n>100)。非参数检验,不依赖于总体分布形式,不是参数间的比较,是用于分布间的比较。主要用于样本量较小(n<30)总体标准差σ未知的正态分布。×样本量过小×检验效能低√注意:在大样本情况下u检验和t检验结果基本一致。SPSS统计分析软件应用t检验75第七十五页,共一百零二页,2022年,8月28日

预分析─正态性检验操作步骤:分析→描述统计→P-P图预测点和实际的点(直线)重合或基本重合可以说明服从正态分布或近似正态分布。SPSS统计分析软件应用t检验76第七十六页,共一百零二页,2022年,8月28日

两样本均数t检验操作步骤:分析→比较均值→独立样本t检验SPSS统计分析软件应用t检验77第七十七页,共一百零二页,2022年,8月28日

结果两组描述性结果若P>0.05,方差齐若P≤0.05,方差不齐P>0.05,方差齐,看第一行结果P<0.05,差异有统计学意义结果解释:1.方差齐性检验结果P=0.860>0.05,说明方差是齐的,看第一行结果。2.t检验结果P=0.019<0.05,按α=0.05检验水平,可以认为两组血磷值不同,从描述性结果看,患者血磷值高于健康人。SPSS统计分析软件应用t检验78第七十八页,共一百零二页,2022年,8月28日

均值比较的其它分析方法及适用条件样本均值与已知总体均数(μ±σ)进行比较用于配对设计资料,检验配对样本差值的总体均数与0是否有显著性差异用于多组(≥3组)间均值的比较,独立、正态、方差齐SPSS统计分析软件应用t检验79第七十九页,共一百零二页,2022年,8月28日例题1某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,结果见表1,问三组石棉肺矿工的用力肺活量有无差异?SPSS统计分析软件应用方差分析80第八十页,共一百零二页,2022年,8月28日表1三组石棉矿工的用力肺活量石棉肺患者可疑患者非患者1.82.32.91.42.13.21.52.12.72.12.12.81.92.62.71.72.53.01.82.33.41.92.43.01.82.43.41.83.32.03.5SPSS统计分析软件应用方差分析81第八十一页,共一百零二页,2022年,8月28日

适用条件

多组间(≥3组)均数比较

各样本相互独立

样本来自的总体均服从正态分布方差齐性SPSS统计分析软件应用方差分析82第八十二页,共一百零二页,2022年,8月28日

第一步:建立数据库(石棉肺.sav)变量视图数据视图SPSS统计分析软件应用方差分析83第八十三页,共一百零二页,2022年,8月28日操作步骤:分析→描述统计→P-P图

第二步:预分析─正态性检验SPSS统计分析软件应用方差分析84第八十四页,共一百零二页,2022年,8月28日

第三步:单因素方差分析操作步骤:分析→比较均值→单因素ANOVASPSS统计分析软件应用方差分析85第八十五页,共一百零二页,2022年,8月28日

结果结果解释:F=84.544,P<0.001,拒绝H0(三组均数无差异),可以认为三组肺活量是不相同的。SPSS统计分析软件应用方差分析86第八十六页,共一百零二页,2022年,8月28日

组间两两比较操作步骤:分析→比较均值→单因素ANOVA→两两比较SPSS统计分析软件应用方差分析87第八十七页,共一百零二页,2022年,8月28日

组间两两比较结果子集间差异有统计学意义,子集内差异无统计学意义。(也有可能只有两个子集)SPSS统计分析软件应用方差分析88第八十八页,共一百零二页,2022年,8月28日例题2监测发现某学校发生甲型肝炎暴发,经现场调查,共发现19例甲肝确诊病例。开展以下病例对照研究:以19例甲肝确诊病例为病例组,选取该校53名无任何临床症状且HAVIgM抗体阴性的学生作为对照组,比较两组饮水类型和洗手习惯有无差异?两组饮水类型比较组别是否饮用过某井生水合计饮用未饮用病例组14519对照组213153合计363672两组洗手习惯比较组别是否经常洗手(>3次/d)合计饮用未饮用病例组14519对照组401353合计543672SPSS统计分析软件应用卡方检验89第八十九页,共一百零二页,2022年,8月28日数据类型:定性数据(分类数据)(饮用和未饮用)设计类型:两样本(病例组和对照组)率的比较解题思路可供参考的检验方法:

四格表χ2检验四格表χ2检验适用条件:两组样本率或构成比的比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论