SPSS教程66888PPT学习课件_第1页
SPSS教程66888PPT学习课件_第2页
SPSS教程66888PPT学习课件_第3页
SPSS教程66888PPT学习课件_第4页
SPSS教程66888PPT学习课件_第5页
已阅读5页,还剩257页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,SPSS13forWindows医学统计方法与应用,(基础统计),2,目录,SPSS13界面介绍数据库建立和结果输出数据整理数据变换报表统计描述T检验,3,方差分析相关分析线性回归分析常用统计图,4,SPSS13界面介绍(StatisticalProductsandServicesSolutions),窗口类型介绍主界面菜单介绍对话框介绍SPSS系统设置,目录,5,窗口类型介绍,数据编辑窗口,变量编辑窗口,6,结果输出窗口,脚本编辑窗口,命令语句编辑窗口,7,数据观察/编辑窗口,变量名,个体序号,数据格,编辑栏,数据格位置,8,变量定义选项:,变量名,类型,数据位,小数位,标签,数值标签,缺失值,数据量度,变量定义编辑窗口,栏宽,对齐方式,9,主界面菜单介绍,文件菜单,编辑菜单,视图菜单,10,数据库处理菜单,变量变换菜单,11,统计分析菜单,描述性统计子菜单,统计分析菜单,数据概况统计子菜单,12,统计分析菜单,均数比较子菜单,统计分析菜单,一般线性模型子菜单,13,统计分析菜单,相关分析子菜单,统计分析菜单,回归分析子菜单,14,统计分析菜单,对数线性分析,生存分析,非参数检验,分类分析,15,作图菜单,条形图,线图,面积图,圆图,散点图,直方图,图形特性描述,高_低图,误差条图,箱图,16,工具菜单,变量信息,定义变量,使用变量,17,对话框介绍,变量类型设置对话框,变量标签设置对话框,18,SPSS系统设置,Edit/Options,可以对数据、表格、草稿、标题、数据编辑器、结果阅读器、草稿阅读器视图界面进行定义或修改。,19,数据库建立和结果输出,相关统计学概念(1)SPSS数据统计分析步骤数据库的建立数据编辑数据保存、转换和读取结果输出数据和结果打印,目录,20,相关统计学概念(1),总体(population):总体是根据研究目的确定的同质观察单位的全体,或者说是同质的所有观察单位某种观察值(变量值)的集合。样本(sample):样本是总体中随机抽取部分观察单位,其实测值的集合。随机抽样就是按随机化原则(即总体中每一个观察单位都有同等机会被选入到样本中来)获取样本,以避免误差和偏倚对研究结果有所影响。样本包含的观察单位称样本含量或样本大小(samplesize),也称样本例数。资料和变量(dataandvariable):研究者对每个观察单位的某项特征进行测量和观察,这种特征称为变量。对变量测得的值称变量值(valueofvariable)或观察值(observedvalue)亦称为资料。观察个体间的差异,称为变异(variation)。,21,定量资料(quantitativedata):数值变量(numericalvariable)其变量的值是定量的,表现为数值的大小,一般有度量衡。分类资料(categoricaldata):分类变量(categoricalvariable)其观察值是定性的,表现为互不相容的类别或属性。无序分类:阳性或阴性,治愈或未治愈有序分类:治愈、显效、好转、无效概率(probability):概率是描述随机事件发生的可能性大小的数值,常用P表示。随机事件概率的大小在0与1之间,既0P1。P值越接近于1,表示某事件发生的可能性越大;P值越接近于0,表示某事件发生的可能性越小。P=1表示事件必然发生,P=0表示事件不可能发生。P0.05称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。,22,SPSS数据统计分析步骤,输入供SPSS分析的数据,选择统计分析过程,为统计分析选择变量,运行过程并对统计结果做出判断,23,数据库的建立,问题举例:一个医生观察了一组住院病人,完成了其中24名患者的资料收集,指标包括:观察编号、住院号(inno)、年龄(age)、性别(sex)、身高(x1,cm)、体重(x2,kg)、血压(收缩压x3,舒张压x4,mmHg)、空腹血糖(x5,mmol/L)和胰岛素样生长因子-1水平(igf-1,ng/ml),并根据临床情况将患者的病情分为5级(x0,1为正常,2为一级,3为二级,4为三级,5为四级),建立其原始数据表。,数据分析:住院日期为日期变量病情分级为有序变量(Ordinal)性别为字符变量(innominal)其它各指标为连续变量(Scale)注意到igf-1指标中有个体数据丢失或实验误差,24,编号innoindateagesexx0 x1x2x3x4x5ifg-11551744210/21/199623.0男3166.052.5108788.90186.631771728110/16/199625.2女5160.060.090505.99230.321181726410/15/199626.4女4164.058.5100807.59117.451712099902/25/199728.0男2172.061.21107014.07105.74702479706/27/199732.0女2152.042.0118765.89135.89491720410/14/199633.9女2157.058.01468612.418.33641950301/23/199735.0男3167.068.0124767.94162.401662846010/20/199738.0女1153.550.5114628.81416.74174133210/26/199843.2男3174.080.01449412.60141.731582811710/09/199745.0女2155.067.01801105.76297.581461921812/17/199648.1男2178.069.0110727.44234.852404343712/21/199849.3男3173.069.0110709.80467.81422207503/31/199752.8男2163.062.01258014.87150.62722223904/07/199754.2男2167.572.0140907.80172.551953125701/08/199857.3女2143.541.51528813.530.00204091010/13/199858.8男2168.061.51107015.80120.42224196511/11/199862.8男2160.060.0140908.83160.37362468106/24/199765.6男3162.052.01667017.79180.41164123110/22/199867.4女2153.062.01408611.9417505/199968.9女1145.042.01085011.72160.331724554903/03/199971.1女4151.061.51509015.80145.97143697806/25/199872.3女2148.050.0966616.88181.51382486806/30/199773.0女2149.051.51167413.16129.26244357912/25/199874.6男4170.060.0160869.37350.09,原始数据表,25,数据编辑(1),剪切复制粘贴清除网格字体,File/New/Data,26,数据编辑(2),Data/InsertCase插入个体,27,数据编辑(3),Data/InsertVariable插入变量,28,数据编辑_变量设置(1),Width、Decimals、Column选项,通过微调按钮调整数值,29,数据编辑_变量设置(2),变量类型,数值(默认),逗号,点,科学记数,日期时间,货币,自定义数据类型,字符,30,数据编辑_变量设置(3),数值标签ValueLabels,数值,数值标签,31,数据编辑_变量设置(4),丢失值MissingValues,没有丢失值,离散丢失值,混合丢失值,连续值,离散值,32,数据编辑_变量设置(5),数据量度Measure,有序变量,名字变量,连续变量,33,数据保存、转换和读取,数据文件默认保存为*.savFile/SaveFile/SaveAs,可以将数据文件转换为其它格式如:*.xls*.dat*.dbfFile/SaveAs,数据文件读取:File/Open/Data直接读取*.sav文件或直接读取*.xls文件等数据文件,34,结果输出(1),激活结果阅读器SPSSViewerFile/New/Output,分析结果窗,分析结果目录窗,35,结果输出(2),选择分析过程,如:MeansAnalyze/CompareMeans/Means,36,修改选项内容:原文字为Mean更换为平均值,37,结果输出(3),统计分析_图表设置Graphs/Bar,38,图表结果输出:可以通过Copy复制到其它应用程序,或Export输出为图形文件*.jpg默认输出文件:*.spo,39,数据和结果打印,可以根据需要打印全部或部分数据,40,数据整理,个体排序行列转置合并文件选择个体加权个体,目录,41,个体排序,Data/SortCases,选择排序变量,升序,降序,复置,42,按住院号inno排序结果_升序,43,行列转置(Transpose),变量值转换为变量名,变量(Variable)转换为个体(Case),丢失的变量,复置,Data/Transpose,44,行列转换,丢失了name、sex变量,以id变量值作为新数据表变量,45,合并文件(MergeFile)-1,Data/Mergefiles/AddCases,46,合并文件_仅合并相同变量,47,Data/Mergefiles/AddVariables,合并文件(MergeFile)-2,48,合并文件_增加变量以主表为主合并所有个体,49,Data/Mergefiles/AddVariables,合并文件(MergeFile)-3,50,合并文件_增加变量以主表为准合并相同个体,51,选择个体(SelectCases),筛选某些符合特定条件的个体Data/SelectCases,全部个体,若满足条件,随机个体样本,基于时间或个体范围,应用变量过滤,52,条件表达式生成器,函数选择框,输入条件表达式,符号按钮框,53,若条件满足,过滤未满足条件的个体,54,Filter_$=0非选择个体Filter_$=1选择个体,55,删除未满足条件的个体,若条件满足,56,仅保留符合条件的个体不符合条件的个体被删除,不可恢复;因此必须将其另存为新的数据文件。,Sex=“女”and(x5=8andx51女-2,67,记数,Transform/Count,68,170男性,69,报表,实时分析处理立体表综合表行输出综合报告列输出综合报告,目录,70,实时多维分析立体表计算综合变量统计量,显示分组变量的统计量,但不能显示变量值综合表显示分组变量各分类下综合变量的统计量及变量值行输出综合报表以行的形式输出统计量,列变量为综合变量列输出综合报表以列的形式输出统计量,71,sexagesbp_bdbp_bsbp_0dbp_0sbp_10dbp_10sbp_20dbp_20sbp_30dbp_30group258160.0100.0150.094.0150.090.0146.090.0150.092.01251146.090.0130.080.0118.070.0110.070.0110.070.01247150.090.0145.075.0135.075.0130.060.0130.060.01170160.0100.0146.090.0140.090.0140.090.0140.090.01172150.096.0140.090.0140.090.0140.090.0140.090.01160170.0100.0148.076.0140.074.0136.072.0136.072.01252148.090.0120.080.0120.080.0120.080.0120.080.01255155.080.0140.085.0130.080.0130.085.0130.080.01177160.0100.0140.090.0140.090.0140.090.0140.090.01155150.094.0145.080.0140.080.0135.075.0135.075.01277165.090.0160.082.0155.080.0151.072.0140.070.01266150.0100.0130.090.0120.080.0120.080.0120.080.01262150.090.0140.086.0140.096.0140.082.0140.082.01263160.095.0150.085.0155.075.0140.070.0136.070.01267165.090.0145.080.0140.080.0135.075.0135.075.01,治疗前后两组病人血压原始数据表(治疗组):,说明:sex=性别(1为女,2为男),age=年龄,sbp_b=治疗前收缩压,dbp_b治疗前舒张压,sbp_0=治疗后0分钟收缩压,dbp_0治疗后0分钟舒张压,group=分组,72,sexagesbp_bdbp_bsbp_0dbp_0sbp_10dbp_10sbp_20dbp_20sbp_30dbp_30group265150.080.0150.080.0150.080.0150.080.0150.080.02269180.080.0180.080.0184.080.0184.080.0184.080.02263150.092.0146.090.0146.090.0146.090.0150.090.02265160.0100.0160.0100.0162.0100.0160.098.0160.098.02177170.095.0170.095.0170.095.0170.095.0170.095.02251150.090.0142.080.0142.080.0146.080.0146.080.02269170.0110.0166.0108.0170.0110.0170.0110.0170.0110.02160160.0100.0150.0100.0158.0100.0158.0100.0160.0100.02164170.0100.0168.098.0168.098.0170.0100.0170.0100.02258160.095.0160.095.0160.095.0160.095.0160.095.02160180.096.0180.096.0182.096.0182.096.0182.096.02253150.096.0150.096.0150.096.0150.096.0150.096.02267170.0100.0170.0100.0170.0100.0170.0100.0170.0100.02166150.090.0150.090.0154.092.0154.092.0154.092.02170160.0100.0158.096.0160.0100.0160.0100.0160.0100.02262155.094.0152.094.0155.092.0155.094.0155.094.02167164.098.0160.095.0160.095.0164.098.0164.098.02,续前表(对照组),73,实时分析处理立体表(OnlineAnalyticProcessingCubs),Analyze/Reports/OLAPCubs,综合统计变量,分组变量,拟统计内容,统计学内容,74,求均值和标准偏差(立体报表),75,求均值和标准偏差(立体表不同层统计结果),治疗组(1),对照组(2),男性组(整体),女性组(整体),76,取消层合并为平面报表,双击OLAPCubs表,Pivot/MoveLayertoRows,Pivot/MoveLayertoRows,或,Pivot/ResetPivotDefaults,还原表,77,综合表,Analyze/Reports/CaseSummaries,78,样本综合表(无分组),79,样本分组综合表,80,样本综合表(分类统计),不显示个体可进行分类统计,81,鼠标双击综合表上的对象可进行文字修改,Edit/SPSSPivotTableObject/Edit,82,行输出综合报告ReportSummariesinRows,行输出综合报告过程是以行的形式输出统计量,每个所选的变量都在报告中产生一列。,Analyze/Report/ReportSummariesinRows,分组排序方式,83,综合统计,选项,页面设置,标题,预览,格式化,显示个体数据,变量,数据列变量选择,分组变量选择,84,分组综合统计内容Summary,数据列格式化定义Format,85,分组格式定义Format,分组选项Options,分类间空行,每一分类从新一页开始,综合分析前的空行,页码从1开始,86,报表综合统计内容Summary,报表标题设置Titles,页眉,页脚,变量,87,行综合输出表结果,注意:行综合输出适合于多项统计分析结果的输出,88,列输出综合报告ReportSummariesinColumn,列输出综合报告过程是以列的形式输出统计量,每个所选的变量都在报告中产生一列。,Analyze/Report/ReportSummariesinColumn,插入统计合计值,89,列综合输出表结果,注意:列综合输出仅适合于单项统计分析结果的输出,90,统计描述,频数表分析(Frequencies过程)描述性统计分析(Descriptives过程)平均数分析(Means过程)探索性分析(Explore过程),统计分析包括统计描述和统计推断。统计描述是用统计图表、统计指标来描述资料的分布规律及其数据特征。,目录,91,频数(frequency):各组段内的数据个数,频数分布类型有正态,左偏态和右偏态算术均数(mean):总体均数,样本均数X几何均数(geometricmean):原始数据分布不对称,但经对数转换后呈对称分布的数据。几何均数G中位数(median):指将一组数值从小到大排序后居于中间位置的那个数值。中位数M极差(range):全距R,描述数据的分布范围,极差大说明数据分布较分散四分位数间距(inter-quartilerange):QU与QL的差距,相关统计学概念(2),92,百分位数(percentile):Px,如P25,P50等四分为数:QL(下四分位数,25%),QU(上四分位数,75%)方差(variance):样本方差S2,总体方差2标准差(standarddeviation):标准差S替代方差描述数据分布的离散程度变异系数(coefficientofvariation):CV,标准差与算术均数之比,它描述数据分布的相对离散程度。标准误(standarderror,SE)与均数的标准误(standarderrorofmean,SEM):均数的标准误与标准差成正比,与样本例数n的平方根成反比,93,频数表分析(Frequencies过程),Frequencies分析过程可产生频数分布图、条形图、饼图、直方图、计算任意百分位数、分布参数估计值、集中趋势与离散趋势等各项统计学指标。,Analyze/DescriptiveStatistics/Frequencies,统计,图表,格式化,显示频数表,94,某市1982年110名7岁男童的身高资料:,序号,数据cm,95,统计,图表,直方图,饼图,条形图,正态曲线,96,频数表,身高的各项统计学指标,集中趋势指标,离散趋势指标,偏度系数,峰度系数,分布参数估计值,四分位数,97,某城市7岁男童身高直方图,正态曲线,98,描述性统计分析(Descriptives过程),Descriptive分析过程可计算数值变量的描述性统计量:均数、总和、标准差、方差、全距、最小值、最大值、标准误、峰度系数、偏度系数及标准化(Z值、Z分数)。,Analyze/DescriptiveStatistics/Descriptives,99,Data/SelectCases/Ifconditionissatisfiedsex=男,Data/SelectCases/AllCases,100,平均数分析(Means过程),Means过程可分组计算指定变量的描述性计算如:均数、总和、标准差、方差、观察例数等;可进行单因素随机设计方差分析(One-wayanalysisofvariance)和线性检验(Testforlinearity)。,第一层:以病情分级进行分组,自变量列表,因变量列表,Analyze/CompareMeans/Means,101,第二层:以性别进行分组,均值个体数量标准差中位数,102,第一层:病情分级,第二层:性别,中位数,103,续前表,总病例统计值,104,40名麻疹易感儿的血凝抑制抗体滴度,平均抗体滴度统计表(平均滴度为1:64),105,第一步:建立分组变量,第二步:加权频数变量,106,几何均数,第三步:选择统计变量和分组变量,第四步:选择统计项目,107,探索性分析(Explore过程),Explor过程对数据进行探索性分析,包括数据描述、筛选、奇异值辨认和假设验证,提供整体或分组数据的概要性统计指标或图表,以了解数据的分布规律和特征以及亚组间的特征性差异。提供反应数据集中趋势的四种最大似然估计量、数据中前5位最大值和最小值、正态分布检验及正态分布Q-Q图、转换前和多种转换后的方差齐性检验及分布-水平散点图。,108,女性:66名281.14162.82339.26206.04214.19294.24120.37332.60191.95144.76207.67255.37419.86621.73984.81841.97330.86229.97273.67147.20179.07215.55203.72258.34100.4053.71684.86422.84655.12354.67462.16186.35206.41112.7181.71185.54218.39106.90141.48119.18160.2282.86180.46486.38228.43263.99398.2674.31359.48434.70579.99102.51280.48171.7586.32298.43412.01453.15478.4378.28374.38371.23147.26130.89301.08234.21男性:83名169.49125.82190.62262.67279.77181.48286.85262.20308.34101.09215.60822.86566.27207.51163.33193.32121.89182.52147.31269.30243.46225.86106.90123.27134.27118.60227.46148.01167.59166.06275.34119.80327.97100.61253.28290.93335.76147.37190.99196.50164.99131.27164.45183.7799.75189.96138.29215.07547.76412.64470.84400.32103.72111.13145.15142.1487.22111.95184.54102.6193.30237.02165.5180.73143.27130.38417.64401.25249.38120.31160.49256.92202.69347.91345.86727.5995.73404.00393.26427.08432.65321.65160.11,某医生测定了149名正常人的空腹血清胰岛素样因子-1水平:,109,Analyze/DescriptiveStatistics/Explore,统计指标,统计图,110,描述性统计指标,反映集中性趋势的4种似然估算量,奇异值,百分位值及Tukeys折点,均值可信限范围,所有分析均忽略缺失值个体,分析中检验变量含缺失值个体被忽略,缺失值作为分组之一,111,每个因变量分别做箱图,多个因变量在一个箱图中显示,茎-叶图,直方图,正态分布Q-Q图,方差齐性检验及分布-水平散点图,方差齐性的力度估计,数据转换,数据转换方式,112,描述性统计指标,113,反映集中性趋势的4种似然估算量,百分位值及Tukeys折点,114,奇异值,115,正态检验,方差正态检验,116,直方图-1,117,直方图-2,118,正态Q-Q图-1,期望正态分布直线,119,正态Q-Q图-2,期望正态分布直线,120,去势正态分布Q-Q图-1,期望正态分布直线,121,去势正态分布Q-Q图-2,期望正态分布直线,122,均数箱图,奇异值,P50均值,P25-P75,123,分布自然对数-水平自然对数散点图,数据转换力度不接近0,表示要使两组方差齐性,需做数据转换,124,数据转换,经数据转换后的方差正态齐性检验,选择自然对数转换,基于均数的显著性为0.1350.05,表示接受两组均数方差的假设,125,126,先进行IGF-1F数据转换(自然对数),127,数据转换(Ln)后的描述性统计指标,128,数据转换(Ln)后的百分位值及Tukeys折点,数据转换(Ln)后的4种似然估算值,129,数据转换(Ln)后的奇异值,130,数据转换(Ln)后的正态检验,数据转换(Ln)后的方差正态齐性检验,两组间方差齐性P0.05,131,数据转换(Ln)后的直方图,正态分布,132,数据转换(Ln)后的正态分布Q-Q图,接近期望正态分布直线,133,数据转换(Ln)后的去势正态分布Q-Q图,接近期望正态分布直线,134,T检验,单样本T检验独立样本T检验配对样本T检验,目录,135,相关统计学概念(3),假设检验(hypothesistest)也称显著性检验(significancetest)1、建立检验假设(hypothesisundertest):无效假设,=0(样本均数=总体均数)H02、建立备择假设(alternativehypothesis):H1,若H0被否决,则H1成立。3、设定检验水准(sizeoftest)或称显著性水准(significancelevel):=0.05(方差齐性检验=0.10,正态性检验=0.20)4、确定P值,作出推断:推断结论包括统计结论和专业结论,统计结论说明有统计学意义(statisticalsignificance)或无统计学意义(nostatisticalsignificance),若P,则拒绝H0,接受H1,有统计学意义(统计结论);则可认为不同或不等(专业结论)。假设检验的方法:t检验(t-test或称Studentst-test)和u检验(,136,u-test或称Z-test)。t检验应用条件:当样本量较小时(如n50),理论上要求样本取自正态总体,两小样本均数比较时要求两样本总体方差相等。u检验的应用条件:样本含量n较大,或n虽小但总体标准差已知。单样本t检验(onesample/groupt-test):即样本均数代表的未知总体均数和已知总体均数0(一般为理论值、标准值或经过大量观察所得的稳定值)的比较。配对t检验(pairedt-testfordependentsamples):两种情况(1)两个同质受试对象分别接受两种不同的处理;(2)同一受试对象分别接受两种不同的处理。配对t检验设两种处理的效应相同,即1=2,则1-2=0(即已知总体0)。两样本t检验(tow-samplet-testforindependentsamples):完全随机设计两样本均数的比较。当关心两总体均数1,2是否相等时,理论上应考虑是否两总体方差相同,即齐性方差(homogeneity),若相等直接接受t检验。,137,单样本T检验(One-sampleTTest),SPSS的One-sampleTTest过程用于执行单样本T检验,它是进行单变量均数与一常数或假设值的比较,要求单变量为定量变量(数值型变量)。,Analyze/CompareMeans/One-sampleTTest,检验变量,检验值,138,T检验:样本均数与总体均数的比较,问题:正常人的脉搏平均72次/分,现测得10例某病患者的脉搏(次/分):54,67,68,78,70,66,67,70,65,69,试问此病患者与正常人有无显著性差别?,结论:因t=-2.453,df=9,P=0.0370.05,有统计学意义;故此病患者与正常人脉搏有显著性差异。,139,问题:某市1982年110名7岁男童的身高(cm)如下表,试估计该市7岁男童身高的95%可信区间。,不设检验值,140,T检验:总体均数的可信区间估计,结论:因t=-264.848,df=109,双侧概率P0.05,可认为两总体方差相等。取t=2.524,df=22,P=0.0190.05,可认为该地克山病患者与健康人的血磷值之间有统计意义。,两独立样本均数比较,144,两独立样本几何均数比较,问题:选甲型流感病毒抑制抗体滴度(倒数)0.05,可认为两总体方差相等。取t=-2.934,df=22,P=0.0080.05,可认为两种方法的免疫效果差别之间有统计意义。,146,配对样本T检验,SPSS的Paired-SamplesTTest过程用于执行配对样本均数的比较。,Analyze/CompareMeans/Paired-SamplesTTest,问题:某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近配成对子,共8对并将每对种的两头动物随机分到正常饲料组和维生素E缺乏组,经一定时期将大白鼠杀死,测得其肝中维生素A的含量,结果如下。问不同饲料的大白鼠肝中维生素A含量有无差别?大白鼠对号(1):12345678正常饲料组(x1):35502000300039403800375034503050维生素E缺乏组(x2):24502400180032003250270025001750,147,配对样本均数比较,配对变量,148,结论:相关系数=0.584,P(sig.)=0.129,认为两配对变量无相关关系。t=4.207,df=7,P=0.0040.05,拒绝H0,接受H1,可以认为各组方差齐同,156,方差分析表,结论:组间F值=MS组间/MS组内=84.544,根据第一和第二自由度得P0.0005,按=0.05检验水准,拒绝H0,接受H1,可认为各组总体均数不等或不全等;线性趋势检验MS未加权/MS加权一致,F=9.165组间/1.534组内=167.259,根据第一和第二自由度得P0.0005,按=0.05检验水准,拒绝H0,接受H1,可认为三组别值与各组均数间呈线性趋势;偏离线性趋势检验F=0.100组间/1.534组内=1.829,根据第一和第二自由度得P0.187,按=0.05检验水准,接受H0,可认为偏离线性无统计学意义。,157,各组肺活量两两比较表,星号表示均数的差别在=0.05检验水准上有统计学意义,因各组方差齐同,故不选择TamhanesT2法检验,158,各组均数趋势图,结论:各组肺活量均数随分类值(分组值)的增大而增加呈线性趋势,159,随机区组设计的两因素方差分析,广义线性模型(GLM)中的单变量(Univariate)过程可以进行双因素和多因素方差分析、协方差分析和线性回归分析。适用条件:1、各样本是相互独立的随机样本;2、各样本来自正态;3、各样本的总体方差齐同;4、单个因变量为连续型变量;5、单个或以上因素为分类变量;6、单个或以上的协变量(Covariate)为连续变量。,Analyze/GenerallinearModel/Univariate,GLM-单变量过程,160,问题:在不同的室温下测定家兔的血糖浓度。室温分七组,家兔分四个种属,每一种属七只,见下表。问不同温度的血糖浓度有无差别及不同水平血糖浓度均数的变化趋势?,161,Analyze/GenerallinearModel/Univariate,因变量,固定因素,随机因素,协变量,加权变量,模型,参照值,绘图,因素各水平两两比较,162,全析因模型,自定义模型,因素和协变量,效应选择,平方和,模型中包含截距,163,参照类型:Polynomial多项式模型趋势检验,参照分类,164,假定方差齐同时的两两比较方法选项,假定方差不齐时的两两比较方法选项,因素,两两比较检验因素,165,因素室温和因素家兔种属及其各水平值和例数,方差分析表,因素室温的F=MS室温/MS家兔种属=18.866,根据第一自由度df1=3和第二自由度df2=18得P0.0005;按=0.05检验水准,可认为不同室温的血糖浓度总体不等或不完全相等。,同左下道理因素家兔种属,P0.0005;按=0.05检验水准,可认为不同家兔种属(区组)的血糖浓度总体不等或不完全相等,故该区组因素(控制因素)不容忽略。,166,期望均方表,检验结果表,类似方差分析表因素室温变异和残差,167,多项式参照模型,线性,二次(抛物线),三次,四次,模型指标,因变量值,六个模型中,假定值均相同都等于0,故参照估计值和差值相等;参照估计值和差值以二次模型最大,同时P值最小故取其模型;按=0.05检验水准,可认为不同室温水平与其血糖浓度均数呈抛物线模型趋势。,168,Tukey法的不同室温均数两两比较表,星号表示均数差别在=0.05检验水准上有统计学意义,169,Tukey法的均衡子集表,每个均衡子集内的各组均数比较均无统计学意义,170,问题:用A和B两种药治疗贫血病人,治疗一个月测得血中红细胞增加数(百万/mm3)。12名性别、年龄和病情都一致的病人,按A和B两药的使用与否分成四组。结果如下表,问A和B单独使用的治疗效果如何?两药同时使用的治疗效果如何?,析因(有重复数,平衡数据)设计的双因素方差分析,171,Analyze/GenerallinearModel/Univariate,因变量,固定因素,随机因素,协变量,加权变量,模型,参照值,绘图,因素各水平两两比较,172,因素,水平轴,分离线,分离图,绘图,173,估计边缘均数,显示边缘均数,残差图,拟合度不足,设定检验水准,参照系数矩阵,因素和因素交互效应栏,174,因素A和因素B及其各水平值和例数,因素A和因素B的描述性统计,A药和B药同时使用红细胞增加的均数为210万/mm3单独使用A药红细胞增加的均数为120万/mm3单独使用B药红细胞增加的均数为100万/mm3都不使用红细胞增加的均数为80万/mm3,175,方差齐性检验,方差分析表,P=1.000,按=0.05检验水准,接受H0,可认为各格子方差齐同。,同上道理推出:使用和不使用B药的红细胞增加总体均数不等。A药和B药存在交互作用。,因素AP0.05,可认为均数比较无统计学意义。绣品厂与蓄电池厂、电视机厂与蓄电池厂、蓄电池厂与绣品厂、蓄电池厂与电视机厂比较,P0.05,可认为各格子总体方差齐同,193,方差分析表,协变量饲料P0.05,可认为用不同饲料喂养白鼠的增重调整均数相等观察效能饲料=1.000,可认为的检验效能很大,协变量饲料无须增加标本含量;观察效能饲料=0.064,可认为的检验效能很小,即使增加样本含量也难于得出显著差异结果,194,参数估计值表,公共回归系数不为零,边缘均数表,消除协变量对增重的影响,显示调整后的均数、标准误及95%可信区间,195,完全随机区组设计的协方差分析,核黄素缺乏组X1:256.9271.6210.2300.1262.2304.4272.4248.2242.8342.9356.9198.2核黄素缺乏组增重Y1:27.041.725.052.014.548.848.09.537.056.576.09.2限食量组X2:260.3271.1214.7300.1269.7307.5278.9256.2240.8340.7356.3199.2限食量组增重Y2:32.047.736.765.039.037.951.526.741.061.3102.18.1不限食量组X3:544.7481.2418.9556.6394.5426.6416.1549.9580.5608.3559.6371.9不限食量组增重Y3:160.396.1114.6134.876.372.899.4133.7147.0165.8169.854.3,问题:在“核黄素缺乏对于蛋白质利用的影响之研究”中,将体重相近(3438克),出生三周的大白鼠36只,按照窝别分成12窝,每窝三只,随机分到核黄素缺乏组(1),限食量组(2)和不限食量组(3)进行喂养。观察记录的数据如下表,观察不同饲料对体重增长的影响?,196,因变量,固定因素,随机因素,协变量,加权变量,模型,参照值,绘图,因素各水平两两比较,197,全析因模型,自定义模型,因素和协变量,效应选择,平方和,模型中包含截距,198,估计边缘均数,显示边缘均数,设定检验水准,因素和因素交互效应栏,参数估计值,比较主效应,多重比较检验方法之一。基于Studentst统计量,199,因素分组和因素区组及其各水平值和例数,各方差分量的系数和计算期望均方的公式,200,应变量增量的描述性统计,201,方差分析表,因素分组P0.05,可认为不同分组的增重总体调整均数相等因素区组P0.05,可认为用不同区组的增重总体均数不等或不全等,故该区组因素(控制因素)不容忽略协变量饲料P0.05,可认为不同分组的增量总体调整均数相等,205,相关分析,Pearson相关分析Spearman等级相关分析偏相关分析,目录,206,相关统计学概念(5),所谓“相关关系”,既变量之间既存在密切的关系,又不能由一个(或几个)变量的数值精确地求出另一个变量的值,我们就定义这类变量之间的关系为“相关关系”。负相关一个量的增长导致另一个量的下降。正相关一个量的增长同时促使另一个量的增长。相关系数(CorrelationCoefficient)是一个介于-1与1之间的值。如果两个量之间的相关系数为-1,则为“绝对负相关”;若两个量之间的相关系数为1,则为“绝对正相关”;相关系数为0时,表示二者没有关联关系。测量二元分布的相关性的主要公式是Pearson公式。,207,相关分析是研究两个随机变量之间相互关联的密切程度。当两个变量都服从正态分布资料时,可选用Pearson相关系数。当其中一个甚至两个变量都不服从正态分布,可选用Spearman等级相关系数。偏相关系数是在其它变量固定的条件下,某两个变量之间是相关关系,从而排除了其它自变量的干扰作用。SPSS使用Bivariate过程计算Pearson相关系数和Spearman等级相关系数。用Partial过程计算偏相关系数,并对偏相关系数进行假设检验。,AnalyzeCorrelateBivariate,AnalyzeCorrelatePartial,208,AnalyzeCorrelateBivariate,Pearson相关分析,问题:某地一年纪12名女大学生的体重(kg)X与肺活量(L)Y数据如下表,试计算肺活量与体重的相关系数,并检验两者间是否有直线相关关系?,体重(X):424246464650505052525858肺活量(Y):2.552.202.752.402.802.813.413.103.462.853.503.00,209,210,相关系数类型,假设检验选项,用*或*标记在=0.05或=0.01水平有统计学意义的相关系数,211,Pearson相关系数为0.749,P=0.005,按=0.05水准,拒绝无效假

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论