SPSS13.0专业知识讲座_第1页
SPSS13.0专业知识讲座_第2页
SPSS13.0专业知识讲座_第3页
SPSS13.0专业知识讲座_第4页
SPSS13.0专业知识讲座_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS统计软件简介东南大学公共卫生学医疗保险系张iaacenter@第1页1.

SPSS介绍2.

数据输入与保存——文献建立与编辑——变量及变量操作3.

SPSS信息输入、输出4.

SPSS表格与图形5.

图形编辑功能6.

SPSS编程与自动化7.

SPSS统计功能之一:样本描述与数据准备8.

SPSS统计功能之二:假设检查、非参数统计9.

SPSS统计功能之三:有关与回归分析10.

SPSS统计功能之四:多元统计分析(介绍)第2页SPSS是软件英文名称首字母缩写,原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”。不过伴随SPSS产品服务领域扩大和服务深度增加,SPSS公司已于2023年正式将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务处理方案”,标志着SPSS战略方向正在做出重大调整。第3页功能强大、实用与美观统一

视窗格调——SPSS最突出特点就是操作界面极为友好,他使用Windows窗口方式展示多种管理和分析数据办法功能,使用对话框展示出多种功能选择项,只要掌握一定Windows操作技能,粗通统计分析原理,就能够使用该软件为特定科研工作服务。输出成果十分美观美丽(从国外角度看),存放时则是专用SPO格式,能够转存为HTML格式和文本格式。第4页在众多顾客对国际常用统计软件SAS、BMDP、GLIM、GENSTAT、EPILOG、MiniTab总体印象分统计中,其诸项功能均取得最高分

。第5页非专业统计人员首选统计软件SPSS采取类似EXCEL表格方式输入与管理数据,数据接口较为通用,能方便从其他数据库中读入数据。其统计过程包括了常用、较为成熟统计过程,完全能够满足非统计专业人士工作需要。第6页非专业统计人员首选统计软件对于熟悉老版本编程运行方式顾客,SPSS还尤其设计了语法生成窗口,顾客只需在菜单中选好各个选项,然后按“粘贴”按钮就能够自动生成标准SPSS程序,极大方便了中、高级顾客。第7页SPSS基本特点数据自动处理强大统计功能完全Windows格调良好帮助系统合自学功能简单编程完美图形处理功能丰富数据对接功能支持DLE与Active技术内置VBA客户语言强大函数功能Intenet功能

第8页SPSS功能样本数据描述和预处理;假设检查(包括参数检查、非参数检查及其他检查);方差分析列联表有关分析回归分析对数线性分析聚类分析鉴别分析因子分析对应分析时间序列分析生存分析可靠性分析第9页SPSS由多种模块组成(和SAS相同),SPSS11版一共由十个模块组成,其中SPSSBase为基本模块,其他九个模块为AdvancedModels、RegressionModels、Tables、Trends、Categories、Conjoint、ExactTests、MissingValueAnalysis和Maps,分别用于完成某一方面统计分析功能,他们均需要挂接在Base上运行。除此之外,SPSS11完全版还包括SPSSSmartViewer和SPSSReportWriter两个软件,他们并未整合进来,但功能上完全是SPSS辅助软件。最新推出SPSS12.0除了原有十个模块外,又新增了复杂抽样模块,能从您调查数据中得到更多精确分析成果。第10页历史20世纪60年代1975年在芝加哥组建了SPSS总部。

1984年SPSS总部首先推出了世界上第一种统计分析软件微机版本SPSS/PC+1994至1998年间,SPSS公司陆续购并了SYSTAT公司、BMDP软件公司、Quantime公司、ISL公司等,并将各公司主打产品收纳SPSS旗下,从而使SPSS公司由本来单一统计产品开发与销售转向公司、教育科研及政府机构提供全面信息统计决策支持服务,成为走在了最新流行“数据仓库”和“数据挖掘”领域前沿一家综合统计软件公司。

第11页应用广泛应用于统计、应用数学、经济、市场营销、心理、卫生统计、生物、公司管理、气象、社会学等领域。其分析过程包括:调查设计、数据搜集、数据存取和管理、数据分析、数据检查、数据挖掘、数据展示等。尚有一系列附加模块和独立模块产品以加强它分析功能。它图形窗口界面使其非常简单易用但却具有满足多种分析要求数据管理、统计分析功能及多种报表办法。第12页缺陷由于在SPSS公司产品线中,SPSS软件属于中、低级(SPSS公司共有二十余个产品),因此从战略观点来看,SPSS显然是把相称精力放在了顾客界面开发上。该软件只吸取较为成熟统计办法,而对于最新统计办法,SPSS公司做法是为之发展某些专门软件,如针对树构造模型AnswerTree,针对神经网络技术NeuralConnection、专门用于数据挖掘Clementine等,而不是直接纳入SPSS,因此他们在SPSS中均难觅芳踪。另外,其输出成果虽然美丽,但不能为WORD等常用文字处理软件直接打开,只能采取拷贝、粘贴方式加以交互。这些都能够说是SPSS软件致命伤。

第13页数据输入与保存SPSS界面定义变量输入数据保存数据第14页例某克山病区测得11例克山病患者与13名健康人血磷值(mmol/L)如下,问该地急性克山病患者与健康人血磷值是否不一样(卫统第三版例4.8)?编号克山病患者编号健康人10.8410.5421.0520.6431.2030.6441.2040.7551.3950.7661.5360.8171.6771.1681.8081.2091.8791.34102.07101.35112.11111.48121.56131.87第15页数据文献管理建立与保存数据文献(File菜单)新建数据文献直接打开使用数据库查询打开使用文本导入向导读入文本文献打开其他格式数据文献保存数据文献File菜单中其他条目第16页10个下拉式菜单主菜单汉字名称备注File文献操作介绍Edit数据编辑重点介绍View观测(视图)

Data建立数据与数据整顿重点介绍Transform变量转换重点介绍Analyze统计分析重点介绍Graphs绘图重点介绍Utilities实用程序重点介绍Windows视窗控制

Help在线帮助

第17页数据预分析数据简单描述绘制直方图按题目要求进行统计分析保存和导出分析成果保存文献导出分析成果第18页数据文献管理编辑数据文献定义新变量直接定义新变量从原有变量计算新变量-Transform菜单数据录入直接录入数据录入技巧深入整顿数据文献-Data菜单第19页程序编辑窗口使用方法详解程序编辑窗口界面邂逅Paste按钮用程序编辑窗口加快我们工作用程序编辑窗口完成对话框无法完成工作第20页SPSS成果窗口使用方法详解1成果窗口元素介绍成果浏览窗口(Viewer)成果初稿浏览窗口(DraftViewer)如何美化你输出成果--SPSS选项设置2驾驭成果浏览窗口成果窗口一般操作成果导出如何在WORD等软件中使用输出成果3文本输出成果编辑4表格编辑办法详解1基本操作特色菜单内容详解5图片编辑办法详解基本操作特色菜单内容详解

第21页SPSS统计绘图功能详解1常用统计图操作界面介绍(条图)1条图通用界面2复式条图与分段条图界面其他常用统计图1散点图2线图3饼图4面积图5直方图6其他常用统计图编辑办法详解2交互式统计图3统计地图第22页条图散点图线图直方图饼图面积图箱式图正态Q-Q图正态P-P图质量控制图Pareto图自回归曲线图高低图

交互有关图序列图频谱图误差线图

第23页朴素美削尖脑袋模样墙上长满了爬山虎太阳照在红墙内外反客为主蓝飘带我没有放倒!第24页第25页描述性统计分析-DescriptiveStatistics菜单详解1Frequencies过程1界面说明2分析实例3成果解释2Descriptives过程界面说明成果解释3Explore过程界面说明成果解释4Crosstables过程界面说明分析实例成果解释

第26页Frequencies过程

例某地101例健康男子血清总胆固醇值测定成果如下,请绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M、p2.5和p97.5(卫统第三版p2331.1题)。4.773.376.143.953.564.234.314.715.694.124.564.375.396.305.217.225.543.935.214.125.185.774.795.125.205.104.704.743.504.694.384.896.255.324.504.633.614.444.434.254.035.854.093.354.084.795.304.973.183.975.165.105.864.795.344.244.324.776.366.384.885.553.044.553.354.874.175.855.165.094.524.384.314.585.726.554.764.614.174.034.473.403.912.704.604.095.965.484.404.555.383.894.604.473.644.345.186.143.244.903.05

第27页步骤Analyze==>DescriptiveStatistics==>FrequenciesVariables框:选入X单击Statistics钮:

选中Mean、Std.deviation、Median复选框

单击Percentiles:输入2.5:单击Add:输入97.5:单击Add:

单击Continue钮

单击Charts钮:

选中Barcharts单击Continue钮

单击OK第28页Descriptives过程

【Statistics钮】Descriptives复选框:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数标准误、偏度系数、偏度系数标准误及指定均数可信区间。M-estimators复选框:作中心趋势粗略最大似然确定,输出四个不一样权重最大似然确定数。Outliers复选框:输出五个最大值与五个最小值。Percentiles复选框:输出第5%、10%、25%、50%、75%、90%、95%位数。【Plot钮】Boxplots单选框组:确定箱式图绘制方式,能够是按组别分组绘制(Factorlevelstogether),也能够不分组一起绘制(Depentendstogether),或者不绘制(None)。Descriptive复选框组:能够选择绘制茎叶图(Stem-and-leaf)和直方图(Histogram)。Normalityplotswithtest复选框:绘制正态分布图并进行变量是否符合正态分布检查。Spreadvs.LevelwithLeveneTest单选框组:当选择了分组变量时,绘制spread-versus-level图(我还没有找到他汉字名字该叫什么),设置绘图时变量转换方式,并进行组间方差齐性检查。【Options钮】用于选择对缺失值处理方式,能够是不分析有任一缺失值统计、不分析计算某统计量时有缺失值统计,或报告缺失值。第29页Crosstabs过程

例6.2某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种办法治疗效果有没有差异(医统第二版P37例3.10)?处理愈合未愈合合计呋喃硝胺54862甲氰咪胍442064合计9828126第30页步骤Data==>WeightCasesWeightCasesby单选框:选中

FreqencyVariable:选入W单击OK钮

Analyze==>DescriptiveStatistics==>CrosstabsRows框:选入RColumns框:CStatistics钮:Chi-square复选框:选中:单击Continue钮

单击OK钮第31页均数间比较-CompareMeans菜单详解1Means过程界面说明成果解释2One-SamplesTTest过程界面说明成果解释3Independent-SamplesTTest过程界面说明成果解释4Paired-SamplesTTest过程1界面说明2分析实例3成果解释5One-WayANOVA过程1界面说明2分析实例3成果解释

第32页Paired-SamplesTTest过程

某单位研究饮食中缺乏维生素E与肝中维生素A含量关系,将同种属大白按性别相同,年纪、体重相近者配成对子,共8对,并将每对中两头动物随机分到正常饲料组和维生素E缺乏组,过一定期期将大白鼠杀死,测得其肝中维生素A含量,问不一样饲料大白鼠肝中维生素A含量有没有差异(卫统第三版例4.5)?

大白鼠对号

正常饲料组

维生素E缺乏1

3550

24502

2023

24003

3000

18004

3950

32005

3800

32506

3750

27007

3450

25008

3050

1750第33页一般线性模型――GeneralLinearModel菜单详解1两原因方差分析univarate对话框界面说明成果解释2协方差分析分析步骤成果解释3其他较简单方差分析问题4多元方差分析分析步骤成果解释5反复测量方差分析Repeatedmeasures对话框界面说明成果解释

第34页两原因方差分析

例对小白鼠喂以A、B、C三种不一样营养素,目标是理解不一样营养素增重效果。采取随机区组设计办法,以窝别作为划分区组特性,以消除遗传原因对体重增加影响。现将同品系同体重24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量成果(克)列于下表,问小白鼠经三种不一样营养素饲养后所增体重有没有差异?区组号A营养素B营养素C营养素150.1058.2064.50247.8048.5062.40353.1053.8058.60463.5064.2072.50571.2068.4079.30641.4045.7038.40761.9053.0051.20842.2039.8046.20第35页步骤Analyze==>GeneralLinealmodel==>UnivariateDependentVariable框:选入weightFixedFactors框:选入group和foodModel钮:单击Custom单选钮:选中Model框:选入group和food单击OKPostHoc钮:单击PostHoctestfor框:选入foodSNK复选框:选中单击OK单击OK第36页协方差分析

某医生欲理解成年人体重正常者与超重者血清胆固醇是否不一样。而胆固醇含量与年纪有关,资料见下表。

正常组超重组年纪(X1)胆固醇(Y1)年纪(X2)胆固醇(Y2)483.5587.3334.6414.7515.8718.4435.8768.8444.9495.1638.7334.9493.6546.7425.5656.4404.9396.0475.1527.5414.1456.4414.6586.8565.1679.2第37页步骤Analyze==>GeneralLinealmodel==>UnivariateDependentVariable框:选入cholFixedFactors框:选入groupModel钮:单击Custom单选钮:选中Model框:选入group、age和group*age(后者用interaction办法就可选入)Sumofsquares列表框:改为ModelI单击OK单击OK第38页有关分析――Correlate菜单详解1Bivariate过程界面说明分析实例成果解释2Partial过程界面说明成果解释3Distances过程

第39页多元线性回归与曲线拟合――Regression菜单详解1Linear过程1简单操作入门界面详解输出成果解释2复杂实例操作分析实例成果解释2CurveEstimation过程1界面详解2实例操作3BinaryLogistic过程1界面详解与实例2成果解释3模型深入优化与简单诊断1模型深入优化2模型简单诊断第40页非参数检查――NonparametricTests菜单详解1

概论2

One-SampleKolmogorov-SmirnovTest3

Two-Independent-SamplesTests

第41页生存分析--Survival菜单详解1LifeTables过程界面说明成果解释2Kaplan-Meier过程界面说明成果解释3CoxRegression过程界面说明成果解释4Coxw/Time-DepCov过程界面说明成果解释第42页第一讲:SPSS介绍,界面入门、数据管理要求:理解SPSS系统组成,掌握数据管理界面一般操作,熟悉常用数据转换命令使用方法。重点:能够独立完成在SPSS中建库、录入数据、计算新变量、筛选变量等操作,重点考查下列过程:compute、sort、split、weight、mergefiles。懂得如何使用粘贴命令自动生成SPSS程序。第43页第二讲:SPSS成果浏览窗口使用方法详解、统计绘图功能详解要求:熟悉SPSS成果窗口常用操作办法,掌握输出成果在文字处理软件中使用办法。掌握常用统计图(线图、条图、饼图、散点、直方图等)绘制办法,熟悉其他统计图绘制办法,熟悉统计图一般编辑办法。重点:能对分析成果进行编辑、输出。重点考查下列内容:成果表格编辑、在word中使用成果、成果导出。能够独立判断遇到统计问题应当采取何种统计图形,并用SPSS独立完成多种常用统计图绘制。能根据目标对统计图进行一定编辑。重点考查下列内容:统计图形正确选用,条图绘制和编辑,散点图绘制和编辑,其他多种统计图特色编辑功能。第44页第三讲:统计基础知识及其在SPSS中实现要求:熟悉和初步掌握基础统计概念、过程和办法:单变量统计、双变量统计、多变量统计。SPSS中有关这些统计知识和过程帮助及实现:理解SPSS对统计概念和办法系统诠释、SPSS若干统计过程及基本功能介绍。第45页第四讲:统计描述,多项选择题分析,均数间比较要求:掌握常用描述性指标计算办法,熟悉分类数据两种录入格式,掌握多项选择题常用指标和分析办法。掌握成组、配伍t检查、单原因方差分析操作办法和成果阅读。重点:能够正确选用合适统计过程求出均数、标准差等多种常用描述指标。能独立对多项选择题进行正确描述。能够用SPSS独立进行成组、配伍t、u检查、一元方差分析,能根据分析目标正确选择两两比较办法。第46页第五讲:卡方检查,有关分析,回归分析要求:熟悉分类数据多种常用检查成果(成组卡方、配对卡方、分层卡方)计算办法,掌握输出成果中各部分正确含义并能正确选择所需成果。掌握有关分析和回归分析操作,掌握其成果阅读。重点:能用正确数据格式完成成组、配对卡方检查和分层卡方检查,能从成果中选择正确概率值。能用SPSS独立完成简单有关分析与回归分析,能正确阅读其分析成果。第47页SPSS初中级培训班课程大纲

SPSS北京办事处第48页第一讲:SPSS介绍,界面入门、数据管理要求:

理解SPSS系统组成,掌握数据管理界面一般操作,熟悉常用数据转换命令使用方法。

考查目标:

能够独立完成在SPSS中建库、录入数据、计算新变量、筛选变量等操作,重点考查下列过程:compute、sort、split、weight、mergefile。

懂得如何使用粘贴命令自动生成SPSS程序。第49页第二讲:SPSS成果浏览窗口使用方法详解、统计绘图功能详解要求:

熟悉SPSS成果窗口常用操作办法,掌握输出成果在文字处理软件中使用办法。

掌握常用统计图(线图、条图、饼图、散点、直方图等)绘制办法,熟悉其他统计图绘制办法,熟悉统计图一般编辑办法。考查目标:

能对分析成果进行编辑、输出。重点考查下列内容:成果表格编辑、在word中使用成果、成果导出。

能够独立判断遇到统计问题应当采取何种统计图形,并用SPSS独立完成多种常用统计图绘制。能根据目标对统计图进行一定编辑。重点考查下列内容:统计图形正确选用,条图绘制和编辑,散点图绘制和编辑,其他多种统计图特色编辑功能。第50页第三讲:统计描述,多项选择题分析要求:

掌握常用描述性指标计算办法,熟悉分类数据两种录入格式,掌握多项选择题常用指标和分析办法。考查目标:

能够正确选用合适统计过程求出均数、标准差等多种常用描述指标。能独立对多项选择题进行正确描述。第51页第四讲:卡方检查,均数间比较,非参数检查要求:

熟悉分类数据多种常用检查成果(成组卡方、配对卡方、分层卡方)计算办法,掌握输出成果中各部分正确含义并能正确选择所需成果。

熟悉SPSS提供用于测量变量间关联度指标体系分类。

掌握成组、配伍t、u检查操作办法和成果阅读。

熟悉用SPSS进行非参数统计分析做法,掌握成果阅读。考查目标:

能用正确数据格式完成成组、配对卡方检查和分层卡方检查,能从成果中选择正确概率值。

能够用SPSS独立进行成组、配伍t、u检查、一元方差分析,能根据分析目标正确选择两两比较办法。

能正确判断是否应使用非参数检查,能正确阅读多种非参数检查统计分析成果。第52页第五讲:方差分析模型要求:

掌握单原因方差分析数据格式、操作办法与成果阅读,熟悉方差分析中多种两两比较办法选择、操作和成果阅读。

掌握一元多原因方差分析模型原理、操作和分析成果阅读,掌握对应图形工具在分析中应用。

熟悉多元方差分析模型和反复测量方差分析模型原理和操作办法,掌握这二者分析成果阅读。考查目标:

能够用SPSS独立进行一元多原因方差分析模型统计分析,能独立、正确阅读多元方差分析模型和反复测量方差分析模型统计分析成果。

重点考查内容:一元多原因方差分析模型为考查重点,详细有对话框操作、分析成果阅读、均数图、两两比较办法选择和成果阅读。第53页第六讲:有关分析、多元线性回归与Logistic回归分析要求:

掌握有关分析、偏有关分析操作与成果阅读。

掌握多元线性回归模型原理、分析步骤、操作和成果阅读,重点掌握逐渐、前进、后退三种筛选办法含义与使用方法、分析成果阅读,熟悉多种常用模型诊断工具(分类图等)使用方法。

掌握二分类Logistic回归模型原理、分析步骤、操作和成果阅读。

理解其他回归模型原理、分析步骤、操作和成果阅读。考查目标:

能用SPSS独立完成简单有关分析、多元线性回归与Logistic回归模型分析,能正确阅读其分析成果,能利用常用模型诊断工具对模型拟和情况进行初步诊断。重点考查:回归分析时变量筛选、回归分析成果和Logistic模型分析成果阅读,变量是否满足回归分析要求判断。第54页第七讲:聚类分析,鉴别分析要求:

掌握迅速聚类和系统聚类操作,理解多种距离,掌握其成果阅读。

理解鉴别办法分类,熟悉鉴别分析适用条件和成果验证办法,掌握鉴别分析操作,重点掌握成果阅读。考查目标:

能按要求将样本进行分类,重点考查对冰柱图和树状图成果解释。

能独立判断数据是否符合鉴别分析适用条件,能求出对应鉴别式,并使用他对新纪录进行分类。重点考查对成果阅读(领域图、未标化典型鉴别函数、Bayes鉴别函数)和使用分析成果对新纪录进行分类。第55页第八讲:因子分析,生存分析要求:

熟悉因子分析(主成份分析)用途、目标,掌握如何判断因子分析适用条件,能正确选择合适因子。熟悉因子旋转含义并能正确使用。掌握分析成果阅读。

理解寿命表法、K-M曲线一般操作办法,重点掌握成果阅读。

掌握Cox模型原理、操作办法和成果阅读。考查目标:

能独立使用SPSS进行因子分析处理实际问题,能够正确阅读分析成果。重点考查因子数目确实定和成果阅读。

独立完成简单寿命表法、K-M法和复杂COX模型分析,能正确阅读分析成果。重点考查COX模型操作,分析成果阅读。第56页

例11.1某研究人员在探讨肾细胞癌转移有关临床病理原因研究中,搜集了一批行根治性肾切除术患者肾癌标本资料,现从中抽取26例资料作为示例进行logistic回归分析(本例来自《卫生统计学》第四版第11章)。i:标本序号x1:确诊时患者年纪(岁)x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级x3:肾细胞癌组织内微血管数(MVC)x4:肾癌细胞核组织学分级,由低到高共4级x5:肾细胞癌分期,由低到高共4期y:肾细胞癌转移情况(有转移y=1;无转移y=0)。第57页标本序号i年纪x1VEGFx2MVCx3分级x4分期x5癌转移y159243.4210236157.211036121902104583128431555380341661194.421073817611084212403209501741101058368.622011683132.84201225294.643113521561101431147.82101536331.63111642166.221017143138.6331183211142301935140.221020703177.24312165251.64412245212424023683127.233124312124.82302558112843026603149.8431第58页Logistic回归对话框如下:

第59页第60页第61页上表为统计处理情况汇总,即有多少例统计被纳入了下面分析,可见此处因不存在缺失值,26条统计均纳入了分析。

第62页此处已经开始了拟合,Block0拟合是只有常数无效模型,上表为分类预测表,可见在17例观测值为0统计中,共有17例被预测为0,9例1也都被预测为0,总预测精确率为65.4%,这是不纳入任何解释变量时预测精确率,相称于比较基线。

第63页上表为Block0时变量系数,可见常数系数值为-0.636。

第64页上表为在Block0处尚未纳入分析方程侯选变量,所作检查表达假如分别将他们纳入方程,则方程变化是否会有显著意义(根据所用统计量不一样,也许是拟合优度,Deviance值等)。可见假如将X2系列哑变量纳入方程,则方程变化是有显著意义,X4和X5也是如此,由于Stepwise办法是一种一种进入变量,下一步将会先纳入P值最小变量X2,然后再重新计算该表,再做选择。

第65页此处开始了Block1拟合,根据我们设定,采取方法为Forward(我们只设定了一种Block,因此背面不会再有Block2了)。上表为全局检查,对每一步都作了Step、Block和Model检查,可见6个检查都是故意义。此处为模型概况汇总,可见从STEP1到STEP2,DEVINCE从18降到11,两种决定系数也都有上升。

第66页此处为每一步预测情况汇总,可见精确率由Block065%上升到了84%,最后达成96%,效果不错,最后只出现了一例错判。

第67页上表为方程中变量检查情况列表,分别给出了Step1和Step2拟合情况。注意X4P值略大于0.05,但仍然是能够接收,由于这里用到是排除标准(默以为0.1),该变量能够留在方程中。以Step2中X2为例,可见其系数为2.413,OR值为11。

上表为假设将这些变量单独移出方程,则方程变化有没有统计学意义,可见都是有统计学意义,因此他们应当保存在方程中。

第68页最后这个表格说明是在每一步中,尚未进入方程变量假如再进入现有方程,则方程变化有没有统计学意义。可见在Step1时,X4还应当引入,而在Step2时,其他变量是否引入都无关了。

第69页模型深入优化与简单诊断

模型深入优化

前面我们将X1~X5直接引入了方程,事实上,其中X2、X4、X5这三个自变量为多分类变量,我们并无证据以为它们之间个各等级OR值是成倍上升,严格来说,这里应当采取哑变量来分析,即需要用Categorical钮将他们定义为分类变量。但本次分析不能这样做,原因是这里总例数只有26例,假如引入哑变量模型会使得每个等级统计数非常少,从而分析成果将极为奇怪,无法正常解释,但为了说明哑变量模型使用方法,下面我将演示它是如何做,毕竟不是每个例子都只有26例。

第70页上表为自变量中多分类变量哑变量取值情况代码表。左侧为原变量名及取值,右侧为对应哑变量名及编码情况:以X5为例,表中可见X5=4时,即取值最高情况被作为了基线水平,这是多分类变量生成哑变量默认情况。而X5(1)代表是X5=1情况(X5为1时取1,不然取0),X5(2)代表是X5=2情况,依此类推。同步注意到许多等级值有几个统计,显然背面分析成果不会太好。

第71页上表出现了非常有趣现象:所有检查P值均远远大于0.05,不过所有变量均没有被移出方程,这是怎么回事?再看看下面这个表格吧。

第72页这个表格为方程似然值变化情况检查,可见在最后Step2生成方程中,无论移出X2还是X4都会引发方程显著性变化。也就是说,似然比检查成果和上面Walds检查成果冲突,以谁为准?此处应以似然比检查为准,由于它是全局性检查,且Walds检查本身就不太准,这一点大家记住就行了,实在要弄明白请去查阅有关文献。

第73页第74页上表为Block1迭代统计,可见无论是似然值,还是三个系数值,均是从迭代开始就向着一种方向发展,最后达成收敛,这说明整个迭代过程是健康,问题不大;假如半途出现曲折,尤其是当引入新变量后变化方向变化了,则提醒要好好研究。

第75页上表为方程中变量有关矩阵,可见X2和常数有关性较强,当引入X4后仍然如此,提醒要关注这一现象,以防因自变量间共线性造成方程系数不稳(此时迭代统计多半也会有波动)。当然,由于本例只有26条统计,这一问题是没有措施深入研究。

第76页上图是Step1结束时,即只引入X2时预测图,0和1代表实际取值,当预测概率值大于0.5时,则预测成果为1,反之为0,由上图可见,该模型对0预测是比较好,多数概率都在0附近,但对1预测不准,虽然正确,计算出概率也在0.8左右,并且有好几个都判错了。

第77页上图为Step2结束后模型预测情况,可见此时预测成果有了较大改善,概率精度提升了许多,只有一例0被错判为了1,并且从分布上看,这一例也许是极端情况,再引入其他变量也不见能将预测效果变化多少。

第78页第79页第80页第81页

第82页第83页第84页SPSS高级培训班课程大纲

SPSS北京办事处第85页第一讲:方差分析模型掌握单原因方差分析数据格式、操作办法与成果阅读,熟悉方差分析中多种两两比较办法选择、操作和成果阅读。掌握一元多原因方差分析模型原理、操作和分析成果阅读,掌握对应图形工具在分析中应用。熟悉多元方差分析模型和反复测量方差分析模型原理和操作办法,掌握这二者分析成果阅读。第86页第二讲:有关分析,回归分析模型掌握有关分析、偏有关分析操作与成果阅读。掌握多元线性回归模型原理、分析步骤、操作和成果阅读,重点掌握逐渐、前进、后退三种筛选办法含义与使用方法、分析成果阅读,熟悉多种常用模型诊断工具(分类图等)使用方法。熟悉加权最小二乘法、两阶段最小二乘法原理、操作和成果阅读,理解最优尺度回归功能。第87页第三讲:Logistic模型、非线性回归掌握二分类Logistic回归模型原理、分析步骤、操作和成果阅读,熟悉无序多分类、有序多分类Logistic回归模型、Probit模型原理、分析步骤、操作和成果阅读熟悉非线性回归模型操作和成果阅读。第

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论