2022年SPSS操作步骤汇总_第1页
2022年SPSS操作步骤汇总_第2页
2022年SPSS操作步骤汇总_第3页
2022年SPSS操作步骤汇总_第4页
2022年SPSS操作步骤汇总_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS学习第一章 数据文件的建立数据编码Type:Numeric:数值型 string:字符串型Missing :Measure:scale 定量变量 nominal 定性变量依据已有的变量建立新变量1、 对于数据进行重新编码Transform recode into different variables 选 择input variable output variable 定义新变量的名称change开头定义新旧变量 continue2、 通过 SPSS函数建立新变量Transform compute variable 从 function group 中挑选公式范围 下面挑选详细的公式i

2、f 中设置要转变 continue OK可以对变量进行各种运算 其次章 清除数据与基本统计分析1、 对不合理的数据检查并清理检查: analysis-description statistic-frequencies选入要检查的数据 OK结果:频数统计表看是否有错误清理:1. 对系统缺失值的清理1 / 17 missing systemDataselect caseif condition is satisfiedif function group(missing )- 下面选(missing )-continueoutput(delete unselected cases)-OK对 num为

3、哪一位的进行修改2. 对 sex=3 的清理(直接就清除了)Dataselect caseif condition is satisfiedif sex调入再输入 =3continue- output (delete unselected cases)-OK对 num为哪一位的进行修改 2. 对相关变量间规律性检查和清理Dataselect caseif condition is satisfiedif 输入表达式(前后规律不相符合的表达式)- continue- output(delete unselected cases)-OK对 num为哪一位的进行修 改 3. 统计描述 正态分布统计描

4、述 1 、 正 态 性 检 验 : Analysis nonparametric tests legacy dialogs 1-sample K-Sone-sample Kolomogorov Smirnov test normalok/2、统计描述: Analysis descriptives-time选入 options ok3、依据男女统计描述:data split file compare group sex调入 ok Analysis-descriptive statistic descriptivetime 调入 options 挑选 OK 非正态分布资料统计2 / 17 描述1、

5、 正态性检验 nonparametric2、 Analysis descriptive statisticsfrequencies 选 入 - statistics挑选 OK第三章T 检验1、单样本 t 检验 正态性检验 analyze compare meansone-sample t testtest value 挑选要对比的数值 OK 2、配对样本 t 检验建立数据文档两列(前和后)- 正态性检验 analysis- compare meanspaired sample t test 调入 ok3、 两独立样本 t 检验(正态性检验的时候采纳分开组,其他都要合并在一起)建立数据库第一列(

6、 group)其次列(数值) - data split file compare group 调入 groupok- 正态性检验 OK- data split file挑选 analysis allanalyze compare meansindependent sample t test选入,分组 OK结果分方差齐与否第四章 方差分析(前提正态)1、 单因素方差分析(就是平常的三个组比较)建立数据库第一列(group )其次列(数值) - data split file compare group 调入 groupok- 正态性检验 OK- data split 3 / 17 file选 择

7、 analysis all-analyzecompare meansone-way-anova 数 据 调 入 dependent list 分 组 调 入factor-optionsdescriptive 基本统计描述homogeneity of variance 做方差齐性分析 OK2、 方差分析两两比较analyze compare meansone-way-anova-数据调入 dependent list分组调入 factor 点 post hoc 挑选 SNK LSD3、 随机区组设计方差分析建立数据库第一列(group )其次列( block )第三列(数值)-按 照 group

8、 split 开 , 进 行 正 态 性 检 验 OKgeneral liner modelunivairate数值调入 dependent variablegroup 和 block调入 fixed factor modelcustombuild terms (main effects)再把 group 和 block 调入 model 下的矩形框 -continueOK假如区组间无差别,组间进行两两比较;首 先 进 行 方 差 齐 性 检 验 : Option 调 入 homogentity test continue ok 分 析 : univariate post hocunivari

9、ate 调 入groupSNK LSDcontinue ok4、 多因素分析以 time 为观看值分析 pt 、da、sex 间的差别General liner modelunivariatetimedependent variance, pt 、da、sexfix factormodelmian factors调 入4 / 17 continue OK将无关的逐一排除挑选出最终有差异的求得 R square第五章 卡方检验1、 行 x 列卡方检验(也就是几组数据差异性比较)输入数据第一列(列123)其次列(行1234)第三列(频数)定义频数变量: Dataweight case 调入频数分析

10、:analyze descriptive statisticscrosstabs 第一行调入row第 二 列 调 入 column-statistics选 择chi-square continue cells选项挑选 rowok 结果中,最终一行英文,理论值小于 5 的各数和最小理论值假如有统计学意义,可以进行两两比较:在数据设置那里,找到missing valuediscrete missing value下的格子中填入 3(表示把 3 取掉了,只是 1 和 2 进行比较) - 后续操作同上2、 四格表卡方检验输入数据第一列(处理因素)其次列(疗效)第三列(频数)定义频数变量: Datawe

11、ight case 调入频数分析:analyze descriptive statisticscrosstabs 第一行调入row第 二 列 调 入 column-statistics选 择chi-square continue cells选项挑选 row、expected ok 结果中,最终一行英文,理论值小于 5 的各数和最小理论值;准确概论法, continuity correction表示校正卡方的结果 5 / 17 Ps: 诸如第一个例题中,假如分析性别与感染率的显著性差异,步骤 同四个表卡方检验,由于分开写了,不用转换为频数资料而已 3、 配对卡方检验 输入数据第一列( a)其次列

12、( b)第三列(频数)定义频数变量: Dataweight case 调入频数分析方法一:analyze nonparametric legacy dialogy-2-related sample tested 列的选项 McNemara 和 b 分别选入配对激活下分析方法二:analyze descriptive statisticscrosstabs ab填入 statistics点击右下 McNema r ok第六章 秩和检验1、配对秩和检验(定量)输入数据第一列(前)其次列(后)分 析 : analyze nonparametric legacy sample tested a 和 b

13、 分别选入配对dialogy-2-related 结果:第一个表格是比较大小的数量,其次个表格是统计分析结果 两独立样本比较秩和检验(定量)输入数据第一列( group)其次列(数值)分析: analyze nonparametric legacy dialogy -2 independent samples输入分析的数据和分组情形OK 2、 有序变量两独立样本比较秩和检验(定性)输入数据第一列 (group )其次列(有序变量) - 第三列(频率)6 / 17 定义频数变量: Dataweight case 调入频数分析: analyze nonparametric legacy dialo

14、gy -2 independent samples有序变量调入 test variables listgroup 调入分组并定义ok 多个独立样本的比较(定量)比如:甲乙丙三个样本进行比较输入数据第一列( group)其次列(数值)nalyze nonparametric legacy dialogy -K independent samples- 数值调入 test variable 分组范畴 1-3Oktest group 调入分组矩形框给出假如差别有统计学意义, 那么进行两两比较, 方法参考卡方的两两表,用 missing 来定义 第七章 相关与回来 第一节 一元线性回来 1、例题:有

15、12 组发硒值和血硒值的含量表 输入数据第一列(发硒)其次列(血硒)分析:正态性检验,相关和回来的前提是正态性 正 态 性 检 验 : Analysis nonparametric tests legacy dialogs 1-sample K-Sone-sample Kolomogorov Smirnov test normalok相关分析 :correlateBivariateBivariate correlation服从正态分布的挑选pearson,不听从的挑选 spearman 7 / 17 回来分析 :regression regression linear 将 y 变量调入depe

16、ndent , x 变 量 调 入 independent-statisticslinear regression 挑选 descriptiveOK结果分析: p 值0.05 差别有统计学意义,可以建立回来方程2、 频数资料的相关与回来建立数据库第一列( x)其次列( y)第三列( f )分析:先将频数通过 weight case 进行操作Analyze regression linear 选入自变量因变量 OKPs: 这样的回来模型有常数项,也可以去掉,options include constant in equation前 面 的 去 掉 statisticR square change

17、OK 这样去去掉了常数项, 但是要强调的是, 有无常数项是两个完全不同 的数学模型, R square 也不能作为直接的比较,挑选哪个回来方程 最为合适,必需要把他们放在医学的实际环节中去检验才可以;3、 多元相关回来好多个 X的回来分析,分析x 之间的相关关系Analyze correlatebivariate将所数字调入options means and standard deviationsok结果显示了 6 个 X 之间两两的相关系数;其次节 多元线性回来讨论一个 Y 和多个 X 的关系8 / 17 输入数据, x 和 y回来分析:analyse regression linear输入

18、自变量,因变量 OK结果: B 表示偏回来系数, p0.05 有统计学意义,否就排除掉,不 纳入回来方程中 第三节 多元逐步回来 回来分析:analyse regression linear 输入自变量,因变量method中输入 stepwise OK 结果:将全部有意义的分布引入,都有相关系数和回来方程第八章Logistic 回来讨论因变量(二值变量)与自变量(二值或等级或计量资料)的关系例如:例子中因变量为infect,自变量为一堆( 9 个),笔者认为,由于自变量较多, logistic回来可分为两步,先用单因素分析对自变量进行挑选, 然后对经单因素分析有统计学意义的自变量再做多因素 l

19、ogistic回来;等级资料计量资料1、将数据分类计数资料1、 单因素分析对于计数资料采纳 卡方检验 的方法:Descriptive statisticcrosstabs infect调入到 rows, 计数资料调入 columnsstatisticchi-square ok 结果显示: 每项计数资料是否有统计学意义,登记来经有统计学意义的资料Ps: 外加一个分层资料合并步骤:transform recode recode into 9 / 17 different variablesold to new,就跟数据合并一样,分组合并一样对于等级资料采纳 秩和检验 的方法:analyze non

20、parametric legacy dialogy -2 independent samples输入分析的数据和分组情形(依据OK对于计量资料采纳 显著性检验 的方法:Y 变量分为 0-1 两组)Analyze compare meansindependent sample t test 调入计量资料并分组( 0/1 )-OK结果看 p 值是否有统计学意义2、 logistic 回来通过单因素分析, 找出了有统计学意义的观看项, 然后进行 logistic回来;分析:Analyze regression binary logistic调入因变量调入自 变 量 ( covariates) -me

21、thod 默 认 enter options 激 活hosmer- lemeshow goodness of fit、CI for expB、at last step ok 也可以依据需要在其中挑选 查看结果, p 小于 0.05 ,变量差别具有统计学意义,可以纳入回来方程;结果说明留意事项: logistic回来是非线性回来,自变量作用的大小视为 exp(B)值,此处输血次数的回来系数为正表示输血次数多就感染的可能性大,手术部位(结肠和直肠)10 / 17 ,结肠发生感染的可能性大于直肠部位;第十一章 诊断试验评判和 roc 曲线分析1、 诊断试验建立数据库第一列 (金标准)其次列(待评判方

22、法)第三列(f )现将频数通过 weight case 定义为频数变量分析: analyze descriptive statisticcrosstabs 现实中表格左边的调入 row,表格上面的调入column-cells中挑选运算 row、column、total的百分比 OK结果分为四行:四小行分表表示,观看值,行百分比,列百分比,总 百分比 金标准新方法阳性行百分数阳性阴性阳性猜测值阴性列百分数灵敏度误诊率行百分数阴性猜测值列百分数漏诊率特异度2、 诊断试验一样性检验 Kappa值 Kappa0.2 差,后每增加 0.2 分别为一般、中等、好、很好分析:其他过程同上,在cells之后,

23、点击statistic挑选右下KappaOK 结果: value 即为 Kappa值,要留意 Kappa值也要留意对卡帕检验的 p 值和样本量 3、 roc 曲线分析 即为:受试者操作特点曲线, 通过曲线下面积反应诊断试验的诊断价 值;11 / 17 曲线下面积等于 0.5 表示完全无诊断价值, 后每增加 0.2 表示低中高;例子中将医生诊断水平与病例诊断水平做比较建立文档定义频数变量analyze-ROC curve 待评判的调入 test variable 标准选入 state variable 并在下面的对话框中挑选 1 表示恶性 - 在 display with diagonal re

24、ference line and standard error and confidence intervalok 例子 2 是血清钠对一般感冒和rmsf 发热是否有诊断作用建立文档定量资料analyze- ROC curve待评判的调入 test variable 分组选入 state variable 并在下面的对话框中挑选 1 -在 display 全选 options 中修改默认选项为 smaller test result indicate more positive test(由于血清钠越低越表示阳性,而系统默认越高越为阳性) -OK 结果分析:看曲线下面积第十二章 生存分析 1、

25、基本概念:大事:讨论规定的生存时间的重点删失:失访或截尾 生存时间:从某一起点开头到所关怀时间发生经受的时间中位生存时间:半数生存期,表示恰好有50%的而个体存活的时间生存曲线:以观看时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线;生存曲线是一条下降的曲线, 表示随着时间的推移, 生存率逐步降低; 平缓的生存曲线表示高生存率或较 12 / 17 长的生存期,陡峭的生存曲线表示低生存率或较短生存期;2、寿命表法 定期随访的大样本资料建立数据 - 第一列( time )其次列(结局state 1/0)第三列(f )分析:定义频数analyze survivallife ta

26、bles time调入time (display time interval中从 0 到几每隔几)- 结局输入 status(single value 输入 1 表示死亡,由于看上述文字:value indicating event has occurred 表示目标大事发生的值,所以输入死亡所表示的数字) -options挑选 life tables 和 survival plotOK3、Kaplan-Meier 法小样本量有两个分组,两种不同方法生存分析并比较生存率建立数据 - 第一列( time )其次列(结局state 0死亡 /1 失访/2 存活)第三列(组别)分析: analyze

27、 survival- Kaplan-Meier time 调入 time ,group调入 factor ,结果调入 status(定义结果挑选 0,表示死亡)-options挑选 survival table 、mean and median survival -compare factor中挑选 log-rank 法ok 结果给出两组的平均生存时间和中位生存时间,标准误和可信区间,overall comparisons表示对两者的生存率进行比较;Ps:在寿命表中也可以对生存率进行比较,options选项中 compare 13 / 17 level of first factor 中挑选

28、overall第十四章 量表信度效度分析1、 量表信度分类:外在信度 表示量表在不同时间测定时测量结果一样程度,重测信度、分半信度内在信度 表示量表各项目之间的一样性程度,cronbach s a 信度Analyze scale reliability analysis 因子分别选入 2、 量表效度总体选入或依据不同的量表能够测量出讨论中所欲测量特性的程度;效度越高表示该测量的 结果与测验行为的真实度越符合,越能够达到测验的目的;内容效度:专家法评判,对量表的题目,内容,范畴是否符合调查目 的进行分析评判 标准效度: 必需要有比较标准, 指的是测量值与标准值之前的接近程 度 结构效度: 依据实

29、际测量的数据, 考察所用的量表是否能反映事先假 设的理论结构; KMO法;详细操作,先不用把握了,不会考的;第十五章 统计图形 第一节 条形图 Bar chart14 / 17 先要看懂几个翻译,特别重要! !Simple 简洁条形图 Clustered 分组条形图 Stacked 分段条形图(积累图)Data in chart are:Summaries for group of cases Summaries for separate variables Value of individual cases 图 1. 简洁条形图(绘制各种手术方式的人数)依据观看量分组 汇总 按单独变量 汇总

30、 按某观看量的数值 做条形选 Simple 简洁条形图 - Summaries for group of cases 依据观看量分组 汇总 bars represent(图形代表什么?)挑选 n of case ,表示直条的长短观看量分组的数值category axis 中选定要绘制的观看量;可以点击 title 进行标题命名,双击图形可以对其作出设置(绘制手术中失血量和输血量的均值)两个变量就选用: Summaries for separate variable 按单独变量 汇总,将两个变量选入 bars represent,其他同上,也可以双击设置图形;(绘制每个病例的输血次数)每个变量单独绘制就选用:Value of ind

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论