SPSS操作步骤汇总_第1页
SPSS操作步骤汇总_第2页
SPSS操作步骤汇总_第3页
SPSS操作步骤汇总_第4页
SPSS操作步骤汇总_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章数据文件的建立数据编码Type:Numeric :数值型string:字符串型Missing :定性变量选择 input variable outputMeasure: scale 定量变量 nominal根据已有的变量建立新变量1、对于数据进行重新编码Transform recode into different variablesvariable-定义新变量的名称一change幵始定义新旧变量一continue2、通过SPSS函数建立新变量Transform compute variable -从 function group 中选择公式范围 下面选择具体的公式一if中设置要改变一c

2、ontinue OK何以对变量进行各种计算)第二章 清除数据与基本统计分析1、对不合理的数据检查并清理检查:analysis-descriptionstatistic-frequencies选入要检查的数据一OK结果:频数统计表看是否有错误 missing system清理:1. 对系统缺失值的清理Dataselectcaseif condition is satisfied if function group(missing)-下面选(missing)-continue output(delete unselected cases)-OK 对num为哪一位的进行修改2. 对 sex=3 的清

3、理(直接就清除了)Dataselect case if condition is satisfied if sex 调入 再输 入 =3continue- output (delete unselected cases ) -OK 对 num为哪一 位的进行修改2. 对相关变量间逻辑性检查和清理Dataselect case if condition is satisfiedif 输入表达式(前后逻辑不相符合的表达式) - continue- output ( delete unselected cases ) -OK 对num为哪一位的进行修改3. 统计描述正态分布统计描述1 、正态性检验:

4、 Analysis nonparametric testslegacy dialogs 1-sampleK-S on e-sample Kolomogorov Smir nov test no rmal ok/2、 统计描述: Analysis descriptives-time选入 options ok3、按照男女统计描述: data split file - compare group - sex 调入一okAnalysis-descriptive statistic descriptivetime 调入一options选择一OK非正态分布资料统计描述1、正态性检验 nonparametr

5、ic2、Analysis descriptive statistics frequencies 选入 - statistics 选择 OK第三章 T 检验1、单样本 t 检验正态性检验 analyze compare meansone-sample t testtest value 选择要对比的数值 OK2、配对样本t检验建立数据文档一两列(前和后)-正态性检验一analysis- compare means pairedsample t test -调入一ok3、 两独立样本t检验(正态性检验的时候采用分幵组,其他都要合并在一起)建立数据库一第一列(group )第二列(数值) -data

6、split file - comparegroup 调入 group ok-正态性检验一 OK- data split file选择 analysisall analyze compare meansindependent sample t test选入,分组一 OK结果分方差齐与否第四章方差分析(前提正态)1、单因素方差分析(就是平常的三个组比较)建立数据库一第一列 (group)第二列(数值)-data split file - compare group 调入 group ok-正态性检验一0K- data split file 选择 analysis all-analyze compa

7、re means one-way-anova 数据调入 dependent list 分组调 入 factoroptions descriptive 基本统 计描述homogeneity ofvarianee做方差齐性分析一OK2、方差分析两两比较analyze compare means one-way-anova-数据调入 dependent list 分组调入 factor 点 post hoc 选择 SNK LSD3、随机区组设计方差分析建立数据库一第一列(group)第二列(block )第三列(数值)-按照group split幵,进行正态性检验一OK general linerm

8、odelunivairate 数值调入dependent variable group 和 block 调入 fixed factor model custom buildterms ( main effects )再把 group 和 block 调入 model 下的矩形框-continue OK 如果区组间无差别,组间进行两两比较首先进行方差齐性检验: Option 调入 homogentity test continue ok 分析: univariatepost hocunivariate 调入 group SNKLSD continue ok4、多因素分析以 time 为观察值分析

9、 pt 、da、 sex 间的差别General liner modelunivariate time(dependent variance), pt 、 da、sex(fix factor) modelmian factors 调入一continue OK将无关的逐一排除一选择 出最终有差异的求得 R square第五章 卡方检验1、行x列卡方检验(也就是几组数据差异性比较) 输入数据第一列(列 123)第二列(行 1234)第三列(频数) 定义频数变量: Dataweight case 调入频数分析:analyze descriptive statistics crosstabs 第一行调

10、入 row第二列 调入 column-statistics选择 chi-square continue cells 选项选择row ok结果中,最后一行英文,理论值小于 5 的各数和最小理论值 如果有统计学意义,可以进行两两比较:在数据设置那里,找到 missing value discrete missing value下的格子中填入3(表示把 3取掉了,只是 1 和2进行比较) - 后续操作同上2、四格表卡方检验 输入数据第一列(处理因素)第二列(疗效)第三列(频数) 定义频数变量: Dataweight case 调入频数分析:analyze descriptive statistics

11、 crosstabs 第一行调入 row第二列调入 column-statistics选择 chi-square continue cells 选项选择 row、 expected ok结果中,最后一行英文,理论值小于5的各数和最小理论值。确切概论法,continuitycorrection 表示校正卡方的结果Ps: 诸如第一个例题中,如果分析性别与感染率的显着性差异,步骤同四个表卡方 检验,由于分开写了,不用转换为频数资料而已3、配对卡方检验输入数据一第一列(a)第二列(b)第三列(频数)定义频数变量: Dataweight case 调入频数分析 方法一 : an alyze non pa

12、rametric legacy dialogy-2-related sampletested a 和 b 分别选入配对激活下列的选项 McNemar分 析 方 法 二 : analyze descriptive statistics crosstabs ab 填 入 statistics 点击右下 McNemra ok第六章 秩和检验1、配对秩和检验(定量)输入数据第一列(前)第二列(后)分析: analyze nonparametric legacy dialogy-2-related sample testeda和 b 分别选入配对结果:第一个表格是比较大小的数量,第二个表格是统计分析结果

13、两独立样本比较秩和检验(定量)输入数据一第一列(group)第二列(数值)分析: analyze nonparametric legacy dialogy -2 independent samples 输 入分析的数据和分组情况 OK2、有序变量两独立样本比较秩和检验(定性)输入数据一第一列(group )第二列(有序变量)-第三列(频率)定义频数变量:Data weight case 调入频数分析:an alyze non parametric legacy dialogy -2 in depe ndent samples有序变量调入test variables list group调入分组

14、并定义一 ok多个独立样本的比较(定量)比如:甲乙丙三个样本进行比较输入数据一第一列(group )第二列(数值)n alyze non parametric legacy dialogy -K in depe ndentsamples- 数 值调入test variable test group调入分组矩形框给出分组范围1-3 Ok如果差别有统计学意义,那么进行两两比较,方法参考卡方的两两表,用miss ing来定义第七章相关与回归第一节一元线性回归1、例题:有12组发硒值和血硒值的含量表输入数据一第一列(发硒)一第二列(血硒)分析:正态性检验,相关和回归的前提是正态性正态性检验: An a

15、lysis non parametric tests legacy dialogs 1-sampleK-S on e-sample Kolomogorov Smir nov test n ormal ok相关分析 :correlate Bivariate Bivariate correlation服从正态分布的选择pears on,不服从的选择 spearma n回归分析:regression regression linear 将 y 变量调入 dependent,x 变量 调 入in depe nden t-statisticslinearregressi ondescriptive OK

16、结果分析:p值V差别有统计学意义,可以建立回归方程2、频数资料的相关与回归建立数据库一第一列(x)第二列(y)第三列(f)分析:先将频数通过 weight case 进行操作Analyze regression linear 选入自变量因变量 OKPs: 这样的回归模型 有常数项,也可以 去掉, options include constant inequation 前面的V去掉一 statistic R square change OK 这样去去掉了常数项,但是要强调的是,有无常数项是两个完全不同的数学模型,R square 也不能作为直接的比较,选择哪个回归方程最为合适,必须要把他们放在

17、医学的实际环节中去检验才可以。3、多元相关回归好多个X的回归分析,分析x之间的相关关系Analyze correlate bivariate 将所数字调入 options means and standard deviations ok结果显示了 6个X之间两两的相关系数。第二节 多元线性回归研究一个 Y 和多个 X 的关系输入数据, x 和 y回归分析: analyse regression linear 输入自变量,因变量 OK结果:B表示偏回归系数,pv有统计学意义,否则排除掉,不纳入回归方程中 第三节 多元逐步回归回归分析: analyse regression linear 输入自变

18、量,因变量 method 中输入 stepwise OK 结果:将所有有意义的分布引入,都有相关系数和回归方程 第八章 Logistic 回归 研究因变量(二值变量)与自变量(二值或等级或计量资料)的关系 例如:例子中因变量为 infect ,自变量为一堆( 9 个),笔者认为,由于自变量较 多, logistic回归可分为两步,先用单因素分析对自变量进行筛选,然后对经单因素分析有统计学意义的自变量再做多因素 logistic 回归。1、将数据分类计数资料 等级资料 计量资料1、 单因素分析 对于计数资料采用 卡方检验 的方法: Descriptive statisticcrosstabs i

19、nfect 调 入 到 rows, 计 数 资 料 调 入columns statisticchi-square ok结果显示:每项计数资料是否有统计学意义,经有统计学意义的资料记下来Ps:夕卜加一个分层资料合并步骤:transform recode recode into differentvariables old to new, 就跟数据合并一样,分组合并一样 对于等级资料采用 秩和检验 的方法:analyze nonparametric legacy dialogy -2 independent samples输入分析的数据和分组情况(按照 Y 变量分为 0-1 两组) OK对于计量资

20、料采用 显着性检验 的方法:An alyze compare meansin depe ndent sample t test-调入计量资料一并分组(0/1 )-OK 结果看 p 值是否有统计学意义2、logistic 回归通过单因素分析,找出了有统计学意义的观察项,然后进行logistic 回归。分 析: An alyze regressi on binary logistic 调入因变量一调入 自变量 (covariates )-method(默认 enter) options 激活 hosmer- lemeshow goodness of fit 、CI for exp(B) 、at l

21、ast step - ok (也可以根据需要在其中选择 ) 查看结果,p小于,变量差别具有统计学意义,可以纳入回归方程。结果解释注意事项:logistic 回归是非线性回归,自变量作用的大小视为 exp (B) 值,此处输血次数的回归系数为正表示输血次数多则感染的可能性大,手术部位(结肠和直肠),结肠发生感染的可能性大于直肠部位。第十一章诊断试验评价和roc曲线分析1、诊断试验建立数据库一第一列(金标准)一第二列(待评价方法)一第三列( f )现将频数通过weight case定义为频数变量分析:analyze descriptive statistic crosstabs 现实中表格左边的调

22、入 row, 表格上面的调入 column-cells 中选择计算row、column、total的百分比一OK 结果分为四行:四小行分表表示,观察值,行百分比,列百分比,总百分比新方法金标准阳性阴性阳性行百分数阳性预测值列百分数灵敏度误诊率阴性行百分数阴性预测值列百分数漏诊率特异度2、诊断试验一致性检验一 Kappa值Kappa冬差,后每增加分别为一般、中等、好、很好分析:其他过程同上,在 cells 之后,点击 statistic 选择右下 KappaOK 结果: value 即为 Kappa 值,要注意 Kappa 值也要注意对卡帕检验的 p 值和样本量 3、 roc 曲线分析 即为:受

23、试者操作特征曲线,通过曲线下面积反应诊断试验的诊断价值。 曲线下面积等于表示完全无诊断价值,后每增加表示低中高。 例子中将医生诊断水平与病例诊断水平做比较 建立文档定义频数变量 analyze-ROC curve 待评价的调入 test variable 标 准选入 state variable并在下面的对话框中选择 1 表示恶性 - 在 display withdiagonal reference line and standard error and confidence interval ok例子 2 是血清钠对普通感冒和 rmsf 发热是否有诊断作用 建立文档定量资料 analyze-

24、 ROC curve 待评价的调入 test variable 分组 选入 state variable 并在下面的对话框中选择 1 - 在 display 全选 options 中 修改默认选项为 smaller test result indicate more positive test(因为血清钠越低越表示阳性,而系统默认越高越为阳性)-OK结果分析:看曲线下面积第十二章 生存分析1、基本概念: 事件:研究规定的生存时间的重点 删失:失访或截尾 生存时间:从某一起点开始到所关心时间发生经历的时间 中位生存时间:半数生存期,表示恰好有50%的而个体存活的时间生存曲线:以观察时间为横轴,以

25、生存率为纵轴,将各个时间点所对应的生存率连 接在一起的曲线。生存曲线是一条下降的曲线,表示随着时间的推移,生存率逐渐 降低。平缓的生存曲线表示高生存率或较长的生存期,陡峭的生存曲线表示低生存 率或较短生存期。2、寿命表法定期随访的大样本资料建立数据 - 第一列( time )第二列(结局 state 1/0 )第三列( f )分析:定义频数一 analyze survival life tables time 调入 time (display time interval 中从 0 到几每隔几) - 结局输入 status ( single value 输入 1 表示 死亡,因为看上述文字: v

26、alue indicating event has occurred表示目标事件发生的值,所以输入死亡所表示的数字)-options 选择 life tables 和 survivalplot OK3、Kaplan-Meier 法小样本量有两个分组,两种不同方法生存分析并比较生存率建立数据 - 第一列( time )第二列(结局 state 0 死亡 /1 失访/2 存活)第 三列(组别)分析: analyze survival-Kaplan-Meier time 调入 time ,group 调入 factor ,结果调入 status (定义结果选择 0,表示死亡) -options选择

27、survival table 、mean and median survival -compare factor中选择 log-rank 法 ok结果给出两组的平均生存时间和中位生存时间,标准误和可信区间, overallcomparisons 表示对两者的生存率进行比较。Ps:在寿命表中也可以对生存率进行比较,options选项中compare level of first factor 中选择 overall第十四章 量表信度效度分析1、 量表信度 分类:外在信度 表示量表在不同时间测定时测量结果一致程度,重测信度、分半 信度内在信度 表示量表各项目之间的一致性程度, cronbach s

28、 a 信度 Analyze scale reliability analysis总体选入或根据不同的因子分别选入2、 量表效度 量表能够测量出研究中所欲测量特性的程度。效度越高表示该测量的结果与测验行 为的真实度越符合,越能够达到测验的目的。 内容效度:专家法评价,对量表的题目,内容,范围是否符合调查目的进行分析评 价 标准效度:必须要有比较标准,指的是测量值与标准值之前的接近程度 结构效度: 根据实际测量的数据, 考察所用的量表是否能反映事先假设的理论结构。KMOo 具体操作,先不用掌握了,不会考的。 第十五章 统计图形 第一节 条形图Bar chart 先要看懂几个翻译,非常重要! ! S

29、imple 简单条形图 Clustered 分组条形图Stacked 分段条形图(堆积图)Data in chart are按单独变量汇总按某观察量的数值 做条形图Summaries for separate variablesValue of in dividual cases1.简单条形图(绘制各种手术方式的人数)按照观察量分组汇总选 Simple 简单条形图 -Summaries for group of casesbars represent(图形代表什么?)选择 n of case,表示直条的长短观察量分组的数值一category axis中选定要绘制的观察量。可以点击title进行标题命名,双击图形可以对其作出设置(绘制手术中失血量和输血量的均值)两个变量则选用:Summaries for separate variable 按单独变量 汇总,将两个变量选入bars represent,其他同上,也可以双击设置图形。(绘制每个病例的输血次数)每

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论