SPSS操作步骤汇总_第1页
SPSS操作步骤汇总_第2页
SPSS操作步骤汇总_第3页
SPSS操作步骤汇总_第4页
SPSS操作步骤汇总_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

EpSyDg-Wyw1「1982GTSPSS学习第一章数据文件的建立数据编码Type:Numeric:数值型string:字符串型Missing:Measure:scale定量变量nominal定性变量根据已有的变量建立新变量1、对于数据进行重新编码Transform~recodeintodifferentvariables—选择inputvariableoutputvariable-定义新变量的名称一change—开始定义新旧变量一continue2、通过SPSS函数建立新变量Transform—computevariable-从functiongroup中选择公式范围下面选择具体的公式一if中设置要改变一continue—OK(可以对变量进行各种计算)第二章清除数据与基本统计分析1、对不合理的数据检查并清理检查:analysis-descriptionstatistic-frequencies—选入要检查的数据一OK结果:频数统计表一看是否有错误—missingsystem清理:对系统缺失值的清理Data—selectcase—ifconditionissatisfied—if—functiongroup(missing)--下面选(missing)--continue—output(deleteunselectedcases)--OK—对num为哪一位的进行修改对sex=3的清理(直接就清除了)Data—selectcase—ifconditionissatisfied—if—sex调入再输入二3—continue--output(deleteunselectedcases)--OK—对num为哪一位的进行修改对相关变量间逻辑性检查和清理Data—selectcase—ifconditionissatisfied—if—输入表达式(前后逻辑不相符合的表达式)--continue--output(deleteunselectedcases)--OK—对num为哪一位的进行修改统计描述正态分布统计描述1、正态性检验:Analysis—nonparametrictests—legacydialogs—1-sampleK-S—one-sampleKolomogorovSmirnovtest-normal—ok/2、统计描述:Analysis—descriptives--time选入一options—ok3、按照男女统计描述:data—splitfile-comparegroup-sex调入一okAnalysis-descriptivestatistic-descriptive—time调入一options选择一OK非正态分布资料统计描述1、正态性检验nonparametric2、Analysis—descriptivestatistics—frequencies选入--statistics选择一OK第三章T检验1、单样本t检验正态性检验一analyze—comparemeans—one-samplettest—testvalue选择要对比的数值OK2、配对样本t检验建立数据文档一两列(前和后)--正态性检验一analysis-comparemeans—pairedsamplettest—i周—ok3、两独立样本t检验(正态性检验的时候采用分开组,其他都要合并在一起建立数据库一第一列(group)第二列(数值)--data—splitfile-comparegroup—调入group—ok-正态性检验一OK--data—splitfile—选择analysisall—analyze—comparemeans—independentsamplettest—选入,分组一OK结果分方差齐与否第四章方差分析(前提正态)1、单因素方差分析(就是平常的三个组比较)建立数据库一第一列(group)第二列(数值)-data—splitfile-comparegroup—调入group—ok-正态性检验一OK--data—splitfile—选择analysisall--analyze—comparemeans—one-way-anova—数据调入dependentlist—分组调入factoroptions—descriptive基本统计描述一homogeneityofvariance做方差齐性分析一OK2、方差分析两两比较analyze—comparemeans—one-way-anova---数据调入dependentlist—分组调入factor—点posthoc—选择SNKLSD3、随机区组设计方差分析建立数据库一第一列(group)第二列(block)第三列(数值)--按照groupsplit开,进行正态性检验一OK一generallinermodel一univairate一数值调入dependentvariable一group和block调入fixedfactor一model一custom一buildterms(maineffects)再把group和block调入model下的矩形框---continue—OK如果区组间无差别,组间进行两两比较。首先进行方差齐性检验:Option一调入一homogentitytest一continue一ok分析:univariate一posthoc一univariate一调入group一SNKLSD一continue一ok4、多因素分析以time为观察值分析pt、da、sex间的差别Generallinermodel一univariate一time(dependentvariance),pt、da、sex(fixfactor)一model一mianfactors一调入一continue一OK一将无关的逐一排除一选择出最终有差异的一求得Rsquare第五章卡方检验1、行x列卡方检验(也就是几组数据差异性比较)输入数据一第一列(列123)一第二列(行1234)一第三列(频数)定义频数变量:Data一weightcase一调入频数分析:analyze一descriptivestatistics一crosstabs一第一行调入row一第二列调入columnstatistics一选择chi-square一continue-cells选项一选择row一ok结果中,最后一行英文,理论值小于5的各数和最小理论值如果有统计学意义,可以进行两两比较:在数据设置那里,找到missingvalue一discretemissingvalue下的格子中填入3(表示把3取掉了,只是1和2进行比较)--后续操作同上2、四格表卡方检验输入数据一第一列(处理因素)一第二列(疗效)一第三列(频数)定义频数变量:Data—weightcase—调入频数分析:analyze—descriptivestatistics—crosstabs—第一行调入row—第二列调入columnstatistics—选择chi-square—continue-cells选项一选择row、expected—ok结果中,最后一行英文,理论值小于5的各数和最小理论值。确切概论法,continuitycorrection表示校正卡方的结果Ps:诸如第一个例题中,如果分析性别与感染率的显着性差异,步骤同四个表卡方检验,由于分开写了,不用转换为频数资料而已3、配对卡方检验输入数据一第一列(a)一第二列(»一第三列(频数)定义频数变量:Data—weightcase—调入频数分析方法一:analyze—nonparametric—legacydialogy--2-relatedsampletested—a和b分别"选入配对一激活下列的选项McNemar分析方法二:analyze—descriptivestatistics—crosstabs—ab填入一statistics—点击右下第六簟秩和检验1、配对秩和检验(定量)输入数据一第一列(前)一第二列(后)分析:analyze—nonparametric一legacydialogy--2-relatedsampletested一a和b分别选入配对结果:第一个表格是比较大小的数量,第二个表格是统计分析结果两独立样本比较秩和检验(定量)输入数据一第一列(group)—第二列(数值)分析:analyze—nonparametric—legacydialogy--2independentsamples—输入分析的数据和分组情况一OK2、有序变量两独立样本比较秩和检验(定性)输入数据一第一列(group)—第二列(有序变量)--第三列(频率)定义频数变量:Data—weightcase—调入频数分析:analyze—nonparametric—legacydialogy--2independentsamples—有序变量调入testvariableslist—group调入分组并定义一ok多个独立样本的比较(定量)比如:甲乙丙三个样本进行比较输入数据一第一列(group)—第二列(数值)nalyze—nonparametric—legacydialogy--Kindependentsamples-数值调入testvariabletest—group调入分组矩形框给出分组范围1-3—Ok如果差别有统计学意义,那么进行两两比较,方法参考卡方的两两表,用missing来定义第七章相关与回归第一节一元线性回归1、例题:有12组发硒值和血硒值的含量表输入数据一第一列(发硒)一第二列(血硒)分析:正态性检验,相关和回归的前提是正态性正态性检验:Analysis—nonparametrictests—legacydialogs—1-sampleK-S——one-sampleKolomogorovSmirnovtest-normal——ok相关分析:correlate—Bivariate—Bivariatecorrelation—服从正态分布的选择pearson,不服从的选择spearman回归分析:regression—regression—linear—将y变量调入dependent,x变量调入independentstatistics—linearregression—选择descriptive—OK结果分析:P值〈差别有统计学意义,可以建立回归方程2、频数资料的相关与回归建立数据库一第一列(x)—第二列^)—第三列(f)分析:先将频数通过weightcase进行操作Analyze—regression—linear—选入自变量因变量一OKPs:这样的回归模型有常数项,也可以去掉,options—includeconstantinequation前面的▽去掉一statistic—Rsquarechange—OK这样去去掉了常数项,但是要强调的是,有无常数项是两个完全不同的数学模型,Rsquare也不能作为直接的比较,选择哪个回归方程最为合适,必须要把他们放在医学的实际环节中去检验才可以。3、多元相关回归好多个X的回归分析,分析x之间的相关关系Analyze—correlate—bivariate—将所数字调入一options—meansandstandarddeviations—ok结果显示了6个X之间两两的相关系数。第二节多元线性回归研究一个Y和多个X的关系输入数据,X和y回归分析:analyse~regression—linear—输入自变量,因变量一OK结果:B表示偏回归系数,p<有统计学意义,否则排除掉,不纳入回归方程中第三节多元逐步回归回归分析:analyse—regression—linear—输入自变量,因变量一method中输入stepwise—OK结果:将所有有意义的分布引入,都有相关系数和回归方程第八章Logistic回归研究因变量(二值变量)与自变量(二值或等级或计量资料)的关系例如:例子中因变量为infect,自变量为一堆(9个),笔者认为,由于自变量较多,logistic回归可分为两步,先用单因素分析对自变量进行筛选,然后对经单因素分析有统计学意义的自变量再做多因素logistic回归。1、将数据分类计数资料等级资料计量资料1、单因素分析对于计数资料采用卡方检验的方法:Descriptivestatistic—crosstabs—infect调入至1]rows,计数资料调入columns—statistic—chi-square—ok结果显示:每项计数资料是否有统计学意义,经有统计学意义的资料记下来Ps:外加一个分层资料合并步骤:transform—recode—recodeintodifferentvariables—oldtonew,就跟数据合并一样,分组合并一样对于等级资料采用秩和检验的方法:analyze—nonparametric—legacydialogy--2independentsamples—输入分析的数据和分组情况(按照Y变量分为0-1两组)—OK对于计量资料采用显着性检验的方法:Analyze—comparemeans—independentsamplettest-调入计量资料一并分组(0/1)--OK结果看p值是否有统计学意义2、logistic回归通过单因素分析,找出了有统计学意义的观察项,然后进行logistic回归。分析:Analyze—regression—binarylogistic—调入因变量一调入自变量(covariates)--method(默认enter)—options—激活hosmer-lemeshowgoodnessoffit、CIforexp(B)、atlaststep-ok(也可以根据需要在其中选择)查看结果,p小于,变量差别具有统计学意义,可以纳入回归方程。结果解释注意事项:logistic回归是非线性回归,自变量作用的大小视为exp(B)值,此处输血次数的回归系数为正表示输血次数多则感染的可能性大,手术部位(结肠和直肠),结肠发生感染的可能性大于直肠部位。第十一章诊断试验评价和roc曲线分析1、诊断试验建立数据库一第一列(金标准)一第二列(待评价方法)一第三列(f)现将频数通过weightcase定义为频数变量分析:analyze—descriptivestatistic—crosstabs—现实中表格左边的调入row,表格上面的调入column-cells中选择计算row、columnstotal的百分比一OK结果分为四行:四小行分表表示,观察值,行百分比,列百分比,总百分比新方法金标准阳性阴性阳性行百分数阳性预测值列百分数灵敏度误诊率阴性行百分数阴性预测值列百分数漏诊率特异度2、诊断试验一致性检验一Kappa值KappaW差,后每增加分别为一般、中等、好、很好分析:其他过程同上,在cells之后,点击statistic—选择右下Kappa—OK结果:value即为Kappa值,要注意Kappa值也要注意对卡帕检验的p值和样本量3、roc曲线分析即为:受试者操作特征曲线,通过曲线下面积反应诊断试验的诊断价值。曲线下面积等于表示完全无诊断价值,后每增加表示低中高。例子中将医生诊断水平与病例诊断水平做比较建立文档一定义频数变量一analyze-ROCcurve—彳寺评价的调入testvariable—标准选入statevariable并在下面的对话框中选择1表示恶性--在display—withdiagonalreferencelineandstandarderrorandconfidenceinterval—ok例子2是血清钠对普通感冒和rmsf发热是否有诊断作用建立文档一定量资料一analyze--ROCcurve—彳寺评价的调入testvariable—分组选入statevariable并在下面的对话框中选择1--在display全选一options中修改默认选项为smallertestresultindicatemorepositivetest(因为血清钠越低越表示阳性,而系统默认越高越为阳性)--OK结果分析:看曲线下面积第十二章生存分析1、基本概念:事件:研究规定的生存时间的重点删失:失访或截尾生存时间:从某一起点开始到所关心时间发生经历的时间中位生存时间:半数生存期,表示恰好有50%的而个体存活的时间生存曲线:以观察时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线。生存曲线是一条下降的曲线,表示随着时间的推移,生存率逐渐降低。平缓的生存曲线表示高生存率或较长的生存期,陡峭的生存曲线表示低生存率或较短生存期。2、寿命表法定期随访的大样本资料建立数据--—第一列(time)—第二列(结局state1/0)一第三列(f)分析:定义频数一analyze—survival一lifetables-time调入time(displaytimeinterval中从0到几每隔几)--结局输入status(singlevalue输入1表示死亡,因为看上述文字:valueindicatingeventhasoccurred表示目标事件发生的值,所以输入死亡所表示的数字)--options—选择lifetables和survivalplot—OK3、Kaplan-Meier法小样本量有两个分组,两种不同方法生存分析并比较生存率建立数据--—第一列(time)—第二列(结局state0死亡/1失访/2存活)一第三列(组别)分析:analyze—survival--Kaplan-Meier一time调入time,group调入factor,结果调入status(定义结果选择0,表示死亡)--options选择survivaltablesmeanandmediansurvival--comparefactor中选择log-rank法一ok结果给出两组的平均生存时间和中位生存时间,标准误和可信区间,overallcomparisons表示对两者的生存率进行比较Ps:在寿命表中也可以对生存率进行比较,options选项中compareleveloffirstfactor中选择overall第十四章量表信度效度分析1、量表信度分类:外在信度〜表示量表在不同时间测定时测量结果一致程度,重测信度、分半信度内在信度〜表示量表各项目之间的一致性程度,cronbach’sa信度Analyze—scale—reliabilityanalysis—总体选入或根据不同的因子分别选入2、量表效度量表能够测量出研究中所欲测量特性的程度。效度越高表示该测量的结果与测验行为的真实度越符合,越能够达到测验的目的。内容效度:专家法评价,对量表的题目,内容,范围是否符合调查目的进行分析评价标准效度:必须要有比较标准,指的是测量值与标准值之前的接近程度结构效度:根据实际测量的数据,考察所用的量表是否能反映事先假设的理论结构。KMO法。具体操作,先不用掌握了,不会考的。第十五章统计图形第一节Barchart条形图先要看懂几个翻译,非常重要!!Simple简单条形图Clustered分组条形图Stacked分段条形图(堆积图)Datainchartare:Summariesforgroupofcases按照观察量分组汇总Summariesforseparatevariables按单独变量汇总按某观察量的数值做条形图Valueofindividualcases1.简单条形图(绘制各种手术方式的人数)选Simple简单条形图--Summariesforgroupofcases按照观察:量分组汇总一barsrepresent(图形代表什么)选择nofcase,表示直条的长短观察量分组的数值一categoryaxis按某观察量的数值做条形图可以点击title进行标题命名,双击图形可以对其作出设置(绘制手术中失血量和输血量的均值)两个变量则选用:Summariesforseparatevariable按单独变量汇总,将两个变量选入barsrepresent,其他同上,也可以双击设置图形。(绘制每个病例的输血次数)每个变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论