




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS软件在医学科研中的应用(SPSS13.0)何平平北大医学部流行病与卫生统计学系Tel:828016191hSPSS软件在医学科研中的应用(SPSS13.0)何平平北大SPSS的基本数据管理功能SPSSBasicDataManagement参考文献:SPSSProgrammingandDataManagement,2ndEdition:AGuideforSPSSandSASUsers.SPSSInc.2005.2hSPSS的基本数据管理功能SPSSBasicData一、数据获取二、变量属性三、记录排序四、文件拆分五、筛选记录六、数据文件的合并——纵向合并七、数据文件的合并——横向合并八、通过计算产生新变量九、重新赋值十、排秩十一、重排格式十二、日期计算十三、随机抽样3h一、数据获取3h一、数据获取GettingDataintoSPSS读取SPSS数据文件:*.sav,常用的其他外部数据文件:*.xls,*.dbf,*.txt,*.dat,*.w*,*.sas7bdat,*.mdb……注意:医学领域常用数据库EpiData软件,先将数据文件*.rec转换为*.sps文件,然后在SPSS的语法窗口运行,生成*.sav
文件。4h一、数据获取GettingDataintoSPSS读取数据获取途径5h数据获取途径5h二、变量属性VariableProperties1.Name:变量名。允许用中文,但习惯上采用英文变量名。2.Type:变量类型,常用数值型(Numeric)、字符型(String)、日期型(Date)。3.Width:变量宽度,默认为8。4.Decimals:小数位数,默认为2。5.Label:变量编码,又称为变量标签,用于注释变量名的含义。6h二、变量属性1.Name:变量名。允许用中文,但习惯上采用英6.Values:变量值编码,又称为变量值标签,用于注释变量值的含义。例如:变量sex,变量标签为“性别”;变量值为1与2,变量值编码:1为“男性”,2为“女性”。7.Missing:缺失值。默认为系统缺失值,用“.”表示。8.Columns:列宽,默认为8。9.Align:对齐方式。数值型变量默认右对齐(Right),字符型变量默认左对齐(Left)
。10.Measure:测度,包括三类:数值变量(Scale),名义变量或无序分类变量(Nominal),有序分类变量或等级变量(Ordinal)。7h6.Values:变量值编码,又称为变量值标签,用于注释变量数据清单变量清单数据文件ex.sav(数据窗口……数据清单界面)8h数据清单变量清单数据文件ex.sav(数据窗口……数据清单界数据文件ex.sav(数据窗口……变量清单界面)注意:一行对应一个“记录(Case)”;一列对应一个“变量(Variable)”。此数据窗口不是一个很好的数据录入界面。9h数据文件ex.sav(数据窗口……变量清单界面)注意:一行对删除ex.sav文件中id为5-7的case,将文件另存为ex_1.sav为以后使用方便,将ex.sav另存为如下数据库(SaveAs….)10h删除ex.sav文件中id为5-7的case,将文件另存为删除ex.sav文件中id为1-4的case,将文件另存为ex_2.sav11h删除ex.sav文件中id为1-4的case,将文件另存为删除ex.sav文件中变量sbp1-dbp2,删除id=6的记录,将文件另存为ex3.sav12h删除ex.sav文件中变量sbp1-dbp2,删除id=6只保留ex.sav文件中变量id、sbp1-dbp2,删除id=7的记录,将文件另存为ex4.sav13h只保留ex.sav文件中变量id、sbp1-dbp2,删除三、记录排序SortCases14h三、记录排序14hex.sav文件中,
按照“height(身高)”的大小排序。升序降序15hex.sav文件中,按照“height(身高)”的大小排四、文件拆分SplitFile
16h四、文件拆分SplitFile16h比较组分组变量根据分组变量排序ex.sav文件中,按照“sex(性别)”拆分文件17h比较组分组变量根据分组变量排序ex.sav文件中,按照“18h18h分性别对“height(身高)”进行统计描述描述性统计19h分性别对“height(身高)”进行统计描述描述性统计19h20h20h不同性别的“height(身高)”统计描述所有记录的“height(身高)”统计描述注意:SPSS的输出结果文件为*.spo21h不同性别的“height(身高)”统计描述所有记录的“hei五、筛选记录SelectCases22h五、筛选记录SelectCases22h如果条件满足过滤删除selectunselect23h如果条件满足过滤删除selectunselect23h筛选条件:有高血压家族史(genic>0)24h筛选条件:有高血压家族史(genic>0)24h如果选用Deleted,则一定要将筛选后的文件另存一个文件名25h如果选用Deleted,则一定要将筛选后的文件另存一个文件名filter_$变量,0表示未选中该记录,1表示选中该记录不符合条件的记录,被用斜线筛除26hfilter_$变量,0表示未选中该记录,1表示选中该记录不有高血压家族史的患者身高的统计描述所有患者身高的统计描述27h有高血压家族史的患者身高的统计描述所有患者身高的统计描述27六、数据文件的合并——纵向合并:增加记录MergeFiles….AddCases打开数据文件ex_1.sav作为“工作数据文件”28h六、数据文件的合并——纵向合并:增加记录MergeFile打开ex_2.sav作为“外部数据文件”29h打开ex_2.sav作为“外部数据文件”29h*代表工作数据文件,+代表外部数据文件。30h*代表工作数据文件,+代表外部数据文件。30h将连接后的文件另存一个文件名:ex_12.sav31h将连接后的文件另存一个文件名:ex_12.sav31h七、数据文件的合并——横向合并:增加变量MergeFiles….AddVariables打开ex3.sav作为“工作数据文件”32h七、数据文件的合并——横向合并:增加变量MergeFile打开ex4.sav作为“外部数据文件”33h打开ex4.sav作为“外部数据文件”33h(1)两个文件均提供记录(Bothfilesprovidecases)关键变量对于排序的文件,按照关键变量进行匹配*代表工作数据文件,+代表外部数据文件。34h(1)两个文件均提供记录(Bothfilesprovid警告:如果数据未按照关键变量的升序进行排序,那么不能按照关键变量匹配35h警告:如果数据未按照关键变量的升序进行排序,那么不能按照关键连接后的数据文件,另存为ex_34a.sav36h连接后的数据文件,另存为ex_34a.sav36h(2)按照关键变量,将外部数据文件匹配到工作数据文件中(Externalfileiskeyedtable)。37h(2)按照关键变量,将外部数据文件匹配到工作数据文件中(Ex连接后的数据文件,另存为ex_34b.sav38h连接后的数据文件,另存为ex_34b.sav38h(3)按照关键变量,将工作数据文件匹配到外部数据文件中(Workingfileiskeyedtable)。39h(3)按照关键变量,将工作数据文件匹配到外部数据文件中(Wo连接后的数据文件,另存为ex_34c.sav40h连接后的数据文件,另存为ex_34c.sav40h八、通过计算产生新变量
compute41h八、通过计算产生新变量41h产生一个新变量:bmi=体重/((身高)**2)42h产生一个新变量:bmi=体重/((身高)**2)42h43h43h九、重新赋值Recode……..Intodifferentvariables44h九、重新赋值Recode……..Intodifferen旧及新的变量值45h旧及新的变量值45h根据bmi对7个记录进行分组,bmi:正常:18.0-23.9;超重:24.0-27.9;肥胖:>=28.0。46h根据bmi对7个记录进行分组,bmi:正常:18.0-23定义新的变量名:bmi_gr47h定义新的变量名:bmi_gr47h48h48h问题:当bmi=23.91时,bmi_gr的取何值?根据上述recode方法,bmi_gr为缺失值!解决办法:RECODEbmi(18.0thru24.0=1)(24.0thru28.0=2)(28.0thruHighest=3)INTObmi_gr.EXECUTE.49h问题:当bmi=23.91时,bmi_gr的取何值?根据上述十、排秩rankcases50h十、排秩rankcases50h对sbp1(治疗前SBP)进行排秩51h对sbp1(治疗前SBP)进行排秩51h排秩后产生新变量rsbp1,其中对于相等的变量值(称为结点ties)取平均秩次。本例中第2、3位的平均秩次为2.5。52h排秩后产生新变量rsbp1,其中对于相等的变量值(称为结点t十一、重排格式Restructure53h十一、重排格式Restructure53h1.将变量转换为记录Restructureselectedvariablesintocases54h1.将变量转换为记录54h将变量转换为同一组55h将变量转换为同一组55h记录标识转置后的新变量需要转置的变量需要固定的变量56h记录标识转置后的新变量需要转置的变量需要固定的变量56h创建一个索引变量57h创建一个索引变量57h索引变量的变量名按照自然数列对索引变量取值58h索引变量的变量名按照自然数列对索引变量取值58h未选取的变量从新数据库中删除59h未选取的变量从新数据库中删除59h开始重排60h开始重排60h重排后的数据文件data1.sav。61h重排后的数据文件data1.sav。61h2.将记录转换为变量Restructureselectedcases
intovariables62h2.将记录转换为变量62h63h63h记录标识索引变量64h记录标识索引变量64h按照“记录标识”变量排序65h按照“记录标识”变量排序65h按照原变量值顺序,排列新变量组66h按照原变量值顺序,排列新变量组66h开始重排67h开始重排67h重排后的数据文件data2.sav。68h重排后的数据文件data2.sav。68h十二、日期计算
Date/Time
69h十二、日期计算69h用日期与时间进行计算70h用日期与时间进行计算70h两个日期之间的计算71h两个日期之间的计算71hDate1与Date2之差以“天”为单位72hDate1与Date2之差以“天”为单位72h结果变量:day,单位为“天”变量标签73h结果变量:day,单位为“天”变量标签73h74h74h十三、随机抽样
RandomSampling
步骤1随机数种子(RandomNumberSeed)的设定以数据文件data.sav为例75h十三、随机抽样步骤1随机数种子(RandomNumbe指定种子(此处以随机抽样的日期为种子)76h指定种子(此处以随机抽样的日期为种子)76h步骤2随机筛选记录(SelectCasesRandomly)77h步骤2随机筛选记录(SelectCasesRando随机抽取样本单击Sample按钮78h随机抽取样本单击Sample按钮78h从前10个记录中随机抽取2个记录79h从前10个记录中随机抽取2个记录79h从前10个记录中随机抽取2个记录80h从前10个记录中随机抽取2个记录80h随机抽样的结果:抽取了no为3、4的两个记录。81h随机抽样的结果:81h注意:1.随机抽样主要用于现场调查中,从总体中用简单随机的方法随机抽取一个样本。2.随机抽样的过程中,需要设定种子,以保证随机抽样结果是可重现的。(一般来说,如果不设定种子,那么第二次抽样很可能与第一次抽样的结果不同。)82h注意:82h小贴士:SPSS通过菜单,可以实现大部分的数据管理及统计分析功能,软件操作简单、易学。在学习SPSS时,要养成一个好习惯:用语法文件(*.sps)保存每一步操作(只需要在每个对话框中点击Paste,就可以将操作粘贴到语法窗口,即Syntax窗口)。这样做,至少有两个益处:1.避免重复地操作;2.很清楚地记录了统计分析的过程。83h小贴士:83h如果您偷懒,从不保存语法文件……1.您花了一整天的时间进行了复杂的数据整理及统计分析……几天后,老板告诉您:数据库需要删除一个记录,您要重新做统计!天啊!为了这一个记录,难道还要再花费一整天重头开始么?!84h如果您偷懒,从不保存语法文件……1.您花了一整天的时间进行了如果您偷懒,从不保存语法文件……2.您花了一整天的时间进行了复杂的数据整理及统计分析。很幸运,数据很准确,方法很合适,似乎没有什么遗憾了。……N年后,有人拿着您的统计结果,很崇拜地请教:当初您是怎么算出这个结果的?天啊!我怎么可能记得N年前的事情?!85h如果您偷懒,从不保存语法文件……2.您花了一整天的时间进行了如果您养成了这个好习惯:用语法文件(*.sps)保存每一步操作……哈哈!只需要几秒钟我就能将统计结果重现!apieceofcake!86h如果您养成了这个好习惯:用语法文件(*.sps)保存每一步操SPSS软件在医学科研中的应用(SPSS13.0)何平平北大医学部流行病与卫生统计学系Tel:8280161987hSPSS软件在医学科研中的应用(SPSS13.0)何平平北大SPSS的基本数据管理功能SPSSBasicDataManagement参考文献:SPSSProgrammingandDataManagement,2ndEdition:AGuideforSPSSandSASUsers.SPSSInc.2005.88hSPSS的基本数据管理功能SPSSBasicData一、数据获取二、变量属性三、记录排序四、文件拆分五、筛选记录六、数据文件的合并——纵向合并七、数据文件的合并——横向合并八、通过计算产生新变量九、重新赋值十、排秩十一、重排格式十二、日期计算十三、随机抽样89h一、数据获取3h一、数据获取GettingDataintoSPSS读取SPSS数据文件:*.sav,常用的其他外部数据文件:*.xls,*.dbf,*.txt,*.dat,*.w*,*.sas7bdat,*.mdb……注意:医学领域常用数据库EpiData软件,先将数据文件*.rec转换为*.sps文件,然后在SPSS的语法窗口运行,生成*.sav
文件。90h一、数据获取GettingDataintoSPSS读取数据获取途径91h数据获取途径5h二、变量属性VariableProperties1.Name:变量名。允许用中文,但习惯上采用英文变量名。2.Type:变量类型,常用数值型(Numeric)、字符型(String)、日期型(Date)。3.Width:变量宽度,默认为8。4.Decimals:小数位数,默认为2。5.Label:变量编码,又称为变量标签,用于注释变量名的含义。92h二、变量属性1.Name:变量名。允许用中文,但习惯上采用英6.Values:变量值编码,又称为变量值标签,用于注释变量值的含义。例如:变量sex,变量标签为“性别”;变量值为1与2,变量值编码:1为“男性”,2为“女性”。7.Missing:缺失值。默认为系统缺失值,用“.”表示。8.Columns:列宽,默认为8。9.Align:对齐方式。数值型变量默认右对齐(Right),字符型变量默认左对齐(Left)
。10.Measure:测度,包括三类:数值变量(Scale),名义变量或无序分类变量(Nominal),有序分类变量或等级变量(Ordinal)。93h6.Values:变量值编码,又称为变量值标签,用于注释变量数据清单变量清单数据文件ex.sav(数据窗口……数据清单界面)94h数据清单变量清单数据文件ex.sav(数据窗口……数据清单界数据文件ex.sav(数据窗口……变量清单界面)注意:一行对应一个“记录(Case)”;一列对应一个“变量(Variable)”。此数据窗口不是一个很好的数据录入界面。95h数据文件ex.sav(数据窗口……变量清单界面)注意:一行对删除ex.sav文件中id为5-7的case,将文件另存为ex_1.sav为以后使用方便,将ex.sav另存为如下数据库(SaveAs….)96h删除ex.sav文件中id为5-7的case,将文件另存为删除ex.sav文件中id为1-4的case,将文件另存为ex_2.sav97h删除ex.sav文件中id为1-4的case,将文件另存为删除ex.sav文件中变量sbp1-dbp2,删除id=6的记录,将文件另存为ex3.sav98h删除ex.sav文件中变量sbp1-dbp2,删除id=6只保留ex.sav文件中变量id、sbp1-dbp2,删除id=7的记录,将文件另存为ex4.sav99h只保留ex.sav文件中变量id、sbp1-dbp2,删除三、记录排序SortCases100h三、记录排序14hex.sav文件中,
按照“height(身高)”的大小排序。升序降序101hex.sav文件中,按照“height(身高)”的大小排四、文件拆分SplitFile
102h四、文件拆分SplitFile16h比较组分组变量根据分组变量排序ex.sav文件中,按照“sex(性别)”拆分文件103h比较组分组变量根据分组变量排序ex.sav文件中,按照“104h18h分性别对“height(身高)”进行统计描述描述性统计105h分性别对“height(身高)”进行统计描述描述性统计19h106h20h不同性别的“height(身高)”统计描述所有记录的“height(身高)”统计描述注意:SPSS的输出结果文件为*.spo107h不同性别的“height(身高)”统计描述所有记录的“hei五、筛选记录SelectCases108h五、筛选记录SelectCases22h如果条件满足过滤删除selectunselect109h如果条件满足过滤删除selectunselect23h筛选条件:有高血压家族史(genic>0)110h筛选条件:有高血压家族史(genic>0)24h如果选用Deleted,则一定要将筛选后的文件另存一个文件名111h如果选用Deleted,则一定要将筛选后的文件另存一个文件名filter_$变量,0表示未选中该记录,1表示选中该记录不符合条件的记录,被用斜线筛除112hfilter_$变量,0表示未选中该记录,1表示选中该记录不有高血压家族史的患者身高的统计描述所有患者身高的统计描述113h有高血压家族史的患者身高的统计描述所有患者身高的统计描述27六、数据文件的合并——纵向合并:增加记录MergeFiles….AddCases打开数据文件ex_1.sav作为“工作数据文件”114h六、数据文件的合并——纵向合并:增加记录MergeFile打开ex_2.sav作为“外部数据文件”115h打开ex_2.sav作为“外部数据文件”29h*代表工作数据文件,+代表外部数据文件。116h*代表工作数据文件,+代表外部数据文件。30h将连接后的文件另存一个文件名:ex_12.sav117h将连接后的文件另存一个文件名:ex_12.sav31h七、数据文件的合并——横向合并:增加变量MergeFiles….AddVariables打开ex3.sav作为“工作数据文件”118h七、数据文件的合并——横向合并:增加变量MergeFile打开ex4.sav作为“外部数据文件”119h打开ex4.sav作为“外部数据文件”33h(1)两个文件均提供记录(Bothfilesprovidecases)关键变量对于排序的文件,按照关键变量进行匹配*代表工作数据文件,+代表外部数据文件。120h(1)两个文件均提供记录(Bothfilesprovid警告:如果数据未按照关键变量的升序进行排序,那么不能按照关键变量匹配121h警告:如果数据未按照关键变量的升序进行排序,那么不能按照关键连接后的数据文件,另存为ex_34a.sav122h连接后的数据文件,另存为ex_34a.sav36h(2)按照关键变量,将外部数据文件匹配到工作数据文件中(Externalfileiskeyedtable)。123h(2)按照关键变量,将外部数据文件匹配到工作数据文件中(Ex连接后的数据文件,另存为ex_34b.sav124h连接后的数据文件,另存为ex_34b.sav38h(3)按照关键变量,将工作数据文件匹配到外部数据文件中(Workingfileiskeyedtable)。125h(3)按照关键变量,将工作数据文件匹配到外部数据文件中(Wo连接后的数据文件,另存为ex_34c.sav126h连接后的数据文件,另存为ex_34c.sav40h八、通过计算产生新变量
compute127h八、通过计算产生新变量41h产生一个新变量:bmi=体重/((身高)**2)128h产生一个新变量:bmi=体重/((身高)**2)42h129h43h九、重新赋值Recode……..Intodifferentvariables130h九、重新赋值Recode……..Intodifferen旧及新的变量值131h旧及新的变量值45h根据bmi对7个记录进行分组,bmi:正常:18.0-23.9;超重:24.0-27.9;肥胖:>=28.0。132h根据bmi对7个记录进行分组,bmi:正常:18.0-23定义新的变量名:bmi_gr133h定义新的变量名:bmi_gr47h134h48h问题:当bmi=23.91时,bmi_gr的取何值?根据上述recode方法,bmi_gr为缺失值!解决办法:RECODEbmi(18.0thru24.0=1)(24.0thru28.0=2)(28.0thruHighest=3)INTObmi_gr.EXECUTE.135h问题:当bmi=23.91时,bmi_gr的取何值?根据上述十、排秩rankcases136h十、排秩rankcases50h对sbp1(治疗前SBP)进行排秩137h对sbp1(治疗前SBP)进行排秩51h排秩后产生新变量rsbp1,其中对于相等的变量值(称为结点ties)取平均秩次。本例中第2、3位的平均秩次为2.5。138h排秩后产生新变量rsbp1,其中对于相等的变量值(称为结点t十一、重排格式Restructure139h十一、重排格式Restructure53h1.将变量转换为记录Restructureselectedvariablesintocases140h1.将变量转换为记录54h将变量转换为同一组141h将变量转换为同一组55h记录标识转置后的新变量需要转置的变量需要固定的变量142h记录标识转置后的新变量需要转置的变量需要固定的变量56h创建一个索引变量143h创建一个索引变量57h索引变量的变量名按照自然数列对索引变量取值144h索引变量的变量名按照自然数列对索引变量取值58h未选取的变量从新数据库中删除145h未选取的变量从新数据库中删除59h开始重排146h开始重排60h重排后的数据文件data1.sav。147h重排后的数据文件data1.sav。61h2.将记录转换为变量Restructureselectedcases
intovariables148h2.将记录转换为变量62h149h63h记录标识索引变量150h记录标识索引变量64h按照“记录标识”变量排序151h按照“记录标识”变量排序65h按照原变量值顺序,排列新变量组152h按照原变量值顺序,排列新变量组66h开始重排153h开始重排67h重排后的数据文件data2.sav。154h重排后的数据文件data2.sav。68h十二、日期计算
Date/Time
155h十二、日期计算69h用日期与时间进行计算156h用日期与时间进行计算70h两个日期之间的计算157h两个日期之间的计算7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 共同买设备协议合同样本
- 农资供需合同样本
- 中标居间协议合同样本
- 轻奢雅致+禅意主题住宅示范区景观概念设计
- 家国教育主题班会与实践活动的设计与实施
- 出租房设备租赁合同标准文本
- pc构件销售合同样本
- 代办车辆注销合同标准文本
- 2025年03月贵州望谟县城市社区工作者公开招聘30人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 出售闲置小院合同标准文本
- 建筑业建筑工程施工安全管理实践报告
- 园长指导保教活动制度
- 幼儿园大班科学课件:《植物的生长》
- 中医禁食疗法专家共识护理课件
- 阑尾粘液腺癌护理查房
- 猪纤维蛋白粘合剂-临床药品应用解读
- 2023个人房屋租赁合同标准版范本
- GB/T 2882-2023镍及镍合金管
- 自身免疫性肝炎诊断和治疗指南(2021版)解读
- 《小池》的说课课件
- 《童年》读书分享PPT
评论
0/150
提交评论