已阅读5页,还剩174页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Dept. of Epi. & Biostat.,School of Public Health,NJMUJunchengDai,E_mail:,常用统计学方法简介 SPSS实战篇,提 纲,背景介绍,数据管理,数据导入,数据分析,一些建议,参考文献,SPSS 软件简介,SPSS原为Statistical Package for the Social Sciences的简称,意为“社会科学统计软件包”。2002年SPSS公司正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”。 SPSS for Windows是一个集数据整理、分析功能于一身的组合式软件包。SPSS的基本功能:数据管理、统计分析、图表分析、输出管理等,创 始 人 Nie、Hull and Bent 历史悠久 1968年完成spss基本框架的构建 1984年正式推出基于pc的版本用户群广 全球范围内用户超过250,000 遍及全世界60多个国家,有1,200多名员工 权 威 全美50个州的政府所指定使用的统计软件,SPSS 软件简介,常用的统计分析软件,SASSPSSStataS-plusR,软件的特点,功能强大囊括了各种成熟的统计方法和模型提供各种数据准备与数据整理技术自由灵活的表格功能提供了各种常用的统计学图形兼容性好在数据方面在结果方面易用性强,SPSS13.0的新增功能,图形和结果新增三种新的图形:Population pyramids、3-D bar charts以及Dot charts图形功能的表达:组图功能、添加误差条、参考线、连接线等数据和结果的管理与导出字符型变量可长达32767字节可以读入SAS 9.1.3数据应用日期时间向导可将结果中的统计图表直接导出到PowerPoint文件统计功能的增强新增决策树模块在复杂抽样模块中增加了线型回归、方差分析和协方差分析等二分类和多分类Logistic回归等定性数据的分析功能,提 纲,背景介绍,数据管理,数据导入,数据分析,一些建议,参考文献,SPSS界面介绍,SPSS界面介绍,数据的录入,数据的录入,数据的录入,数据的录入,数据的录入,变量名:不超过64个字符,首字符必须是字母或汉字,不能以“_”或“.”结尾变量名不能有空格或某些特殊符号,如“!”、“?”和“*”变量名不能与SPSS的关键字相同,如ALL、AND、BY、EQ、WITH、OR等,数据的录入,标准数值型逗号数值型圆点数值型科学计数法型日期型美元数值型用户自定义型字符型,变量类型,数据的录入,数据的录入,数据的录入,数值标签,数据的录入,缺失值的定义,数据的录入,列宽,对齐,连续性变量有序分类变量无序分类变量,数据的获取,方法一:,数据的获取,方法二:,数据的获取,SPSS13.0可以导入*.sav,*.xls,*.dbf,*.dat,*.txt,*.mdb,*.w,*.dbc以及各类SAS数据文件。,数据的获取,使用文本导入向导读入文本类型的数据*.txt,数据的保存,数据的保存,提 纲,背景介绍,数据管理,数据导入,数据分析,一些建议,参考文献,数据的管理,文件级别的管理,Define Variable PropertiesCopy Data PropertiesDefine DatesInsert VariableInsert CaseGo to Case Sort CasesTranspose RestructureMerge Files Aggregate Identify Duplicate CasesOrthogonal DesignSplit File Select Cases Weight Cases,Define Variable Properties ,Define Variable Properties ,Insert Variables/Cases,插入变量,插入记录,Insert Variables/Cases,点击右键,插入变量,插入记录,Go to Case.,Sort Case.,Sort Case.,点击右键,*只能进行单变量排序,Transpose.,将数据库的行 列,列 行,Restructure.,Restructure.,Restructure.,Merge Files.,纵向合并,横向合并,Add Cases.,遵循两个原则:两个待合并的SPSS数据文件,其内容合并是有实际意义的;为方便SPSS数据文件的合并,在不同数据文件中,数据含义相同的列,最好起相同的变量名,变量类型和变量长度也要尽量相同,这样方便 SPSS对变量的自动对应和匹配。,Add Cases.,Add Variables.,遵循三个原则:如果不是按照记录号对应的规则进行合并,则两个数据文件必须至少有一个变量名相同的公共变量,这个变量是两个数据文件横向对应合并的依据,称为关键变量;如果是使用关键变量进行合并的对应,则两个数据文件都必须事先按关键变量进行升序排列;为方便SPSS数据文件的合并,在不同数据文件中,数据含义不同的列,变量名不应该取相同的名称。,Add Variables.,Add Variables.,*横向合并一定要按照关键变量进行排序,否则相应的合并操作将会失败!,Aggregate.,Aggregate.,Identify Duplicate Cases.,Identify Duplicate Cases.,Split File.,Select Cases.,Select Cases.,分析所有的记录只分析满足条件的记录从原始数据中按某种条件抽样基于时间或记录序号来选择记录使用筛选指标变量来选择,Weight Cases.,ComputeRecodeVisual BanderCountRank CasesAutomatic RecodeDate/TimeCreat Time SeriesReplace Missing ValueRandom Number GeneratorsRun Pending Transforms,变量级别的管理,Compute.,生成新变量,Compute.,设置条件,练习:1、计算平均的收缩压和舒张压:2、计算BMI:3、计算年龄:有两种方法,Age=RND(CTIME.DAYS(invidate)-CTIME.DAYS(birth)/365.25)Age=RND(invidate - birth)/(60 * 60 * 24 * 365.25),bmi=weight/(height/100)*2,sbp= (sbp1+sbp2+sbp3)/3dbp=(dbp1+dbp2+dbp3)/3,Recode.,练习:1、Into Same Variables 将性别变量编码(1=男;2=女)修改为0=男;1=女2、Into Different Variables 根据计算出来的年龄分组,1表示=60岁,Into Different Variables,Into Different Variables,Visual Bander.,Visual Bander.,Visual Bander.,Visual Bander.,Count.,Rank Cases.,Rank Cases.,Automatic Recode.,Date/Time.,Replace Missing Value.,Replace Missing Value.,用所有记录该变量上数值的均值用相邻的前和后的邻近数值的均值用相邻的前和后邻近数值的中位数线性内插值法:以缺失值前后的2个有效观察值,根据内插法估计和替代缺失值。线型趋势法。用线性回归法生成和替代缺失值。,Random Number Generators.,提 纲,背景介绍,数据管理,数据导入,数据分析,一些建议,参考文献,数据汇总报告描述性统计统计表均数比较一般线性模型混合模型相关分析回归分析对数线性模型聚类/判别分析因子分析及主成分分析量表(信度、效度)分析非参数检验时间序列分析生存分析多重响应等几大类缺失值分析复杂抽样,SPSS统计分析过程,数据汇总报告(Reports),即时汇总数据汇总行汇总报告列汇总报告,OLAP Cubes,OLAP:Online Analytical Processing,OLAP Cubes,OLAP Cubes,OLAP Cubes,基本描述统计分析,Frequencies,Frequencies,Frequencies,Descriptives,Descriptives,Explore,判断有无离群点或极端值提示数据转换方法了解组间差异的特征给出统计量、正态检验和描述性统计图,包括茎叶图、直方图及箱图,Explore,Explore,Explore,Explore,Crosstabs,例:某医师研究用兰苓口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相似的80名患者随机分成两组,分别用两种药物治疗。问两药的治疗有效率是否相同。,Crosstabs,Crosstabs,Crosstabs,、P值,连续性变量的假设检验,一、t检验 1、样本均数与总体均数的比较 2、完全随机设计(成组设计)的两样本均数的比较 3、完全配对设计的两样本均数比较二、方差分析 1、完全随机设计(成组设计)的单因素方差分析 2、随机区组设计(配伍设计)的两因素方差分析三、协方差分析,样本均数与已知总体均数的比较,例:通过大量调查,已知某地正常男婴体重为3.26Kg,某医生随机抽取20名难产男婴,测得出生体重如下:问,该地难产男婴体重是否不同于本地正常男婴?3.5 3.5 3.2 3.5 3.3 3.0 3.3 3.2 3.4 2.7 3.4 3.6 3.5 2.8 3.4 2.9 3.5 3.5 4.0 4.0,SPSS 分析命令:AnalyzeCompare MeansOne-Sample T Test,样本均数与已知总体均数的比较,总体均数,样本均数与已知总体均数的比较,结论:不能认为难产男婴的出生体重与正常男婴不同。,完全随机设计(成组设计)两个样本均数的比较,例:某医生测得12名正常人和13名病毒性肝炎患者血清转铁蛋白含量(g/L) 结果如下:问肝炎患者和正常人血清转铁蛋白含量有无差异?病毒性肝炎患者:2.34 2.47 2.22 2.31 2.36 2.38 2.15 2.57 2.19 2.25 2.28 2.31 2.42正常人: 2.61 2.71 2.73 2.64 2.68 2.81 2.76 2.55 2.91 2.85 2.71 2.64,SPSS 分析命令:AnalyzeCompare MeansIndependent-Samples T Test,完全随机设计(成组设计)两个样本均数的比较,完全随机设计(成组设计)两个样本均数的比较,统计描述,方差齐性检验,结论:病毒性肝炎患者与正常人血清转铁蛋白含量有差别。,配对设计的两个样本均数比较,例:为比较某新药与常规药降血脂的效果,将性别相同、血清总胆固醇水平相近的高血脂患者配成对子,每对中随机抽取一个人服用新药,另一个人服用常规药。服用一段时间后,测得血清总胆固醇含量(mmol/L)如下:问新药与常规药降血清总胆固醇效果是否相同?新 药:6.57 6.46 6.27 6.89 6.21 7.61 7.60 7.04 6.68 7.42常规药:6.00 6.83 5.97 7.28 6.30 6.64 7.38 7.00 6.03 7.22,SPSS 分析命令:AnalyzeCompare MeansPaired-Samples T Test,配对设计的两个样本均数比较,配对设计的两个样本均数比较,结论:不能认为新药与常规药降低血清总胆固醇的效果不同。,配对差值,方差分析Analysis of Variance, ANOVA,方差分析的目的: 推断多个总体均数是否相等方差分析的使用条件:各处理组样本来自正态总体各样本是相互独立的随机样本各处理组的总体方差相等,即方差齐性,方差分析的结果解释: 方差分析的F 检验,当P0.05,可以认为各组总体均数不等或不全相等,但并不以为着任意两组总体均数都有差别。需要进一步作两两比较才能知道哪些组间有差别。多个样本均数间的两两比较 当样本组数大于2时,不宜再用前述的t检验分别作两两比较,否则会增大犯第一类错误的概率。方差分析与t检验的联系 t检验可以看作时方差分析的特例:,方差分析的注意事项,完全随机设计(成组设计)的单因素方差分析1个因素,k个水平,例:某社区随机抽取30名糖尿病患者、糖耐量减低(IGT)者和正常人进行载脂蛋白(mg/dl)测定,结果如下:问三种人载脂蛋白水平有无差别?糖尿病患者:85.70 105.20 109.50 96.00 115.20 95.30 110.00 100.00 125.60 111.00 106.50IGT异常者:96.00 124.50 105.10 76.40 95.30 110.00 95.20 99.00 120.00正 常 人:144.00 117.00 110.00 109.00 103.00 123.00 127.00 121.00 159.00 115.00,方法一:AnalyzeCompare MeansOne-Way ANOVA,完全随机设计(成组设计)的单因素方差分析1个因素,k个水平,指定进行方差齐性检验,完全随机设计(成组设计)的单因素方差分析1个因素,k个水平,结论:可以认为三种人血清载脂蛋白水平有差别。,两两比较,假定方差齐时,假定方差不齐时,两两比较,多重比较,结论:糖尿病患者与正常人、IGT异常者与正常人的载脂蛋白水平有差异;糖尿病患者与IGT异常者的载脂蛋白水平无差异。,两两比较,结论:糖尿病患者与正常人、IGT异常者与正常人的载脂蛋白水平有差异;糖尿病患者与IGT异常者的载脂蛋白水平无差异。,SNK,同一列,无差别不同列,有差别,分类变量的假设检验和非参数检验,一、分类变量的假设检验 1、完全随机设计(成组设计)的两样本率(构成比)比较 2、配对设计的两样本率(构成比)比较 3、完全随机设计的多个样本率(构成比)比较二、非参数检验 1、完全随机设计的两样本比较 2、配对设计的两样本比较 3、完全随机设计的多个样本比较 4、随机区组设计多个样本比较,完全随机设计两个样本率的比较,例1:某中药在改变剂型前曾在临床观察152例,治愈129例,未治愈23例;改变剂型后又在临床观察130例,治愈101例,未治愈29例,能否得出新剂型疗效与旧剂型不同的结论?,完全随机设计两个样本率的比较,完全随机设计两个样本率的比较,SPSS 分析命令:AnalyzeDescriptive StatisticsCrosstabs,行变量,列变量,例2:某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮炎,本生产季节开始,随机抽取15名车间工人穿上新防护服,其中1名患皮炎,其余28名工人仍穿旧防护服,其中10名患皮炎。生产一段时间后,检查两组工人皮炎患病率,问两组工人皮炎患病率有无差异?,例3:某医师A药治疗9例病人,治愈7人;用B药治疗10例病人,治愈1人,问两药疗效是否有差别?,配对设计两个样本率的比较,例1:分别用反向血凝法和酶标法对200名献血员进行HBsAg检测,结果如下,问两种检验方法检出率有无差异?,方法一:Crosstabs,方法一:Crosstabs,方法一:Crosstabs,方法一:Crosstabs,方法 二:非参数检验 Nonparametric Test,方法 二:非参数检验 Nonparametric Test,方法 二:非参数检验 Nonparametric Test,完全随机设计的多个样本率的比较,例:某省从水氟含量不同的地区随机抽取10-12岁儿童,进行第一恒齿患病率的调查,问3个地区第一恒齿患病率是否不同?,SPSS 分析命令:AnalyzeDescriptive StatisticsCrosstabs,完全随机设计的多个样本率的比较,结论:3个地区第一恒齿患病率不同或不全相同。,分层资料的2检验,例:Doll和Hill以709例肺癌患者作病例、709个非肿瘤患者作对照,按照性别分层,研究吸烟与肺癌的关系,调查结果见表,试做病例对照分析,SPSS 分析命令:AnalyzeDescriptive StatisticsCrosstabs,分层资料的2检验,分层资料的2检验,分层资料的2检验,分层资料的2检验,分层资料的2检验,结果显示:在剔除了混杂因素性别的影响后,吸烟与肺癌仍然显著相关,即吸烟是导致肺癌发生的危险因素。,秩和检验主要适用于以下情况:数值变量资料:严重偏离正态分布或者分布未知数值变量资料:完全随机设计中方差不齐有序分类资料(等级资料)注:但数据满足参数检验的条件时,若采用秩和检验,会降低统计效能(1)。,非参数检验秩和检验,两组连续性变量资料的秩和检验,例:某实验室观察某种抗癌新药治疗小鼠移植性肿瘤的疗效,两组各10只老鼠,以生存日期作为观察指标,试检验两组小鼠生存日数有无差别?,SPSS 分析命令:AnalyzeNonparametric Tests2 Independent Samples,两组连续性变量资料的秩和检验,结论:两组小鼠生存日数差别有统计学意义,试验组小鼠生存时间长于对照组。,两组连续性变量资料的秩和检验,两组有序变量资料的秩和检验,例:某研究者欲评价新药按摩乐口服液治疗高甘油三酯血症的疗效,将高甘油三酯血症患者189例随机分为两组,分别用按摩乐口服液和山楂降脂片治疗,问两种药物治疗高甘油三酯血症的疗效有何不同?,SPSS 分析命令:AnalyzeNonparametric Tests2 Independent Samples,结论:两种药物对高甘油三酯血症的疗效分布不同。,两组有序变量资料的秩和检验,配对设计资料的符号秩和检验,例:某研究者欲研究保健食品对小鼠抗疲劳作用,将同种属的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能在线电子产品交易平台开发合同
- 承包装车合同(2025年)
- 2025工程款按进度付款的合同
- 2025门清包安装劳务合同范本
- 有线电视整体转让合同
- 2025沙盘模型制作合同书
- 配电柜接线外包合同范本(2025年)
- 2025年装修维修服务合同范本
- 房屋买卖合同中的补偿与赔偿责任2025年
- 房屋承建合同书2025年
- 社会组织管理概论全套ppt课件(完整版)
- 新生儿复苏技能操作课件
- DB37∕T 5085-2016 组合铝合金模板工程技术规程
- 生和码头港口设施维护管理制度(3篇)
- 《植物生理学》课件第三章+植物的光合作用
- 重庆市劳动人事争议调解仲裁
- 高等学校建筑学专业本科(五年制)教育评估标准
- 铝合金理论重量表
- 四年级上册英语期末复习课件综合复习及检测讲义 牛津上海版一起
- 2020年污水处理厂设备操作维护必备
- LSS-250B 纯水冷却器说明书
评论
0/150
提交评论