SPSS统计软件的概述_第1页
SPSS统计软件的概述_第2页
SPSS统计软件的概述_第3页
SPSS统计软件的概述_第4页
SPSS统计软件的概述_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 HYPERLINK 统计学SPSSS上机实验讲讲义天津中医药药大学中医医学院公共卫生教教研室主讲人 赵铁牛2010-9绪论:学点点统计学,迎迎接挑战什么是统计计学:thhe scciencce annd arrt off deaalingg witth vaariattion in ddata throough colllectiion,classsifiicatiion aand aanalyysis in ssuch a waay ass to obtaain rreliaable resuults。即:统计计学是一套套收集数据据和分析信信息的方法法和原则,以以帮助人们们在面对不不确定性

2、时时制定决策策。由此看看来:1)它它是处理资资料中变异异性的科学学和艺术。2)它的的目的在于于取得可靠靠的结果。3)它是是在搜集、归类、分分析和解释释大量数据据的过程中中完成其使使命的。学习统计学学可以:11)在从事事医药方面面的科学研研究时,从从设计、分分析到解释释全面借助助统计学。2)在医医学论文所所应用的统统计学知识识中70%是最基本本的概念和和经典的统统计方法,出出现的错误误也最多。为此,作作为读者也也学提高识识别统计学学错误的本本领,否则则就不能正正确对待出出版物中的的结果和结结论,人云云亦云,贻贻误自身工工作。3)在在工作中,正正确理解与与运用医学学指标的正正常参考范范围、总结结自

3、己的治治疗经验、证实自己己提出的诊诊断方法不不亚于现有有方法、考考证民间验验方的优劣劣等。学什么:学学统计学的的基本概念念,学统计计学独特的的思维方式式,学常用用的统计方方法和电脑脑软件的使使用。至于于复杂的统统计理论和和技术,专专业性比较较强,需要要时可通过过协作解决决问题。实验安排实验一:11)SPSSS统计软软件的概述述及数据文文件的建立立与修改第11周 实验二:11)统计图图 第13周 22)计量资资料统计描描述实验三:11)t检验验第15周2)单因素素方差分析析3)测验11上课时间:周一 116:15-18:000上课地点:本部实验验楼一、 SPPSS统计计软件的概概述及数据据文件的

4、建建立与修改改SPSS统统计软件的的概述:SPSSS是社会科科学用的统计软软件包。事事实上,它它不仅适用用于社会科科学,同样样可应用于于经济学、心理学、医学等各各个不同领领域。除了了数据录入入外,它无无须编写程程序,完全全可以在WWindoow下通过过“菜单”、“对话框”使用点击击或双击鼠鼠标来操作作,对读者者提供及大大的方便,深深受用户欢欢迎。SPSS for winddow安装装时,根据据所选的模模块多少及及版本的不不同,所占占的硬盘空空间也不同同, 一般般来说,需需要16-24MBB。除此之之外,为了了运行此软软件,一般般还应有大大于10MMB的自由由空间,否否则,会感感到存取速速度明显

5、的的下降,甚甚至会出现现错误信息息。目前,本软软件无汉化化版。本软软件与其他他软件有数数据转化接接口,可以以方便地读读入其他软软件的数据据文件,也也可以方便便地转化为为相应的其其他数据文文件。2SPSSS13.0的主要要窗口:数数据编辑窗窗(Datta Edditorr)、结果果输出窗(Viiewerr)、程序序编辑窗(SSyntaax Edditorr)和脚本本编辑窗(SScrippt)。3SPSSS foor Wiindoww的启动和和退出 双双击软件图图标,进入入其主界面面,主菜单单的内容有有:File 文件操操作Edit 文本编编辑View 视图图Data 数据文文件的建立立与编辑Tr

6、anssformm 数据转转换Analyyze 统计分分析Graphhs 统计图图表的建立立与编辑Utiliitiess 实实用的一些些工具Windoow 窗口信息息与控制Help 帮助每个菜单都都包括一系系列功能,用用鼠标点击击可出现下下拉式菜单单,供下一一步选择和和操作。数据文件的的建立:数数据文件的的建立是指指把科研工工作过程中中采集的各各种信息、数据以某某种方式存存入到计算算机的磁盘盘中,建立立可随时存存取、修改改、统计分分析的数据据文件的全全过程。一一般来说,它它包括数据据编码、建建立数据文文件的二维维结构、数数据录入、选定数据据文件名及及保存数据据等几个步步骤。操作过程:Dataa

7、4.1数据据编码 在建立数据据文件之前前首先要进进行数据编编码(Daata CCode),它它包括如下下三个层次次:4.1.11定义数据据项的变量量名(Vaariabble NName)给数据项取变量名可以用汉语拼音或是英文缩写。但是,应遵循如下原则:1)变量名名由一般不不多于8个个字符组成成。2)首字符符应该是英英文字母,其其后可以为为字母或数数字及除了了“?”“!”“*”以外的字字符。但是是应该注意意,不能以以下划线“-”和“.”作为变量量名的最后后一个字符符。3)变量名名不能使用用SPSSS的保留字字。SPSSS的保留留字有:AALL、AAND、OOR、NOOT、EQQ、GE、GT、LL

8、E、LTT、NE、TO、WWITH及及一些常用用的函数符符号等。4)系统中中不区分变变量名中的的大小写字字母。例如如ABCEE与abccd被认为为是同一变变量。4.1.22定义数据据项变量的的标签(VVariaable Labeel)定义义变量标签签是对该变变量名所表表示的数据据项内涵的的进一步说说明,可以以用英文或或中文。变变量标签是是一个可选选择项,可可以定义,也也可以不定定义。4.1.33定义数据据项变量取取值的标签签(Vallue LLabells)每个个变量名对对应一个数数据项,每每个变量取取不同的值值,表示数数据项中的的不同信息息。有时为为了更好地地理解统计计分析过程程中的输出出结

9、果,要要进一步给给变量的不不同的取值值赋以不同同的标签,以以便对不同同的信息作作出解释。并不是所所有的变量量值都要定定义标签,一一般来说,离离散变量才才给变量值值定义标签签。3.2建立立数据文件件的操作定义变量包包括定义变变量名、变变量类型、变量长度度(含小数数点位数)、变量标签签、变量值值标签、缺缺失值和变变量显示格格式(宽度度、对齐方方式)等。定义变量量的步骤如如下:进入入数据窗口口、激活定定义变量的的对话框、定义每个个变量的名名称及数据据类型等、保存(存存储)数据据文件的框框架结构、最后是数数据录入和和存储。5其他类类型的数据据文件的读读入 SSPSS有有很好的兼兼容性,它它能把DBBA

10、SE、FOXBBASE、FOXPPRO及EEXCELL所建立的的数据文件件读入并进进行统计分分析。6上机内内容:5.1根据据医学统统计学1187页表表15-11 围手术术期输血对对先天性巨结结肠术后感感染关系的的探讨的数数据,在电电脑上建立立该项数据据文件:并并依照1888页定义义相应的变变量名,定定义合适的的变量类型型,数据宽宽度和小数数点为数,依依照1899页表155-2定义义变量标签签,依照1189页表表15-33 定义分分类变量的的变量值标标签。最后后录入该数数据,并以以“EG15001”为名保存存在D盘的的“SPSSS上机实验验”的文件夹夹下。5.2对EEG15001.saav数据集

11、集依照seex和agge排序。操作过程:DataSortt Casses5.3对EEG15001.saav数据集集依照seex拆分成成两个数据据文件。操作过程:DataSpliit Fiile5.4根据据医学统统计学11页表1-1,建立立可在SPPSS软件件上分析用用数据文件件。5.5根据据医学统统计学339页表55-2,建建立可在SSPSS软软件上分析析用数据文文件。本单元参考考书目:马斌荣.医学统计计学人民民卫生出版版社贾俊平统统计学清清华大学出出版社二、 统计计图表 统计表和统统计图是统统计描述的的重要工具具,在搜集集、整理及及分析资料料时,尤其其在科研论论文中,表表达统计结结果及进行行

12、对比分析析时应用极极为广泛。将统计分分析的事物物及其指标标用表格的的形式列出出,即为统统计表。合合理的统计计表可将统统计数据和和分析结果果简明而正正确地表达达出来,既既可避免冗冗长的文字字叙述,又又可使数据据条理化、系统化,便便于理解、分析和比比较。1统计表 在对分分类变量较较多的数据据进行分类类汇总,或或在处理由由多项应答答组成的问问卷时,SSPSS的的统计表(TTablee)过程体体现了很大大的灵活性性和方便性性。统计表菜单单下包括以以下六种过过程:Custoom Taabless 自定义统统计表Multiiple Respponsee Setts 定义义多项应答答数据集Basicc Ta

13、bbles 基本统统计表Generral TTablees 综合统统计表Multiiple Respponsee Tabbles 多项项应答统计计表Tablees off Freequennciess 频数数统计表本课程只讲讲授基本统统计表(BBasicc Tabbles) 基本统计表过程可用以创建三维统计表。所谓三维统计表,是指由行变量(row/down variable)、列变量(column/across variable)和分层变量(layer/separate variable)构成的统计表。2统计图图 统计计图利用点点的位置、线段的升升降、直条条的长短和和面积的大大小等各种种几何图

14、形形来表达统统计资料和和指标,它它将研究对对象的特征征、内部构构成、相互互关系、对对比情况、频数分布布等情况形形象而生动动地表达出出来,更直直观地反映映出事物间间的数量关关系,更易易于比较和和理解,可可以给读者者留下清晰晰的印象,研研究论文与与宣传展示示中经常用用到它。统统计图的缺缺点是往往往不能精确确地显示数数字大小,所所以经常与与统计表一一起使用。在医学中中常用的统统计图有直直条图、百百分条图、圆图、普普通线图、半对数线线图、直方方图、箱图图和散点图图等。绘制制统计图总总的基本要要求首先是是根据资料料的性质和和分析目的的选择适当当的图形。击主菜单单中的GrraphssInteeractti

15、ve,弹弹出统计制制图的子菜菜单:Bar 直条图Dot 点形图Line 线图Ribboon 带带形图Drop-Linee 下降线线图Area 面积积图Pie 饼饼图Boxpllot箱式图Errorr Barr误差条图图Histoogramm直方图Scattterpllot散点图3上机内内容基本统计表表:数据集为上上节课录入入并存储的的EG15501.ssav。操作过程:AnallyzeCusttom TTableesBasiic Taabless,弹出基基本统计表表主对话框框。Summaariess:汇总变变量,一般般为定量变变量。选入入汇总变量量后,击SStatiisticc按钮,可可在统计

16、量量对话框中中选择汇总总统计量,如如均数、标标准差、标标准误等。Subgrroupss定义分组组变量。Down:行变量,一一般为分类类变量。Acrosss:列变变量,一般般为分类变变量。Separrate:分层变量量 ,一般般为分类变变量。 Alll commbinaationns (nnesteed):嵌嵌套排列。当行变量量、列变量量或分层变变量同时选选入两个或或两个以上上变量时,该该选项被激激活。 Eacch seeparaatelyy(staackedd):平行行排列。当行行变量、列列变量或分分层变量同同时选入两两个或两个个以上变量量时,该选选项被激活活。根据数据据集,以ssex、hhc

17、t、oopa、ddiseaase、iinfecct为研究究变量制作作三维统计计表、行变变量嵌套统统计表、行行变量平行行排列统计计表。条图: 用用以描述按按性质分组组某项指标标值的大小小。如表2-1数据,建建立数据文文件barr.savv,(建立立三个变量量:yeaar(119522,211972),cause(1肺结核,2=心脏病,3=恶性肿瘤),prop)并制图:表2-1 某地两两年3种疾疾病的死亡亡率(1/10万)死因1952年年1972年年肺结核163.2227.4心脏病72.583.6恶性肿瘤57.2178.22单式条图:分别以11952和和19722年数据制制图,作三三种疾病的的死亡

18、率比比较。DataSeleect CCasessIf 时间11, GrooupsBarSimpple & Summmariies Deffine Otheer suummarry fuunctiion(MMean) Varriablle : Propp Cattegorry : causse复式条图:建立3种种疾病死亡亡率比较的的复式条图图: GrooupsBarClusster & SSummaariess Deffine Otheer suummarry fuunctiion(MMean) Varriablle : Propp Cattegorry : causse(yeear) Deff

19、in CClustter bby :yyear (cauuse)。4)分段条条图(sttackeed)线图(Liine): 用以描描述某一(些些)变量随随时间变量量变化的关关系。根据表22-2中数数据,建立立数据liine.ssav,并并制作单变变量线图(ssimplle)和复复变量线图图(mulltiplle)。表2-2 某地居居民19550-19964年伤伤寒与结核核病死亡率率(1/110万)年份19501952195419561958196019621964伤寒31.322.418.09.25.03.81.60.8结核174.55157.11142.00127.2297.771.359.

20、246.0饼图(piie):用用以描述构构成比资料料。根据表22-3中数数据,建立立数据piie.saav,并制制作5种主主要死因构构成饼图。表2-3 某地19983年 5种主要要死因构成成死因分类例数心脏病1242脑血管病1113恶性肿瘤651呼吸系统病病337消化系统疾疾病157Paretto 图:产生从高高到低排列列的条图,并并可给出累累积曲线。以piee.savv 为例,绘绘制单式PParetto 图。箱丝图 (BBoxpllot):用以描述述数值变量量的五个百百分位点,即即P0(最最小值)、P25、P50、P75、P1000(最大值值)。对EG11501.sav 数据文件件,作出hh

21、ct关于于sex的简简单箱形图图。散点图(SScattter):用于表示示双数值变变量之间的的相关关系系。以数据文文件linne.saav为例,绘绘制结核与与伤寒之间关系系的简单散散点图。绘制复合合散点图(OOverllay):以数据文文件linne.saav为例,xx轴表示时时间变量,yy轴表示结结核和伤寒寒死亡率。直方图(HHistoogramm):用以以描述一组组数值变量量资料的频频数分布对EG11501.sav数据据文件,作作出hctt的直方图图。本单元参考考书目:1马斌荣荣.医学学统计学人民卫生生出版社2. 陈陈平雁. SPSSS13.0软件应应用教程人民卫生生出版社贾俊平统统计学清

22、清华大学出出版社三、计量资资料的统计计描述1数据汇汇总报告(RReporrt) 主菜单AAnalyyze列出出了统计分分析的绝大大部分内容容,在菜单单中Repportss列在第一一行,它的的重要功能能是数据的的汇总统计计,它可以以按自行规规定的格式式报告描述述统计量。1.1. 即时汇总总分析(OOLAP Cubees)OLAP是是Onliine AAnalyyticaal Prrocesssingg的缩写,该该过程主要要用于统计计描述。其其特点是提提供快捷、灵活多样样的交互方方式。操作过程:从菜单选选择AnaalyzeeRepoortsOLAPP Cubbes Summmaryy varria

23、blle:分析析变量。一一般为计量量变量。 Grooupinng vaariabble:分分组变量。可选1个个或多个,对对上面的分分析变量进进行分组统统计。Stattistiics:统统计量。数据集EEG15001.saav分别以以sex为分分组变量 、infeect为分分组变量及二二者共同为为分组变量对tiime, hct计计算统计量量,包括合合计、均数数、样本量量、标准差差、标准误误、最小值值和最大值值。1.2 数数据汇总(CCase Summmarizze)数据汇总是是将数据编编辑窗中的的全部或部部分数据源源在结果窗窗中罗列出出来,以便便浏览或打打印。同时时对数据的的基本特征征进行描述述

24、。操作过程:从菜单选选择AnaalyzeeRepoortsCasee Summmariize Variaabless:选入汇汇总变量。Groupping variiablee:选入分分组变量。Stattistiics:统统计量。对数据集集EG15501.ssav以sex 为为分组变量量,计算反反应变量ttime、losssb、oppab的例例数、均数数及标准差差,只限于于数据文件件中前200例的计算算,并输出出原始数据据。1.3行行汇总报告告(Repport Summmariees inn Roww)行汇总报告告过程可以以罗列原始始数据,其其格式是以以观察单位位和统计量量为行标目目,以报告告变

25、量为列列标目。与与汇总数据据过程相比比,它可以以给出更为为复杂的报报告形式,其其输出格式式的设置也也更为详细细。操作过程:从菜单选选择AnaalyzeeRepoortsRepoort SSummaariess in Row Data Coluumns:定义报告告变量。Breakk Collumnss :选入入分组(分分类)变量量。注意:在本本界面存在在两个Suummarry正下方SSummaary:分分组报告统统计量。右下方SSummaary:汇汇总报告统统计量。对数据集集EG15501.ssav以sex 为为分组变量量,计算反反应变量ttime、losssb、oppab,分分组统计量量选择均

26、数数、样本量量和标准差差,汇总统统计量选择择均数、样样本量、标标准差及最最大和最小小值。1.4列列汇总报告告(Repport Summmariees inn Collumn)列汇总报告告以分组变变量的不同同水平为行行目标,以以报告变量量(包括合合计汇总变变量)和统统计量为列列目标。列列汇总报告告的功能与与行汇总报报告有许多多相似之处处,但也有有不同,列列汇总每次次只能选择择1个变量量,但可以以分别选择择不同的统统计量,不不能列出原原始数据;行汇总可可多选变量量,但入选选变量只能能选择相同同的统计量量,可以列列出原始数数据。操作过程:从菜单选选择AnaalyzeeRepoortsRepoort

27、SSummaariess in ColuumnData Coluumns:定义报告告变量。Breakk Collumnss :选入入分组(分分类)变量量。对数据集集EG15501.ssav以sex 为为分组变量量,在报告告变量中,每每次选一个个变量,SSummaary按钮钮被激活,击击Summmary按按钮,分别别选定待输输出的统计计量,一次次仅选一个个待输出的的统计量。若不选,则则系统默认认求合计。本实验要要求:计算反应应变量tiime的PPerceentagge innsidee Loww:1200 Higgh:1880、losssb均数、oppab最大大值。2频数分分布分析(FFrequ

28、uenciies) 频数分布布分析主要要通过频数数分布表、条图和直直方图,以以及集中趋趋势和离散散趋势的各各种统计量量,描述数数据的分布布特征。操作过程:从菜单选选择AnaalyzeeDesccripttiveFreqquencciesStattistiics:统统计量。有有包括四分分位间距等等的百分位位数、包括括均数等的的集中趋势势和包括标标准差的离离散趋势可可供选择。Charrt:统计计图。对数据集集EG15501.ssav的llossbb(失血量量)作描述述性分析,并并绘制直方方图。3描述性性统计分析析(Desscripptivees)描述性统计计分析主要要用以计算算描述集中中趋势和离离

29、散趋势的的各种统计计量,此外外还有一个个重要功能能是对变量量做标准化化变换,即即Z变换。操作过程:从菜单选选择AnaalyzeeDesccripttiveDesccripttivess对数据集集EG15501.ssav的llossbb、opaab进行描描述性分析析。4探索性性分析(EExploore)探索性分析析主要有以以下几个目目的:对数据进进行初步检检查,判断断有无离群群点(ouutlieers)和和(或)极极端值(eextreemevvaluees)。对前提条条件假定,如如正态分布布和方差齐齐性进行检检验。了解组间间差异特征征。探索性分析析(Expploree)可以给给出统计量量、正态性

30、性检验和描描述性统计计图,包括括茎叶图、直方图和和箱图。对数据集集EG15501.ssav中的的timee(手术时时间)按分分组(分类类)变量ssex(性性别)进行行探索性分分析,要求求输出描述述统计量、做出箱图图和茎叶图图、作正态态性检验及及方差齐性性检验并绘绘制正态概概率图。5对122只小鼠进进行完全随随机分3组组:方法1:TTansfform Ranndom numbber sseedCommputee,指定目目标变量mm,Uniiformm(3),TTansfform Cateegoriize方法2:DData-Seleect CCasess-Ranndom sampple Fiilt

31、erred,于于Sampple中,指指定Exaactlyy 4 ccasess froom 122 casses, 选择Taansfoorm Comppute,指指定目标变变量m,NNumerric EExpreessioon为1,选选择Tannsforrm Comppute,指指定目标变变量m,NNumerric EExpreessioon为3,iif fiilterr=1,DData-Sortt Casses,指指定m、AAscenndingg。最后从从前面的88条中按上上述方法再再测取4条条。本单元参考考书目:1马斌荣荣.医学学统计学人民卫生生出版社2. 陈陈平雁. SPSSS13.0软

32、件应应用教程人民卫生生出版社3. 贾贾俊平统统计学清清华大学出出版社四、两组计计量资料的的均数比较较- t检验与单单因素方差差分析1对于两两组计量资资料的均数数做显著性性检验可用用t检验。它要求该该两组资料料都分别服服从正态分分布或近似似正态分布布,并且要要求两组的的方差具有有齐同性。t检验可可根据实验验设计分为为单样本t检验(Oeen-Saamplee T TTest)、配对t检验验(paiired-sampples T teest)和和两组独立立样本的tt检验(iindeppendeent- sampples T teest)。表4-1 两均数数差别的比比较样本均数与与总体均数数的比较H0

33、:=0H1:0n较小,服服从正态分分布t=n50,或或0已知 or 配对资料H0:dd=0H1:dd0成组设计两两样本均数数比较H0:H1:n1500 , nn250方差分析:又称为变变异度分析析,它是英英国统计学学家R.AA.Fissher首首先提出的的一种统计计方法,为为此有时也也称为F检检验。方差差分析简写写为ANOOVA(AAnalyysis of Variiancee)。它要要求各组观观察值服从从正态分布布或近似正正态分布,并并且各组之之间的方差差具有齐性性。方差分分析的基本本思想是把把所有观察察值之间的的变异分解解为几个部部分,即把把描写观察察值之间的的变异的离离均差平方方和分解为

34、为某些因素素的离均差差平方和及及随机抽样样误差的离离均差平方方和,进而而计算其均均方,然后后相互比较较,做统计计学处理。如表3-2表4-2 完全随随机设计方方差分析计计算表差异源SS(自由度度)MSF组间SS组间组间=kk-1MS组间= SS组组间/组间F= MSS组间/ MMS组内组内(误差差)SS组内=SS总-SS组间间组内=总-组间 =N-kMS组内= SS组组内/组内总计SS总总=N-13步骤要要求:1)写出检检验假设 2)建立数据据文件 3)统计分析析,并纪录录统计量和和检验结果果4)写出统统计结论和和专业结论论4单样本本 t检验: 推断样本本所代表的的未知总体体与已知总总体均数有有

35、无差别,还还可以计算算相应的描描述性统计计量及样本本均数和总总体均数之之差的955%可信区区间。操作过程:AnallyzeComppare MeannsOne-Sampple TT Tesst已知某水水样中含CCaCO33的真值为为20.77mg/LL,现用某某法重复测测定改水样样11次,CaCCO3的含含量为:220.999,20.441,20.110,20.000,20.991,22.660,20.999,20.441,20.000,23.000,22.000。问该该法侧得的的均数是否否偏高?5配对tt检验:用于检验验两组相关关样本或成成对样本所所得平均数数间是否有有显著性差差异,实质质上是检验验样本差值值的总体均均数与0的的差异有无无显著性意意义,以及及配对样本本是否相关关。操作过程:AnallyzeComppare Meannspairred

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论