统计制表样本_第1页
统计制表样本_第2页
统计制表样本_第3页
统计制表样本_第4页
统计制表样本_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲:资料记录描述(一):记录制表描述性记录概述描述性记录重要对记录数据构造和总体状况进行描述,普通并不进一步理解记录数据内部规律。重要分三方面内容:Reports(报表模块)、DescriptiveStatistics(描述记录)Tables(定制表格)。描述性记录是记录分析和记录推断基本,在后来每个过程中几乎都会用到。本讲将重要简介Reports与Tables模块中记录制表1、Reports该命令共包括了4个过程,分别是OLAPCubes(OnlineAnalyticalProcessing在线分析),CaseSummaries(案例摘要),ReportSummariesinRows(行摘要),ReportSummariesinColumns(列摘要)。OLAPCubes:所谓在线分析指是用迅速简朴方式对变量进行描述,并生成一种多层表,顾客可以按照需要组织分组变量某个/某些特定水平组合输出,这在使用类别较多分组变量时将会非常节约输出空间。例如研究者要对汽车重量按照其产地以及汽缸数计算平均数以及原则差。该窗口右侧为当前数据中所有变量,summaryvariables为需要进行分析变量(本例中为weight),如果同步选入各种变量,系统将在同一张表格内一次对它们进行分析;groupingvariables为分组变量(本例为origin与cylinder),但是请注意:OLAP过程不会同步输出分组变量所有组合水平下分析成果,而是用多层表格形式体现,在默认状况仅仅显示共计状况;同步origin与cylinder两个变量均未缺失case才可进入最后分析。Statistics子对话框中提供了几种惯用记录量,可依照研究目选取适当数值描述指标:Differences子对话框用于计算不同汇总变量间、同一变量在各组间差值或比例:定义要所需要记录描述项目后,点击OK:上表为进入分析记录汇总,可见在所有406条记录中,共有1条记录由于有缺失值而未能入选。下表即为在线分析成果,可见总共405辆汽车总重量为1204910磅,均数为2975.09磅,原则差为843.546磅。注意该表仅仅是汇总成果,实际为一种多层表,请双击该表进入编辑状态后,可以按照产地和汽缸数取值不同进行组合,得到不同weight平均值和原则差。如果研究者想进一步理解欧洲车与日本车在车重差别,可以使用differences子对话框指定typeofdifferences为arithmeticdiffernce,differencesbetweengroupsofcases中grouping为origin,category为2、minus为3,点击pairs按钮,OK即可得到下表:似乎和上表相比没有任何差别,但是双击该表进入编辑状态,在countryorigin下拉选项中多余了European-Japanese选项,选取它即可。请注意该表中每一种指标都是单独计算。CaseSummaries:与OLAP过程可以产生自定义简洁分层表格不同是,该命令可以将指定分组变量所有组合所有列出。依然以上题为例,对车重按照产地与汽缸数分类记录其平均数与原则差。该对话框与OLAP相似,将要分析weight移入variables中,cylinder与origin移入groupingvariables中;在statistics中选取需要指标,点击OK即可。(最佳将displaycases前小勾去掉,使得成果输出较为简洁)。ReportSummariesinRows该命令是专门用于生成复杂表格,并且其输出格式为.txt格式。例如研究者想将系统自带数据Breastcancersurvey观测对象,按照淋巴结与否转移、组织学分级分别记录患者生存时间与肿瘤大小平均数、原则差;并记录在不同组织学分级中,计算肿瘤大小超过1.5公分所占比例。如果通过前面简介命令,需要多步解决后才可以得到想要成果;但是通过该命令可以仅仅运营一次就得到想要成果。Datacolumns为需要对其进行汇总变量,breakcolumns为分组变量分别点击datacolumns中time与size,定义其format,窗口如下:同理也可以在breakcolumns中定义淋巴结转移状况、组织学分级;此外可以定义如何对这两个分组变量所相应time和size进行记录描述:定义结束后直接点击ok,系统运营后得出成果表格如下(节选),如果需要修改表格中数据可以直接双击该表格编辑。ReportSummariesinColumns该过程与reportsummariesinrows十分相似;但是输出成果更快凑。例如上述例题,改用本命令:其操作环节同reportsummariesinrows,分别将time与size移入datacolumns,再将淋巴节转移以及组织学分级移入breakcolumns;与reportsummariesinrows不同是在上述窗口中多了:inserttotal按钮,以及summary按钮被放在datacolumns框中。Inserttotal可以在输出表格中加入一种名为total汇总变量。接着咱们可以对datacolumns中pathsize、time作汇总设定;点击summary,分别设定size为超过1.5公分,time为取平均值:在format中设定其中文标目以及对其方式:同样对breakcolumns中两个分组变量也做类似设定,完毕上述设定后点击OK得到成果:*试对系统自带文献cars按不同产地和汽缸数计算汽车平均功率,以及加速至60mph所需时间均数以及原则差;并给出在不同产地中该项时间为20秒以上车型所占比例。*试对系统自带文献cars按不同产地和汽缸数计算汽车平均功率以及平均车重;并计算平均车重与平均输出动力比值。2、Tables上述Reports命令中汇总设立重要针对定量资料(从其statistics或summary选项中可以看出重要是计算平均数、原则差、最大值、最小值、偏度系数、峰度系数等专门针对计量资料记录指标);而诸多时候咱们将要对分类变量进行汇总并制定相应表格,这时repots命令就无能为力了。Tables命令正是用于分类变量记录汇总和分类变量记录制表。BasicTables:该命令为最基本tables过程,但是已经可以对分类资料/计量资料(两者中选取一种)进行各种复杂描述,只但是与tables中其她命令相比较为basic而已;此外它还具备一种特点,可以按照研究者需要定做恰当表格输出。例如在某次高血压调查中,收集了患者某些个人资料以及血压控制状况,详见高血压.sav。某研究者想按照不同性别、文化限度、和肥胖限度计算高血压控制限度频数分布;此外研究者仅仅想理解轻度肥胖、文化限度为初中及如下患者血压控制限度。对话框中down为表格横标目,across为表格纵标目;separatetables为分层变量(如果研究者仅仅想理解分组因素某个水平汇总状况,从而简化输出成果,可以考虑将原先down中某些变量移入separatetables中)。表格输出编排方式有两种:allcombination[nested]嵌套式表格、eachseparately[stacked]分列式表格。系统默以为嵌套式。Statistics对话框为表格中数据记录方式,本例仅仅要理解频数分布状况,因此选取count。Total中,可以选取在表格中加入共计栏/列。接着咱们定义如下如果表格中浮现频数为0时应当如何显示,系统默以为空格;咱们选取填0。点击ok系统运营成果如下,固然也可以选取输出eachseparately[stacked]分列式表格:该表为嵌套式表格,所有分组变量依次进入表格,后进入嵌套在先进入变量下一级。如果研究者仅仅想按照各分组变量单独汇总成果,可以选取分列式表格输出:表格中将分别按照性别、文化限度、肥胖限度各自输出控制状况频数分布。此外研究者仅仅想理解轻度肥胖、文化限度为初中及如下患者血压控制限度。则可以选取使用分层表:将肥胖限度与文化限度选入separatetables中,其她设立同前,点击ok,系统将输出如下表格:该表格为分层表,可以双击该表格,选取需要因素组合水平(本例中为轻度肥胖、文化限度为初中及如下),系统将给出针对性表格:GeneralTables:Basictables过程已经为咱们提供了良好制表功能,但是还是有些局限性;例如:它只能分别对分类或计量资料作汇总,如果要同步对两者进行记录则无能为力;它不支持对多选题数据进行汇总。为此SPSS提供了比basictables过程更强大generaltables命令。例如针对同一高血压疗效调查,研究者但愿对不同文化限度与性别汇总下列信息:血压控制频数分布输出患者年龄均数与原则差输出非药物控制办法实行状况(非药物办法有饮食、运动、情绪和其她四种选项,一种患者也许同步选取其中各种),涉及频数和构成比。如果将上述三个问题一一拆解也许需要不少时间,并且容易在汇总过程中出错。使用generaltables过程可以一次性解决三个问题,并将三某些成果输出在同一种表格中。对话框中rows为横标目,columns为纵标目,multresponse选项框为多选题定义框在本例题中可以将性别、文化限度选入rows中(固然选入columns中也可以)作为分组根据;将血压控制状况、年龄、非药物控制办法(该变量存在于multresponse框中)选入columns中。但是在入选非药物控制办法之前,要对该选项作设定:先将setdefinition中method1至method4所有选上,移入variablesinset中。在下方variablesarecodedas可以定义变量集中变量取值:dichotomies表达变量采用二分法(即所谓二项分类),在之后countedvalues中填入入选变量值(例如本题中定义所有非药物办法中变量值为2表达有采用本办法被系统选中);categories为多项分类法,如果采用本办法最佳在分析开始前对变量进行恰当编排(例如在医科大学研究生教诲过程中要开设20门选修课,现要分析研究生最喜欢3门选修课,如果将所有开设研究生课程一一列出,然后在每门课程变量取值中定义0为不喜欢,1为喜欢,则需要设定20个课程变量,而后再一一取值十分麻烦;可以考虑将每个同窗3次选取作为三个变量,录入数据时直接输入课程编码即可,这种解决办法就是多分类法)。在本例中由于不同观测对象也许采用非药物疗法种类数不同,例如有采用两种,有采用三种,有一种都不采用,因此本题采用对每个非药物疗法进行二分类办法进行编码。在multresponsesets中显示多选题变量名,可以单击该变量名进行修改,修改后点击save保存设立回到generaltables主对话框:接着要对汇总变量(年龄、血压控制状况以及非药物疗法采用状况)进行汇总记录量设定。对于不同类型变量(计量或分类)必要先制定类型。Definescells用于分类变量(即血压控制),Issummarized则用于计量资料(年龄);依照题意分别通过editstatistics设定汇总记录量:定义后可以点击OK系统输出下列表格:该表格为分列式,即分组变量性别与文化限度分别并排列出;如果要得到嵌套式表格,必要将性别或文化限度中某个移入layers中,并在输出成果中用pivotingtrays设定。先在成果输出中用右键单击——spsspivottableobject——open,在浮现窗口中选取pivot——pivotingtrays。系统将弹出如下对话框,其行与列含义与前面设立相似,将layers变量拖拽至column中即可。需要解释是“比例%”;原先它含义为该数据占列共计比例;例如男性初中如下文化,调节饮食有11例,所占比例为31.4%(男性初中如下共有35人,其中有12人血压控制状况为缺失,因此从血压控制状况计算处共计人数只有7+6+10=23人;35人中采用调节饮食有11人,占该人群比例11/35=31.4%;由于同一种观测对象也许同步选取两种或各种办法,因此该列比例之和超过100%)。MultipleResponseTables:该过程专门为多项选取题而设立。例如对上述例题咱们采用multipleresponsetables过程操作:变量放置同generaltables,与generaltables不同是在multipleresponse中系统已经自动定义好多选题,并已经生成一种为nodrug变量;此外该过程默认状况下就已经输出嵌套式表格,省去generaltables中复杂转换过程。但是该命令也有局限性之处,那就是它只可以用于分类变量(由于多项选取自身就是分类成果),对于定量变量例如年龄等不再合用。因此只要将性别与文化限度放入rows中,将血压控制状况与非药物控制办法放入columns中,点击statistics设定记录指标;在本例中仅仅需要计数(count)与行比例(row%);表格输出是默认是nesting(嵌套式),并且无论行或列均以嵌套方式输出:如果觉得没有必要对纵标目(columns)也按照嵌套式输出,则可以将nesting下columns前勾去掉,得到如下表格:TablesofFrequencies:该过程最大特点是在一张表格中为各种分类变量提供其频数分布状况,其功能较前面几种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论