应用统计学数据管理_第1页
应用统计学数据管理_第2页
应用统计学数据管理_第3页
应用统计学数据管理_第4页
应用统计学数据管理_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据管理

在数据文件建立好之后,还需要对数据进行必要的加工处理。对同一个数据往往需要从各种不同的侧面进行研究,采取多种统计方法进行分析,而不同的统计方法对数据文件结构的要求不尽相同,这就需要对数据文件的结构进行重新调整或转换,以便适合于相同的统计方法。数据管理

文件级别的数据管理

变量级别的数据管理文件级别的数据管理(1)SPSS中的Data菜单提供了文件级别的数据管理,可以对整个数据文件进行加工整理。

InsertVariable:插入变量

InsertCases:插入记录

GotoCase:到达某条记录

简单命令(这些功能都可以用鼠标在数据表界面直接完成,很少用菜单操作,在此不详述)

SortCases:记录排序

SplitFile:记录拆分

SelectCases:记录筛选

WeightCases:记录加权

常用的简单过程(使用频繁,必须掌握)文件级别的数据管理(2)

DefineVariableProperties:定义数据字典

CopyVariableProperties

:将预定义的数据字典直接引入当前数据文件,即复制外部数据文件属性到当前数据文件

变量与数据文件属性向导(对大型或连续性数据分析项目非常有用)

Transpose:数据转置

Restructure:数据文件的重新排列

数据重构向导文件级别的数据管理(3)

AddCases:纵向合并

AddVariable

:横向合并

文件合并过程(MergeFiles)

DefineDates:定义日期变量过程,用于时间序列数据

Aggregate:数据汇总过程

IdentifyDuplicateCases:查找重复记录

其他过程文件级别的数据管理(4)

正交设计过程(OrthogonalDesign)单变量排序:SPSS提供了一种简易操作方法,即在数据表格的变量名处单击右键,弹出右图多变量排序:使用SortCases过程来进行,查看详情记录排序记录排序选中District,选择升序选钮(默认),将District选入Sortby框选中Region,选择降序选钮,将Region选入Sortby框记录排序注意:在多重排序中,指定排序变量名的次序很关键,首先安第一个变量排序,对于与第一个变量取值相同的记录考虑按第二个变量排序排序后,原来记录数据的排序将被打乱,对于时间序列数据,若未存放有记录标志的变量,应注意保存原数据的排列顺序,以免数据混乱记录排序记录拆分1.选中此框不拆分文件2.按所选变量拆分文件,各组分析结果放在一起便于比较3.按所选变量拆分文件,各组分析结果单独放置4.用于选择拆分数据文件的变量5.要求将数据按所用拆分变量排序6.数据集很大,且拆分变量已排序,选此可节省运行时间123456记录拆分记录筛选123451.分析所有记录2.分析满足条件的记录,按If按钮设定筛选条件3.从原数据中按某种条件抽样,按Sample进行设定4.基于时间或记录序号选择记录,按Range进行设定5.使用筛选指示变量选择记录,非0值的记录被选中6.未选中的记录被隔离7.未选中的记录被删除67记录筛选记录筛选记录加权

设置作为权重的变量,如第一行表示agecat=1gender=1的人共33个,accid表示人数,应设为权重记录加权定义数据字典变量名、测量尺度等变量列表频数、标签、缺失值设定等拷贝变量属性自动生成值标签定义数据字典数据转置Transpose:该过程用于对数据进行行列转置,即原来的一条记录转成为一个变量,而变量则转成为一个记录,两次Transpose过程后数据集会恢复原样(点此见具体操作)。数据转置将变量Group、x选入variable框,再点击OK键转置前的数据集转置后的数据集

注:未选中的变量id其数据信息在转置后丢失数据转置数据文件重新排列Restructure:此过程是用来改变数据的排列格式,即长型格式和宽型格式之间的互转。数据文件重新排列数据文件重新排列

数据anxiety转换前后的长型格式和型格式数据文件重新排列文件纵向合并*:当前数据集中的变量+:新添加数据集中的变量

左框:新、老数据文件中不匹配的变量名

右框:已匹配的变量名,选择完成后单击OK即可AddCases:纵向合并,从外部数据文件中增加记录到当前数据文件中,相互合并的数据文件中应该有相同的变量。文件纵向合并文件横向合并1.

未被纳入的变量列2.

被纳入合并后新数据集的变量列表3.

记录匹配使用的关键变量AddVariables:横向合并,从外部数据文件增加变量到当前数据文件,两个数据集要有一个一一对应的关键变量进行匹配合并,且记录应按关键变量升序后再合并。123文件横向合并数据汇总分组变量被汇总变量数据汇总

定义汇总函数

定义新产生汇总变量的名称和标签FunctionName&Label数据汇总查找重复记录希望查找重复值的变量重复记录按该变量的取值排序设定第一个还是最后一个重复记录为主记录查找重复记录PrimaryLast=0表示相应的记录为重复记录查找重复记录变量级别的数据管理(1)SPSS中的Transform菜单提供了变量级别的数据管理,可以对变量进行操作。

计算新变量(Compute):最常用

Recode:对变量值进行分组合并

VisualBander:连续变量的可视化分段

Count:表示某个变量的取值中是否出现某个值,或某个区间

RankCases:变量编秩

AutomaticRecode:对记录按某个变量值的大小排序

变量转换变量级别的数据管理(2)

CreateTimeSeries:建立时间序列

ReplaceMissingValues:缺失值替代

RandomNumberSeed:设定随机种子

专用过程变量级别的数据管理(3)

控制命令

RunPendingTransforms:用于执行编程中被挂起的数据整理操作专用于时间序列模型例1

数据fee.sav是上海和杭州16名住院病人的费用数据,计算上海的住院病人平均每天的住院费用,要求结果取整。计算新变量输入新变量名perfee计算新变量计算新变量输入条件表达式计算新变量选择函数输入函数表达式计算新变量例2

在数据fee.sav中生成新变量grade,当住院总费用小于5000元时取值为“相对较低”,大于等于5000元且小于7000元取值为“中等”,大于等于7000元且小于10000元为“较高”,大于等于10000元为“很高”。变量值分组合并新变量名grade选入原变量total变量值分组合并变量值分组合并

三种Range的设置,所有的范围均包含了端点,而前面设定的变换会优于后面的变换,因此应该将大于等于10000元最先设定,而将小于5000元最后设定。变量值分组合并变量值分组合并变量值分组合并变量值分组合并务必选上该项变量值分组合并变量值分组合并recode过程提供了精确分组的功能,但如果希望进行的分组是有规律的,比如等距分组,或等样本量分组,使用

recode过程进行操作就显得非常麻烦,且可视化程度不高。此时可以考虑使用visualbander过程进行可视化分段。连续变量的可视化分段例3

仍以数据fee.sav为例,按变量total将病人分为5组,5000元以下为第一组,5000元以上的按等间距的方式分4组。连续变量的可视化分段连续变量的可视化分段连续变量的可视化分段设定分段规则连续变量的可视化分段连续变量的可视化分段自动填充值标签连续变量的可视化分段例4

仍以数据fee.sav为例,查看变量total中是否出现值6890。查看特定变量值查看特定变量值查看特定变量值查看特定变量值查看特定变量值例5

仍以数据fee.sav为例,根据城市分组计算住院总费用的

秩次。变量编秩变量编秩

用于定义秩次类型,默认为rank(秩分数)变量编秩

用于定义对相同值观测量的处理方式默认值为取平均秩次。变量编秩变量编秩将字符变量转换为数值变量例6

仍以数据fee.sav为例,将字符型变量city转化成数值变量newcity。将字符变量转换为数值变量新变量名将字符变量转换为数值变量将字符变量转换为数值变量个人道德素养

做好個人道德素養;不要因為貪小便宜,貪一時方便而不顧道德品行丟失把人格尊嚴都降低了。

因為一個人把道德品質丟失了,再想建立起來將是萬分的困難。所以每個人都應該尊首道德底線,不應敗壞基本道德品質。以下是公司裡面出現的不好的現象:1、厕所紙巾偷到宿舍去用2、車間應急藥箱裡面的藥偷走(偷盜行為可恥)以下是公司裡面出現的不好的現象:1、公共场所随意扔垃圾2、電視房垃圾亂丟以下是公司裡面出現的不好的現象:恶意损坏公共财物以下是公司裡面出現的不好的現象:吃饭不要浪废食物道德與生活

從字義看兩者的意義與差別:1、倫理的意義:倫—類別、關係;理—紋理、道理。

倫理—人類社會裡種種身分間合理的關係,行為分際(做人要守本分)。(哪些人際關係、身分)2、道德的意義:道—道路、道理;德—獲得。

道德—走人走的道路,便可獲得人的待遇。(不走捷徑、不誤入歧途→尊嚴、榮譽)人道

(ps.如何批評一個人罔顧為人?)道德與生活

1、利己:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论