第2章数据文件的操作和预处理_第1页
第2章数据文件的操作和预处理_第2页
第2章数据文件的操作和预处理_第3页
第2章数据文件的操作和预处理_第4页
第2章数据文件的操作和预处理_第5页
免费预览已结束,剩余12页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2个关键环节,而且,随着分析的深入还有可能进行多次预处理。SPSS为我们提供了丰富的数据预处理功,【Transform】菜单中对这些重要功能分别介绍。在介绍这些功能的同时,我们会解释这些功能的,数据文件的整理(【Data】菜单功能,用于文件合并,在本节中继续讲解其他子菜单的功能。标右键,选择【InsertCases选项卡中,将鼠标移到数据区域上方表示变量的灰域,选中一列,选择【Edit】菜单或者单击鼠标右结构,定义好变量结构以后回到【DataView】选项卡中输入变量数值。nn+1个案例,作都要在边缘的灰域才可以哦,在中间白域实现不了。标拖到合适的位置,注意同样要在边缘 域才能实现SPSS例例2-1在第1章的数据1-1记录车险投保人的数据中,要求了解如下情况:1.车险投保人交通事故的大体情况;2.不同 1“Sortby”排序变量框,2-12125%如果排序变量只有一个,还有一种简便的操作方法,选中要排序的变量,例如“acids(交通事故数弹出菜单中选择“SortAscending”或“SortDescending”也可实现排序。2112-2所示。2-22-1.sav)2-1、 女性30040530-40060640-500706500704现变量值的“自动汇总,例如,我们可能并不很关心不同、不同的投保人的交通事故的最大最例2-2利用车险投保人交通事故数据2-1,根据和如表2-1的段对交通事故数进行分类汇总要实现按进行分类计算每类均值,分为三步实现分类汇总操作“genderariable(s)ariable(s)步,可以点击为汇总变量加变量名;在如图2-4的框中,可以看出分类汇总可以计算的统计量主要分为三类(Mean(Median(Sum(First(Last(Minimum值,以及非的4个案例个数;(above(Inside0.10.1,10%0.1。13章或相关统计学文文 选图2-3分类汇总主 图2-4分类汇总选 框,选择文 选在图2-3主框下半部分是文件选项,三个选项含义为Addaggregatevariablestoactivedataset:表示将汇总变量加入当前数据集,这个选项强烈不推荐,因为后面看到汇总以后数据结构和当前大不相同,强行加入会导致结果不正确,读者可自行验证;Createanewdatasetcontainingonlytheaggregatevariables:表示生成一个新的激活的数据集来3个选项效果差不多,如果想立刻看到汇总结果可以选这个选项;Writeanewdatasetcontainingonlytheaggregatevariables.:表示将汇总结果到一个SPSS数据文22-2表示:表2-2分类汇总结男女数据的计数组织方式2表2-3分类汇总结3030-4040-5050SPSS提供的数据文件拆分、数据选取和,为我们提供了多样化处理数据的途径。数据拆分可以,类汇总实现起来就会非常麻烦;此时数据按分类情况拆分成几个部分,再分别计算其统计量就可,S数据拆分来一次输出所有分析结果,提高效率。例2-3例2-3将车险投保人数据2-1, 段进行数据拆分,计算均值、标准差和中位数根据题目要求,选择段作为拆分变量,分两步完成目标Step1:选择【Data】菜单→【SplitFile在如图2-5的框中,选择第二拆分选项,并通过箭头将拆分变量段(ageint)选入拆分变量框“GroupBasedon”中,拆分变量可以是一个,也可以是多个,此处三个拆分选项的含释如下:1.yzeallcases,donotcreategroups:表示数据文件不用拆分,这是默认选项paregroups3.Organizeoutputbygroups:表示将拆分后各组分析结果输出到不同的表格中,这样便于2“Fileisalreadysorted”选项,这样可以提高拆分速度,如果没有排序则选择第一个选项,点击。图2-5文件拆分2-42-4段3030-4040-505000(四分位数

30岁以 30-40岁40-50岁50岁以 注意,如果数据拆分以后,在SPSS数据窗口下方的状态条右下角,会出现的字样,表明拆分变量是ageint,取消数据拆分以后,字样会。2-133SPSS2-42-1进行数据选取,1.3.12022035-45在如图2-6的框中,可以看到数据选取的5个选项,分别说AllcasedIfconditionissatisfied1BasedontimeorcaserangeUsefiltervariable01数据选取数据选取图2-6数据选取要实现1小题的目标,在图2-6框选择第2个选项,点击按钮,进入图2-7 入以下条件“age>=35&age<=45,点击,回到图2-6框;条条 框图2-7条件选取要实现2小题的目标,在图2-6中选择第3选项,点击进入图2-8框,选择第1个选项,填入比例20%,点击,回到图2-6框;图2-8随机选取2x个样本中随机抽取y30020个,就可以在两个框中填上20,300,再点击。要实现3小题的目标,在图2-6中选择第4选项,点击,在弹出框2-9中填入120220,点击,回到图2-6框图2-9精确选取2-63Filteroutunselectedcases:对未选中案例过滤,即保留未选中案例在数据中,但是以后的数据分析Copyselectedcasestoanewdataset:将选中的案例拷贝到新数据集文件中,原文件保存不变,此处SPSS17升级为多窗口软件后新增加的功能;Deleteunselectedcases:将未选中案例从数据集文件中删除,不在保留,由于案例一旦删除将不可filter_$01。2-10选取以后,字样会。数据也是统计分析中常用的预处理技术,例如平均数,组间方差等“”是一个重要的统计思想,之所以要,是因为不同的案例对统计量的贡献不相同,这种贡献不同体现在两方面:的差异可以是人们认为的也可以是客观形成的这个在第10章最小二乘中再次涉及。段高,因此,其贡献也大,因此求总平均数时,要考虑该段投保人数这个“权重。数据的进入如图2-11框在选项中选择2选“案例将权变“N_BREAK”选“FrequencyVariable”框中,再点击即可完成数据。通过以后计算的平均数为1.722,与用原数据2-1计算的平均数相同,而如果不进行,计算的平均数是1.718,和原平均数不同,可见,的重要性。43图2-11数据要消除数要消除数 也是重新选取数 ,并在图2-1TransposeRestructure有的读者可以参考有关书籍5。数据变量处理(Transform菜单SPSS的变量计算是在已有数据基础上,根据用户给定的算术表达式、条件表达式或者函数,对所有案例或者满足条件案例计算结果,存入一个新变量中,SPSS提供丰富的条件表达式和函数,使得变量计述,有的读者可以参考相关书籍6;要熟练掌握变量计算需要大量练习和长时间积累,不是一次两次就能掌握好的在以后的讲述中反复使用变量计算请读者留意不断进行练习掌握好这个5参 6参看《基于SPSS的数据分析,大学2打开如图2-12的框中,框主要由五部分构成,左上角是新变量定义区域,包括变量名 “pureinco debtratio/100)“creditmar,defaulter*30,在图2-12框中,左下角有一个用于指定条件的,点击会弹出如图2-7条件选取框,如.图2-12变量计算数据计数在实际工作中应用非常广泛,对于把握案例的特征非常有效。SPSS实现计数是对所有个案指定哪些变量参与计数,指定计数结果的新变量2-72-2将出现如图2-13的框,框由四部分,上面是计数结果的变量名称和变量,左边为(age)(education) 图2-13数据计数主SystemmissingSystemorusermissingRange:xthroughyx到yRange:Lowestthroughyy4Range:xthroughhighestx4 ”取值为35-45岁,因此计数区间为第4种类型35到45的区间,在两个框中填 3561001种类型取值0。另外两个按钮用于修改已有的计数区间,而用于删除已有的计数区间图2-14计数区间注意:如果计数区间有多个时,一定要保证计数区间是互不相交的,因为,SPSS在计数时对于每个“SPSS书籍中被称为变量分组,其实质是根据已有变量产生一个新的分组变量,60分一定是某个组限,这样才能与实际一致;所谓完备性,是指确定组限时2-82-1301组,30-402组,40-503组,504出现如图2-15框,框分为四部分,左边部分是数据集文件中所有变量,也是待重赋值的变和指定条件按钮图2-15变量重赋值主“age→?“age→ageint30303个图2-16重赋值组限定义量值,定义变量结构以后,变量重赋值操作才算彻底完成(具体数据见光盘2-1.sav)值,则变量“(age)”将会成为取值为1、2、3、4段的变量,而原来变量记录的具体数据将有变量数据不再使用才会选此菜单,其操作与上面大同小异,框如图2-17所示,可以看出,明显的图2-17重赋值框(覆盖原变量2.1.3。RecordCases随机数产生器“RandomNumberGenerators,限于篇幅本书就不介绍了,有读者可参看相关书籍。文件拆分和数据菜单,特别需要理解数据选取、文件拆分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论