![张伟豪SPSS培训视频3笔记(缺失值处理、筛选个案)_第1页](http://file4.renrendoc.com/view/0faffaa47e6ffbe85697991bced0fbcc/0faffaa47e6ffbe85697991bced0fbcc1.gif)
![张伟豪SPSS培训视频3笔记(缺失值处理、筛选个案)_第2页](http://file4.renrendoc.com/view/0faffaa47e6ffbe85697991bced0fbcc/0faffaa47e6ffbe85697991bced0fbcc2.gif)
![张伟豪SPSS培训视频3笔记(缺失值处理、筛选个案)_第3页](http://file4.renrendoc.com/view/0faffaa47e6ffbe85697991bced0fbcc/0faffaa47e6ffbe85697991bced0fbcc3.gif)
![张伟豪SPSS培训视频3笔记(缺失值处理、筛选个案)_第4页](http://file4.renrendoc.com/view/0faffaa47e6ffbe85697991bced0fbcc/0faffaa47e6ffbe85697991bced0fbcc4.gif)
![张伟豪SPSS培训视频3笔记(缺失值处理、筛选个案)_第5页](http://file4.renrendoc.com/view/0faffaa47e6ffbe85697991bced0fbcc/0faffaa47e6ffbe85697991bced0fbcc5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、如果要把连续变量进行分组,比如将不同的年龄分为老中青三种,30岁以下,30到50, ,5 以上,如何处理呢?如下选择转换一一重新编码为不同变量将age选入,命名新名称为agenew,然后点旧值与新值,然后选择范围,填30到50,意思是范围30到50,命名为新值2,添加进去,如旧事血& ,的时门三99 OCOn*89909192IBU11日做岭女也日一事QLwtsitntu 30-* 1 30Ms0-2 MD !*,:叵。和加”:。加WW户修便。尼8心939495日国96JQfj (可的个累0算泉传1 - 13卫3I1A / X9829921232551.002.00101001132511.0
2、02.00mi 2_fi325L.A UM)一? 9出1 曲(6。IBM SPSS SUIStCX PicotiorUdkoObON然后在范围,从值到最高里填入50,意思是50岁以上,新值命名为3,添加后点击继续29OX | 712. 319|SH”什 (S(L):系统缺失必复制旧值也)旧 新):Lowest thru 30 - 1 30 thru 50 - 250 thru Highest3停止共享/匚输出变量为字符串坦)H楮数值字符串移动为数值(M)f55)继姨I取消帮助I/ :口 0I/ ;c 一一一 rL在这里要注意的是,虽然旧值到新值数字有重叠,但是SPSS会认为上一行包含重叠数字,
3、 下一行不包含,例如上面,第一行包含30,第二行包含50.XM M(S) BM SPSS Su&ttBo 方里!akR B(v)的杯累 分作 i海吵 M() img) Jiitwy) 时 口押)月昌四ir r因褊即 n 1需归困Ji一J 名称类型宽度岫怵茹70CS1_1数值82SMEAN(CSI)7t71CS2.1数值82SMEAN(CS2)无72CS3_1数值82SMEAN(CS3)无无上73CS4_1数值82SMEAN(CS4)无无74CS5_1数值82SMEAN(CS5)无无75CS6.1数值82SMEAN(CS6)无无76G7 1_数值82SMEAN(CS7)无无77filters我值
4、10gender = 1 & a.0, Not Sele.无798081 TOC o 1-5 h z 1523-T :83 :| 一 一 O4 .,!. T【im ;叫 SIBM SPSS - FrocF or E5184M8 Hal?慢如果要把筛选掉的个案恢复,只需要将变量视图中的最后filter删除就可以了,717273747576777879 n心和,“ 二箭乂卜间、gender从-fry铝个案口国1.0021.0041.0011.004too11.0022.0031.0031.0020D-.HBEBSKB12.00301.0040144362.003D 11zaaa 2 nn1,鬻9八
5、”碇个利1 当陋/e孑aa个案Unicode OH0uwro)天oCM SPSS Sumacs Processor M如果是想随机挑样本,那就选择随机个案样本,弹出对话框,第一个大约,指的是从所有样 本中随机选大约百分之多少的样本,百分之多少可以填在格子里。第二个是精确,比如从所 有的295个样本中选50个,那么就在第一个空填50,第二个空填295.随机选样本的作用:一般我们都需要预调研,但这样的话就需要调研两次,比较麻烦,我们 可以偷个懒,直接收集一次所有的样本,然后通过随机筛选的方法,选出一部分样本作为我们的预调研样本进行分析,但是这是偷t赖的做法,不能写在论文里的,如果需要将选出来的样本
6、单独建一个数据集,如下选择将选定个案复制到新的数据集,起个名字,确定,就会新出现一个新的数据集。文件0 1WB0 m6404.006507.006606.006706.006804.006904.007004.007106.007206.007304.007406.007506.007606.0077cr nn. i|SQ14。制旬相)O*Ae()*I。上A2;二,X。角式4支1*匚第ftM HU-1小家T1 WftTTe:C4XXSfi.6)至的缺名不“a个案I出*JS一I.5.00-u.uut .a6.006.007.ol5.006.0070|5.006.005.03.007.006.q5
7、.005.006.64.004.004.06.006.006.05.005.006.04.004.004.0!5.004.006.06.006.005.06.005.00a nn6 cn4.006.00AQQ工-M5.006.004-Q0RnnIBM SPSS Stales Proct”“凯goode Ct J还可以选择第三种,基于时间或个案全距,也就是可以选一个范围,比如选第50到80个, 但是一定要注意,这50到80不是自己设定的ID编号,而是spss最左边列的编号。最主要的筛选方法就是这几种,最后一种几乎用不到.还有一种情况是需要把所有数据按照一定标准分成几组,然后同时分析这几组,那就需
8、要拆分文件,如下攵得电)MB5 004.005.003 007.0C)6d69 )0_.MW1索位 El乐交由6.005.006.005.005.0C)6.d70)06 004.004.004 004.0C)4.d71)07.006.006.006.006.0C)6.d172)0IMF?V6.006.006.005.005.0C) 6M73 )0修阿冬分必4 004.004.004 004.0C)4.q74)0个 NffWJBie5.005.007.005.004.0C6.d75 )0七星出6 005.005.006 006.0C)5.q物分灯文件王交*M0)76)06.005.006.006
9、.005.0C)5.a77 *a nn4 nnr nn4 nna nr二工MHfUDfV) *情折分助 唠IMI个系希分文伸IFL! n)d-、eu SPSS aaeates ProcMOf gUnicode OH选择数据一一拆分文件,!? ”:、j .: - ,二二.1又件0MffliV) 8MQ,分费9) KM(M) 即彩 定制 尖阚,取工)8O(W) Wn(H)rL!二“EJyr司备都/ MJS3噩包招遇 5 - U .i:.I Zrnn| S| Q齐分文qXSQ18SQ19L64 )06 E5 !。分析M卸个案不倒918:A)006.005.0!op65)04b rnami*006.0
10、06 0(6 007.066 )04一006.005.0(6.007.067 )0:0r “gee006.005.0C6.005.o168 503|b-005.003.0(7.006069 )0J -1 限分.文序文华啜)006.005.0C5.006.70 )0巨士1 OxfteiWriF)004.004 0C4 004071)0006.006 0C6 006072 )fjW L3J1 , M 弧006.005.0(5.006.073)0f .w,vnj-t.w.004.004.0(4 004074 )06 006 005.005.007.005.0C4 006075 )06.006.006
11、.005.005.006.0(6.005.076 )06 004 006.005.006.006 0C5.005.077 )nEnna nn4 nn4 nnr nn4 nn6 nn5忘* 1支金*($3 SPSS States ProcessorUacMON如果我们要按性别进行同时分析,就选择比较组,把gender选进去,然后确定。这样的话 随便做一个分析,比如做回归,首先在右下角就会显示拆分条件gender随便做几个变量的回归,输出表格里每个表格都会按男女分开展示分析结果。也可以同时加入好几个变量进行拆分后的分析,比如性别、婚姻等都可以同时放进去,分析结果就会按照这些条件分开分析,如下图fi
12、ne9 h克3X02 :” FUrtKde ON H 2 7.W 259日S入解夫,,出速口劣公寸9博日济公司日货公H iB?wQ T . 92:CtMO * e MEQO MIQ) HM UK 格或 加 他) 峨 定别 XmtWQJ) 编再分工整候|碘玩JW,2 侬30 J百国船缰3H与亘111211 39397d2 545“51”3 702 Q531143 。分旬f金索丁 sMRm与比较00博立始置1壮乐2”2)黑摩出“国:Mtf1(nai0J63 4G2.5753 932 4日5/目69。& 八g 品WMW 却 nwn 晶 %_A_*noaWMftMDVA,Q *S1 Xmi IBM S
13、PSS StMntin B 工件 /幡 方融U 故Q) * 入 格表9)分*;)亶0也 融影 定加 XBMW&J)名H昌汽电回4双F B画嬖蹂 * 出在储百筲斗 q的子旧口H 益初M*中 穹会莫覆唐E 电博且济公 S垓日胸公BWMJ 9审日祷公H .以日亦公* 力工铸公H 屯山日次公日 他口货公B 力诙百货公N ia对次 只母 owe ewa EM入碗夫集彳 3 3例 IVANOVA “他 的即网 回耳仃 etQv怦去贡: s* 2ev IVANOVA5 Mor口-flH01563 85618 2275779 508i tieF8 503tf we-000b0 female1 matnedEY
14、1w 即,2unmanid1加01t13.740182.627196 35721171196 870 isei4401.014b1 male1 mitnM、1wGtt4510Ml 30194 811342 2552 656M9Tunmang1w04613fi37I39d22 54 弘0232 5369W9 *QC82b - 京;?屹3 8。3fM.-lUM,二 7gendvf mamed8w, fff1“竹0femal 1 mamd 1( x6 $Q31 1591;,75c,二 c343ie”2 4-5074OC:IBM SPSS Statisbcs Processor MUmcode ON
15、H 2 7. W 25QS m描述性与推论统计次数分配以类别变量为主描述性统计以连续变量为主交叉表两个类别变项关联性 的技术,又称为列联 表分析皮尔森相关连续变量之间的相关t检定两群之间ANOVA三群(含)以上的均值有 无差异多元回归自变量对应变量影响程 度的强弱以上所有的统计方法,大多都是回归的特例。次数分配和描述性统计不一定必须是做分类或 连续变量,只不过是习惯这样分着做,有时可以互换先说频数统计频数统计一般是针对分类变量,因此统计量选项不要勾选方差标准差等内容,因为分类变量 没有这些东西。Q - W SPSS Erm flVB文MD横改)tWQ) HAD Q。 修 aa 9IEfe(8
16、WWW) 直 wm 序 45 10 ,1 - -,+ 二!一除 匕 叱一 mOVA1 计F1:巾mMs 甘一 1B网国 勤国,回, agM22WQQ671000?ip r1.1Junmannfl116179H3 87 IMOW360710001090mviuftd频数统计报告的第一个作用是看看有没有缺失值,有的话补上。还要看每个变量的频数是不 是正常,比如上图中婚姻,只有1和2,但是出来3等异常数字,说明录入的有问题。二目曷9丈曲r r瓮国褊#14 Q空, 7段抬1io”BANOVAft =1 ITB1J IBSUPS UMiWctCtS文第RSy w(n分析 iwuitc) xm(wry)
17、g(aa 国 Htit 电蜂国皿将att呼 *八卬f224M4133M8U84 505100010001*000g18272727cc9e4 poiwm 端40100 51 “515。B441731000644173100018.327WOOSClMMit oo、g15812215安s)e41 451100 0$”41 I5110005)694 91000eu SPS3 StMtbcs Ptmm” MUhKodt OHeiitC每本总匕(8加。a窜,修衣楼事总匕(B对我9群:4 thM a aC3”型e ma 2.工作 “历MIN其次看下边的频数表,需要掌握的原则有两个,第一个,每个变量的选项
18、中,最小数量频数 的选项不能小于最大数量频数选项的4倍,比如上图中,小学频数是8,最大的大学频数是 190,远小于4倍,这时候就需要将小学和高中合并,成为54,那190就不是它的4倍了,才可以。第二个,每个变量的选项中,最小数量频数的选项不能低于总频数的5%,比如上 图中小学频数是8,总频数是295,小于5%,就需要调整(合并)。这样检查并调整后,才 能做T检验或者ANOVA (方差检验最后还有一条,任何一个变量,在做T检验和ANOVA时,选项数量不能超过4个,比如上 图中,职业类型就有12种,这种是不能分析的。所以一般是不拿职业类型做分析的。文付陟Y) 9M& 行加D分析(A) MWW) K
19、R(C) W(C)实南虱月) 口4 gd,惶玄(Bm汽a gjTuMJ(fl MtB1 elemE”62727172 high school4615,156tl)屋g”185164 417 J64 417 3927WOOa储29510001000!WJ直?仍Htr ,1101565365365364 013241441.494$30155.15.1100.02951000109.0。与16379 34 &CC-150004715$15S835 1coo atx144.747100010001000incometRM SPSS Statstoos Piocssortt4UtOSON H 5 03
20、.W 1191cm如果想要在输出结果中出现上图红框中的数字,而不是只显示选项名称,那就需要操作下选择编辑一一选项一一输出,在上图红框中选为值和标签,默认是只有标签。如果变量的选项不符合条件需要合并,怎么操作呢?如下比如收入需要合并最下边两项,我们要合并的是前边的红框中的数字,而不是收入数字甘treeg也 9J11 IBM SPSS五里鼻 AXFRF)垂见)f!(D分帆夕 窟凹 B(G) 5 /用 昵 SQ(W) 加8SQ14S SIWTl ruwttnm国刘的值讳韵wmo(F)64)06.0065)05.0066)06.0067)04.0068)04.0069)07.0070)06.0071)
21、05.0072)06.0073)06.0074)06.0075)04.0076)04.0077a nn01析*H方格网支苴) 03陆蹩方不网昊国)梃鹿眼”,!司覆分布化吵 k扁忧分杨化。B日蹄oh同餐吊Qi BDerfiwM1 tfflWRAfllV).6 004.005 001Q17SQ18SQ194.004.005.005.006.005.006 006 006.004.004.004.005.005.004.006 006 006.006.006.004.006 006 005.006.006.006.005.005.005.004 004 006.004.004.004.005 006
22、 006.00q nn4 nnd nn7.003.005.00I IF-wrf6。的614.004.006 006.006 007.003.006 003.006 00405.06.05.C40404 nnKtMWn7H7KR4filmIEW SPSS SUUC3 Processor U06.007 006U05.003.005.6 006 0044.004.004.006.006.006.00)44 no4DQ4.nn选择income,新起个名字,点新值和旧值aS1W1IHfllOdrai |6j6.004MMV4.004.4.004.o ren)觉摄&6.006.用和i他场6.005.7.
23、006.u(56.00674 )06.006.007.004 004 006 006.00473 W e.uu 3.UU b.UU b.UU b.005.003.005)0)0甲5 6 77 7 74.004.003.004 004 004.003.003.04.005.005.005.006.006.006.004.04nnAno, &nn 4 nn,/nnji nn4。|BM8P33tM3Procs”Ilat :8cMQN |然后旧值123都是新值123,然后把其他所有制编为新值4,当然也可以编为4是4,5是4. 这样最后一列就会出现合并后的新值。最后记得将变量视图中新的income值加上
24、新标签。 要注意的是,在论文中呈现的应该是最原始的分组,不要进行并组,只不过在表格说明中说 一下哪个需要并组,原因是什么,在做后边方差分析时会先并组。就可以了。如果要做连续变量,就需要用描述性统计,方法如下又件 Ue MDQO MMKD;带摘 分次少 IMiM) B(G)定实用好 BO(W) 唧凶45订4J.UU2314.001986.00.黑KI也】F1)四)平地fl的网i吟.%uuQ.u|/B22及4.006.006.005.00/D3Ig I62196.00/B4/ D6二 A5.005.0079744 00/ L 4 on6 00r夕5,VUV. w81925.00A zrwptd冬友
25、!停4.005.009102156.002734.00阿液化。分乌nrLa0709*(A)。启军崎值笠和界)6.006.004.004.00111904.004 004限酒尸叱6.004.005.00122054.005.004.003.004.00132083.004.004.006.005.005.00 .4.0014苻7r cna nnnn7 nn4 nnr onfinni,aan谢Be)所BMSPSSSiattstcsProcessorUnicode OH把所有需分析的变量选入框中,在选项框中,需要选中峰度和偏度,这两个值是检验是否符 合正态分布的,因为我们的变量要符合正态分布才可以分
26、析。3tXmiJ - IBM SPSS S:atu X文以D ZhE;HM(p 映 Q*大(2)分新e.口町彳H Q云拼1阖声幺用i ma b aL一 - 4 + - 己的短r 1B回Ifi以贽B 国 UHMKjnenh。计1、广m向raw*ViTI hh1 Q CSvCS1100TOO45421 17X96C5U2no屈乐惊讳C$21007 004 13561 360M.191U2-503LJCS31007.004 67121 ia5M.574.142百293CS4*51007 00SS89812im975U21 205293C951007 g4947i ?ns6-354U2N5293ICS
27、OA51007 00508811 20615. 276142184通CS7*52 007 00iU921 OSMO232M20M)2935012 007 005 40009911240514249429382*63 007005 55259旧9043142o293S037 005 49151 04934-43tH2-1722835042 0?7 005 339093 524U21加SO5“53 00TOOS749?9501 a437142293socX5V00roo5 20341.0)312341.1424102WS07AS1007.00$07801061”-380142488293885toozoo5101?.9705731BU2432283S09100700517”1 OOM1-414U21阳18010X5too7 00
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教版数学八年级下册《章前引言及 加权平均数》听评课记录1
- 人教部编版八年级道德与法治上册:7.1《关爱他人》听课评课记录2
- 苏教版小学二年级下册数学口算题
- 七年级生物教学计划
- 工程建设项目招标代理合同范本
- 2025年度二零二五年度食堂档口租赁合同与食品安全宣传教育协议
- 农机合作社入社协议书范本
- 二零二五年度智能驾驶技术聘用驾驶员安全合作协议书
- 2025年度船舶买卖合同中的船舶交易市场分析及预测
- 2025年度员工公寓租赁补贴协议范本
- 2025年矿山开采承包合同实施细则4篇
- 2025年度茶叶品牌加盟店加盟合同及售后服务协议
- 氧气、乙炔工安全操作规程(3篇)
- 建筑废弃混凝土处置和再生建材利用措施计划
- 集装箱知识培训课件
- 某县城区地下综合管廊建设工程项目可行性实施报告
- 《架空输电线路导线舞动风偏故障告警系统技术导则》
- 2024年计算机二级WPS考试题库
- JJF(京) 92-2022 激光标线仪校准规范
- 普惠金融政策解读
- 广东省广州黄埔区2023-2024学年八年级上学期期末数学试卷(含答案)
评论
0/150
提交评论