统计数据分析_第1页
统计数据分析_第2页
统计数据分析_第3页
统计数据分析_第4页
统计数据分析_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《统计数据分析基础教程》叶向著,中国人民大学出版社2月第一版叶向著,中国人民大学出版社2月第一版SPSS部分知识准备定性变量(qualitativevariable)—P5也称离散变量或分类变量,如:民族、党派等。为方便计算机解决标示的值并无算术上的意义。定序变量—P5也称有序变量,如:等级、职称等。为方便计算机解决标示的值有大小、先后的递推关系,数值之间无互相的倍率关系。定量变量(quantitativevariable)—P5也称有序变量,如:成绩、身高等。值之间有大小与倍率关系。调核对象—P6调查所要面对的对象。个体—P6调核对象的观点。总体—P6全部潜在调核对象的观点集合。样本—P6被调核对象的集合。普查—P6对全部潜在调核对象的调查。简朴随机抽样—P7总体中全部个体都有同等机会被抽取到样本中。方便样本—P7采用简朴的随机办法获得的样本。抽样误差—P7抽样产生的样本中,个体特性的比例与总体中的比例差别带来的。未响应误差—P7抽中的个体没有回应其观点。响应误差—P7个体回应的观点并非其真实的。抽样调查—P7从总体中选用部分个体进行的调查。问卷—P8向调核对象发出的问题集合。系统抽样—P8将所用样本循环排列,根据样本量与总体量的比率拟定一种“间距”,再随机选用一种开始点,以此点开始等间距抽取下一种。分层抽样—P9先把总体按某些特性分类,然后再在各类中按简朴随机法抽取样本。整群抽样—P9先把整体划分为无规律特性的“群”,让后随机地抽出“群”来。多级抽样—P9在抽出的“群”中再次抽“群”。目的抽样—P9调查人员主观选择调核对象办法。方便抽样貌似随机实际非随机的选择调核对象办法。判断抽样—P9调查者主观选择获取样本的办法。定额抽样—P9在各分类中按比例的个数采用方便抽样或判断抽样法进行的抽样。雪球抽样—P9由被调核对象推荐下一种被调核对象的办法。自我选择—P10由个体选择与否接受被调查。问卷设计概念封面信—P24阐明调查目的、调查单位或调查者的身份,调查的大概内容,调核对象的选用办法,以及对成果的保密方法等。指导语—P25对被调查者如何填写问卷进行阐明。问题及答案—P25主体,分开放式与封闭式两类。编码—P25为便于将成果输入计算机进行解决分析,对每一种答案赋予一种数字作为其代码。编号—P28为便于在分析数据时感觉数据可能录入错误时进行比对改正,在发出或收回问卷时为每一份问卷予以一种唯一的编号。设计环节列举所要收集的信息—P26通过研究已有的研究、与大家沟通讨论、访问专家学者,尽量多地列出问题。决定访问的形态—P26涉及问卷与否构造化及与被调查者与否直接面对的四种组合。决定访问的方式—P26人员访谈、电话访谈、邮寄问卷等方式。决定问题内容—P26要考虑:此问题与否必要,被调查者与否会有答案,被调查者与否乐意回答,被调查者与否乐意要花太大精力回答。决定问题的形式—P27决定采用封闭(单选、多选)、开放式题型。决定问题的用语—P27浅显易懂、无歧义、非引导性、易回答、避开放。决定问题的次序—P27问题要有递进关系。测验及修订—P27小范畴实际使用,检查、发现问题、修正错误。决定问卷的外观—P28通过纸质、颜色等手段,让问卷易于为被调查者接纳。设计要点填空题型—P28适宜于容易回答、容易填写的问题。二项单选题型—P29适宜于只有两个答案只能选其一或需要将被调查者的态度进行两极分辨的问题。多项单选题型—P29适宜于做频率分析与交叉表分析,答案要有穷尽性与互斥性。多项限选题型—P29对各选项能够做频率分析。多项排序题型—P30需要对被选择的次序进行加权计算。多项任选题型—P31有几项选择,就要有定义几个变量。矩阵题型—P31每一种类项定义一种变量。相倚(子题)题型—P31过滤性问题与相倚性问题,应分别定义变量。当过滤性问题被选否时,相倚性问题的选项无效。答案设计—P32穷尽性:穷尽全部可能出现的状况,没有遗漏。互斥性:不能交叉重叠或互相包含。量表题型—P33反映对问题的态度的程度。李克特量表在李克特量表中答案的次序必须是按强弱递推变化的,答案普通提供4~8个,最佳有中性答案。量表中的陈说(问题)如果有不同方向,要穿插安排,避免被调查者不认真考虑顺手全选某一极端。博加德斯社会距离量表博加德斯量表中,问题要按其陈说的强弱采用由弱到强的排列。语义差别量表鉴别形容词:评价(好、坏),力度(强、弱),行动(主动、被动)。在两端之间设7个强度级别。数据录入与清理建立数据文献框架拟定变量的个数—P69填空题:每小题1个。—P70单选题:每小题1个。—P70多选题:限选不排名或不限选用二分法,每个选项1个变量。—P72限选不排名或限选排名用分类法,可选数个变量。—P73子问题:—按其具体类型拟定。—P73量表题:每1个类项1个变量。—P59数定义变量名—P70为在调用时简洁明了,普通用英文字母加数字。定义变量数据类型—P70普通用N(数值型)。定义变量名标签—P70由于变量名普通用英文字母加数字,可读性较差,在此可用较多的中文进行明确描述。定义变量值标签—P71变量值惯用数值表达,无可读性,在此用中文进行描述。定义缺失值—P71对被调查者没有回答的问题给一种标记,计算时就会予以区别解决。定义计量尺度—P71将变量分辨为定量数据、定序数据、定性数据三类。核对数据—P77其实是运用SPSS的频率分析(Frequencies)命令来统计出全部变量取值的频率,从而发现变量取值范畴不合理的数据。数据分析总论概念数据分析就是从采集的数据中挖掘出故意义的信息。数据分析往往从频率分析开始,通过频率分析我们能够理解变量取值的状况,频率分析也是最基本、最常见也是大众容易理解、明白的是频率分析。频率分析的第一步是产生频率分布表,第二步是将频率分析表的数据绘制为直观的统计图。将SPSS产生的频率分布表考入Excel—P91直接右击SPSS生成的频率分布表;在弹出菜单中单击“复制(Copy)菜单项;到Excel数据表中单击“粘贴”按钮。将SPSS产生的频率分布表考入Word—P96SPSS的功效是对数据进行分析,并不适合于用来撰写报告,而Word正好在这方面独具特长,因此对SPSS产生的频率表需要复制到Word中使用。右击SPSS生成的频率分布表;在弹出菜单中单击“复制(Copy)菜单项;到Word中单击“粘贴”按钮;由于不兼容性,可能会产生某些显示上的问题,可适宜修改。用Excel对频率表数据绘制图形—P100SPSS随含有生成图形的一定功效,但与Excel比起来,就要相形见绌了,因此我们普通用Excel来生成图形。右击SPSS生成的频率分布表;在弹出菜单中单击“复制(Copy)菜单项;到Excel中单击“粘贴”按钮;选择需要制作图表的数据列;运用Excel的生成图形功效制作符合自己需求的图形;对生成的图形进行适宜的调节,使其更加直观。将Excel产生的图形考入Word—P同前面提到的理由,我们是用Word来撰写报告的,因此Excel产生的图形要考到Word中来应用。单击Excel产生的图形,当出现8个控制点时,单击“复制”按钮;到Word中,单击“粘贴”按钮。一维(单变量)频率分析概念只对问卷中众多变量中的一种变量的取值频率分布进行分析。用SPSS对单选题进行一维分析—P88环节单击“分析(Analyze)”菜单项;在下拉菜单中移到“描述统计(DescriptiveStatistics)”菜单项;单击下级菜单项“频率分布表(Frequencies)”;在“频率(Frequencies)”对话框中从左侧变量框中选用变量到右边的框中;单击“拟定(OK)”按钮。如果选择了多个变量,则对各个变量分别进行频率分析。有关英语单词意义FrequenciesVariableValidMissingFrequencyPercentValidPercentCumulativePercent频率变量有效的缺失的频数百分率有效百分率累计百分率用SPSS对填空题进行一维分析—P109选择题的答案都是非持续型的,进行频率分析时能够分别对有限的每一种选项计算出现的频率,但填空题中收集的答案可能是持续型的,其点将有可能会是无限的,且各个点位出现的几率也无实际意义。为便于统计频率,我们用SPSS的“从新编码(Recode)”功效将原始数据按其落在的区间转换为一种新的值,其办法是:拟定划分的区间;单击SPSS的“转换(Transform)”菜单下“重新编码(Recode)”菜单项下“到同不同变量(IntoDifferentVariables)”菜单项,打开“重新编码到不同变量(RecodeIntoDifferentVariables)”对话框;在“重新编码到不同变量(RecodeIntoDifferentVariables)”对话框中,将需要重新编码的变量加入到“InputVariable→OutputVariable”框;在“名称(Name)”框中输入新变量的名称,单击“更改”按钮;单击“旧数值和新数值(OldandNewValues)”按钮,打开“重新编码到不同变量:旧的数值和新的数值(RecodeIntoDifferentVariables:OldandNewValues)”对话框;在“旧值(OldValue)”框中点选“范畴(Range)”,然后在下面的前一种框中输入区间下限,后一种框中输入区间上限;在“新值(NewValue)”框中点选“值(Value)”,在其后的框中输入准备赋给的新值;单击“增加(Add)”按钮,直至全部区间赋值完毕;单击“继续(Continue)”按钮,返回“重新编码到不同变量(RecodeIntoDifferentVariables)”对话框;单击“拟定(OK)”按钮。频率排序—P119将SPSS生成的频率分布表考入Excel;使用Excel中的函数“RANK()”来完毕。二维(双变量)频率分析概念对两个变量的不同取值状况下的数据分布状况进行分,从而得出变量之间互相影响或依存的关系主变量如果是单选题,每一选择为一种状况计算次变量的频率。如果是持续型数据的填空题则需要进行重新编码,先转化为离散值,再按一种值一种状况计算次变量的频率。有关英语单词意义CasesCountWithin案例计数其中用SPSS对双变量进行交叉表分析—P133单击“分析(Analyze)”菜单下“描述统计(DescriptiveStatistics)”菜单项下“交叉表(Crosstabs)”菜单项,弹出“交叉表(Crosstabs)”对话框;从左侧框中选择需要交叉分析的一种变量进入“行(Row(s))”框;从左侧框中选择需要交叉分析的另一种变量进入“列(Column(s))”框;单击“单元格(Cells)”按钮,弹出“交叉表:单元格显示(Crosstabs:CellDisplay)”对话框;单击“比例”框中的“行”或“列”,指定前面进入“行”或“列”框的那个变量为主变量,单击“继续(Continue)”按钮,关闭“交叉表:单元格显示(Crosstabs:CellDisplay)”对话框;单击“拟定(OK)”按钮。交叉表分析的有关性卡方检查—P155单击“分析(Analyze)”菜单下“描述统计(DescriptiveStatistics)”菜单项下“交叉表(Crosstabs)”菜单项,弹出“交叉表(Crosstabs)”对话框;从左侧框中选择需要交叉分析的一种变量进入“行(Row(s))”框;从左侧框中选择需要交叉分析的另一种变量进入“列(Column(s))”框;单击“单元格(Cells)”按钮,弹出“交叉表:单元格显示(Crosstabs:CellDisplay)”对话框;勾选“(Residuals)”框中的“(Statistics)”选项,弹出“(Crosstabs:Statistics)”对话框;勾选“Chi-square”选项,单击“继续(Continue)”按钮;单击“拟定(OK)”按钮。Excel在统计中的使用以Excel为例。自动筛选—P64单击数据系列中任意一单元格;单击“数据”菜单下“筛选”菜单项下“自动筛选”菜单项,则在各数据列最上一行右侧自动加入一下拉箭头符号;单击任意一列的下拉箭头符号,即可设立筛选条件并进行筛选;单击“数据”菜单下“筛选”菜单项下“全部显示”菜单项则取消筛选。高级筛选—P67单击数据系列中任意一单元格;单击“数据”菜单下“筛选”菜单项下“高级筛选”菜单项,则全部数据被选中并弹出“高级筛选”对话框;在“高级筛选”对话框中选择筛选成果的位置、参加筛选数据区域等条件;单击“拟定”按钮执行之。数据分析工具—P81安装将Office安装盘放入光驱;单击“工具”菜单下“加载宏”菜单项;在“加载宏”对话框中勾选“分析工具库”、“分析工具库-VBA函数”两项并单击“拟定”按钮。使用单击“工具”菜单下“数据分析”菜单项即可弹出“数据分析”对话框;其中的功效都是有关统计的某些模块。生成序列号—P84在第一种单元格输入起始编号;单击“编辑”菜单下“填充”菜单项下“序列”菜单项,弹出“序列”对话框;给定有关参数,单击“拟定”按钮。生成随机数运用“数据分析”功效—P85这是为某一行列按各个取值给定的出现概率随机赋值。单击“工具”菜单下“数据分析”菜单项,弹出“数据分析”对话框;在“数据分析”对话框中选择“随机数发射器”,单击“拟定”按钮,弹出“随机数发生器”对话框;在“随机数发生器”对话框中给定有关参数,单击“拟定”按钮。运用RAND()函数返回介于0~1之间的随机数。运用RANDBETWEEN()函数—P87返回介于最小整数到最大整数之间的随机数。Countif()函数—P92计算某个区域中满足给定条件单元格的数目。Countif()函数的语法为COUNTIF(range,criteria)其中:Range为需要计算其中满足条件的单元格数目的单元格区域。Criteria为拟定哪些单元格将被计算在内的条件,其形式可觉得数字、体现式或文本。全选数据区域—P93用Shift+Ctrl+↓组合键能够选定该列的全部数据。Excel之“绝对引用”—P93在Excel中当在一种单元格中书写好有单元格引用的公式后,如果通过单元格柄拖动向临近的单元格复制时,则引用的单元格的坐标会随着拖动的方向递进变化。如果要保持引用单元格的固定不动,能够用到“绝对引用”功效。在书写公式时,当书写到需要“绝对引用”单元格的坐标或选中需要“绝对引用”的区域时;按“F4”键,则刚刚写好的单元格坐标或选中区域的列号前后被加上“$”符号,成为如“$B$2:$B$101”的摸样。选用相隔的两列—P100先选中一列;按住“Ctrl”键再选另一列。图表背景阴影—P103选中图表右击;在弹出菜单中单击“图表区格式”菜单项;在“图表区格式”对话框中勾选“阴影”选项;单击“拟定”按钮。图形编辑—P100图表背景圆角—P106选中图表右击;在弹出菜单中单击“图表区格式”菜单项;在“图表区格式”对话框中勾选“圆角”选项;单击“拟定”按钮。取整—P114用Countif()函数分段统计—P115用Frequency()函数分段统计—P118用Excel如何统计出学生成绩各分数段内的人数分布呢?诸多文章都推荐使用Countif函数,可是每统计一种分数段都要写一条函数,十分麻烦。例如,要在C58:C62内统计显示C2:C56内不大于60分、60至70之间、70至80之间、80至90之间、90至100之间的分数段内人数分布状况,要输入下列5条公式:在C58内输入公式统计少于60分的人数:=CountIF(C2:C56,"<60")在C59内输入公式统计60到70之间的人数:=CountIF(C2:C56,">=60")-CountIF(C2:C56,">=70")在C60内输入公式统计70到80之间的人数:=CountIF(C2:C56,">=70")-CountIF(C2:C56,">=80")在C61内输入公式统计80至90之间的人数:=CountIF(C2:C56,">=80")-CountIF(C2:C56,">=90")在C62内输入公式统计90分至100之间的人数:=CountIF(C2:C56,">=90")。如果要把0至10之间、10至20之间、20至30……90至100之间这样多个分数段都统计出来,就要写上十条公式了。其实,Excel已经为我们提供了一种进行频度分析的Frequency数组函数,它能让我们用一条数组公式就轻松地统计出各分数段的人数分布。例如,我们要统计出C2:C56区域内0至100每个分数段内的人数分布:在B58:B68内输入:0、9.9、19.9、……9.9、99.9、100。用鼠标选择区域C58至C69,在编辑栏内输入“=FreQuency(C2:C56,B58:B69)”。按“Crtl+Shift+Enter”组合键产生数组公式“={FreQuency(C2:C56,B58:B69)}”,这里要注意“{}”不能手工键入,必须按下“Crtl+Shift+Enter”组合键由系统自动产生。完毕后C58:C69将显示如图所示的分数分布状况。用CountIF函数统计分数段的办法流传很广,但效率并不高,提出这个新办法但愿对大家有所协助。另外,在Excel的协助里也有一种用FreQuency函数统计分数段的简朴范例,大家能够参考。排名—P119选定需要参加排序全部数据的区域行列(注意:没选进排序时不动,表头行、总计行不选),且要从作为排序根据的该列端开始Excel才懂得此列是排序根据;单击“升序”/“降序”按钮,Excel将会以根据列的数据按升序或降序的原则对选定数据区域每一行数据调节位置。Rank()函数—P120Rank()函数的作用是计算某数据在该列数据中的位置。用Excel制作堆积图—P136用SPSS产生的分析表,有中文标题也有英

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论