对样本数据的频数分析__统计图表的制作抽样调查课_第1页
对样本数据的频数分析__统计图表的制作抽样调查课_第2页
对样本数据的频数分析__统计图表的制作抽样调查课_第3页
对样本数据的频数分析__统计图表的制作抽样调查课_第4页
对样本数据的频数分析__统计图表的制作抽样调查课_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第一节 一个单选题或填空题的频数分析5.1.1频数分析的题形与数据录入 单项选择题(只能选择一种)、多项选择题以及主观题。主观选择题的一些处理方式与多项选择题的一些处理方式有些相似之处 。数据录入 只需要把相应的选择的选项所代表的数据录入 ,对填空题,要把意思相同或相似的归为一组,并按顺序把这些归纳的组项进行编号,再录入。 25.1.23第二节 多个单选题交叉分组下的频数分析5.2.1数据录入根据最终的编号数来设置变量,有多少个编号就设置多少个变量,在录入数据时,被选择的项就用“1”来表示,没有选择的项就不填写 。 两分法45.2.2实例 某种商品消费者情况的媒体调查1.您的性别是 A 男

2、B 女2.您的学历是 A 高中以下 B 大专 C 大本 D 硕士生 E 博士或博士以上3.您获取商品的信息来源于 A 电视广告 B 报纸广告 C 杂志广告 D 广播广告 E 其它分析:很显然,第一、二个问题都是单项选择题,而第三个问题则是不定项选择题,假如我们调查了20份调查问卷,调查数据可见数据库,其中在第三个问题中,除了已有的选项外,有了被调查者还在其它的上面填写了网上宣传、商家(或厂家)的现场促销、亲朋好友的推荐、推销员的推销)。5首先编码: a.对于第一个题目的选项,设置一个变量,用数据1表示男、用数据0表示女, b.对于第二个问题,设置一个变量,用1表示高中以下、用2表示大专、用3表

3、示大本、用4表示硕士、用5表示博士或博士以上, 对于第三个问题, c.设置8个变量(分别对应 电视广告、报纸广告、杂志广告、广播广告、网上宣传、商家(或厂家)的现场促销、亲朋好友的推荐、推销员的推销,这里直接用中文表示它们),只要有选择,就在相应的数据库上用1表示,没有选择则不选择(或0)。其次,具体调查数据见以下的数据库 678单项的频数分析 根据上面的数据库,打开相应的界面,并把性别的这个变量移到右边Variable(s)下面,结果如下图所示:9按OK,得到以下的分析结果 10也可以charts.-Chart Type -Pie charts-Continue-OK做饼图,很显然,由SPS

4、S软件生成的图形与由Excel软件生成的图形是基本一致的,但由于用Excel软件生成的图形较容易调节,而且也比较美观,所以一般不由SPSS直接生成,而是借用Excel来完成。1112多项选择题非交叉分析 方法 与单项选择题一个样,每个选项处理一次,然后把所有选项的处理结果合并起来作出一个表格。进入Frequencies的界面,并把把第三题的所有选项都选进右边的变量栏里,按OK按钮,得出如下结果1314 信息来源调查表 单位:% 来源电视报纸杂志广播网络商厂促销朋友推销员百分比654550304550455515更加美观的结果,Excel来画柱状图:16性别和学历的交叉分析 17181920操作

5、流程:同时把性别和学历变量分别移到Row(s)(表示行)和Column(s)(表示列)下面-中间子菜单Cells-取消Counts下的按钮,并在Percentages下选择Total按钮-Continue按钮回主菜单-OK21第三节 多项选择题的频数分析多响应变量分析3.1多项选择题的数据编码和变量设置 a. 多重二分法(multiple dichotomy method),多项选择题的每一个选项看作一个0-1变量,0代表没有被选中,1代表被选中。b.选择项较多,而被调查者最多只选择其中少数几项时,输入数据时容易出错,采取多重分类法 (multiple category method) 变量个

6、数等于同时选中的选项个数的最大值。每个变量的选项都和多项选择题的选项相同。每个变量代表全体被调查者的一次选择,即记录的是被选中的选项的代码(相当于先定义列向量,分别表示第一选项、第二选项,.,再赋n个值,每个变量的值填入n个回答者的多选题编号 )。22例 您购车时,哪些因素会影响你的购车决策。(允许选择3个答案,而且要求被调查者按主次顺序选出答案,如521,即价格最重要,其次是款式,再次是性能。) 1、性能 2-款式 3-油耗 4-品牌 5-价格 6-颜色 7-其他1. 多重分类法编码表(该表格转置后看,更科学)变量名变量标签编码方案b1第一选项1-性能 2-款式 3-油耗 4-品牌 5-价格

7、 6-颜色 7-其他b2第二选项1-性能 2-款式 3-油耗 4-品牌 5-价格 6-颜色 7-其他b3第三选项1-性能 2-款式 3-油耗 4-品牌 5-价格 6-颜色 7-其他若某人同时选择价格、款式、和性能,则变量b1=5b2=2, b3=1。232.定义多项选择题的变量集合两种不同的进入方式 AnalyzeMultiple Response或者AnalyzeTablesMultiple Response TablesVariables in Set: 若按多重二分法编码,将Set Definition框中的变量放入Variables in Set框,在Variables Are Cod

8、ed As中选择dichotomies,在Counted value右侧框中输入1。 若按多重分类法编码,将Set Definition框中的变量放入Variables in Set框,在Variables Are Coded As中选择categories,还需要设定取值范围,使在该范围内的记录值纳入分析。一般的取值范围是该多项选择题选项的最大和最小代码(最小与最大编码数字)。243.定义多重反应分析的变量集的名称、名称标签在Name框是输入多项选择题变量集的名称(英文),在Lable框是多项选择题变量集定以一个名称标签(相应的中文名字)。此例 “GCJCYXYS”-“购车决策影响因素”。4

9、.单击Add钮,将定义完成的“变量集”填加到“多选集”( Multiple Response sets)中 5.单击Close完成 多项选择题变量集的定义 在SPSS的Multiple Response,最多可以定义20个多项选择题变量集(所以,一次问卷调查一般不要超过20个的多项选择题)。253.2多项选择题的分析过程频数分析和列联表分析3.2.1生成多项选择题的频数分析表步骤:AnalyzeMultiple ResponseFreqenciesMult Response Sets将分析对象(本例如购车决策影响因素$GCJCYXYS)选入右边的Table(s) for框,其他默认,OK26对

10、170名受访者的调查结果的分析示例 购车决策影响因素多项选择题的频数分析表 Category label(购车决策影响因素)CodeCountPercengtage of Responses (%)Percengtage of Cases (%)性能1499.628.8款式26512.738.2油耗310420.461.2品牌49218.054.1价格515029.488.2颜色6407.823.5其他7102.05.9Total responses510100.0300.0273.2.2多项选择题的列联表分析过程(Crosstabs),产生多重交叉列联表列联表分析可以通过两种不同的方式进入:

11、 1、从菜单AnalyzeMultiple ResponseCrosstabs进入 。 2、从菜单AnalyzeTablesMultiple Response Tables进入。列的处理:在Mult Response Sets框中,显示已经定义好得多项选择题变量集,把要分析的变量集(点击标签)选入Colums框。行的处理:把另外一个选择题的变量放入Rows框,并定义该变量值的范围(Define Ranges 定义最小值和定义最大值)Option子对话框的选择(一般选择其默认状况)OK。28示例 sex*$JCSX Cross tabulation $JCSXSEX决策影响因素Total1-性能

12、2-款式3-油耗4-品牌5-价格6-颜色7-其他性别男Count34163533492558% within sex58.6%27.6%60.3%56.9%84.5%3.4%8.6%女Count15516859101385112% within sex13.4%45.5%60.7%52.7%90.2%33.9%4.5%TotalCount496710392150401017029多项选择题答案的排序分析要求被调查者按主次顺序选出若干答案,此种情况,多项选择题的数据编码和变量设置只能采取multiple category method。分析结果若想得到每个选项的交叉列联表,有三种方法:1.从菜单

13、AnalyzeMultiple ResponseCrosstabs进入,此时需要把行变量放入Rows框,单击Define Ranges钮, 定义最小值与大值,把代表第一重要、第二重要、.,的变量放入Columns框,单击OK钮即可。2.从菜单AnalyzeDescriptive StatisticsCrosstabs进入,把行变量放入Rows框,把代表第一重要、第二重要、.,的变量放入Columns框,单击OK钮即可。3.从菜单AnalyzeTablesMultiple Response Tables进入,把行变量放入Rows框,把代表第一重要变量选入Columns框,单击OK钮得到第一个列联

14、表,然后分别把代表第一重要变量换成第二,第三,.,得到第二个列联表、第三个列联表。注意不能把代表第一重要、第二重要、.,的变量同时选入Columns框。30第四节 利用Graphs制作统计图4.1.1 SPSS图形功能概述1SPSS创建图形的一般过程SPSS图形菜单制作图形可分为三个过程:(1)建立数据文件,在数据窗口录入数据,或是从其它数据文件中读取数据。(2)利用SPSS的Graphs模块或其他过程生成图形。(3)修饰生成的图形,新生成的图形往往不符合统计图要素,例如图形题目、标尺的单位等,对其做些调整修饰。314.1.1 SPSS图形功能概述2图形生成与数据文件结构 统计图形的生成与数据

15、文件的结构和类型紧密相关。数据文件结构往往决定着生成图形的类型,即使来自同一资料,整理成不同结构的数据文件,也会生成不同的统计图形 324.1.1 SPSS图形功能概述3图形生成与数据的度量尺度 在定义变量时,要在Measure栏中设置其度量尺度(也称为测量水平),其在数据分析中的作用不是很明显,但在用图表生成器(Chart Builder)绘制图形或绘制交互式图形时却很重要,如果测量水平设置不正确将会影响图形的绘制。 例如,在绘制复式条形图时需选择分类变量,分类变量的测量水平只能是名义尺度或定序尺度,对应的变量是数值型或字符型,用数字代表分类(如,0代表男性,1代表女性),当不是这两种测量水

16、平之一时,将不能作为分类变量使用。334.1.1 SPSS图形功能概述4Graphs各菜单的功能 (1)图表生成器(Chart Builder) 图表生成器是SPSS14.0 for Windows及其以后版本中新添的绘制图形的特色功能,它是由早期版本中Graphs菜单中的Gallery过程发展形成的。其界面如图3.1所示。变量列表框画布区域图形类型选择框343.1 SPSS图形功能概述4Graphs各菜单的功能 (2)传统模式创建图形(Legacy Chart) 利用传统模式创建图形(Legacy Chart)是直接生成SPSS图形的主要方式。和交互模式不同的是传统图形的生成模式是以对话框设

17、置的方式创建的,这一点和前面的统计分析功能的对话框操作类似。操作时需要在各级对话框中选择图形的变量,设置变量产生的图形类型和参数以及其他的选项,例如对缺失值的处理等。354.1.1 SPSS图形功能概述4Graphs各菜单的功能 (3)交互模式创建图形(Interactive) 交互图形是利用SPSS的交互操作方式创建的图形,当生成基本图形以后,还需要对图形做进一步的设置和编辑,以便得到效果满意且具有较高质量的图形。在图形输出窗口中,可以利用图形的交互式功能选择图形的组成元素并编辑和修改它们的属性,例如颜色、填充模式、图形的标题以及位置等。图形的交互操作提高了创建图形的质量,交互式的特点也使得

18、创建图形的灵活性更大。364.1.2 各种统计图的创建1条形图(1)条形图的功能 条形图(Bar Charts)描述定类或定序变量的分布,用宽度相等直条的高度来表示非连续性资料的数据大小,用于性质相似的数据进行比较。374.1.2 各种统计图的创建1条形图(2)条形图的类型 简单条形图(Simple) 复合条形图(Clustered)堆栈条形图(Stacked) (1)Summaries for groups of cases 此选项为默认选项。表示统计量按个案分组方式组织,即将根据分组变量对所有个案进行分组,然后根据分组后的个案数据创建条形图 (2)Summaries of separate

19、 variable 变量分组模式,表示将为每个变量创建条形图(3)Values of individual cases 个案模式,表示将为分组变量中的每一个个案生成一个条形图,条带的长度表示观测值的大小。当数据文件中包含大量个案时,不适宜用个案模式条形图来描述384.1.2 各种统计图的创建1条形图(3)条形图的生成以复式条形图的生成为例进行说明选择Graph Legacy Dialogs Bar,弹出上一页图3-2所示的“Bar Charts”对话框,图形类型选择Clustered,条形图模式选择Summaries for groups of cases,单击Define按钮弹出如图3-3所

20、示的对话框。 图3-3394.1.2 各种统计图的创建1条形图(3)条形图的生成以复式条形图的生成为例进行说明确定分类变量 选择复合分类变量确定直条表示(Bars Represent)的方式和统计量 变量列表404.1.2 各种统计图的创建1条形图(3)条形图的生成生成的图形结果如图414.1.2 各种统计图的创建2线图(1)线图的功能 线图(Line Charts)是用线条的上下波动的形式,来反映连续性的相对资料的变化趋势。它主要用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。 424.1.2 各种统计图的创建2线图(2)线图的类型简单线图(Simple Line

21、Chart):用一条折线表示某个现象的变化趋势;多重线图(Multiple Line Chart):用多条折线同时表示多种现象的变动趋势;垂直线图(Drop-line Line Chart):反映某些现象在同一时期内差距的统计图。 433.2 各种统计图的创建2线图(2)线图的类型444.1.2 各种统计图的创建2线图(3)线图的生成 以多重线图的生成为例进行说明 选择Graph Legacy DialogsLine,弹出上页图3-5所示的Line Charts(线图)对话框,选择Multiple(多重线图),Data in Chart Are选项组中选择“Summaries of group

22、s of cases”(个案分组模式),单击Define按钮弹出如图3-6所示的对话框 。454.1.2 各种统计图的创建2线图(3)线图的生成 以多重线图的生成为例进行说明选择分类变量确定折线表示(Line Represent)的方式和统计量464.1.2 各种统计图的创建2线图(3)线图的生成 以多重线图的生成为例进行说明 生成的图形如图所示474.1.2 各种统计图的创建3饼图(1)饼图的功能 饼图(Pie Charts)也称作圆图,是用圆的整体面积代表被研究对象的总体,按各构成部分的比重把圆面积分成若干个扇形,用以表示对象的部分对总体的比例关系的统计图。484.1.2 各种统计图的创建

23、3饼图(2)饼图的类型 Summaries for groups of cases 个案分组模式;Summaries of separate variables 变量分组模式;Values of individual cases 个案模式。 494.1.2 各种统计图的创建3饼图(3)饼图的生成 选择分类变量,即定义饼图的分片确定分片代表的含义 504.1.2 各种统计图的创建3饼图(3)饼图的生成 514.1.2 各种统计图的创建4高低图(1)高低图的功能 高低图(High-Low Charts)是一种说明某种现象在单位时间内变化情况的统计图,它适合描述每小时、每天、每周等时间内不断波动的市

24、场信息资料。例如股票、商品价格等,高低图既说明某些现象在短时间内的变化,也说明它们长期的变化趋势。524.1.2 各种统计图的创建4高低图(2)高低图的类型 (1)Simple High-low-close 简单高低图。该图利用小方框表示某段时间内的最终数值,用小方框上下的触须表示该段时间内取值的最大值和最小值。这种图形适合用于股票、期货和外汇金融等,它说明每天的最高价格、最低价格和收盘时的价格;(2)Cluster high-low-close 分组高低图。与简单高低图类似,但是它可以同时描述两种或两种以上证券或期货的价格情况;(3)Simple rage bar 简单极差图。这种图形用长条

25、的长度代表每个时间段最高值与最低值之差;(4)Clustered range bar 分组极差图。与简单极差图类似,但是可以描述两个或两个以上证券或金融的情况(5)Difference area 差异区域图。这种图形利用不同的曲线表示同一段时间内的两种不同情况,并且用阴影填充曲线之间的区域。534.1.2 各种统计图的创建4高低图(3)高低图的生成 以简单高低图的生成为例进行说明 544.1.2 各种统计图的创建4高低图(3)高低图的生成 以简单高低图的生成为例进行说明 生成的高低图如3-12所示554.1.2 各种统计图的创建5箱图(1)箱图的功能 箱图(Boxplot)又称为箱线图,它是一

26、种用来描述数据分布的统计图形,它可以用来表示观测数据的中位数、4分位数和极值等描述性统计量,从视觉的角度观测变量值的分布情况 。564.1.2 各种统计图的创建5箱图(2)箱图的类型 简单箱图复合箱图574.1.2 各种统计图的创建5箱图(3)箱图的生成以简单箱图为例进行说明 在选择Simple(简单箱图)类型,选择“Summaries of groups of cases”个案分组模式,单击Define按钮,弹出如图的对话框设置: 选择分类变量 确定绘制箱图的变量 583.2 各种统计图的创建5箱图(3)箱图的生成以简单箱图为例进行说明 生成的箱图如图3-15所示说明:(1)图中每个箱形的含

27、义是:从开始的线段到矩形框包含了1/4的观测数据,从矩形框的低端到矩形框中间的线段包含1/4的观测数据,从这条线到矩形框结束又包含1/4的观测数据,从矩形框结束到顶端的线段包含1/4的观测数据。(2)恰有一半的数据位于箱形所在的区域。(3)当最小或最大的观测值距箱形的距离比箱形本身的长度要大好几倍时,箱图中箱形外的线并不一定是从最小的观测值开始并到最大的观测值结束。在这种情况下两端用点标上观测值即可,这种值被称为离群值,也就是非正常值。 594.1.2 各种统计图的创建6误差条图(1)误差条图的功能 误差条图(Error Bar)是一种描述数据总体离散情况分布的统计图形,可以反映数据的离差情况

28、,并且描绘正态分布资料的描述性指标,如均值、标准差,并由此求得参数数值范围、总体均值的置信区间等。 604.1.2 各种统计图的创建6误差条图(2)误差条图的类型Simple 简单误差条图。对分类轴变量的每个类型生成一个分布误差条形图;Clustered 复合误差条图。对分类轴上的变量的每一类型生成一簇误差条形图,每一簇中误差条形图将区分变量显示。 614.1.2 各种统计图的创建6误差条图(3)误差条图的生成 选择Simple(简单误差条图)类型,选择“Summaries of groups of cases”个案分组模式,单击Define按钮,弹出如图的对话框。624.1.2 各种统计图的

29、创建6误差条图(3)误差条图的生成 选择分类变量确定绘制误差条图的变量确定误差条图中条带的含义634.1.2 各种统计图的创建6误差条图(3)误差条图的生成 生成的误差条图如所示从图中可以观察到各科成绩在置信度为95%的成绩置信区间的误差条图。图中的圆点表示平均数,上下两条横线表示置信区间的上下限和标准误差。644.1.2 各种统计图的创建7金字塔图(1)金字塔图的功能 金字塔图(Population Pyramid),也称人口金字塔图,利用图形直观描述分类变量中不同分类的某种属性在各个区间取值的频数。例如,医疗机构对某种药物进行对比试验,得到服药和没服药的人员的体重数据,我们可以将两类人员体

30、重分布的频数分裂表示成长条状,然后依次罗列在一条坐标纵轴上,形成一塔图形。利用金字塔图可以直观地表示出某种属性的人员的变化规律 。654.1.2 各种统计图的创建7金字塔图(2)金字塔图的生成选择Graph Legacy Dialogs Population Pyramid,弹出如图所示的“Define Population Pyramid”对话框 (1)选择分类变量和属性变量分类变量是作为拆分金字塔的变量,属性变量是描述分类变量属性的变量(2)确定计算频数的方式在“Count”选项组中确定计算频数的方式,有两个选项:Compute counts from data 利用数据计算频数值,此选项为默认选项;Get counts from variable 利用其他变量获得频数值。选择该项,表示频数值保存在某一变量中。664.1.2 各种统计图的创建7金字塔图(2)金字塔图的生成 生成的金字塔图形如图所示674.1.2 各种统计图的创建8散点图(1)散点图的功能 散点图又称散布图或相关图,它是以点的分布反映变量之间相关情况的统计图形,根据图中各点分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论