第7章 描述统计分析_第1页
第7章 描述统计分析_第2页
第7章 描述统计分析_第3页
第7章 描述统计分析_第4页
第7章 描述统计分析_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计数据分析基础教程

―基于SPSS和Excel的调查数据分析第7章描述统计分析本章内容7.1利用SPSS对定量数据进行描述统计分析7.2利用SPSS实现多组均值比较7.3利用Excel对定量数据进行描述统计分析7.4利用Excel求量表均值并排名描述统计分析问卷回收后,对于数值型数据(定量数据),通常会以均值、中位数等统计量来描述其集中趋势,也会以标准差、最小值、最大值、极差等统计量来描述其离散程度。最常用的描述统计量是均值和标准差。描述统计量(集中趋势:均值)描述数据集中趋势的统计量主要有均值、中位数等。均值(mean):样本值的算术平均值。均值是度量数据集中趋势的常用统计量。在参数估计及假设检验中经常用到。设一组样本数据为,样本量(样本数据的个数)为n,则样本均值用(读作-bar)表示,计算公式为:

描述统计量(集中趋势:中位数)描述数据集中趋势的统计量主要有均值、中位数等。中位数(median):一组数据排序后处于中间位置上的数。中位数将全部数据等分成两部分,每部分包含50%的数据,一部分数据比中位数大,另一部分则比中位数小。中位数是用中间位置上的数值代表数据的集中趋势,其特点是不易受极端值的影响,所以称中位数比均值稳健(robust)。差异的度量:离散程度论语有一句话:“不患寡,而患不均”。这是指不怕财富少,而怕分配不公平,使得贫富差距太大。贫富多寡是由集中趋势统计量来描述的,而是否“均”是由离散程度(描述数据散布,即描述集中与分散程度的度量)统计量来描述的。一般来说,数据越分散,离散程度统计量的值越大。描述统计量(离散程度:极差)极差(Range):极端值之差。即一组数据的极(最)大值与极(最)小值之差,也称全距。由于极差只是利用了一组数据两端的信息,因而容易受极端值的影响,不能全面反映差异状况。描述统计量(离散程度:标准差和方差)标准差(standarddeviation):样本中各个数值到均值的距离的一种平均。标准差实际上是方差的平方根。方差(variance):各点到均值距离平方的平均。方差由于和数据的量纲不同,因而在实际应用中使用得不如标准差那么普遍。数据的标准得分(standardscore)两个类似的班级(一班和二班)上同一门课,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样(第7章

两个班级同一门课成绩.sav)。一班分数的均值和标准差分别为78.53和9.43,而二班的均值和标准差分别为70.19和7.00。那么得到90分的一班的张颖是不是比得到82分的二班的刘小平成绩更好呢?数据的标准得分(standardscore)怎么比较才能合理呢?虽然这种均值和标准差不同的数据不能够直接比较,但是可以把它们进行标准化,然后再比较标准化后的数据。一个标准化的方法是把原始观测值(亦称得分,score)和均值之差除以标准差;得到的度量称为标准得分(standardscore):(x-m)/s

(这里m和s为均值和标准差)数据的标准得分(standardscore)在SPSS中求标准得分:如果需要分组(这里按班级分组),则先用菜单“Data”->“SplitFile”,将数据文件按各班分割开用菜单“Analyze”->“DescriptiveStatistics”->“Descriptives”的“Savestandardizedvaluesasvariables”选项;结果见数据文件中以“z-”为开头的变量。7.1利用SPSS对定量数据进行描述统计分析例7-1护士工作满意度调查分析。

为了了解护士们对工作的满意程度,做了一个调查。“第7章护士工作满意度调查.sav”或“第7章护士工作满意度调查.xls”数据文件中包含了100名护士对工作、工资和升职机会的满意程度。这三个方面的评分都是从0到100,分值越大表明满意程度越高。另外,调查数据还根据该护士所在的医院类型,分为3类:私人医院、公立医院和学院医院。(1)根据整个数据和三个方面的满意程度,判断哪一方面是护士们最为满意的?哪一方面是最不满意的?(2)根据离散程度(标准差、最小值、最大值、极差)的描述,判断护士们对哪一方面的满意程度差别最大?(3)从医院类型的数据中可以了解到什么?是否有某一类型的医院在三个方面的满意程度上优于其他医院?7.1利用SPSS对定量数据进行描述统计分析例7-2用SPSS实现例7-1中的问题(1)和(2)菜单:“Analyze”->“DescriptiveStatistics”->“Descriptives”

定量变量(数值型数据):工作、工资、升职机会表7‑2护士们在三个方面的满意度情况

方面人数均值标准差最小值最大值极差工作10079.798.22639532工资10054.1314.66259065升职机会10058.4516.081692767.1利用SPSS对定量数据进行描述统计分析例7-2用SPSS实现例7-1中的问题(1)和(2)可利用表7‑2中的均值作柱形图7.2利用SPSS实现多组均值比较例7-4用SPSS实现例7-1中的问题(3)菜单:“Analyze”->“CompareMeans”->“Means”分析变量(数值型数据):工作、工资、升职机会分组变量(分类数据):医院类型

表7‑5不同医院类型的护士们在工作、工资和升职机会的满意度情况

医院类型工作满意度工资满意度升职机会满意度均值排名均值排名均值排名学院医院(n=29)80.7157.3159.452公立医院(n=35)79.6253.5255.543私人医院(n=36)79.3352.2360.471将表7‑5改为有排名更好些7.2利用SPSS实现多组均值比较用SPSS实现例7-1中的问题(3)可利用表7‑5中的均值作柱形图

7.2.3利用SPSS实现有序数据的描述统计分析在1991年美国社会调查中,设计了一个问题,让受访者对“服从(Obey)”、“受欢迎(Popular)”、“为自己着想(Thnkself)”、“勤奋工作(Workhard)”和“乐于助人(Helpoth)”这五个方面的重要性进行排序(排名),从中可以分析美国人考虑问题的角度和趋向,进一步分析可以得到美国人的社会价值观和人生观。7.2.3利用SPSS实现有序数据的描述统计分析服从、受欢迎、为自己着想、勤奋工作和乐于助人这五个方面的重要性进行排序。将P199的调查问卷改成类似P60的排名题您认为以下五个方面的重要性顺序如何?请依排名顺序,填入1、2、3、4、5。(1-最重要,2-第二重要,3-第三重要,4-第四重要,5-最不重要)□服从□受欢迎□为自己着想□勤奋工作□乐于助人7.2.3利用SPSS实现有序数据的描述统计分析方法1:采用第4章介绍的单选题的一维频率分析方法,求得受访者选择的各答案所占的百分比(如表7-6所示),并画出百分比柱形图(如图7-4所示)表7-6五个方面重要性的一维频率分析服从受欢迎为自己着想勤奋工作乐于助人最重要19.86%0.41%51.93%14.97%12.83%第二重要12.53%2.75%16.40%36.15%32.18%第三重要14.46%5.80%13.24%32.69%33.81%第四重要34.93%18.84%13.75%14.66%17.82%最不重要18.23%72.20%4.68%1.53%3.36%7.2.3利用SPSS实现有序数据的描述统计分析方法2:采用描述统计分析方法,求得各方面的排名均值,这样每个方面各自只有一个均值,就容易比较了。通过比较均值的大小(均值越大表示越不重要),可以得出受访者对于五个方面重要性的排名顺序。表7-8受访者对于五个方面重要性的排名结果排名方面均值1为自己着想2.032勤奋工作2.523乐于助人2.674服从3.195受欢迎4.60按照排名顺序显示更好些7.2.3利用SPSS实现有序数据的描述统计分析方法2:采用描述统计分析方法,求得各方面的排名均值,这样每个方面各自只有一个均值,就容易比较了(均值越大表示越不重要)。受访者对于五个方面重要性排名均值柱形图采用柱形图更好些7.2.3利用SPSS实现有序数据的描述统计分析受访者对于五个方面重要性排名均值折线图(P201)改为右图(因为均值越大表示越不重要)通过设置“数值轴”的“刻度”选项卡中的选项实现。7.2.3利用SPSS实现有序数据的描述统计分析思考题:是否可以采用描述统计分析方法,求第4章实践2中的问题(2)?P129:(2)对问题2中的每个国家,你的结论如何?对哪个国家的总体感觉最好?对哪个国家的总体感觉最差?7.2.3利用SPSS实现有序数据的描述统计分析例7-7分析不同性别受访者对于五个方面重要性的排名顺序是否相同。菜单“Analyze”->“CompareMeans”->“Means”

表7-11男女受访者对于五个方面重要性的排名结果方面男性(n=408)女性(n=574)均值排名均值排名为自己着想2.1211.961勤奋工作2.5122.522乐于助人2.7132.643服从3.1543.224受欢迎4.5054.665按照某一类型(男)排名顺序显示更好些7.2.3利用SPSS实现有序数据的描述统计分析例7-7分析不同性别受访者对于五个方面重要性的排名顺序是否相同。男女受访者对于五个方面重要性排名均值柱形图采用柱形图更好些7.2.3利用SPSS实现有序数据的描述统计分析不同性别受访者对于五个方面重要性排名均值折线图(P203)改为右图(因为均值越大表示越不重要)通过设置“数值轴”的“刻度”选项卡中的选项实现。7.2.3利用SPSS实现有序数据的描述统计分析例7-8分析不同种族受访者对于五个方面重要性的排名顺序是否相同。菜单“Analyze”->“CompareMeans”->“Means”

表7-12不同种族受访者对于五个方面重要性的排名结果方面白人(n=817)黑人(n=135)其他(n=30)均值排名均值排名均值排名为自己着想1.9412.3912.703勤奋工作2.5022.6122.672乐于助人2.6632.7542.501服从3.2842.7332.804受欢迎4.6254.5354.335按照某一类型(白人)排名顺序显示更好些7.2.3利用SPSS实现有序数据的描述统计分析例7-8分析不同种族受访者对于五个方面重要性的排名顺序是否相同。不同种族受访者对于五个方面重要性排名均值柱形图采用柱形图更好些7.2.3利用SPSS实现有序数据的描述统计分析不同种族受访者对于五个方面重要性排名均值折线图(P204)改为下图(因为均值越大表示越不重要)通过设置“数值轴”的“刻度”选项卡中的选项实现。7.3利用Excel对定量数据进行描述统计分析例7-9有1969~1971年美国一家银行的474名雇员数据。对这474名银行雇员数据,可以进行各种统计分析。(1)这家银行男女雇员各多少人?所占的比例是多少?(2)这家银行当前最高年薪、最低年薪、平均年薪各是多少?每年应付给员工多少薪资?这家银行雇员的平均年薪是否高于当时全美的平均年薪3万美元?(3)不同岗位的男女雇员人数各是多少?岗位和性别之间是否相关?(4)不同性别雇员的平均年薪各是多少?是否男性雇员的平均年薪比女性雇员的高?(5)不同岗位雇员的平均年薪各是多少?是否存在显著差异?(6)建立一个以受雇起薪、以前工作经验、工作时间、受教育年限等为自变量,当前年薪为因变量的线性回归模型7.3利用Excel对定量数据进行描述统计分析利用Excel描述统计分析工具求“这家银行当前最高年薪、最低年薪、平均年薪各是多少?每年应付给员工多少薪资?”菜单:“工具”->“数据分析”,选择“描述统计”表7-14银行雇员的当前年薪情况人数最低年薪最高年薪薪资总额平均年薪47415,750135,00016,314,87534,4207.3.2在Excel中将分类数据转化为组中值问卷上很多有关收入、年龄、消费等数值,会因为牵涉个人隐私或为了方便受访者填写,并不会要求受访者直接填写其数值,而采用勾选某一区间的形式。但在问卷回收后,统计分析人员有时希望计算出平均值。7.3.2在Excel中将分类数据转化为组中值例7-10求收入的平均值。请问您整个家庭月收入状况: □1、5千元以下 □2、5千至1万元

□3、1万至1.5万元 □4、1.5万至2万元 □5、2万元以上组中值的算法为请问您整个家庭月收入状况: □1、2500元 □2、7500元 □3、12500元 □4、17500元 □5、22500元注意:对于只有上限值或只有下限值的类别,其组中值可根据实际情况给定。7.3.2在Excel中将分类数据转化为组中值例7-10求收入的平均值。请问您整个家庭月收入状况: □1、5千元以下 □2、5千至1万元 □3、1万至1.5万元 □4、1.5万至2万元 □5、2万元以上用IF函数转化:=IF(B2=1,2500,IF(B2=2,7500,IF(B2=3,12500,IF(B2=4,17500,IF(B2=5,22500,"")))))请问您整个家庭月收入状况: □1、2500元 □2、7500元 □3、12500元 □4、17500元 □5、22500元7.4利用Excel求量表均值并排名例7-11“数码相机注重属性”调查问卷处理。

Q23.请在下列选购数码相机时的注重属性中勾选重要程度属性非常重要重要一般不重要非常不重要1.价格□5□4□3□2□12.与计算机配合执行的软件□5□4□3□2□13.操控性(稳定性、速度等)□5□4□3□2□14.售后服务及维修能力□5□4□3□2□15.升级的成本□5□4□3□2□16.硬件的扩充能力□5□4□3□2□17.厂商提供的资料详细与否□5□4□3□2□18.品牌形象□5□4□3□2□19.外型是否美观好看□5□4□3□2□110.像素色彩是否清晰□5□4□3□2□111.内存容量及速度□5□4□3□2□112.连接计算机网络的能力□5□4□3□2□113.待机时间长短□5□4□3□2□1注意:量表答案的排列顺序和强度结构,中性类别最好在中间(P33)7.4利用Excel求量表均值并排名例7-11“数码相机注重属性”调查问卷处理。在问卷回收后,出题者也是逐项地分别对其计算出平均值,然后再按其平均值的高低排出顺序,来判断哪几个属性较为让受访者看重。这里介绍3种求各属性(量表)均值的方法。方法1:利用AVERAGE函数求量表均值;方法2:利用描述统计分析工具求量表均值;方法3:利用数据透视表求量表均值。7.4利用Excel求量表均值并排名例7-11“数码相机注重属性”调查问卷处理。表7-15数码相机的注重属性排名结果排名属性注重程度平均值1像素色彩是否清晰4.522操控性(稳定性、速度等)4.443内存容量及速度4.364与计算机配合执行的软件4.245连接计算机网络的能力4.216待机时间长短4.207价格4.197售后服务及维修能力4.199厂商提供的资料详细与否3.9510外型是否美观好看3.9311硬件的扩充能力3.7712品牌形象3.7013升级的成本3.51按照排名顺序显示更好些7.4利用Excel求量表均值并排名例7-12分析男女受访者对“数码相机注重属性”排名情况是否相同。(推荐“利用数据透视表”)表7-16男女受访者对数码相机注重属性的排名结果属性男性(37人)女性(61人)注重程度平均值排名注重程度平均值排名像素色彩是否清晰4.5414.511操控性(稳定性、速度等)4.4124.462价格4.3234.118售后服务及维修能力4.2744.157内存容量及速度4.2744.413待机时间长短4.1964.216与计算机配合执行的软件4.1674.304连接计算机网络的能力4.1484.265厂商提供的资料详细与否4.0893.8711外型是否美观好看3.84103.989品牌形象3.78113.6612升级的成本3.57123.4813硬件的扩充能力3.57123.8910按照某一类型(男)排名顺序显示更好些实践题(1)数据文件:“第7章银行雇员数据(中文).sav”或“第7章银行雇员数据(中文).xls”。(各变量的名称及其属性请参见教材7.3节P204)要求应用所学的描述统计分析方法,回答以下问题:(1)不同性别雇员的平均年薪各是多少?从数值上看,是否男性雇员的平均年薪比女性雇员的高?(2)不同岗位雇员的平均年薪各是多少?从数值上看,哪种岗位雇员的平均年薪最高?请参见实验7.1实践题(4)简化版的“手机营销组合”调查问卷请参见教材第7章附录P223(或实验7.4)数据文件:“第7章手机营销组合调查数据.sav”或“第7章手机营销组合调查数据.xls”。要求对所得调查数据进行基本统计分析,具体请见教材P222~223(或实验7.4,P164-187)。请参见实验7.4P164-187实践题(4)1、 总体情况:本次调查了多少名大学生?男女生各多少名?所占比例各是多少?居住状况如何?有男(女)朋友的学生多吗? JB1、JB2、JB6【单选题的一维频率分析Frequencies】P167-1692、 在受访学生中,有多少人现在有手机?所占比例是多少? Q1【单选题的一维频率分析Frequencies】P169-1703、 在有手机的受访学生中,有多少人使用的是新手机(未满六个月),所占比例是多少?有多少人使用的是旧手机(一年半以上),所占比例是多少?

Q2【单选题的一维频率分析Frequencies】P170请参见实验7.4P164-187实践题(4)4、 在有手机的受访男生中,有多少人使用的是新手机(未满六个月)?有多少人使用的是旧手机(一年半以上)?5、 在有手机的受访女生中,有多少人使用的是新手机(未满六个月)?有多少人使用的是旧手机(一年半以上)?

JB1XQ2【两个单选题的交叉表分析Crosstabs】 P170-1726、 在有手机的受访学生中,到现在为止,该手机的平均使用时间是多少个月?(不考)

首先Q2->Q2N【重新编码Recode】,然后求Q2N的描述统计量【Descriptives】P172-174请参见实验7.4P164-187实践题(4)7、 在有手机的受访学生中,哪个手机品牌的使用者人数最多?所占比例是多少?

Q3【单选题的一维频率分析Frequencies】P1758、 每月零用钱在“800~1000元”的受访学生,哪个手机品牌的使用者人数最多?

JB5XQ3【两个单选题的交叉表分析Crosstabs】P175-1779、 在有手机的受访学生中,平均每月手机话费的均值是多少?最多的是多少?最少的是多少?(不考)

Q4【填空题的描述统计分析Descriptives】P17710、在有手机的受访学生中,平均每月手机话费超过999元(1000元及以上)的有多少人?所占比例是多少?平均每月手机话费低于100元(100元以下)的有多少人?所占比例是多少?(不考) 首先Q4->Q4C【重新编码Recode】,然后对Q4C进行一维频率分析【Frequencies】P177-179请参见实验7.4P164-187实践题(4)11、在有手机的受访学生中,最偏好哪种收费方案?偏好“包月”的有多少人?所占比例是多少?偏好“预存”的有多少人?所占比例是多少?

Q5【单选题的一维频率分析Frequencies】P17912、在有关手机的产品属性中,受访学生认为哪个属性的重要程度最高?哪个属性的重要程度最低?

Q6【求量表均值并排名Descriptives】P179-18013、在有关手机的产品属性中,受访男生认为哪个属性的重要程度最高?哪个属性的重要程度最

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论