




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据分析(方法与案例)作者 贾俊平统计学统 计 学Statistics数据分析(方法与案例)作者 贾俊平统计学统 计 图并没有说谎,是说谎者在画图。 Benjamin Disraeli 统计名言 图并没有说谎,是说谎者在画图。统计名言第 2 章 用图表展示数据2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表Display第 2 章 用图表展示数据2.1 用图表展示定性数据学习目标定性数据的频数分布表定性数据的图示方法定量数据的频数分布表定量数据的图示方法用Excel和SPSS作频数分布表和图形合理使用图表学习目标定性数据的频数分布表用哪些图形展示奖牌?2009年7月
2、26日至8月3日第13届世界游泳锦标赛在意大利罗马举行。美国的泳坛霸主地位难以撼动,中国军团也创造了史上第二的佳绩在本届游泳世锦赛上,中国代表团取得金牌数和奖牌与美国并列第一、奖牌榜排名第二的好成绩,而且中国男子游泳首次夺得世界性大赛的冠军并一举打破世界纪录。本届游泳世锦赛共设有奖牌227枚,其中金牌75枚、银牌75枚、铜牌77枚。下表是本届游泳世锦赛金牌总数取得前三名的国家所获得奖牌的分布情况 用哪些图形展示奖牌?2009年7月26日至8月3日第13届世用哪些图形展示奖牌?根据上面的数据,你认为可以选择哪些图形来展示三个国家所获得的奖牌情况?学完本章的图表展示技术,这样的问题就会迎刃而解用哪
3、些图形展示奖牌?根据上面的数据,你认为可以选择哪些图形来2.1 用图表展示定性数据 2.1.1 生成频数分布表 2.1.2 定性数据的图示第 2 章 用图表展示数据2.1 用图表展示定性数据第 2 章 用图表展示数据2.1.1 生成频数分布表2.1 用图表展示定性数据2.1.1 生成频数分布表2.1 用图表展示定性数据生成频数分布表(定性数据)1.列出各类别2. 计算各类别的频数3. 生成频数分布表分类频数比例百分比比率ABCDE生成频数分布表(定性数据)1.列出各类别定性数据的描述统计量频数(frequency) :落在各类别中的数据个数比例(proportion) :某一类别数据个数占全部
4、数据个数的比值百分比(percentage) :将对比的基数作为100而计算的比值比率(ratio) :不同类别数值个数的比值定性数据的描述统计量频数(frequency) :落在各类别生成频数分布表(定性数据)【例2-1】为研究人们对不同类型软饮料的偏好情况,一家调查公司在某超市随机调查了50名顾客。右表是顾客性别及其所偏好的饮料类型记录。生成频数分布表,观察不同性别的顾客及其所偏好的饮料类型的分布状况,并进行描述性分析 制作频数分布表绿色健康饮品Excel生成频数分布表(定性数据)【例2-1】为研究人们对不同类型使用Excel数据透视表计数 (pivot table)第1步:选择【数据】菜
5、单中的【数据透视表和数据透视图】第2步:确定数据源区域(在操作前将光标放在任意数据单元格 内,系统会自动选定数据源区域)第3步:在【向导3步骤之3】中选择数据透视表的输出位 置,然后选择【布局】第4步:在【向导布局】对话框中,依次将“饮料类型”拖至左 边的“行”(或列)区域,将“顾客性别”拖至 “列”(或 行)区域,将“饮料类型”拖至“数据”区域。第5步:单击【确定】,自动返回【向导3步骤之3】对话 框。单击【完成】用数据透视表生成定性数据的频数分布Excel使用Excel数据透视表计数 (pivot table)第生成频数分布表(列联表Excel)不同类型饮料和不同性别顾客的频数分布 绿色健
6、康饮品生成频数分布表(列联表Excel)不同类型饮料和不同性别用SPSS生成定性数据的频数分布表(单变量频数分布表)第1步:选择【Analyze】【Descriptive Statistics-Frequencies】进入主对话框第2步:将“饮料类型”或“顾客性别”选入 【Variable(s)】;选中【Display Frequency tables】第3步 (若需要描述统计量或图形)主点【Statistics】 或【Charts】,并选择相应的选项。点击 【OK】生成频数分布表SPSS用SPSS生成定性数据的频数分布表(单变量频数分布表)第1生成频数分布表(定性数据SPSS)不同类型饮料的
7、频数分布 升序排列 (汉字拼音字母) 生成频数分布表(定性数据SPSS)不同类型饮料的频数分布用SPSS生成定性数据的列联表 (Crosstabulation交叉表)第1步:选择【Analyze】【Descriptive Statistics- Crosstabs】进入主对话框第2步:将“饮料类型”选入【Row(s)】,将“顾客性别”选 入【Column(s)】(行列可以互换)第3步: (若需要对列联表进行描述性分析)点击 【Cells】,在【Percentages】下选中需要的统计 量,如【Row】、【Column】、【Total】等;(若 需要图形)点击【Display clustered
8、 bar chart】。 点击【OK】 生成交叉频数分布表SPSS用SPSS生成定性数据的列联表 (Crosstabulat列联表的描述性分析(例题分析SPSS)列联表的统计描述 行百分比 列百分比 列联表的描述性分析(例题分析SPSS)列联表的统计描述 列联表的描述性分析(例题分析SPSS)列联表的统计描述 行百分比 列百分比 列联表的描述性分析(例题分析SPSS)列联表的统计描述 2.1.2 定性数据的图示2.1 用图表展示定性数据2.1.2 定性数据的图示2.1 用图表展示定性数据条形图(bar Chart)用宽度相同的条形的高度或长短来表示各类别数据各类别可放在纵轴,称为条形图,可以放
9、在横轴,称为柱形图(column chart) 条形图(bar Chart)用宽度相同的条形的高度或长短来复式条形图(bar Chart)饮料类型和顾客性别的条形图 (SPSS的输出) 复式条形图(bar Chart)饮料类型和顾客性别的条形图帕累托图(pareto chart)按各类别数据出现的频数多少排序后绘制的柱形图 用于展示分类数据的分布帕累托图(pareto chart)按各类别数据出现的频数用SPSS绘制饼图 (Pie)第1步:选择【Graphs】【Interactive-Pie-Clustered】,进入主对话框第2步:如果绘制简单饼图,将某个分类变量(如“饮料类型”)选入【Sl
10、ice】(部分,片);点击【Pies】,选择在饼图中要展示的内容,如【Category】、【Count】、【Percen】等。点击【确定】如果要绘制复式饼图,将某个分类变量(如“饮料类型”)选入【Slice】;将另一个分类变量(如“顾客性别”)选入【Cluster】;点击【Pies】,选择在饼图中要展示的内容,如【Category】、【Count】、【Percen】等。点击【确定】 绘制饼图SPSS用SPSS绘制饼图 (Pie)第1步:选择【Graphs】简单饼图 (pie Chart)用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例
11、用于研究结构问题简单饼图 (pie Chart)用圆形及圆内扇形的角度来复式饼图 (pie Chart)主要用于展示两个或多个分类变量的构成比较,比如,在男女分类的基础上又增加了饮料类型的分类。 复式饼图 (pie Chart)主要用于展示两个或多个分环形图(doughnut chart)环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环用于结构比较研究 环形图(doughnut chart)环形图中间有一个“空环形图(doughnut c
12、hart)【例2-2】2006年北京、上海和天津地区按收入法计算的地区生产总值(按当年价格计算)数据。绘制环形图比较三个地区的生产总值构成 环形图(doughnut chart)【例2-2】2006环形图 (doughnut chart )北京、上海和天津地区按收入法计算的地区生产总值环形图 (doughnut chart )北京、上海和天津2.2 用图表展示定量数据 2.2.1 生成频数分布表 2.2.2 定量数据的图示第 2 章 用图表展示数据2.2 用图表展示定量数据第 2 章 用图表展示数据2.2.1 生成频数分布表2.2 用图表展示定量数据2.2.1 生成频数分布表2.2 用图表展示
13、定量数据生成频数分布表(例题分析)【例2-3】某电脑公司120天的销售额数据(单位:万元) 。生成一张频数分布表观察销售额分布的特征生成频数分布表(例题分析)【例2-3】某电脑公司120天的生成频数分布表(例题分析)确定组数:组数的确定应以能够显示数据的分布特征为目的。在实际分组时,组数一般为5K 15。本例中由于数据较多,可考虑分为10组 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距( 最大值 - 最小值) 组数 例如,本例最大值为237,最小值为141,组距=(237-141)109.6。为便于计算,组距宜取5
14、或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取10 统计出各组的频数。每个组的数据满足axb(上限值不在内(Excel的计数规则是axb) 生成频数分布表(例题分析)确定组数:组数的确定应以能够显示分组中的几个概念1. 下限(lower limit) :一个组的最小值2. 上限(upper limit) :一个组的最大值3. 组距(class width) :上限与下限之差4. 组中值(class midpoint) :下限与上限之间的中点值下限值+上限值2组中值 =制作频数分布Excel分组中的几个概念1. 下限(lower limit) :一生成
15、频数分布表(例题分析)某电脑公司销售额的频数分布 生成频数分布表(例题分析)某电脑公司销售额的频数分布 使用Excel频数函数 (FREQUENCY)Excel的【直方图】工具的缺陷是:频数分布及直方图没有与数据链接,当改变任何一个数据时,频数分布表和直方图不会跟着改变使用统计函数【FREQUENCY】创建频数分布表和直方图可解决这一问题。具体步骤是选择与接受区域相临近的单元格区域,作为频数分布表输出的区域选择统计函数中的【FREQUENCY】函数在对话框【Date-array】后输入数据区域,在【Bins-array】后输入接受区域同时按下“ctrl-shift-Enter”组合键,即得到频
16、数分布统计函数FREQUENCYExcel使用Excel频数函数 (FREQUENCY)Excel的【2.2.2 定量数据的图示2.2 用图表展示定量数据Excel2.2.2 定量数据的图示2.2 用图表展示定量数据分组数据看分布直方图(histogram)用于展示分组数据分布的一种图形用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图直方图下的总面积等于1分组数据看分布直方图(histogram)用于展示分组数用SPSS绘制直方图 第1步:选择【Graphs】菜单,并选择 【his
17、togram】选项进入主对话框第2步:在主对话框中将变量选入【Variables】 ,点击【OK】 绘制直方图SPSS用SPSS绘制直方图 第1步:选择【Graphs】菜单,并选分组数据看分布直方图(SPSS绘制的直方图)分组数据看分布直方图(SPSS绘制的直方图)分组数据看分布直方图(直方图与条形图的区别)条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列条形图主要用于展示定性数据,而直方图则主要用于展示定量数据分组数据看分布直方图(直方图与条形图的区别)条形图中的每未分组数据看分布茎叶图(
18、stem-and-leaf plot)用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留最后一位数字茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据未分组数据看分布茎叶图(stem-and-leaf pl用SPSS绘制茎叶图和箱线图 (包括直方图)第1步:选择【Analyze】菜单,并选择 【Descriptive statistics-Explore】
19、选项进入主对话框第2步:在主对话框中将变量选入【Variables】, 点击【Plots】,在对话框中选择【Stem- and-leaf】(根据需要可选【Histogram】以 给出直方图)。点击【Continue】回到主对话 框。点击【OK】 绘制茎叶图SPSS用SPSS绘制茎叶图和箱线图 (包括直方图)第1步:选择【未分组数据看分布茎叶图(例题分析)某电脑公司销售额分布的茎叶图未分组数据看分布茎叶图(例题分析)某电脑公司销售额分布的未分组数据看分布茎叶图 (例题分析)第一列给出每个茎上叶子的频数第二列是“茎”,第三列是“叶”下面标出了1个极端值237、茎的宽度10、每个叶代表一个数据(案例
20、)SPSS自动将每个茎重复了一次,使分布的细节看的更清楚一些。当然,在数据较少时茎的数值也可以不重复 未分组数据看分布茎叶图 (例题分析)第一列给出每个茎上叶未分组数据看分布箱线图(box plot)用于显示未分组的原始数据的分布箱线图是由一组数据的最大值(maximum)、最小值(minimum)、中位数(median)、两个四分位数(quartiles)这5个值绘制而成的中位数是一组数据排序后处于中间位置上的变量值四分位数是一组数据排序后处在数据25%位置和75%位置上的两个分位数值 绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位
21、数QU)连接两个四分位数画出箱子,再将两个极值点与箱子相连接未分组数据看分布箱线图(box plot)用于显示未分组未分组数据看分布箱线图(箱线图的构成)中位数4681012Q75%Q25%XMaxXMinMedian/Quart./Range箱线图未分组数据看分布箱线图(箱线图的构成)中位数468101未分组数据看分布箱线图(例题分析)最小值141最大值237中位数18225%四分位数170.2575%四分位数197140 150 160 170 180 190 200 210 220 230 240某电脑公司销售额数据的Median/Quart./Rang箱线图未分组数据看分布箱线图(例题
22、分析)最小值最大值中位数25分布的形状与箱线图不同分布的箱线图对称分布Bell-shaped distributionLeft-skewed distribution左偏分布右偏分布Right-skewed distribution分布的形状与箱线图不同分布的箱线图对称分布Bell-shap未分组数据看分布多批数据箱线图 (例题分析)【例2-4】 从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征11名学生各科的考试成绩数据课程名称学生编号1234567891011英语经济数学西方经济学
23、市场营销学财务管理基础会计学统计学计算机应用基础76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分组数据看分布多批数据箱线图 (例题分析)【例2-4】用SPSS绘制多批数据箱线图 第1步:选择【Graphs】下拉菜单,并选择【Boxplot】第2步:在出现的对话框中选择【Simple】,在 【
24、Data in Chat Are】中选择【Summaries of separate variables】,点击【Define】 返回主对话框第3步:在主对话框将所有变量(这里是11个学生)选入 【Boxes Represent】,将“课程名称”选入 【Label Cases by】。点击【OK】 绘制箱线图SPSS用SPSS绘制多批数据箱线图 第1步:选择【Graphs】下未分组数据多批数据箱线图(例题分析Median/Quart./Range)8门课程考试成绩的箱线图未分组数据多批数据箱线图(例题分析Median/Qua11名学生考试成绩的Median/Quart./Range箱线图未分组
25、数据多批数据箱线图 (SPSS绘制的箱线图)11名学生考试成绩的Median/Quart./Range箱垂线图可用于展示多个变量或多个样本取值的分布状况将属于同一样本或类别的多个取值的散点用一条垂线连接起来,用垂线的长度及垂线上的各个点来反映某个样本或类别取值的差异及其变动状况 未分组数据垂线图(drop-line)用SPSS制作垂线图第1步:选择【Graphs】菜单,并选择【Line】第2步:在出现的对话框中选择【Drop-line】,在【Data in Chart Are】中选择【Values of individual cases】,点击【Define】返回主对话框第3步:在主对话框中将
26、所有变量选入【Points Represent】。在【Category Labels】下选择【Variable】,并将相应的类别选入框内。点击【OK】 绘制垂线图SPSS垂线图可用于展示多个变量或多个样本取值的分布状况未分组数据未分组数据垂线图 (例题分析)11名学生8门课程考试成绩的垂线图未分组数据垂线图 (例题分析)11名学生8门课程考试成绩误差图是以均值为中心,加减一定倍数的标准差(也可以是加减一定倍数的标准误差)绘制而成的(该图也可以绘制均值的一定置信水平的置信区间)用于展示多个样本或分类的不同取值的分布状况和离散状况 未分组数据误差图(error bar )用SPSS制作垂线图第1步
27、:选择【Graphs】菜单,并选择【Error Bar】。第2步:在出现的对话框中选择【Simple】,在【Data in Chart Are】中选择【Summaries of separate variables】,点击【Define】返回主对话框。第3步:在主对话框中将所有变量选入【Error Bars】。在【Bars Represent】下选择【Standard deviations】,在【Multiplier】框内输入所需的标准差倍数。点击【OK】。 绘制误差图SPSS误差图是以均值为中心,加减一定倍数的标准差(也可以是加减一定未分组数据误差图 (例题分析)11名学生8门课程考试成绩的
28、误差图(均值加减2倍的标准差)未分组数据误差图 (例题分析)11名学生8门课程考试成绩两个变量间的关系二维散点图(2D Scatter plots)展示两个变量之间的关系用横轴代表变量x,纵轴代表变量y,每组数据(xi , yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的图有2维、3维、矩阵等形式两个变量间的关系二维散点图(2D Scatter plo两个变量间的关系二维散点图(2D Scatter plots)【例2-5】 表212是我国31 个地区2006年的固定资产投资额、地区生产总值(GDP)和最终消费支出数据。绘散点图并观察它们之间的关系 两
29、个变量间的关系二维散点图(2D Scatter plo用SPSS绘制重叠散点图 (Overlay Scatter)第1步:选择【Graphs】菜单,并选择【Scatter/Dot】第2步:如果绘制两个变量的简单散点图,点击【Simple Scatter】,点击【Define】,将两个变量分别选入【Y Pairs】和【X Pairs】,点击【OK】如果要绘制重叠散点图,点击【Overlay Scatter】,点击【Define】,将所要配对的数据依次选入【Y-X Pairs】(本例为“固定资产投资额-地区生产总值”和“固定资产投资额-最终消费支出”),点击【OK】如果要绘制矩阵散点图,点击【Ma
30、trix Scatter】,将几个变量(本例为“固定资产投资额”、“地区生产总值”和“固定资产投资额”)同时选入【Matrix Variables】,将区分坐标轴的样本(本例为“地区”)选入【Label Cases by】,点击【OK】 绘制重叠散点图SPSS用SPSS绘制重叠散点图 (Overlay Scatter两个变量间的关系二维散点图(2D Scatter plots)两个变量间的关系二维散点图(2D Scatter plo如果想比较几个变量之间的关系,也可以把它们的散点图绘制在同一张图里,绘制成重叠散点图(Overlay Scatter)(注意:绘制重叠散点图时,变量值之间的数值差异
31、不能过大,否则不便于比较)比如,如果想比较固定资产投资额与地区生产总值和最终消费支出的关系,可以把固定资产投资作为共同的一个坐标轴,地区生产总值和最终消费支出作为另一个坐标轴也可以绘制散点图矩阵(Matrix Scatter)两个变量间的关系重叠散点图(用SPSS绘制重叠散点图)如果想比较几个变量之间的关系,也可以把它们的散点图绘制在同一两个变量间的关系重叠散点图(Overlay Scatter)两个变量间的关系重叠散点图(Overlay Scatte两个变量间的关系矩阵散点图(Matrix Scatter)两个变量间的关系矩阵散点图(Matrix Scatter比较多个样本的相似性 雷达图(
32、radar chart)也称为蜘蛛图(spider chart)从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图可用于研究多个样本在多个变量上的相似程度当多个变量的取值相差较大或量纲不同时,可进行变换处理后再做图。线性变换:对数变换:比较多个样本的相似性 雷达图(radar chart)也多变量数据雷达图(例题分析)【例2-6】2006年我国东部、中部、西部及东北地区城镇居民的生活消费支出数据如表28所示。绘制雷达图,比较不同地区的消费支出构成 多变量数据雷达图(例题分析)【例2-6】2006年我国东多变量数据雷达图 (例题分析原始数据)四个地区城镇居民消费支出中,食品
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 清洗酒店台布协议书
- 姐弟抚养后续协议书
- 项目合作筹备协议书
- 简单参股协议书范本
- 学生碰撞调解协议书
- 企业外出旅游协议书
- 转岗降薪协议书范本
- 人脸签约服务协议书
- 简约私人纠纷协议书
- 劳务服务推广协议书
- GB/T 23445-2009聚合物水泥防水涂料
- 中医基础理论(中英文对照)
- 生理学(全套课件)
- 香港公司条例
- 污水处理系统工程合同范本
- 德能勤绩廉个人总结的
- 二年级美术上册课件 《3.我的手印画》 赣美版 (共18张PPT)
- Q∕SY 126-2014 油田水处理用缓蚀阻垢剂技术规范
- GB∕T 3216-2016 回转动力泵 水力性能验收试验 1级、2级和3级
- 电子电气评估规范-最新
- 黑布林绘本 Dad-for-Sale 出售爸爸课件
评论
0/150
提交评论