统计学基础第2章用图表展示数据_第1页
统计学基础第2章用图表展示数据_第2页
统计学基础第2章用图表展示数据_第3页
统计学基础第2章用图表展示数据_第4页
统计学基础第2章用图表展示数据_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、作者 贾俊平统计学统 计 学(第三版)20212021年8月 图并没有说谎,是说谎者在画图。 Benjamin Disraeli 统计名言2021年8月第 2 章 用图表展现数据2.1 用图表展现定性数据 2.2 用图表展现定量数据 2.3 合理运用图表2021年8月学习目的定性数据的频数分布表定性数据的图示方法定量数据的频数分布表定量数据的图示方法用Excel和SPSS作频数分布表和图形合理运用图表2021年8月男学生更容易逃课吗? 读完四年大学,一次课也没有逃过,这样的学生恐怕不多。2004年5月,中国人民大学财政金融学院的3名学生就逃课问题做了一次调查。调查的对象是财政金融学院的大一,大

2、二,大三本科生。样本的抽取方式是分层抽样与简单随机抽样结合,先根据年级划分层次,然后对各个班级简单随机抽样,共抽取151名学生组成一个样本,并对每个学生采用问卷调查。问卷内容包括每周逃课次数、所逃课程的类型选修课、专业课等等和逃课缘由等。调查得到的男女学生每周平均逃课次数的汇总表如下 2021年8月男学生更容易逃课吗? 逃课情况男女合计几乎一次不逃2849771到3次2431553到5次64105次以上336其他123合计6289151他以为男学生更容易逃课吗?用哪些简单的统计描画支持他的看法?假设要用图形表现上面的数据,反映男女学生逃课方面的差别、逃课次数的构成以及男女学生在逃课方面能否具有

3、类似性等等,有哪些图形可供他选择运用呢?2021年8月2.1 用图表展现定性数据 2.1.1 生成频数分布表 2.1.2 定性数据的图示第 2 章 用图表展现数据2021年8月2.1.1 生成频数分布表2.1 用图表展现定性数据2021年8月生成频数分布表(定性数据)1.列出各类别2. 计算各类别的频数3. 生成频数分布表分类频数比例百分比比率ABCDE2021年8月生成频数分布表(定性数据)【例】一家市场调查公司为研讨不同类型饮料的市场占有率,对随机抽取的一家超市进展调查。下面的表是调查员随机察看的50名顾客购买的饮料类型记录。生成一张频数分布表,察看不同类型饮料的销售分布情况 用Excel

4、制造频数分布表2021年8月运用Excel数据透视表数计数 (pivot table)第1步:选择【数据】菜单中的【数据透视表和数据透视图】第2步:确定数据源区域第4步:在【导游3步骤之3】中选择数据透视表的输出位置 。然后选择【规划】第5步:在【导游规划】对话框中,依次将“分类变量“(这里 是饮料品牌)延续拖放两次:一次拖至左边的“行区域 ,一次拖至 “数据区域第6步:然后单击【确定】,自动前往【导游3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表用数据透视表产生定性数据的频数分布2021年8月生成频数分布表(定性数据)不同类型饮料的频数分布 2021年8月定性数据的描画统计量频数

5、(frequency) :落在各类别中的数据个数比例(proportion) :某一类别数据个数占全部数据个数的比值百分比(percentage) :将对比的基数作为100而计算的比值比率(ratio) :不同类别数值个数的比值2021年8月2.1.2 定性数据的图示2.1 用图表展现定性数据2021年8月条形图(bar Chart)用宽度一样的条形的高度或长短来表示各类别数据各类别可放在纵轴,称为条形图,可以放在横轴,称为柱形图(column chart) 2021年8月帕累托图(pareto chart)按各类别数据出现的频数多少排序后绘制的柱形图 用于展现分类数据的分布2021年8月饼图

6、 (pie Chart)用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例用于研讨构造问题2021年8月环形图(doughnut chart)环形图中间有一个“空洞,样本或总体中的每一部分数据用环中的一段表示与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图那么可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环用于构造比较研讨 2021年8月环形图(doughnut chart)【例】2006年北京、上海和天津地域按收入法计算的地域消费总值(按当年价钱计算)数据。绘制环形图比较三个地域的消费总值构成

7、2021年8月环形图 (doughnut chart )北京、上海和天津地域按收入法计算的地域消费总值2021年8月2.2 用图表展现定量数据 2.2.1 生成频数分布表 2.2.2 定量数据的图示第 2 章 用图表展现数据2021年8月2.2.1 生成频数分布表2.1 用图表展现定性数据2021年8月生成频数分布表(例题分析)【例】某电脑公司2021年前4个月各天的销售量数据(单位:台)。生成一张频数分布表察看销售额分布的特征 2021年8月生成频数分布表(例题分析)确定组数:组数确实定应以可以显示数据的分布特征为目的。在实践分组时,组数普通为5K 15。本例中由于数据较多,可思索分为10组

8、 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距( 最大值 - 最小值) 组数 例如,本例最大值为237,最小值为141,组距=(237-141)109.6。为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取10 统计出各组的频数。每个组的数据满足axb(上限值不在内 2021年8月分组中的几个概念1. 下限(lower limit) :一个组的最小值2. 上限(upper limit) :一个组的最大值3. 组距(class width) :上限与下限之

9、差4. 组中值(class midpoint) :下限与上限之间的中点值下限值+上限值2组中值 =用Excel制造频数分布2021年8月生成频数分布表(例题分析)某电脑公司销售额的频数分布 2021年8月生成频数分布表(例题分析运用开口组)2021年8月运用Excel频数函数 (FREQUENCY)Excel的【直方图】工具的缺陷是:频数分布及直方图没有与数据链接,当改动任何一个数据时,频数分布表和直方图不会跟着改动运用统计函数【FREQUENCY】创建频数分布表和直方图可处理这一问题。详细步骤是选择与接受区域相临近的单元格区域,作为频数分布表输出的区域选择统计函数中的【FREQUENCY】函

10、数在对话框【Date-array】后输入数据区域,在【Bins-array】后输入接受区域同时按下“ctrl-shift-Enter组合键,即得到频数分布统计函数FREQUENCY2021年8月2.2.2 定量数据的图示2.1 用图表展现定性数据Excel2021年8月分组数据看分布直方图(histogram)用于展现分组数据分布的一种图形用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就构成了一个矩形,即直方图直方图下的总面积等于1用Excel制造直方图 2021年8月用SPSS绘制直方图 第1步:选择【

11、Graphs】下拉菜单,并选择 【histogram】选项进入主对话框第2步:在主对话框中将变量选入【Variables】 ,点击【OK】 用SPSS绘制直方图 2021年8月分组数据看分布直方图(SPSS绘制的直方图)2021年8月分组数据看分布直方图(直方图与条形图的区别)条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度那么表示各组的组距由于分组数据具有延续性,直方图的各矩形通常是延续陈列,而条形图那么是分开陈列条形图主要用于展现定性数据,而直方图那么主要用于展现定量数据2021年8月未分组数据看分布茎叶图(stem-and-leaf plot)用于显示未分组的原始数据的分布

12、由“茎和“叶两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保管最后一位数字6. 茎叶图类似于横置的直方图,但又有区别直方图可察看一组数据的分布情况,但没有给出详细的数值茎叶图既能给出数据的分布情况,又能给出每一个原始数值,保管了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据2021年8月用SPSS绘制茎叶图和箱线图 (包括直方图)第1步:选择【Analyze】下拉菜单,并选择 【Descriptive statistics-Explore】 选项进入主对话框第2步:在主对话框中将变量选入【Variables】, 点击【Plots】,在对话框中选

13、择【Stem- and-leaf】(根据需求可选【Histogram】以 给出直方图)。点击【Continue】回到主对话 框。点击【OK】 用SPSS绘制茎叶图2021年8月未分组数据看分布茎叶图 (例题分析)第一列给出每个茎上叶子的频数第二列是“茎,第三列是“叶下面标出了1个极端值237、茎的宽度10、每个叶代表一个数据(案例)SPSS自动将每个茎反复了一次,使分布的细节看的更清楚一些。当然,在数据较少时茎的数值也可以不反复 2021年8月未分组数据看分布箱线图(box plot)用于显示未分组的原始数据的分布箱线图是由一组数据的最大值(maximum)、最小值(minimum)、中位数(

14、median)、两个四分位数(quartiles)这5个值绘制而成的中位数是一组数据排序后处于中间位置上的变量值四分位数是一组数据排序后处在数据25%位置和75%位置上的两个分位数值 绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)衔接两个四分位数画出箱子,再将两个极值点与箱子相衔接2021年8月未分组数据看分布箱线图(箱线图的构成)中位数4681012Q75%Q25%XMaxXMinMedian/Quart./Range箱线图2021年8月未分组数据看分布箱线图(例题分析)最小值141最大值237中位数18225%四分位数17

15、0.2575%四分位数197140 150 160 170 180 190 200 210 220 230 240某电脑公司销售额数据的Median/Quart./Rang箱线图2021年8月分布的外形与箱线图不同分布的箱线图对称分布Bell-shaped distributionLeft-skewed distribution左偏分布右偏分布Right-skewed distribution2021年8月未分组数据看分布多批数据箱线图 (例题分析)【例】 从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成果进展调查,所得结果如表。试绘制各科考试成果的批比较箱线图,并分析各

16、科考试成果的分布特征11名学生各科的考试成绩数据课程名称学生编号1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础766593746870558590958187757391789751768570926881717488698465739570786690737884709363798060878167869183777690708283829284817069727875789188669480857186746879628181557870756871772021年8月用SPSS绘制多批数据箱线图 第1步:选择【Graphs】下拉菜单,并选择

17、【Boxplot】第2步:在出现的对话框中选择【Simple】,在 【Data in Chat Are】中选择【Summaries of separate variables】,点击【Define】 前往主对话框第3步:在主对话框将一切变量(这里是11个学生)选入 【Boxes Represent】,将“课程称号选入 【Label Cases by】。点击【OK】 用SPSS绘制箱线图2021年8月未分组数据多批数据箱线图(例题分析Median/Quart./Range)8门课程考试成果的箱线图2021年8月11名学生考试成果的Median/Quart./Range箱线图未分组数据多批数据箱线

18、图 (SPSS绘制的箱线图)2021年8月两个变量间的关系二维散点图(2D Scatterplots)展现两个变量之间的关系用横轴代表变量x,纵轴代表变量y,每组数据(xi , yi)在坐标系中用一个点表示,n组数据在坐标系中构成的n个点称为散点,由坐标及其散点构成的二维数据图2021年8月两个变量间的关系二维散点图(2D Scatterplots)2021年8月假设想比较几个变量之间的关系,也可以把它们的散点图绘制在同一张图里,绘制成重叠散点图(Overlay Scatter)(留意:绘制重叠散点图时,变量值之间的数值差别不能过大,否那么不便于比较)比如,假设想比较固定资产投资额与地域消费总值和最终消费支出的关系,可以把固定资产投资作为共同的一个坐标轴,地域消费总值和最终消费支出作为另一个坐标轴也可以绘制散点图矩阵(Matrix Scatter)两个变量间的关系重叠散点图(用SPSS绘制重叠散点图)2021年8月用SPSS绘制重叠散点图 (Overlay Scatter)第1步:选择【Graphs】下拉菜单,并选择 【Scatter/Dot】点击【Define】 第2步:将所要配对的数据依次选入【Y-X Pairs】(本例为“固定资产投资额-地域消费总值和“固定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论