第三章 第一节 数据的整理与显示_第1页
第三章 第一节 数据的整理与显示_第2页
第三章 第一节 数据的整理与显示_第3页
第三章 第一节 数据的整理与显示_第4页
第三章 第一节 数据的整理与显示_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章 统计数据的概括性描述统计数据的概括性描述第三章第三章 统计数据的概括性描述统计数据的概括性描述第一节 统计数据的整理与展示第二节 数据集位置的测度第三节 数据集离散程度的测度第四节 数据集的峰度与偏度学习目标1. 了解数据预处理的内容和目的了解数据预处理的内容和目的2. 掌握分配数列的整理与显示方法掌握分配数列的整理与显示方法3. 掌握数据集的位置测度的变量与方法掌握数据集的位置测度的变量与方法4. 掌握数据集的离散程度测度的变量与方法掌握数据集的离散程度测度的变量与方法5. 掌握数据集的分布形态测度的变量与方法掌握数据集的分布形态测度的变量与方法案例与背景 统计数据首先需要经过

2、预处理和整理,以便人们对数据分布的类型和特点有了一个大概的了解。但这种了解并不能帮助我们准确地描述出统计数据的分布,还需要更深入的分析,找到能反映数据分布特征的各个代表值。对统计数据分布的特征和规律,可以从本章所介绍的三个方面进行测度和描述:一是数据集位置的测度,反映各数据向其中心值靠拢或聚集的程度;二是数据集离散程度,反映各数据远离其中心值的趋势;三是数据集的峰度与偏度,反映数据分布的形状。这三个方面从不同侧面反映了数据分布特征。本章将重点介绍这些代表值的计算方法、特点及其应用。第一节第一节 统计数据的整理与展示统计数据的整理与展示3.1.1 数据的预处理数据的预处理3.1.2 频数分布表的

3、编制与图示频数分布表的编制与图示3.1.1 数据的预处理1. 数据的审核数据的审核检查数据中的错误检查数据中的错误2. 数据的筛选数据的筛选找出符合条件的数据找出符合条件的数据3. 数据排序数据排序升序和降序升序和降序寻找数据的基本特征寻找数据的基本特征数据审核原始数据(raw data) 审核的内容审核的内容1.1. 完整性审核完整性审核检查应调查的单位或个体是否有遗漏检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全所有的调查项目或指标是否填写齐全2.2. 准确性审核准确性审核检查数据是否真实反映客观实际情况,内检查数据是否真实反映客观实际情况,内容是否符合实际容是否符合实际

4、检查数据是否有错误,计算是否正确等检查数据是否有错误,计算是否正确等数据的审核原始数据(raw data)审核数据准确性的方法审核数据准确性的方法1.1. 逻辑检查逻辑检查从定性角度,审核数据是否符合逻辑,内容是否从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象合理,各项目或数字之间有无相互矛盾的现象主要用于对分类和顺序据的审核主要用于对分类和顺序据的审核2.2. 计算检查计算检查检查调查表中的各项数据在计算结果和计算方法检查调查表中的各项数据在计算结果和计算方法上有无错误上有无错误主要用于对数值型数据的审核主要用于对数值型数据的审核数据的审核二手数据(sec

5、ond hand data)1. 适用性审核适用性审核弄清楚数据的来源、数据的口径以及有关的弄清楚数据的来源、数据的口径以及有关的背景材料背景材料确定数据是否符合自己分析研究的需要确定数据是否符合自己分析研究的需要2. 时效性审核时效性审核尽可能使用最新的数据尽可能使用最新的数据3. 确认是否必要做进一步的加工整理确认是否必要做进一步的加工整理数据筛选(data filter)1. 当数据中的错误不能予以纠正,或者有些当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,数据不符合调查的要求而又无法弥补时,需要对数据进行筛选需要对数据进行筛选2. 数据筛选的内容包括数据筛选的

6、内容包括将某些不符合要求的数据或有明显错误的数将某些不符合要求的数据或有明显错误的数据予以剔除据予以剔除将符合某种特定条件的数据筛选出来,而不将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔符合特定条件的数据予以剔用用SPSS进行数据筛选进行数据筛选 数据筛选(data filter)数据排序 (data rank)1. 按一定顺序将数据排列,以发现一些明显按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索的特征或趋势,找到解决问题的线索2. 排序有助于对数据检查纠错,以及为重新排序有助于对数据检查纠错,以及为重新归类或分组等提供依据归类或分组等提供依据3. 在

7、某些场合,排序本身就是分析的目的之在某些场合,排序本身就是分析的目的之一一4. 排序可借助于计算机完成排序可借助于计算机完成数据排序 (方法)1.1. 分类数据的排序分类数据的排序字母型数据,排序有升序降序之分,但习惯上字母型数据,排序有升序降序之分,但习惯上用升序用升序汉字型数据,可按汉字的首位拼音字母排列,汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降也可按笔画排序,其中也有笔画多少的升序降序之分序之分2.2. 数值型数据的排序数值型数据的排序递增排序:设一组数据为递增排序:设一组数据为x x1 1,x x2 2,x xn n,递增,递增排序后可表示为:排

8、序后可表示为:x x(1)(1) x x( (2)2) x x(2)(2)x x(n)(n)3.1.2 频数分布表的编制与图示1. 频数与频数分布频数与频数分布2. 统计分组统计分组3. 品质数列的整理和显示品质数列的整理和显示4. 变量数列的整理和显示变量数列的整理和显示5. 频数分布的类型频数分布的类型1. 频数与频数分布频数与频数分布频数分布数列的概念频数分布数列的概念在统计分组的基础上,将总体的所有单在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组简的分布,形成总体中各个单位在各组简的分布,又称次数分配或分布

9、数列。又称次数分配或分布数列。频数频数( (frequency)frequency) :又叫次数,又叫次数,落在各类别落在各类别中的数据(单位)个数,中的数据(单位)个数,记作记作 Fi 。 频率频率( (ratio)ratio) :又叫比率,各组次数(频数)又叫比率,各组次数(频数)与总次数(频数)之比。与总次数(频数)之比。 频率分布的性质:频率分布的性质:= = = = = =110111NiNiiiNiiiFFFF分配数列的种类 品质分配数列(属性分布数品质分配数列(属性分布数列)列) :按品质标志分组形成的:按品质标志分组形成的分配数列。分配数列。 变量分配数列(变量分布数变量分配数

10、列(变量分布数列)列) :按数量标志分组形成的:按数量标志分组形成的分配数列。分配数列。单项数列:总体按单项式分组而形单项数列:总体按单项式分组而形成的变量数列,每个变量值是一个成的变量数列,每个变量值是一个组,顺序排列。组,顺序排列。 组距数列:总体按组距式分组而形组距数列:总体按组距式分组而形成的变量数列,每个组是由若干个成的变量数列,每个组是由若干个变量值形成的区间表示。变量值形成的区间表示。 分配数列分配数列品质数列品质数列变量数列变量数列单项数列单项数列组距数列组距数列2. 统计分组统计分组统计分组概念:概念: 是根据统计研究的目的,选择某一主要标志,是根据统计研究的目的,选择某一主

11、要标志,将总体单位划分为若干类型或组别,使组内将总体单位划分为若干类型或组别,使组内具有同质性,组间具有差异性。具有同质性,组间具有差异性。统计分组统计分组作用作用 划分现象的类型划分现象的类型 揭示现象内部结构揭示现象内部结构 分析现象之间的依存关系分析现象之间的依存关系统计分组分组标志的选择统计分组的关键问题:如何选择分组标志统计分组的关键问题:如何选择分组标志和确定各组的界限。和确定各组的界限。根据统计研究的目的来选择根据统计研究的目的来选择在满足研究目的的前提下,应选择本质的、在满足研究目的的前提下,应选择本质的、主要的,而不是非本质的、次要的标志。主要的,而不是非本质的、次要的标志。

12、考虑具体的历史和经济条件。考虑具体的历史和经济条件。简单分组、复合分组和分组体系根据采用的分组标志的多少,可根据采用的分组标志的多少,可以分为:以分为:简单分组简单分组复合分组复合分组简单分组 又称单一分组,是对被研究现象总体只按又称单一分组,是对被研究现象总体只按一个标志进行的分组。一个标志进行的分组。 特点:特点: 只能反映现象在某一标志特征方面的差异情况。只能反映现象在某一标志特征方面的差异情况。 不能反映现象在其他标志特征方面的差异,说不能反映现象在其他标志特征方面的差异,说明问题比较简单明了。明问题比较简单明了。简单分组复合分组对同一总体选择两个或两个以上标志层叠起来对同一总体选择两

13、个或两个以上标志层叠起来进行的分组。进行的分组。特点:特点:可以从几个不同角度了解总体内部的差别和关系,可以从几个不同角度了解总体内部的差别和关系,比简单分组能更全面、更深入地研究问题;比简单分组能更全面、更深入地研究问题;分组的组数随着分组标志的增加而成倍地增加。因分组的组数随着分组标志的增加而成倍地增加。因而在采用复合分组时,选择分组标志的数量要适量,而在采用复合分组时,选择分组标志的数量要适量,并且要考虑倒只有在总体包括的单位数较多的情况并且要考虑倒只有在总体包括的单位数较多的情况下,才宜于采用复合分组。下,才宜于采用复合分组。 理理科科学学生生组组高高等等学学校校学学生生总总体体男男学

14、学生生组组女女学学生生组组男男学学生生组组女女学学生生组组本本科科学学生生组组专专科科学学生生组组男男学学生生组组女女学学生生组组男男学学生生组组女女学学生生组组文文科科学学生生组组本本科科学学生生组组专专科科学学生生组组复合分组分组体系为了从不同侧面反映总体的特征,运用几为了从不同侧面反映总体的特征,运用几个标志对总体进行分组,形成的一个完整个标志对总体进行分组,形成的一个完整的体系。的体系。分组体系有两种不同的形式:分组体系有两种不同的形式:平行分组体系:同一个总体的几个简单分组平行分组体系:同一个总体的几个简单分组按某一规定排列起来就构成一个平行分组体按某一规定排列起来就构成一个平行分组

15、体系。系。复合分组体系:由复合分组形成的分组系列。复合分组体系:由复合分组形成的分组系列。品质分布数列的整理分类分类分类分类分类分类频数频数频数频数频数频数比例比例比例比例比例比例百分比百分比百分比百分比百分比百分比比率比率比率比率比率比率A A AB B BC C CD D DE E E分类数据整理频数分布表 (例题分析)分类数据的图示条形图(bar Chart) 用宽度相同的条形的高度或长短来表示用宽度相同的条形的高度或长短来表示各类别数据的图形各类别数据的图形 有单式条形图、复式条形图等形式有单式条形图、复式条形图等形式 主要用于反映分类数据的频数分布主要用于反映分类数据的频数分布 绘制

16、时,各类别可以放在纵轴,称为条绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图形图,也可以放在横轴,称为柱形图分类数据的图示条形图 (例题分析)15119690481216频数可口可乐旭日升冰茶百事可乐汇源果汁露露品牌不同品牌饮料的频数分布不同品牌饮料的频数分布分类数据的图示饼图(pie Chart) 也称圆形图,是用圆形及园内扇形的面积也称圆形图,是用圆形及园内扇形的面积来表示数值大小的图形来表示数值大小的图形 主要用于表示总体或样本中各组成部分所主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用占的比例,对于研究结构性问题十分有用 绘制圆形图时,总体

17、中各部分所占的百分绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分数据百分比占的中心角度,是按各部分数据百分比占3603600 0的相应比例确定的的相应比例确定的分类数据的图示饼图 (例题分析)顺序数据的整理 累积频数累积频数( (cumulative frequenciescumulative frequencies) ):各类:各类别频数的逐级累加别频数的逐级累加 累积频率累积频率( (cumulative percentagescumulative percentages) ):各类:各类别频率别频率( (

18、百分比百分比) )的逐级累加的逐级累加顺序数据的频数分布表(例题分析)甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)累累 计计户数户数(户户)百分比百分比(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510241322252703008.044.075.090.0100.0合计合计300100.0顺序数据的频数分布表 (例题分析)乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分

19、比百分比(%)累累 计计户数户数(户户)百分比百分比(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.0合计合计300100.0顺序数据的图示累计频数分布图 (例题分析)环形图(annular chart) 环形图中间有一个环形图中间有一个“空洞空洞”,总体中的每一,总体中的每一部分数据用环中的一段表示部分数据用环中的一段表示 环形图与圆形图类似,但又有区别环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例圆形图只能显示一个

20、总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环每一个总体的数据系列为一个环 环形图可用于结构比较研究环形图可用于结构比较研究 环形图主要用于展示分类和顺序数据环形图主要用于展示分类和顺序数据环形图 (例题分析)8%36%31%15%7%33%26%21%13%10% 非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价 数据分组数据分组 累计频数分布累计频数分布 数值型数据的图示数值型数据的图示数据分组分组方法分组方法分组方法等距分组等距分组异距分组异距分组单变量

21、值分组单变量值分组组距分组组距分组单变量值分组(要点) 将一个变量值作为一组将一个变量值作为一组 适合于离散变量适合于离散变量 适合于变量值较少的情况适合于变量值较少的情况组距分组 (要点) 将变量值的一个区间作为一组将变量值的一个区间作为一组 适合于连续变量适合于连续变量 适合于变量值较多的情况适合于变量值较多的情况 需要遵循需要遵循“不重不漏不重不漏”的原则的原则 可采用等距分组,也可采用不等距分组可采用等距分组,也可采用不等距分组等距分组(步骤)确定组数:组数的确定应以能够显示数据的分布特征确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按和规律为目的。在实

22、际分组时,可以按 SturgesSturges 提出提出的经验公式来确定组数的经验公式来确定组数K K频数分布表的编制(例题分析)频数分布表的编制(步骤) 确定组数:根据确定组数:根据 Sturges Sturges 提出的经验公式提出的经验公式得组数得组数K K为:为:组距分组与不等距分组(在表现频数分布上的差异) 等距分组等距分组各组频数的分布不受组距大小的影响各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征可直接根据绝对频数来观察频数分布的特征 不等距分组不等距分组各组频数的分布受组距大小不同的影响各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布

23、的实际各组绝对频数的多少不能反映频数分布的实际状况状况需要用频数密度反映频数分布的实际状况需要用频数密度反映频数分布的实际状况异距分组(几个概念) 标准组距:数列中能被各组组距整除的最大组距。标准组距:数列中能被各组组距整除的最大组距。 常用数列中的最小组距作为标准组距。常用数列中的最小组距作为标准组距。各各组组频频数数(次次数数)频频数数(次次数数)密密度度各各组组组组距距各各组组频频率率频频率率密密度度各各组组组组距距异距分组 (例题分析)某厂工人年龄分布情况某厂工人年龄分布情况工人按年龄分组工人按年龄分组组距组距人数(人)人数(人)标准组距标准组距人数人数次数密度次数密度15202025

24、253030353545455055551051728407065101728407032.5103.45.68146.52合计合计230异距分组 (例题分析)异距分组 (例题分析)组限和组中值 组限组限( (class limit)class limit) :各组的上限界限值:各组的上限界限值 组下限组下限( (low limit)low limit) :一个组的最小值:一个组的最小值 组上限组上限( (upper limit)upper limit) :一个组的最大值:一个组的最大值 闭口组:上限和下限都齐全的组闭口组:上限和下限都齐全的组 开口组:上限或下限有一个没有的组开口组:上限或下

25、限有一个没有的组组限的确定组限确定有一个基本原则:即按这样的组组限确定有一个基本原则:即按这样的组限分组后,标志值在各组的变动能反映事限分组后,标志值在各组的变动能反映事物的质的变化。物的质的变化。常用的组限表示方法:常用的组限表示方法:按连续变量分组,由于相邻两组的上限和下限常时按连续变量分组,由于相邻两组的上限和下限常时同一数值,每组的界限会重叠,为避免计算各组次同一数值,每组的界限会重叠,为避免计算各组次数时出现混乱,一般的原则是数时出现混乱,一般的原则是“上组限不在内,或上组限不在内,或下组限不在内下组限不在内”。按离散变量分组,则相邻的上限和现象通常是以两按离散变量分组,则相邻的上限

26、和现象通常是以两个确定的不同整数值来表示,故相邻两组的上下限个确定的不同整数值来表示,故相邻两组的上下限可以不重合。可以不重合。 等距分组表(上下组限重叠)等距分组表(上下组限间断)等距分组表(使用开口组)组中值(class midpoint) 组中值组中值( (class midpoint)class midpoint) :下限与上限之间的:下限与上限之间的中点值。中点值。2邻邻组组组组距距缺缺上上限限的的开开口口组组组组中中值值下下限限下限值下限值+上限值上限值2组中值组中值 =2邻邻组组组组距距缺缺下下限限的的开开口口组组组组中中值值上上限限累计频数分布累计频数分布在频数分布的基础上将各

27、组频数逐一累计,称为频在频数分布的基础上将各组频数逐一累计,称为频数分布累计。数分布累计。向上累计:从变量值最低组开始向变量值高的组累计,向上累计:从变量值最低组开始向变量值高的组累计,表明小与该组上限的频数(频率)一共有多少;表明小与该组上限的频数(频率)一共有多少;向下累计:从变量值最高组开始向变量值低的组累计,向下累计:从变量值最高组开始向变量值低的组累计,表明大与该组下限的频数(频率)一共有多少。表明大与该组下限的频数(频率)一共有多少。特点:同一数值的向上累计和向下累计次数之和等于特点:同一数值的向上累计和向下累计次数之和等于总体总次数。总体总次数。 累计频数分布图:以变量值为横坐标

28、,累计频数和累计频数分布图:以变量值为横坐标,累计频数和频率为纵坐标。频率为纵坐标。累计频数分布(例题分析)141141159159166166172172177177182182188188196196203203214214143143160160167167173173177177183183189189196196203203215215144144160160168168173173178178184184189189196196205205218218149149161161168168174174178178185185189189196196206206223223150150

29、161161168168174174178178186186190190196196207207225225152152162162170170174174179179186186190190197197208208226226153153163163171171175175179179187187191191197197209209228228153153163163171171175175179179187187192192198198210210233233154154164164172172175175180180187187194194198198210210233233155155

30、165165172172175175180180187187194194200200211211234234156156165165172172176176181181188188195195201201211211234234158158165165172172176176182182188188195195202202213213237237某电脑公司某电脑公司20022002年前年前4 4个月的销售量个月的销售量累计频数分布(例题分析)按销售量按销售量分组分组( (台台) )频数频数(天)(天)频率频率(% %)向上累积频率向上累积频率(% %)向下累积频率向下累积频率(% %)1501

31、50以下以下4 43.333.333.333.33100.00 100.00 1501501601609 97.507.5010.8310.8396.67 96.67 160160170170161613.3313.3324.1724.1789.1789.17170170180180272722.5022.5046.6746.6775.8375.83180180190190202016.6716.6763.3363.3355.3355.33190190200200171714.1714.1777.5077.5036.6736.6720020021021010108.338.3385.8385.

32、8322.5022.502102102202208 86.676.6792.5092.5014.1714.172202202302304 43.333.3395.8395.837.507.50230230以上以上5 54.174.17100.00100.004.174.17合计合计120120100100100.00100.00100.00100.00累计频数分布(例题分析)变量分布数列的图示分组数据直方图(histogram)1.1. 用矩形的宽度和高度来表示频数分布的图用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的形,实际上是用矩形的面积面积来表示各组的来表示各组的频数分布频数分

33、布2.2. 在直角坐标中,用横轴表示数据分组,纵在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图形成了一个矩形,即直方图3.3. 直方图下的总面积等于直方图下的总面积等于1 1分组数据的图示(直方图的绘制)140 150210直方图下的面积之和等于1某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图190 200180160 170频频数数(天天)25201510530220 230 240分组数据直方图(直方图与条形图的区别)1.1. 条形图是用条形的长度条形图是用条形的长度( (横置时横置时) )表示

34、各类别频数表示各类别频数的多少,其宽度的多少,其宽度( (表示类别表示类别) )则是固定的则是固定的2.2. 直方图是用面积表示各组频数的多少,矩形的高直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义的组距,其高度与宽度均有意义3.3. 直方图的各矩形通常是连续排列,条形图则是分直方图的各矩形通常是连续排列,条形图则是分开排列开排列4.4. 条形图主要用于展示分类数据,直方图则主要用条形图主要用于展示分类数据,直方图则主要用于展示数值型数据于展示数值型数据分组数据折线图(frequency

35、 polygon)1.1. 折线图也称频数多边形图折线图也称频数多边形图2.2. 是在直方图的基础上,把直方图顶部的中点是在直方图的基础上,把直方图顶部的中点( (组组中值中值) )用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉3.3. 折线图的两个终点要与横轴相交,具体的做法是折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴与其竖边中点连接到横轴折线图下所围成的面积与直方图的面

36、积相等,二者折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的所表示的频数分布是一致的分组数据的图示(折线图的绘制)折线图与直方图下的面积相等!140 150210某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图190200180160 170220 230240频频数数(天天)25201510530数值型数据的图示未分组数据茎叶图(stem-and-leaf display)1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.由由“茎茎”和和“叶叶”两部分构成,其图形是由数字组两部分构成,其图形是由数字组成的成的3.以该组数据的高位数值作树茎,低位数

37、字作树叶以该组数据的高位数值作树茎,低位数字作树叶4.树叶上只保留一位数字树叶上只保留一位数字5.对于对于n(20 n 300)个数据,茎叶图最大行数不超过个数据,茎叶图最大行数不超过 L = 10 lg(n) 6.茎叶图类似于横置的直方图,但又有区别茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的直方图可观察一组数据的分布状况,但没有给出具体的数值数值茎叶图既能给出数据的分布状况,又能给出每一个原始茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息数值,保留了原始数据的信息未分组数据茎叶图(例题分析)未分组数据茎叶图(扩展的茎叶图)

38、未分组数据箱线图(box plot)1. 用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2. 箱线图由一组数据的箱线图由一组数据的5个特征值绘制而成,它个特征值绘制而成,它由一个箱子和两条线段组成由一个箱子和两条线段组成3. 其绘制方法是:其绘制方法是:首先找出一组数据的首先找出一组数据的5个特征值,即个特征值,即最大值、最最大值、最小值、中位数小值、中位数Me 和两个和两个四分位数四分位数(下四分位数下四分位数QL和上四分位数和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接点与箱子相连接 未分组数据单批数据箱线

39、图(箱线图的构成)未分组数据单批数据箱线图(例题分析)最小值141最大值237中位数182下四分位数170.25上四分位数197140 150 160 170 180 190 200 210 220 230 240某电脑公司销售量数据的箱线图某电脑公司销售量数据的箱线图分布的形状与箱线图对称分布对称分布QL中位数中位数 QU左偏分布左偏分布QL中位数中位数 QU右偏分布右偏分布QL 中位数中位数 QU未分组数据多批数据箱线图 (例题分析)11名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场

40、营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分组数据多批数据箱线图(例题分析)Min-Max25%-75%Median value455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11未分组数据多批数据箱线图 (例题分析)数值型数据的图示时间序列数据线图(line plot) 绘制线图时应注意以下几点绘制线图时应注意以下几点1. 时间一般绘在横轴,指标数据绘在纵轴时间一般绘在横轴,指标数据绘在纵轴2. 图形的长宽比例要适当,其长宽比例大致图形的长宽比例要适当,其长宽比例大致为为10:73. 一般情况下,纵轴数据下端应从一般情况下,纵轴数据下端应从“0”开始,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论