第4章-数据分布特征的描述讲解课件_第1页
第4章-数据分布特征的描述讲解课件_第2页
第4章-数据分布特征的描述讲解课件_第3页
第4章-数据分布特征的描述讲解课件_第4页
第4章-数据分布特征的描述讲解课件_第5页
已阅读5页,还剩167页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章统计数据特征的描述4.1分布集中趋势的测度4.2分布离散程度的测度4.3分布偏态与峰度的侧度4.4茎叶图与箱线图4.5统计表与统计图本章小结第4章统计数据特征的描述4.1分布集中趋势的测1学习目标掌握数据集中趋势和离散程度的测度方法掌握茎叶图和箱线图的制作方法掌握分布偏态与峰度的测度方法掌握统计表和统计图的使用学习目标掌握数据集中趋势和离散程度的测度方法2学习重点侧度数据集中趋势指标的计算方法及应用侧度数据离散程度指标的计算方法及应用统计表与统计图学习重点3学习难点方差、标准差、变异系数的实质学习难点方差、标准差、变异系数的实质4授课学时4学时授课学时4学时54.1分布集中趋势的测度分布集中趋势的测度值是反映数据一般水平的代表值或者数据分布的中心值。一、众数二、中位数三、四分位数四、均值五、几何均值六、切尾均值七、众数、中位数和均值的比较4.1分布集中趋势的测度分布集中趋势的测度值是反映数据一般水6

众数众数7众数

(mode)一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据众数计算公式见书页。众数

(mode)一组数据中出现次数最多的变量值8众数

(不惟一性)无众数

一个众数

多于一个众数

众数

(不惟一性)无众数

一个众数

多于一个众数

9

中位数中位数10中位数

(median)排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小,即中位数

(median)排序后处于中间位置上的值Me50%511中位数计算(1)为分组资料中位数位置=(n+1)/2(奇数项与偶数项)(2)分组资料中位数位置=n/2中位数在累计频数刚刚大于中位数位置的组众数计算公式见书页。中位数计算(1)为分组资料12

四分位数四分位数13四分位数

(quartile)排序后处于25%和75%位置上的值不受极端值的影响主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QLQMQU25%25%25%25%四分位数

(quartile)排序后处于25%和75%位置上14四分位数

(位置的确定)未分组数据:分组数据:四分位数

(位置的确定)未分组数据:分组数据:15

均值均值16均值(算数平均数)

(mean)集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响用于数值型数据,不能用于分类数据和顺序数据注意均值的平均性均值(算数平均数)

(mean)集中趋势的最常用测度值17简单算数平均数

(simplemean)设一组数据为:x1,x2,…,xn总体均值样本均值简单算数平均数

(simplemean)设一组数据为:18加权算数平均数

(weightedmean)设一组数据为:x1,x2,…,xn相应的频数为:f1,f2,…,fk总体均值样本均值加权算数平均数

(weightedmean)设一组数据为:19加权算数平均数

(例题分析)

加权算数平均数

(例题分析)20均值

(数学性质)1. 各变量值与均值的离差之和等于零2.各变量值与均值的离差平方和最小均值

(数学性质)1. 各变量值与均值的离差之和等于零2.21几何平均数几何平均数22几何平均数

(geometricmean)

n个变量值乘积的n次方根主要用于计算平均比率或平均速度计算公式为5.可看作是均值的一种变形几何平均数

(geometricmean)n个变量值乘23几何平均数

(例题分析)

【例】一位投资者购持有一种股票,在2000年、2001年、2002年和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率算术平均:

几何平均:几何平均数

(例题分析)【例】一位投资者购持有一种24几何平均数

(例题分析)【例】胡锦涛在十七大报告中提出,实现人均国内生产总值(GDP)到2020年比2000年翻两番。几何平均数

(例题分析)25

切尾均值切尾均值26切尾均值

(trimmedMean)去掉大小两端的若干数值后计算中间数据的均值在电视大奖赛、体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用计算公式为n表示观察值的个数;α表示切尾系数,

切尾均值

(trimmedMean)去掉大小两端的若干数27切尾均值

(例题分析)【例】谋次比赛共有11名评委,对某位歌手的给分分别是:经整理得到顺序统计量值为去掉一个最高分和一个最低分,α取1/11

切尾均值

(例题分析)【例】谋次比赛共有11名评委,28众数、中位数和均值的比较众数、中位数和均值的比较29众数、中位数和均值的关系左偏(负偏)分布均值

中位数

众数对称(正态)分布

均值=中位数=

众数右偏(正偏)分布众数

中位数均值众数、中位数和均值的关系左偏(负偏)分布均值中位数众30众数、中位数、均值的特点和应用众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用众数、中位数、均值的特点和应用众数314.2分布离散程度的测度分布离散程度的测度值反映数据分布离散和差异程度。主要包括:一、极差二、内距三、方差和标准差四、离散系数4.2分布离散程度的测度分布离散程度的测度值反映数据分布32极差

(range)一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布R

=max(xi)-min(xi)计算公式为极差

(range)一组数据的最大值与最小值之差33内距

(Inter-QuartileRange,IQR)

也称四分位差上四分位数与下四分位数之差

内距=Q3

–Q1反映了中间50%数据的离散程度不受极端值的影响可用于衡量中位数的代表性内距

(Inter-QuartileRange,IQR)34

方差和标准差方差和标准差35方差和标准差

(VarianceandStandarddeviation)1. 反映了数据的分布离散程度和差异程度的最常用的测度值。2.反映了各变量值与均值的平均差异。3.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差方差和标准差

(VarianceandStandard36总体方差和标准差

(simplevarianceandstandarddeviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式总体方差和标准差

(simplevarianceand37样本方差和标准差

(simplevarianceandstandarddeviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!样本方差和标准差

(simplevarianceand38样本方差

自由度(degreeoffreedom)一组数据中可以自由取值的数据的个数当样本数据的个数为n

时,若样本均值x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x

=5

确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差

自由度(degreeoffreedom)一组数39样本标准差

(例题分析)某电脑公司销售量数据平均差计算表按销售量分组组中值(Mi)频数(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合计—120—55400样本标准差

(例题分析)某电脑公司销售量数据平均差计算表40样本标准差

(例题分析)

含义:每一天的销售量与平均数相比,平均相差21.58台样本标准差

(例题分析)41

离散系数离散系数42离散系数

(coefficientofvariation)1. 标准差与其相应的均值之比对数据相对离散程度的测度消除了数据水平高低和计量单位的影响4. 用于对不同组别数据离散程度的比较5.计算公式为离散系数

(coefficientofvariation43在什么情况下使用离散系数呢?当两个数列的性质相同且均值相等的情况下用标准差说明平均数代表性的高低。当两个数列的性质不同或均值不同的情况下需要用离散系数说明平均数代表性的高低。在什么情况下使用离散系数呢?当两个数列的性质相同且均值相等的44离散系数

(例题分析)某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度离散系数

(例题分析)某管理局所属8家企业的产品销售数据企45离散系数

(例题分析)结论:计算结果表明,v1<v2,说明产品销售额的离散程度小于销售利润的离散程度v1=536.25309.19=0.577v2=32.521523.09=0.710离散系数

(例题分析)结论:计算结果表明,v1<v2,说46例题:有甲、乙两个品种的粮食作物,经播种实验后得知乙品种的平均亩产量为998公斤,标准差为162.7公斤,甲品种实验资料如下,试研究两个品种的平均亩产量,确定哪一品种具有较大稳定性,更有推广价值。

亩产量(公斤/亩)100095011009001050播种面积(亩)12111098例题:有甲、乙两个品种的粮食作物,经播种实验后得知乙品种的474.3分布偏态与峰度的测度4.3分布偏态与峰度的测度48偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布与标准正态分布比较!偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布49偏态及其测度(skewness)1.统计学家Pearson于1895年首次提出2.数据分布偏斜程度的测度3. 偏态系数=0为对称分布4. 偏态系数>0为右偏分布偏态系数<0为左偏分布计算公式:偏态及其测度(skewness)1.统计学家Pearso50偏态系数

(例题分析)

某电脑公司销售量偏态及峰度计算表按销售量份组(台)组中值(Mi)频数fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235

491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合计—120540000

70100000

偏态系数

(例题分析)某电脑公司销售量偏态及峰度计算表51偏态系数

(例题分析)结论:偏态系数为正值,但与0的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数偏态系数

(例题分析)结论:偏态系数为正值,但与0的差异不52峰态及其测度(kurtosis)统计学家Pearson于1905年首次提出数据分布扁平程度的测度峰态系数=3扁平峰度适中峰态系数<3为扁平分布峰态系数>3为尖峰分布计算公式峰态及其测度(kurtosis)统计学家Pearson于1953峰态系数

(例题分析)结论:偏态系数小于3,但与3的差异不大,说明电脑销售量为轻微扁平分布峰态系数

(例题分析)结论:偏态系数小于3,但与3的差异不544.4茎叶图与箱线图一、茎叶图二、箱线图4.4茎叶图与箱线图一、茎叶图55茎叶图

(stem-and-leafdisplay)用于显示未分组的原始数据的分布。由“茎”和“叶”两部分构成,其图形是由数字组成的。以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留一位数字(个位数)。茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值。茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。茎叶图

(stem-and-leafdisplay)用于显56茎叶图

(例题分析P22表2.7)茎叶图

(例题分析P22表2.7)57茎叶图

(扩展的茎叶图0~4,5~9)茎叶图

(扩展的茎叶图0~4,5~9)58箱线图

(boxplot)用于显示未分组的原始数据的分布。箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成。箱线图的绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)。连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接。箱线图

(boxplot)用于显示未分组的原始数据的分布。59箱线图

(箱线图的构成)中位数4681012QUQLX最大值X最小值简单箱线图箱线图

(箱线图的构成)中位数4681012QUQLX最大值60箱线图

(例题分析)最小值84最大值128中位数105下四分位数96上四分位数10980859095100105110150120125130周加工零件数的箱线图箱线图

(例题分析)最小值最大值中位数下四分位数上四分位数861分布的形状与箱线图

对称分布QL中位数

QU左偏分布QL中位数

QU右偏分布QL

中位数

QU不同分布的箱线图分布的形状与箱线图对称分布QL中位数QU左偏分布QL62未分组数据—多批数据箱线图

(例题分析)【例】

从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征11名学生各科的考试成绩数据课程名称学生编号1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分组数据—多批数据箱线图

(例题分析)【例】从某大学经63未分组数据—多批数据箱线图

(例题分析)8门课程考试成绩的箱线图未分组数据—多批数据箱线图

(例题分析)8门课程考试成绩的箱6411名学生8门课程考试成绩的箱线图min-max25%-75%medianvalue455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11未分组数据—多批数据箱线图

(例题分析)11名学生8门课程考试成绩的箱线图min-max25%-7565

4.5统计表与统计图4.5统计表与统计图66统计表是显示统计数据的工具。统计表由表头、行标题、列标题、和数字资料四部分组成。表头放在表的正上方,说明统计表的主要内容。行标题放在表的第一列,说明研究问题的类别。列标题放在表的第一行,说明研究问题的指标名称。表的其余部分为统计数字。表外附加放在表的下方,指明资料来源,必要说明,指标注释等。统计表是显示统计数据的工具。671999~2000年城镇居民家庭抽样调查资料项目单位1999年2000年

调查户数平均每户家庭人口平均每户就业人口平均每户就业面平均一名就业者负担人数平均每人全部年收入#可支配收入平均每人消费性支出户人人%元元元元

400443.141.7756.431.775888.775854.024615.91

4222.03.131.6853.671.866316.816279.984998.00资料来源:《中国统计年鉴2001》,中国统计出版社,2001,第305页。注:本表为城市和县城的城镇居民家庭抽样调查材料。

行标题列标题数字资料表头附加1999~2000年城镇居民家庭抽样调查资料项目单位199968统计表的设计

统计表设计原则:科学、实用、简练、美观首先,合理安排统计表的结构。其次,表头一般应包含标号、总标题和表中数据的单位等内容。(表头包含时间、地点、何种数据)。第三,通常情况下,统计表的左右两边不封口,上下两条线要粗,中间其他线要细。列标题用竖线隔开,行标题之间一般不用横线隔开。以小数点同一位数右对齐。第四,“—”表示没有数据,“…”表示缺少。第五,统计表的栏数较多,可以在表或各栏应用(1)、(2)、(3)等数字编号;第六,统计表要注明计量单位和资料来源。数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明。统计表的设计

统计表设计原则:科学、实用、简练、美观69统计表—某地区工业企业主要经济指标经济类型企业数(个)年平均职工人数(人)工业增加值(万元)年末固定资产净值(万元)国有经济集体经济外商经济其他经济合计统计表—某地区工业企业主要经济指标经济类型企业数(个)年平均70统计表—某企业职工计划完成程度统计表计划完成程度(%)职工人数比重(%)80——9013.3390——100310.00100——1101756.67110——120620.00120——130310.00合计30100.00统计表—某企业职工计划完成程度统计表计划完成程度(%)职工人71统计表—某企业商品销售统计表商品名称计量单位价格(元)销售量销售额(元)(甲)(乙)(1)(2)(3)皮鞋双帽子顶手套副合计—统计表—某企业商品销售统计表商品名称计量单位价格(元)销售量72统计图直方图折线图圆饼图曲线图统计图直方图73统计图—直方图统计图—直方图74统计图—折线图统计图—折线图75统计图—圆饼图统计图—圆饼图76统计图—曲线图统计图—曲线图77条形图、三维条形图条形图、三维条形图78饼图、三维饼图饼图、三维饼图79三维圆柱图三维圆柱图80三维圆锥图三维圆锥图81面积图面积图82三维面积图三维面积图83三维曲面图三维曲面图84折线图折线图85本章小结分布集中趋势的测度分布离散程度的测度分布偏态与峰度的侧度茎叶图与箱线图统计表与统计图本章小结分布集中趋势的测度86第4章统计数据特征的描述4.1分布集中趋势的测度4.2分布离散程度的测度4.3分布偏态与峰度的侧度4.4茎叶图与箱线图4.5统计表与统计图本章小结第4章统计数据特征的描述4.1分布集中趋势的测87学习目标掌握数据集中趋势和离散程度的测度方法掌握茎叶图和箱线图的制作方法掌握分布偏态与峰度的测度方法掌握统计表和统计图的使用学习目标掌握数据集中趋势和离散程度的测度方法88学习重点侧度数据集中趋势指标的计算方法及应用侧度数据离散程度指标的计算方法及应用统计表与统计图学习重点89学习难点方差、标准差、变异系数的实质学习难点方差、标准差、变异系数的实质90授课学时4学时授课学时4学时914.1分布集中趋势的测度分布集中趋势的测度值是反映数据一般水平的代表值或者数据分布的中心值。一、众数二、中位数三、四分位数四、均值五、几何均值六、切尾均值七、众数、中位数和均值的比较4.1分布集中趋势的测度分布集中趋势的测度值是反映数据一般水92

众数众数93众数

(mode)一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据众数计算公式见书页。众数

(mode)一组数据中出现次数最多的变量值94众数

(不惟一性)无众数

一个众数

多于一个众数

众数

(不惟一性)无众数

一个众数

多于一个众数

95

中位数中位数96中位数

(median)排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小,即中位数

(median)排序后处于中间位置上的值Me50%597中位数计算(1)为分组资料中位数位置=(n+1)/2(奇数项与偶数项)(2)分组资料中位数位置=n/2中位数在累计频数刚刚大于中位数位置的组众数计算公式见书页。中位数计算(1)为分组资料98

四分位数四分位数99四分位数

(quartile)排序后处于25%和75%位置上的值不受极端值的影响主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QLQMQU25%25%25%25%四分位数

(quartile)排序后处于25%和75%位置上100四分位数

(位置的确定)未分组数据:分组数据:四分位数

(位置的确定)未分组数据:分组数据:101

均值均值102均值(算数平均数)

(mean)集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响用于数值型数据,不能用于分类数据和顺序数据注意均值的平均性均值(算数平均数)

(mean)集中趋势的最常用测度值103简单算数平均数

(simplemean)设一组数据为:x1,x2,…,xn总体均值样本均值简单算数平均数

(simplemean)设一组数据为:104加权算数平均数

(weightedmean)设一组数据为:x1,x2,…,xn相应的频数为:f1,f2,…,fk总体均值样本均值加权算数平均数

(weightedmean)设一组数据为:105加权算数平均数

(例题分析)

加权算数平均数

(例题分析)106均值

(数学性质)1. 各变量值与均值的离差之和等于零2.各变量值与均值的离差平方和最小均值

(数学性质)1. 各变量值与均值的离差之和等于零2.107几何平均数几何平均数108几何平均数

(geometricmean)

n个变量值乘积的n次方根主要用于计算平均比率或平均速度计算公式为5.可看作是均值的一种变形几何平均数

(geometricmean)n个变量值乘109几何平均数

(例题分析)

【例】一位投资者购持有一种股票,在2000年、2001年、2002年和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率算术平均:

几何平均:几何平均数

(例题分析)【例】一位投资者购持有一种110几何平均数

(例题分析)【例】胡锦涛在十七大报告中提出,实现人均国内生产总值(GDP)到2020年比2000年翻两番。几何平均数

(例题分析)111

切尾均值切尾均值112切尾均值

(trimmedMean)去掉大小两端的若干数值后计算中间数据的均值在电视大奖赛、体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用计算公式为n表示观察值的个数;α表示切尾系数,

切尾均值

(trimmedMean)去掉大小两端的若干数113切尾均值

(例题分析)【例】谋次比赛共有11名评委,对某位歌手的给分分别是:经整理得到顺序统计量值为去掉一个最高分和一个最低分,α取1/11

切尾均值

(例题分析)【例】谋次比赛共有11名评委,114众数、中位数和均值的比较众数、中位数和均值的比较115众数、中位数和均值的关系左偏(负偏)分布均值

中位数

众数对称(正态)分布

均值=中位数=

众数右偏(正偏)分布众数

中位数均值众数、中位数和均值的关系左偏(负偏)分布均值中位数众116众数、中位数、均值的特点和应用众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用众数、中位数、均值的特点和应用众数1174.2分布离散程度的测度分布离散程度的测度值反映数据分布离散和差异程度。主要包括:一、极差二、内距三、方差和标准差四、离散系数4.2分布离散程度的测度分布离散程度的测度值反映数据分布118极差

(range)一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布R

=max(xi)-min(xi)计算公式为极差

(range)一组数据的最大值与最小值之差119内距

(Inter-QuartileRange,IQR)

也称四分位差上四分位数与下四分位数之差

内距=Q3

–Q1反映了中间50%数据的离散程度不受极端值的影响可用于衡量中位数的代表性内距

(Inter-QuartileRange,IQR)120

方差和标准差方差和标准差121方差和标准差

(VarianceandStandarddeviation)1. 反映了数据的分布离散程度和差异程度的最常用的测度值。2.反映了各变量值与均值的平均差异。3.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差方差和标准差

(VarianceandStandard122总体方差和标准差

(simplevarianceandstandarddeviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式总体方差和标准差

(simplevarianceand123样本方差和标准差

(simplevarianceandstandarddeviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!样本方差和标准差

(simplevarianceand124样本方差

自由度(degreeoffreedom)一组数据中可以自由取值的数据的个数当样本数据的个数为n

时,若样本均值x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x

=5

确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差

自由度(degreeoffreedom)一组数125样本标准差

(例题分析)某电脑公司销售量数据平均差计算表按销售量分组组中值(Mi)频数(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合计—120—55400样本标准差

(例题分析)某电脑公司销售量数据平均差计算表126样本标准差

(例题分析)

含义:每一天的销售量与平均数相比,平均相差21.58台样本标准差

(例题分析)127

离散系数离散系数128离散系数

(coefficientofvariation)1. 标准差与其相应的均值之比对数据相对离散程度的测度消除了数据水平高低和计量单位的影响4. 用于对不同组别数据离散程度的比较5.计算公式为离散系数

(coefficientofvariation129在什么情况下使用离散系数呢?当两个数列的性质相同且均值相等的情况下用标准差说明平均数代表性的高低。当两个数列的性质不同或均值不同的情况下需要用离散系数说明平均数代表性的高低。在什么情况下使用离散系数呢?当两个数列的性质相同且均值相等的130离散系数

(例题分析)某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度离散系数

(例题分析)某管理局所属8家企业的产品销售数据企131离散系数

(例题分析)结论:计算结果表明,v1<v2,说明产品销售额的离散程度小于销售利润的离散程度v1=536.25309.19=0.577v2=32.521523.09=0.710离散系数

(例题分析)结论:计算结果表明,v1<v2,说132例题:有甲、乙两个品种的粮食作物,经播种实验后得知乙品种的平均亩产量为998公斤,标准差为162.7公斤,甲品种实验资料如下,试研究两个品种的平均亩产量,确定哪一品种具有较大稳定性,更有推广价值。

亩产量(公斤/亩)100095011009001050播种面积(亩)12111098例题:有甲、乙两个品种的粮食作物,经播种实验后得知乙品种的1334.3分布偏态与峰度的测度4.3分布偏态与峰度的测度134偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布与标准正态分布比较!偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布135偏态及其测度(skewness)1.统计学家Pearson于1895年首次提出2.数据分布偏斜程度的测度3. 偏态系数=0为对称分布4. 偏态系数>0为右偏分布偏态系数<0为左偏分布计算公式:偏态及其测度(skewness)1.统计学家Pearso136偏态系数

(例题分析)

某电脑公司销售量偏态及峰度计算表按销售量份组(台)组中值(Mi)频数fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235

491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合计—120540000

70100000

偏态系数

(例题分析)某电脑公司销售量偏态及峰度计算表137偏态系数

(例题分析)结论:偏态系数为正值,但与0的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数偏态系数

(例题分析)结论:偏态系数为正值,但与0的差异不138峰态及其测度(kurtosis)统计学家Pearson于1905年首次提出数据分布扁平程度的测度峰态系数=3扁平峰度适中峰态系数<3为扁平分布峰态系数>3为尖峰分布计算公式峰态及其测度(kurtosis)统计学家Pearson于19139峰态系数

(例题分析)结论:偏态系数小于3,但与3的差异不大,说明电脑销售量为轻微扁平分布峰态系数

(例题分析)结论:偏态系数小于3,但与3的差异不1404.4茎叶图与箱线图一、茎叶图二、箱线图4.4茎叶图与箱线图一、茎叶图141茎叶图

(stem-and-leafdisplay)用于显示未分组的原始数据的分布。由“茎”和“叶”两部分构成,其图形是由数字组成的。以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留一位数字(个位数)。茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值。茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。茎叶图

(stem-and-leafdisplay)用于显142茎叶图

(例题分析P22表2.7)茎叶图

(例题分析P22表2.7)143茎叶图

(扩展的茎叶图0~4,5~9)茎叶图

(扩展的茎叶图0~4,5~9)144箱线图

(boxplot)用于显示未分组的原始数据的分布。箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成。箱线图的绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)。连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接。箱线图

(boxplot)用于显示未分组的原始数据的分布。145箱线图

(箱线图的构成)中位数4681012QUQLX最大值X最小值简单箱线图箱线图

(箱线图的构成)中位数4681012QUQLX最大值146箱线图

(例题分析)最小值84最大值128中位数105下四分位数96上四分位数10980859095100105110150120125130周加工零件数的箱线图箱线图

(例题分析)最小值最大值中位数下四分位数上四分位数8147分布的形状与箱线图

对称分布QL中位数

QU左偏分布QL中位数

QU右偏分布QL

中位数

QU不同分布的箱线图分布的形状与箱线图对称分布QL中位数QU左偏分布QL148未分组数据—多批数据箱线图

(例题分析)【例】

从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征11名学生各科的考试成绩数据课程名称学生编号1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分组数据—多批数据箱线图

(例题分析)【例】从某大学经149未分组数据—多批数据箱线图

(例题分析)8门课程考试成绩的箱线图未分组数据—多批数据箱线图

(例题分析)8门课程考试成绩的箱15011名学生8门课程考试成绩的箱线图min-max25%-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论