实训二 用统计量描述数据_第1页
实训二 用统计量描述数据_第2页
实训二 用统计量描述数据_第3页
实训二 用统计量描述数据_第4页
实训二 用统计量描述数据_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一些人使用统计就像喝醉酒的人使用街灯柱—支撑的功能多于照明。

——AndrewLang

统计名言实训二

用统计量描述数据2.1

水平的度量2.2差异的度量2.3分布形状的度量学习目标度量水平的统计量度量差异的统计量度量分布形状的统计量各统计量的的特点及应用场合用Excel计算描述统计量数据分布的特征数据水平(集中趋势)分布形状(偏态和峰态)数据差异

(离中趋势)集中趋势

(centraltendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值2.1水平的度量

2.1.1平均数

2.1.2中位数

2.1.3四分位数

2.1.4众数

2.1.5

用哪个值代表一组数据?实训二

用统计量描述数据2.1.1

平均数2.1水平的度量xx平均数

(mean)也称为均值,常用的统计量之一消除了观测值的随机波动易受极端值的影响根据总体数据计算的,称为总体平均数,记为;根据样本数据计算的,称为样本平均数,记为x简单平均数

(Simplemean)设一组数据为:x1,x2,…,xn(总体数据xN)(未分组资料数据)样本平均数总体平均数加权平均数

(Weightedmean)(1)单项式分组设各组的变量值为:X1,X2,…,Xk

,相应的频数为:

f1,f2,…,fk样本加权平均:总体加权平均:加权平均数

(Weightedmean)(2)组距式分组设各组的组中值为:M1,M2,…,Mk

相应的频数为:

f1,f2,…,fk样本加权平均:总体加权平均:Excel中的统计函数AVERAGE—计算算术平均数GEOMEAN—计算几何平均数4.1.2中位数4.1水平的度量中位数

(median)定义:排序后处于中间位置上的值。不受极端值影响Me50%50%中位数的计算一

(未分组资料)1.位置确定2.数值确定中位数的计算二

(单项式分组资料)计算步骤:1、计算各组的向上(或向下)累计次数;2、确定中位数组,即累计次数达到的那一组;3、中位数组对应的变量值即为中位数。中位数的计算三

(组距式分组资料)计算步骤:1、找出中位数所在的组,即累计次数达到的那一组。2、用公式计算中位数的值。Excel中的统计函数MEDIAN—计算中位数2.1.3四分位数2.1水平的度量四分位数—用3个点等分数据

(quartile)排序后处于25%和75%位置上的值不受极端值的影响QLQMQU25%25%25%25%四分位数的计算

(未分组资料—位置的确定)定义算法四分位数的计算一

(未分组资料—位置的确定)

Excel给出的四分位数位置的确定方法

2008年8月Excel中的统计函数QUARTILE—计算四分位数(注:0-最小值;1-下四分位数;2-中位数;3-上四分位数;4-最大值)2008年8月2.1.4众数2.1水平的度量众数

(mode)一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数mo众数

(众数的确定方法)根据单项式数列确定众数单项式数列中,众数就是出现次数最多的那个变量值。

规格(CM)80859095100105110115120合计销售量(件)609014016030015013080701180[例]某商店各种规格羊毛衫销售资料如表所示,可以看出,100CM的销售量最大,为300件,因此100CM就是众数。众数

(众数的确定方法)2、根据组距式数列确定众数(1)先确定次数最多一组为众数所在的组(2)用公式计算众数的近似值下限公式:上限公式:

Excel中的统计函数MODE—计算众数2.1.5用哪个值代表一组数据?2.1水平的度量众数、中位数和平均数的关系左偏分布(a)均值

中位数

众数对称分布(b)

均值=

中位数=

众数右偏分布(c)众数

中位数均值众数、中位数、平均数的特点和应用平均数易受极端值影响数学性质优良,实际中最常用数据对称分布或接近对称分布时代表性较好中位数不受极端值影响数据分布偏斜程度较大时代表性接好众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时代表性较好2.2差异的度量

2.2.1极差和四分位差

2.2.2平均差

2.2.3方差和标准差

2.2.4比较几组数据的离散程度:离散系数实训二用统计量描述数据离中趋势数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度2.2.1极差和四分位差2.2差异的度量极差

(range)又称全距,指一组数据的最大值与最小值之差离散程度的最简单测度值,可以简单衡量平均数的代表性大小。极差越小,平均数代表性越大;极差越大,平均数代表性越小易受极端值影响未考虑数据的分布计算公式为:R=max(xi)-min(xi)四分位差

(quartiledeviation)也称为内距或四分间距,主要用于对顺序数据离散程度的测度上四分位数与下四分位数之差:Qd

=QU

–QL反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性25%75%未分组数据看分布—箱线图

(箱线图的构成)中位数4681012Q75%Q25%XMaxXMin箱线图2008年8月未分组数据—多批数据箱线图

(例题分析—Median/Quart./Range)8门课程考试成绩的箱线图2008年8月2.2.2平均差2.2差异的度量平均差

(meandeviation)又称平均绝对离差(meanabsolutedeviation)总体或样本中每一个数据与平均数离差的绝对值的算术平均数。(记为A.D.)反映各数据与平均数的平均离差量。平均差越大,数据离散程度越大,平均数代表性越小;平均差越小,数据离散程度越小,平均数代表性越大;平均差的计算

(meandeviation)一、未分组资料(简单平均法)计算步骤:1、求各数据与平均数的离差,即2、求离差的绝对值,即3、计算平均差平均差的计算

(meandeviation)二、分组资料(加权平均法)计算步骤:1、求各组变量值(组中值)与平均数的离差,即2、求离差的绝对值,即3、计算平均差Excel中的统计函数AVEDEV—计算平均差2.2.3方差和标准差2.2差异的度量方差和标准差

(varianceandstandarddeviation)数据离散程度的最常用测度值反映各变量值与均值的平均差异根据总体数据计算的,称为总体方差(标准差),记为2();根据样本数据计算的,称为样本方差(标准差),记为s2(s)标准差和方差相比,具有与原始数据一样的计量单位,因此实际中应用更为普遍。标准差可以衡量水平相同的平均数的代表性大小。方差和标准差的计算

(varianceandstandarddeviation)计算步骤:1、求出平均数2、求出各数据与平均数的离差3、求出各数据与平均数离差的平方4、用公式计算样本方差和标准差

(samplevarianceandstandarddeviation)未分组数据组距分组数据未分组数据组距分组数据方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!总体方差和标准差

(PopulationvarianceandStandarddeviation)未分组数据组距分组数据未分组数据组距分组数据方差的计算公式标准差的计算公式Excel中的统计函数STDEV—计算样本标准差2.2.4比较几组数据的离散程度

离散系数2.2差异的度量离散系数

(coefficientofvariation)1. 又叫标准差系数,是标准差与其相应的均值之比对数据相对离散程度的测度消除了数据水平高低和计量单位的影响4. 用于对不同水平的数据离散程度的比较5.计算公式为离散系数

(例题分析)【例一】评价哪名运动员的发挥更稳定发挥比较稳定的运动员是塞尔维亚的亚斯娜·舍卡里奇和中国的郭文珺(2—1),发挥不稳定的运动员蒙古的卓格巴德拉赫·蒙赫珠勒(3—8)和波兰的莱万多夫斯卡·萨贡2.3分布形状的度量偏态与峰态实训二

用统计量描述数据数据分布的形状—偏态与峰态扁平分布尖峰分布偏态峰态左偏分布右偏分布与标准正态分布比较!偏态

(skewness)统计学家Pearson于1895年首次提出数据分布偏斜程度的测度3. 偏态系数=0为对称分布4. 偏态系数>0为右偏分布5.偏态系数<0为左偏分布6.偏态系数大于1或小于-1,被称为高度偏态分布;偏态系数在0.5~1或-1~-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低偏态系数

(coefficientofskewness)根据原始数据计算根据分组数据计算峰态

(kurtosis)统计学家Pearson于1905年首次提出数据分布扁平程度的测度峰态系数=0扁平峰度适中峰态系数<0为扁平分布峰态系数>0为尖峰分布峰态系数

(coefficientofkurtosis)根据原始数据计算根据分组数据计算Excel中的统计函数MODE—计算众数MEDIAN—计算中位数QUARTILE—计算四分位数AVERAGE—计算平均数AVEDEV—计算平均差STDEV—计算样本标准差STDEVP—计算总体标准差SKEW—计算偏态系数KURT—计算峰态系数用Excel计算描述统计量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论