统计学第六版贾俊平第4章.ppt_第1页
统计学第六版贾俊平第4章.ppt_第2页
统计学第六版贾俊平第4章.ppt_第3页
统计学第六版贾俊平第4章.ppt_第4页
统计学第六版贾俊平第4章.ppt_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第4章数据分布特征的测度、第4章数据分布特征的测度、4.1集中倾向的测度4.2离散度的测度4.3偏置状态和峰度的测度, 学习目标1 .集中趋势各测度值的修正计算方法2 .集中趋势各测度值的特征和应用场景3 .离散度各测度值的修正计算方法4 .离散度各测度值的特征和应用场景偏差状态和峰值状态的测度方法用Excel修正计算记述统一修正量并进行分析,得到数据分布的特征、数据分布特征的测度, 4.1集中趋势的测度1 .分类数据:位数2 .顺序数据:中值和位数3 .数值型数据:平均4 .位数,中值和平均值的比较,数据分布特征的和测度(本节位置),集中倾向(Central tendency )一组数据接近

2、其中心值的倾向和程度测度集中倾向, 本发明寻找数据级别的代表值或者中心值的不同类型的数据,以不同的集中倾向测度值的低级别的数据的测度值适用于高级别的测定数据,但是高级别的数据的测度值不适用于低级别的测定数据的出现次数最多的变量值不受极端值的影响的数据群是最频繁的。 一些最频值可以主要用于分类数据,顺序数据和数值型数据、最频值(非唯一性)、最频值源数据3360-105126-8、最频值源数据3360-6585多个元数据:25283642、分类数据的个数(解:这里的变量是“饮料品牌”,这是分类变量,不同种类的饮料在变量值调查的50人中,购买可口可乐的人数最多,为15人,占总调查的变量是“回答类别”

3、甲城市中对住宅表示不满的家庭数最多,为108户即Mo不满,顺序数据:中央值和分位,中央值(median ),位于排序后中间位置的值,非极端的顺序数据:顺序数据的中央值(例题分析),解:从中央值的位置为300/2150累计度数来看,中央值处于“一般”的组。 因此,Me=一般数值型数据的中央值(9数据的修正运算例), 【例】: 9户的人均月收入数据原始数据33601500750780108085020012501630排行榜336075085010801250150016302000位置3360124567 9、中值1080、 数值类型数据的中值(10个数据的修正算例)、【例】: 10个家庭的人均

4、月收入数据排行榜336066078078085096010801250150016302000位置336012457910、 排序后位于25%和75%位置的值不受极端值的影响,主要用于顺序数据,也用于数值型数据,但分类数据、四分位(位置确定)、原始数据:顺序数据:顺序数据的四分位(例题分析)、解: QU位于“一般”组。因此,QL=不满QU=一般数值型数据的四分位(9数据的修正运算例) 是【例】: 9户的人均月收入数据原始数据336015007507801080850012501630排行榜336075078085010801250150016302000位置: 1 2 3 4 5 6 7 8

5、9、数值型数据的四分位(1 【例】: 10户人均月收入数据排行榜336066075078085096010801250150016302000位置:2457910, 数值型数据:集中倾向最常用的测度值组的数据均衡点是数据的必然性特征用于容易受极端值影响的数值型数据,不能用于分类数据和顺序数据,不能用于简单平均和加权平均(simple mean/weighted mean ) 、加权平均(例题分析)、加权平均(权重对平均的影响)、甲乙两组各有10名学生,他们的考试成绩及其分布数据如下:考试成绩(x): 0 20 100人数分布(f ):1 1 8乙组:考试成绩(f) 1.各变量值与平均值的方差之

6、和和谐平均(harmonic mean ),平均值的另一种表现形式容易受极端值的影响的修正公式,本来在修正计算时只使用了不同的数据,和谐平均(例题分析),【例】将某蔬菜批发市场的3种蔬菜的日成交数据列表,修正3种蔬菜当天的平均批发价格几何平均,n个变量值乘积的n次方根应用于对比度数据的平均,主要修正平均增长率的修正公式。 某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。 求出每年的年平均增长率。 年平均增长率114.91%-1=14.91%,几何平均(例题分析),【例】一

7、个投资者购买了一种股票,2000年、2001年、2002年、2003年的收益率分别为4.5%、2.1。 算术平均:几何平均:众数、中位数与平均值的比较、众数、中位数与平均值的关系、众数,这四年来这位投资者的平均回报率不受中央值和平均值的特征和应用最频值的影响不受极端值的影响不唯一性的数据分布的偏差程度大的情况应用不受中央值的影响数据分布的偏差程度大的情况应用平均值容易受极端值的影响数学性质优异的数据对称分布或者接近对称分布的情况应用, 数据类型和集中倾向测度值、4.2离散度的测度分类数据:不同比率顺序数据:四分位差数值型数据:离散及标准偏差相对位置的测定:标准点数相对离散度:离散系数、数据的特

8、征和测度(本节位置)、离中倾向数据分布的另一重要特征是各变量值远离其中心值的程度(离散度) 从另一个方面来说明集中倾向测度值的代表度不同类型的数据有不同的离散度测度值,分类数据:异众比率、异众比率、1 .分类数据的离散度的测度2 .非公共排列4 .用于测量众数的代表性的异众比率(例题分析)、1 .分类数据的离散度的测度因此,如果用“可口可乐”代表消费者购买饮料品牌的状况的话,其代表性的就不太好了。 顺序数据:四分位差、四分位差、顺序数据的离散程度的测度也称为内距离或者四分间隔上的四分位和下四分位的差QD=QU QL,中间50%数据的离散程度不受极端值的影响而测定中央值的代表性的四分位差(例题分

9、析) 解:非常不满意为1,不满意为2,一般为3,满意为4,非常满意为5已知QL=不满=2 QU=一般=3四分位差: QD=QU=QL=3 2=1,数值型数据:方差和标准偏差,极差(range ),一组数据的最大值和最小值的差离散的程度在- min(xi )下,校正公式是平均差,其中每个变量值及其平均方差绝对值的平均值全面地反映该组数据的离散度数学性质差,实际上应用较少,校正公式不分组数据,也不分组数据,意思:不分组数据。 平均差为17,方差和标准偏差,数据离散度的最常用测量值反映了各变量值和平均值的平均差从整体数据中校正的结果,即从称为整体方差或标准偏差的样本数据中校正的样本方差在称为“简单方

10、差和标准偏差”(simplevarianceandstandarddeviation )、组数据:组数据:组数据:方差校正公式的一组数据中,可以自由采用的数据的个数如果采样数据的个数为n 例如,当确定样本数目x1=2、x2=4、x3=9且x=5时,x1、x2和x3两个数据可以自由地取值,而另一个数据不能自由地取值。 例如,如果x1=6,x2=7,x3必然取2,并且通过自由度去除不能具有其他值的样本的方差。 其理由可以从多方面来说明,从实用的观点来看样品标准偏差(例题分析),样品标准偏差(例题分析),意思:每天的销售量与平均相比平均差21.58台,相对位置的测定:标准分数,标准分数(standa

11、rd score ) 1 .数据集中某一值的相对位置的度量3 .可用于确定数据集中是否有异点的4 .变量的标准化过程5 .修正公式保持原始标准得分(性质)、平均值0.2 .方差1、标准得分(性质)和z得分经验法则是,当一组数据对称分布时,约68%的数据在平均加上1标准偏差的范围内,约95%的数据在平均加上2标准偏差的范围内,约99%的数据在平均加上3标准偏差的范围内,切比雪夫不等式(chebyss如果一组数据此时,可以使用切比雪夫不等式。 对于任何分布形状的数据都可以应用切比雪夫不等式的是“下界”,即“所占比例至少是多少”任意分布形态的数据,根据切比雪夫不等式,至少在k个标准偏差内。其中,k是大于1的任意值,但不一定是整数,切比雪夫不等式满足k=2,3, 关于4,该不等式的含义是:至少75%的数据在平均值减去2个标准偏差的范围,至少89%的数据在平均值减去3个标准偏差的范围,至少94%的数据在平均值减去4个标准偏差的范围,相对离

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论