第四章数据的概括性量一演示文稿_第1页
第四章数据的概括性量一演示文稿_第2页
第四章数据的概括性量一演示文稿_第3页
第四章数据的概括性量一演示文稿_第4页
第四章数据的概括性量一演示文稿_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章数据的概括性度量一演示文稿现在是1页\一共有31页\编辑于星期五(优选)第四章数据的概括性度量一现在是2页\一共有31页\编辑于星期五

如果你的腳已經踩在爐子上,而頭卻在冰箱裡,統計學家會告訴你,平均而言,你相當舒服。

调侃统计学家

现在是3页\一共有31页\编辑于星期五数据特征测度分类数据的特征和测度分布的形状集中趋势离散程度众数中位数均值离散系数方差和标准差峰度四分位差异众比率偏态现在是4页\一共有31页\编辑于星期五指总体中各单位的次数分布从两边向中间集中的趋势,用平均指标来反映。集中趋势可以反映现象总体的客观规定性;可以对比同类现象在不同的时间、地点和条件下的一般水平;可以分析现象之间的依存关系。测定集中趋势的意义:指同质总体中各单位某一数量标志的一般水平,是对总体单位间数量差异的抽象化现在是5页\一共有31页\编辑于星期五平均指标的种类及计算方法1众数2中位数3四分位数4算术平均数5几何平均数位置平均数数值平均数现在是6页\一共有31页\编辑于星期五第一节集中趋势的测度一.分类数据:众数二.顺序数据:中位数和分位数三.数值型数据:均值四.众数、中位数和均值的比较现在是7页\一共有31页\编辑于星期五集中趋势

(Centraltendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据一般水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定现在是8页\一共有31页\编辑于星期五分类数据:众数现在是9页\一共有31页\编辑于星期五众数

(概念要点)集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据现在是10页\一共有31页\编辑于星期五众数

(众数的不唯一性)无众数

原始数据:10591268一个众数

原始数据:6

5

98

55多于一个众数

原始数据:25282836

4242现在是11页\一共有31页\编辑于星期五分类数据的众数

(算例)表5-1某城市居民关注广告类型的频数分布

广告类型人数(人)比例频率(%)

商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100【例】根据表5-1中的数据,计算众数解:这里的变量为“广告类型”,这是个分类变量,不同类型的广告就是分类数据我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即

Mo=商品广告现在是12页\一共有31页\编辑于星期五顺序数据的众数

(算例)【例】根据表5-2中的数据,计算众数解:这里的数据为顺序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即

Mo=不满意表5-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510合计300100.0现在是13页\一共有31页\编辑于星期五数值型分组数据的众数

(要点及计算公式)1.众数的值与相邻两组频数的分布有关4.该公式假定众数组的频数在众数组内均匀分布2.相邻两组的频数相等时,众数组的组中值即为众数Mo3.相邻两组的频数不相等时,众数采用下列近似公式计算MoMo现在是14页\一共有31页\编辑于星期五众数的确定方法(1)单项数列出现次数最多或频率最大的那个变量值即为众数。

例:佳美超市2004年3月各种包装的味精销售情况:按包装分组(克)销售量(袋)102550751005001000305235714643172众数为50克数值型分组数据的众数算例)现在是15页\一共有31页\编辑于星期五(2)组距数列先根据各组次数确定众数所在的组,这时应注意各组组距是否相等,如不等则要考虑组距对次数的影响,然后利用下列公式计算众数。下限公式:

L:众数组的下限U:众数组的上限Δ1

:众数组次数与下一组次数之差Δ2

:众数组次数与上一组次数之差

i:众数组的组距上限公式:MoMo现在是16页\一共有31页\编辑于星期五

例2004年某地大学生消费支出调查资料下限公式:上限公式:月消费额组中值(元)调查人数(人)300以下300~400400~500500~600600~700700以上250350450550650750801804302207020合计——1000现在是17页\一共有31页\编辑于星期五(3)众数的应用特点众数不受极端数值和开口组的影响,而且计算方便。众数的确定适用于总体单位数较多,并有明显的集中趋势。有时分布数列中会出现双众数和多众数,难以反映总体的一般水平。由于众数的计算并不涉及每一个变量值,故其对变量值的变化反映不灵敏。现在是18页\一共有31页\编辑于星期五顺序数据:中位数和分位数现在是19页\一共有31页\编辑于星期五中位数点集中趋势的测度值之一排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据现在是20页\一共有31页\编辑于星期五中位数确定中位数的确定方法(1)对于未分组的原始资料,首先必须将标志值按大小排序:现在是21页\一共有31页\编辑于星期五未分组数据的中位数)中位数就可以按照下面的方式确定:现在是22页\一共有31页\编辑于星期五顺序数据的中位数【例】根据表3-6中的数据,计算甲城市家庭对住房满意状况评价的中位数解:中位数的位置为:(300+1)/2=150.5从累计频数看,中位数的在“一般”这一组别中。因此

Me=一般表3-6甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意

一般

满意

非常满意2410893453024132225270300合计300—现在是23页\一共有31页\编辑于星期五数值型未分组数据的中位数原始数据: 2422212620排序: 2021222426位置: 123 45中位数22现在是24页\一共有31页\编辑于星期五数值型未分组数据的中位数算例原始数据:105 91268排序: 56891012位置: 123

4

56位置N+126+123.5中位数8+928.5现在是25页\一共有31页\编辑于星期五根据位置公式确定中位数所在的组采用近似公式计算该公式假定中位数组的频数在该组内均匀分布数值型分组数据的中位数现在是26页\一共有31页\编辑于星期五(1)对于对于单项式变量数列资料:(2)对于组距式变量数列

①从变量数列的累计频数栏中找出第个单位所在的组,即“中位数组”。②假定在中位数组内的各单位是均匀分布的,计算中位数的近似值:现在是27页\一共有31页\编辑于星期五下限公式:上限公式:

现在是28页\一共有31页\编辑于星期五中位数的确定(组距数列)【例】某车间50名工人月产量的资料如下:月产量(件)工人人数(人)向上累计次数(人)200以下200~400400~600600以上373283104250合计50—计算该车间工人月产量的中位数。现在是29页\一共有31页\编辑于星期五中位数的确定(组距数列)共个单位共个单位共个单位共个单位LU中位数组组距为d共个单位假定该组内的单位呈均匀分布共有单位数

中位数下限公式为

该段长度应为现在是30页\一共有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论