数据采集与处理 课件 任务4 数据集中趋势处理_第1页
数据采集与处理 课件 任务4 数据集中趋势处理_第2页
数据采集与处理 课件 任务4 数据集中趋势处理_第3页
数据采集与处理 课件 任务4 数据集中趋势处理_第4页
数据采集与处理 课件 任务4 数据集中趋势处理_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目四静态数据处理技术任务4数据集中趋势处理任务导入:某企业工资数据如表4-4-1所示:表4-4-1某企业工资数据表任务要求:根据上述数据,计算出该企业工人的平均月工资水平。一、集中趋势概述集中趋势:是指一组数据向中心值靠拢的倾向和程度。一般来说,数据采集对象总体的频数分布特征一般有集中趋势。测度集中趋势就是寻找数据水平的代表值或中心值,不同类型的数据用不同的集中趋势测度值。集中趋势的测度方法有均值、众数及中位数等方法。算术平均数、调和平均数、几何平均数是根据分布数列中各单位的标志值计算而来的,称为数值平均测度数。众数和中位数等是根据分布数列中某些变量值所处的位置来确定的,称为位置集中测度值。各种集中测度值的计算方法不同,含义、应用场合也有所不同,但它们都可以作为集中趋势的代表值。二、均值均值是指在同质数据采集对象内将各单位的数量差异抽象化,用以反映采集对象一般水平的代表值。例如某单位员工的平均上网时间、学生的平均成绩81分、平均粮食产量800公斤等。(一)均值的概念二、均值1.均值是集中趋势的最常用测度值。(二)均值的特点2.均值是一组数据的均衡点所在。均值说明多数变量值集中在平均数附近,所以均值是标志值集中趋势的测度数,是反映总体变量集中倾向的代表值。3.均值体现了数据的必然性特征。从总体变量的分布情况看,多数现象的分布服从钟形分布,即不管用什么方法求得的均值,都靠近分布的中间,而不会在两头。4.均值易受极端值的影响。由于采用的是平均的方法求均值,均值易受到极值的影响,某个极端大值或极端小值都会影响均值的代表性,同时还影响其对集中趋势测度的准确性。5.均值主要用于数值型数据,不能用于分类数据和顺序数据的测度。二、均值(1)可用于同类现象在不同空间的比较。采用均值可以消除因总体的空间范围不同对数据比较分析的影响,从而得到正确的结论。(2)可用于同类现象在不同时间的比较。例如,由于各企业的工人数可能不一致,所以各单位的总产量一般是不可比的,但如果计算出各单位每个工人的平均产量,就可以进行对比了。(3)可用于数量上的推断。在数据的估计推算中,往往利用部分单位标志值计算的平均数推算总体平均数,或者以总体平均数来推算总体标志总量。(4)可用于分析现象之间的依存关系。例如,商业企业规模的大小和商品流通费用率之间存在依存关系,可以根据商品流转额来划分不同规模的商业企业,再计算各类商业企业的平均商品流通费用率,就可看出商品流转额的增减和流通费用率升降的依存关系。(三)均值的作用二、均值1.算术平均数计算简单均值与加权均值(四)均值的种类及测度(1)简单算术平均数计算均值1)简单算数平均数的计算公式2)简单算术平均数的Excel处理函数是?二、均值1.算术平均数计算简单均值与加权均值(四)均值的种类及测度(2)加权算术平均数计算均值1)加权算术平均数计算公式设一组数据,其组中值分别为:

x1,x2,…,xn相应的频数为:

f1,f2,…,fk,其计算公式如下:二、均值1.算术平均数计算简单均值与加权均值(四)均值的种类及测度(2)加权算数平均数计算均值2)加权算术平均数的Excel处理结合任务引出给出的数据,利用Excel来计算给企业工人的月平均工资。二、均值(四)均值的种类及测度第一步,在A栏及B栏后分别插入一栏,分别输入“月工资组中值x”以及“xf”,如图4-4-6所示。组中值是上下限之间的中点数值,以代表各组标志值的一般水平。组中值仅存在于组距数列分组数列中,单项式分组中不存在组中值。二、均值(四)均值的种类及测度第二步,根据组中值的计算方法,在B3到B8单元格中分别填入相应的组中值,如图4-4-7所示组中值的计算:有上下组限的情况下,组中值=(区间上限+区间下限)/2,而对于只有上限或者只有下限的情况,只有上限的组中值=上限-1/2(相邻组的组距),只有下限的组中值=下限+1/2(相邻组的组距)二、均值(四)均值的种类及测度第三步,点击单元格D3,再点击等号“=”,并点击输入“B3*C3”,如图4-4-8所示。二、均值(四)均值的种类及测度二、均值(四)均值的种类及测度二、均值(四)均值的种类及测度选中E9单元格,点击“=”,再添加“D9/C9”,点击回车,得到该企业工人月平均工资算术平均数1707.42元,如图4-4-12所示二、均值2.几何均值(四)均值的种类及测度几何均值也即是几何平均数,是n项变量值连乘积的n次方根,主要用于计算平均发展速度或平均增长率,其计算公式为:或二、均值(四)均值的种类及测度例:某地区2017-2022年国内生产总值(万元)如下表4-4-2所示,求该地区GDP的年平均发展速度。(平均发展速度表示现象逐期发展的平均速度)表4-4-2某地区2017-2022年国内生产总值(万元)二、均值(四)均值的种类及测度计算该地区GDP的年平均发展速度,Excel处理方法如下:第一步,先求出逐年发展速度(公式:发展速度=(指标报告期数值/指标基数数值)×100%)二、均值(四)均值的种类及测度计算该地区GDP的年平均发展速度,Excel处理方法如下:第二步,点击插入函数,选择统计函数GEOMEAN二、均值(四)均值的种类及测度计算该地区GDP的年平均发展速度,Excel处理方法如下:GEOMEAN函数:返回正数数组或区域的几何平均值语法结构:GEOMEAN(number1,number2,...),Number1,number2,...可用于计算平均数的1至30个参数,也可以不使用这种用逗号分隔参数的形式,而用单个数组或数组引用的形式。二、均值(四)均值的种类及测度计算该地区GDP的年平均发展速度,Excel处理方法如下:第三步,在弹出对话框中选择数值区域C4:C8二、均值(四)均值的种类及测度计算该地区GDP的年平均发展速度,Excel处理方法如下:第四步,点击确定按钮,就可以得出几何平均数123.95%,即该地区GDP在2017-2022年间的平均发展速度为123.95%。二、均值(四)均值的种类及测度计算该地区GDP的年平均发展速度,Excel处理方法如下:请大家尝试用公式法计算平均发展速度三、众数众数是数据采集对象总体中出现次数最多的数据。(一)众数的概念(二)众数的特征1.出现次数最多的变量值。2.不受极端值的影响。3.一组数据可能没有众数或有几个众数。4.众数主要用于分类数据,也可用于顺序数据和数值型数据。三、众数1.分类数据众数的确定(三)众数的确定下表4-4-3资料为某商店几种品牌饮品销售情况的频数分布比例及百分比(%)数据:上表中的众数是?三、众数2.顺序数据的众数(三)众数的确定4-4-4某地区居民对医疗状况评价的频数分布上表中的众数是?三、众数3.数值型数据众数的确定(三)众数的确定下面用Excel以来确定商品单价的众数(不考虑品牌),图4-4-18为某公司某月在各地空调的销售情况。三、众数3.数值型数据众数的确定(三)众数的确定第一步,对“单价”列升序排序;第二步,分类汇总;三、众数3.数值型数据众数的确定(三)众数的确定针对上述资料,如不考虑销售量和销售额,仅仅考虑单价的出现次数,也可以用Excel相关函数确定众数。MODE函数:返回在某一数组或数据区域中出现频率最多的数值。四、中位数中位数是将各数据采集单位特征值按一定的顺序或大小排列,居于中间位置的那个特征值就是中位数,中位数也是一个位置均值,由于处于中间位置,也用它来作为均值的代表。(一)中位数的概念四、中位数(二)中位数的特征1.中位数是排序后处于中间位置的数据2.中位数不受极端值的影响3.主要用于顺序数据的测度,也可用于数值型数据,但不能用于分类数据四、中位数(三)中位数的确定1.顺序数据的中位数表4-4-5某地区居民对医疗状况评价的频数分布中位数为?四、中位数(三)中位数的确定1.顺序数据的中位数表4-4-5某地区居民对医疗状况评价的频数分布中位数的位置为:301/2=150.5,从累计频数看,中位数在“一般”这一组别中。四、中位数(三)中位数的确定2.数值型数据的中位数①如果数据个数为奇数,则处于(n+1)/2位置的标志值是中位数。②如果数据个数为偶数,则处于n/2、(n+2)/2的两个标志值的平均数为中位数。四、中位数(三)中位数的确定2.数值型数据的中位数图4-4-24为某公司某时间在各地空调的销售情况(已排序),下面用Excel以来确定商品单价的中位数(不考虑品牌)。四、中位数(三)中位数的确定2.数值型数据的中位数图4-4-24为某公司某时间在各地空调的销售情况(已排序),下面用Excel以来确定商品单价的中位数(不考虑品牌)。MEDIAN函数:用来返回给定数值的中值针对集中趋势的测度方法,具体的知识点总结如表4-4-6所示。表4-4-6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论