




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目三数据预处理认知任务4数据分组认知任务导入:为准确了解工人的劳动效率,某企业生产管理部门对机加工车间30名工人完成劳动定额的情况进行数据采集,得到如下原始资料(%):97829584938692102100103105100103108107108106109113114109117125115122119118116129115该企业生产管理部门经理要求该部门工作人员尽快对该资料进行整理,以便提供给公司管理层为制定新的生产定额提供参考。任务要求:1.请你根据上述数据资料帮助该企业生产部门工作人员,整理一下机加工车间30名工人完成劳动定额的情况,以便更好的反映工人生产定额完成情况的分布状况及其构成。2.通过以上数据整理工作的流程,简述一下数据分组是什么?数据分组最关键问题是什么?一、数据分组的概念及作用数据分组是在数据采集对象内部进行的一种特定分类,是根据数据处理的目的,将数据按照一定的数据处理需求区分为若干个组成部分的数据处理方法。(一)数据分组的概念一、数据分组的概念及作用1.可以揭示社会经济数据资料的特点及规律性(二)数据分组的作用通过数据采集得到的资料,往往是大量零散的、不系统的第一手数据,仅仅通过这些散乱的资料,难以看出数据采集对象的特点和基本情况,所以需要进行分组。经过数据分组之后,就可以观察出数据具有的一些特点,进而研究数据采集对象具有的规律性。一、数据分组的概念及作用2.可以区分数据采集对象的类型(二)数据分组的作用例如,消费者按照购物习惯可分为传统型购物人群和网店型购物人群等类型,网店购物人群可还以按照性别、职业和年龄等来区分,传统型购物人群也可按照年龄、地域等来分类;当然,还可以按照城镇购物人群和农村居民购物人群等来区分消费者类型。一、数据分组的概念及作用3.可以分析数据采集对象内部构成和结构特征(二)数据分组的作用把被研究现象按某一标志分组后,计算出各组在数据采集对象中的比重,就可以说明经济现象的内部结构,例如网购群体中老、中、青购物者构成情况,西瓜视频、抖音等视媒体爱好者结构等,都反映出不同的购物人群对网购及自媒体的态度。一、数据分组的概念及作用4.可以揭示现象之间的依存关系(二)数据分组的作用数据采集对象都不是孤立存在的,而是相互联系、相互依存、相互制约的。例如,网络时代消费者中,年龄与购物习惯存在着一定的关系,一般来说,青年购物者往往喜欢网购,而老年人则喜欢实体店消费;广告投入和销售额存在一定的依存关系,一般来说,广告投入越多,销售额也比较高。再如商品销售额和流通费用率之间也存在着一定的依存关系,一般来说,销售额越高,流通费用率越低(见表3-3-1)。一、数据分组的概念及作用可以看出,商品流通费用率与商品销售额之间存在的依存关系是?(二)数据分组的作用二、数据分组的方法数据分组的关键问题在于选择分组标志和划分各组界限,而选择分组标志则是数据分组的核心问题。二、数据分组的方法1.根据数据处理的目的与任务选择分组标志(一)选择分组标志例如,以爱好网购的消费者为数据采集对象进行研究时,这个研究对象就有很多标志,如年龄,性别、职业、收入等。如果数据分析的目的是要分析不同年龄段人群在数据采集对象中的构成,那么就要选择年龄作为分组标志;如果要研究职业、收入对网购的影响,则可以选择职业、收入等作为分组标志。二、数据分组的方法2.要从众多标志中选择最能反映被研究对象本质特征的标志作为分组标志(一)选择分组标志在选择分组标志时,可能遇到既可以使用这种标志,又可以使用另一种标志的情况,这就需要根据被研究对象的特征,选择最主要的、最能反映事物本质特征的标志进行分组。例如,研究某城市居民生活水平状况时,既可用居民的个人收入水平作为分组标志,也可以用居民家庭成员人均收入水平作为分组标志。思考:哪个分组标志更能反映其生活水平的高低?二、数据分组的方法3.根据现象所处的历史条件或经济条件来选择数据分组标志(一)选择分组标志数据采集对象是随着时间、地点等条件的变化而变化的。例如,在研究公司发展水平高低时,需要对企业按年产量或年产值进行分组。一般来说,反映公司发展水平高低的标志主要有年产值、年产量、固定资产、年利润额、资本利润率等。在生产力水平较低的情况下,用年产值的多少来表示企业规模的大小比较适当;而在技术更新的历史时期或技术装备比较先进的情况下,有的企业由于采用了机械化生产,虽然年产值可能很大,但发展水平并不一定很高。因此,年产值已不能准确地说明公司发展水平的高低,这时使用年利润额或资本利润率等作为反映公司发展水平的分组标志更为恰当。二、数据分组的方法1.按品质标志分组(属性差异)(二)数据分组的种类例如,网民按性别、民族、文化程度等标志进行分组。按品质标志分组的结果形成品质数列,如下表为某县区200家企业类型分组表。二、数据分组的方法2.按数量标志分组(数量差异)(二)数据分组的种类例如,消费者按年龄分组,职工按工资水平分组等。按数量标志分组的过程中,根据变量值取值范围不同,分组的形式可以分为单项式分组和组距式分组。二、数据分组的方法(二)数据分组的种类单项式分组:即每一组只包含一个变量值,这种分组形式只适用于离散变量,而且只能在离散变量的变动范围较小、变量值个数较少时使用,如,按某工厂机械加工车间工人日产量划分工人生产情况(见下表)。单项式分组(要点)
用一个变量值作为一组适合于变量值较少的离散变量二、数据分组的方法工人日产量分组表(二)数据分组的种类二、数据分组的方法(二)数据分组的种类二、数据分组的方法(二)数据分组的种类组距式分组:即在变量值变异幅度较大时,将变量值取值范围人为地划分为若干个区间,变量在同一区间内取值的现象归为一组,区间的距离即称为组距,如商店按销售额分组等。组距分组(要点)用变量值的一个区间作为一组适合于连续变量和变量值较多的离散变量二、数据分组的方法(二)数据分组的种类二、数据分组的方法(二)数据分组的种类二、数据分组的方法(三)数据分组体系所谓数据分组体系,就是根据数据采集与处理的要求,通过对同一数据采集对象进行不同分组,形成的系列相互联系、相互补充的组的整体。数据分组体系有平行分组体系与复合分组体系之分。二、数据分组的方法(三)数据分组体系平行分组:平行分组是选择两个或两个以上的标志对总体进行一次次简单分组后所形成的体系。在平行分组中,各个分组是并列的,每个分组都是基于一个特定的标志或属性进行的。这种分组方式适用于当各个分组之间没有直接的逻辑或层次关系,或者当需要同时考虑多个标志时。二、数据分组的方法(三)数据分组体系复合分组:复合分组是将总体按照一个主要的标志进行初步分组,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 激光工程师之间的技术合作考题试题及答案
- 心理咨询师考试反应模式试题及答案
- 专利管理理念更新的试题及答案
- 小考数学真题试题及答案
- 探讨光电系统的安全性试题及答案
- 光电工程师资格考试知识点细化及试题及答案
- 乡村全科执业医师考试预防知识试题及答案
- 冷漠眼神测试题及答案
- 2024年基础医学知识学习的有效策略试题及答案
- 化学地理考试题及答案
- 数据结构ppt课件完整版
- 烟花爆竹零售经营从业人员安全培训
- SJG 36-2017 深圳市岩土工程勘察报告数字化规范-高清现行
- 《新媒体运营》课件(完整版)
- 专利检索ppt课件(PPT 54页)
- 建筑立面十八式,你用过几个?
- 三只小猪的真实故事
- (高清正版)T-CAGHP 031—2018 地质灾害危险性评估及咨询评估预算标准(试行)
- 第九章 放射线对人体影响
- 屋面防水翻新改造工程施工方案(全面完整版)
- 教案(餐巾折花)
评论
0/150
提交评论