




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目一数据采集与处理认知任务二认识数据采集与处理的相关概念
数据采集在我们日常生活当中是随处可见的,尤其是2020年初的新冠疫情,我们每个人每天都要不断的在小区入口,公司上班处,或在线填写各类身体健康信息的表格和数据,这些就是数据采集的过程。
一、数据采集对象与数据采集单位
数据采集对象:是指由许多同质的、客观存在的个体构成的整体;
数据采集单位:构成数据采集对象的个体就是数据采集单位。
一般来说,在一个数据采集对象中,数据采集单位在某些方面必须有一个或多个相同的性质。例如要采集一个地区民营经济的相关数据,当地所有的民营经济体就构成了一个数据采集对象,在所有制性质这一点上,所有的民营经济体都是相同的。对于该数据采集对象来说,每一个民营经济体就是数据采集单位。二、标志与指标(一)标志
标志:是采集对象各单位所具有的共同特征的名称,即用来说明总体单位特征的名称。
从不同的维度来考察,每个数据采集单位可以有许多特征,而且这些特征有不同的表现,这种表现叫做标志的特征值,也是数据采集所需要的结果,例如:一家电子厂职工的性别、年龄、民族等。1.按特征值的表现分为不变标志和变异标志不变标志:当一个标志在各个采集单位的特征值都相同时,这个标志称为不变标志;变异标志:当一个标志在各个单位的特征值有可能不同时,该标志称为可变标志或变异标志。例如,电子厂的员工,如果按厂籍来看都一样,这个厂籍就是不变标志,如果按照性别、年龄、学历等来区分,则有所不同,这些标志就是可变标志。数据采集的标志主要是可变标志。标志的分类2.按其性质可分为品质标志和数量标志品质标志:表示事物质的特征,其特征值是不能用数值表示的,例如员工的民族、性别、工种等。数量标志:表示事物量的特征,其特征值用数值表示,例如员工的年龄、工资、工龄等。(二)指标及指标体系1.指标的概念指标:是反映数据采集对象总数量特征的名称和具体数值。例如,全国电商厂商数、天猫“双十一”商品销售额、人均工资收入等。指标一般由六个要素构成:指标名称、计量单位、计算方法、时间范围、空间范围、具体数值。例如,2022年全年我国国内生产总值(GDP)为1210207亿元,这个指标就反映了2022年我国GDP的总体情况。2.指标的种类(1)按反映数据采集对象内容的不同分类指标按反映数据采集对象内容的不同,分为数量指标和质量指标。1)数量指标也即是总量指标,是说明数据采集对象总规模、总水平的指标。例如,员工总数、企业固定资产总额、工资总额、进出口总额等。数量指标所反映的是数据采集对象的绝对数量,有计量单位,其数值的大小随着数据采集对象范围的变化而变化,它是认识数据采集对象的基础。2.指标的种类2)质量指标是说明数据采集对象内部数量关系或数据采集单位水平的指标。例如,各省经济总量占全国经济总量的比重、某电子厂员工的性别比例,年龄构成,农业、轻工业、重工业比例,平均年龄等。它的表现形式有相对数和平均数,其数值的大小与范围的变化没有直接关系。2.指标的种类(2)按其表现形式和作用的不同分类指标按其表现形式和作用的不同,分为总量指标、相对指标和均值。1)总量指标又分为实物指标、劳动指标和价值指标三种。2)相对指标也称相对数,是用两个有联系的指标进行对比、用来反映数据采集对象之间数量关系的指标,如频率、结构、发展程度、强度、普遍程度等。3)均值则是反映数据采集对象内部某一数量标志在一定时间、地点下所达到的一般水平的指标,如平均身高、平均寿命、平均亩产量等。2.指标的种类(3)按管理功能的不同分类指标按管理功能的不同,分为描述指标、评价指标及预警指标。1)描述指标是用来反映数据采集对象的状况、过程和结果,达到对数据采集对象现象的基本认识,是数据信息的主体。例如,反映某网络店铺拥有粉丝数量指标、年销售额指标;再如某地区劳动资源指标、国内生产总值指标、财政收入指标、投资指标等。2)评价指标包括宏观国民经济评价指标和数据采集对象经济活动评价指标,用于对社会经济运行的结果进行比较、评估和考核,以检查工作质量或其他定额指标的结合使用。如产品的合格率、就业率、计划完成程度等指标。3)预警指标主要用于对数据采集对象的运行进行监测,对数据采集对象运行中即将发生的失衡、失控等进行预报、警示。通常选择数据采集对象运行中的敏感性、关键性经济现象,构建相应的监测指标体系。如针对经济增长、经济周期波动、失业、通货膨胀等,可以建立GDP与国民收入增长率、CPI、汇率、利率、社会积累率、消费率、失业率等预警指标。(二)指标及指标体系3.指标体系(1)指标体系指标体系就是各种相互联系的指标所构成的一个有机整体,用来说明所研究现象各个方面相互依存和相互制约的关系,它主要用于解决由于现象的复杂多样性,及各种现象之间相互联系的性质,例如只用个别指标来反映是不全面的,这样就需要采用指标体系来进行综述。(2)指标体系的分类1)根据所研究问题的范围大小分类指标体系根据所研究问题的范围大小,可以建立宏观指标体系和微观指标体系。宏观指标体系:就是反映整个现象大范围的指标体系,如反映整个国民经济和社会发展的指标体系。微观指标体系:就是反映现象较小范围的指标体系,如反映企业或事业单位的指标体系。介于这两者之间的可以称为中观指标体系,如反映各地区或各部门的指标体系。2)根据所反映现象的范围内容不同分类指标体系根据所反映现象的范围内容不同,可分为综合性指标体系和专题性指标体系。综合性指标体系:能较全面地反映总系统及其各个子系统的综合情况,如国民经济和社会发展指标体系。专题性指标体系:则是反映某个方面或问题的,如经济效益指标体系。三、变异、变量和变量值(一)变异一般意义上的变异是指标志(包括品质标志和数量标志)在总体单位之间的不同表现。如人的性别有男女之分,各时期、各地区、各部门的工业总产值各有不同等,这种差别叫作变异。严格来说,变异仅指品质标志的不同具体表现。如性别表现为男、女,民族表现为汉、满、回、苗等。与变异相对,变量则是用来描述数量标志的具体表现。(二)变量及变量值1.变量的概念变量就是可以取不同值的量,这是数学上的一个名词,在数据分析中,变量就是数量标志的名称或指标的名称。变量包括各种数量标志和全部指标,它都是以数值表示的,不包括品质标志。例如,职工人数是一个变量,因为各个工厂的职工人数不同。(二)变量及变量值2.变量的分类变量按其数值是否连续可分为连续变量与离散变量两种。1)连续变量连续变量是指在一定区间内可任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值之间可作无限分割,即可取无限个数值。例如,生产零件的规格尺寸、人体测量的身高、体重、胸围等为连续变量,其数值只能用测量或计量的方法取得。(二)变量及变量值2.变量的分类2)离散变量离散变量是指可按一定顺序一一列举其数值的变量叫离散变量,其数值是断开的。例如,企业个数、职工人数、设备台数、学校数、医院数等,都只能按计量单位数计数,这种变量的数值一般用计数方法取得。(二)变量及变量值3.变量值变量的具体数值表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 媒介合作及劳务合同
- 苗木短期交易协议设计
- 塑料件的种类与识别陈勇课件
- 新都管道封堵施工方案
- 铁路工程安全技术石家庄铁路93课件
- 铁路旅客服务心理铁路旅客运输服务课件
- 中国书法课件
- 中华八大文化课件
- 大学生职业规划大赛《电子与计算机工程专业》生涯发展展示
- 东坡文化课件图片
- 上海初三生命科学知识点总复习
- 八年级期末质量分析-课件
- 10000中国普通人名大全
- 酒店公共场所卫生管理制度(精选5篇)
- 集成电路芯片封装技术第2章ppt课件
- 技能操作鉴定要素细目表(电工技师)
- 武广客运专线隧道防排水技术的突破QC成果
- 电子产品设计生产工艺流程
- 初级培训机器人的机械系统
- 制造工厂品质宣传海报标语
- 吸入装置正确使用方法调查表
评论
0/150
提交评论