数据分析不是为了写一份报告_第1页
数据分析不是为了写一份报告_第2页
数据分析不是为了写一份报告_第3页
数据分析不是为了写一份报告_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据分析不是为了写一份时间:2015 年 2 月 1 日 | 栏目: 数据运营 | 作者: 数据小兵今天这篇文章的直接原因,是为了校正之前一文的部分观点。的“按流程进行数据分析”文中简单描述了数据分析流程:明确分析目的;按照数据分析的目的、具体内容,收集所需数据;对数据进行初步的质量筛查;运用合理的数据分析方法进行分析;最后得到分析的结论,撰写解决问题的建议性。乍读,这个流程好像没什么问题,再读,上面所讲的流程可能更适合调研性工作,提供基于数据分析的解决办法,严格来讲,这个流程遗漏了最为宝贵的环节,没有将数据分析的结论应用到实践中。换句话讲,就是为了而分析!数据小兵 |1为什么要进行数据分析?

2、肯定不是为了。数据分析仅是其中的一部分,更为重要的是将数据分析得到的模型或者建议付诸实践,在应用过程中不断的反馈并对模型进行优化调整,最终使业务得以化的迭代过程。,这可能是一个不断往复优数据分析流程,严谨点来说,可以参考 CRISP-DM(跨行业数据挖掘标准流程),如上图所示,它将整个数据挖掘过程分解为商业理解、数据理解、数据准备、建立模型、模型评估和结果部署 6 个步骤。CRISP-DM 认为,数据挖掘过程是循环往复的探索过程,6 个步骤在实践中并不是按照直线顺序进行,而是在实际项目中经常回到前面的步骤进行不断优化调整。数据小兵 |2商业理解:理解项目目标和从业务的角度理解需求,同时将商业问

3、题转化为数据挖掘问题,并制定完成目标的初步计划。数据理解:从初始的数据收集开始,通过一预处理分析,目的是了解和掌握数据概况,识别数据的质量问题,发现数据的属性,或是探索有趣的数据集。数据准备:涵盖了从原始粗糙数据中构建最终数据集(将作为建模工具的分析对象)的全部工作。数据准备工作有可能被实施多次,而且其实施顺序并不是预先规定好的。这一阶段的任务主要包括:制表,数据变量的选择和转换,以及为适应建模工具而进行的数据等等。构建模型:选择和应用不同的模型技术,模型参数被调整到最佳的数值。比较典型的是,对于同一个数据挖掘类型,可以有多种方法选择使用。一些建模方法对数据的形式有具体的要求,因此,在这一阶段,重新回到数据准备阶段执行某些任务有时是非常必要的。模型评估:进行最终的模型部署之前,更加彻底的评估模型,回顾在构建模型过程中所执行的每一个步骤,是非常重要的,这样可以确保这些模型是否达到了企业的目标。数据小兵 |3模型部署:模型的创建并不是数据分析的最终目的。模型的作用是从数据中找到知识,获得的知识需要便于用户使用的方式重新组织和展现。根据需求,这个阶段可以产生简单的,或是实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论