大数据建模概述_第1页
大数据建模概述_第2页
大数据建模概述_第3页
大数据建模概述_第4页
大数据建模概述_第5页
已阅读5页,还剩8页未读 继续免费阅读

VIP免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据建模概述演讲人:通用名大数据建模应遵循的规律以业务目标作为实现目标业务知识是每一步的核心做好数据预处理试验对寻找解决方案是必要的数据中总含有模式数据挖掘增大对业务的认识与猜测提高了信息作用能力大数据建模的价值不在于预测的准确率模式因业务变化而变化大数据建模技术,是为了解决业务流程问题。数据建模的核心:业务目标。我们要什么样的数据挖掘模型业务调研

问题定位

可解释、有实际业务涵义、可使用的

制定目标

①以业务目标作为实现目标

→↓↓←②业务知识是每一步的核心

业务知识是理解问题的基础。例如大数据分析“饮食与疾病的关系”“糖尿病与高血压发病关系”,这些分析都需要对医学相关知识有一定了解才能建模。数据分布数据质量指标选择衍生指标→→→③做好数据预处理

数据预处理比数据挖掘其他任何一个过程都重要且费力,数据预处理的目的是把数据挖掘问题转化为格式化的数据,使得分析技术更容易利用它。数据预处理两种方法

第一种方法是将数据转化为可以分析的完全格式化的数据,比如,大多数数据挖掘算法需要单一表格形式的数据,一个记录就是一个样例。数据挖掘者都知道什么样的算法需要什么样的数据形式,因此可以将数据转化为一个合适的格式。第二种方法是使得数据能够含有业务问题的更多的信息,通过这些领域的知识,数据挖掘者可能可以找到一个合适的技术解决方案。数据提取数据清洗数据审核数据集成→→→④试验对寻找解决方案是必要的

挖掘过程中往往通过算法和业务知识结合进行多次试验,才能揭示数据隐藏的规则。了解业务知识对模式有更好的理解,模式也对业务知识有贡献。模型初步构建模型优化模型带动业务业务带动模型→→→⑤数据中总含有模式

在一个与业务相关的数据集中,即使一些期望的模式不能被发现,但其他的一些有用的东西可能会被发现。一些数据挖掘项目失败是因为开始的数据采集存在问题。⑥数据挖掘增大对业务的认识

为什么数据挖掘必须是一个业务过程而不是一个技术过程?

业务问题是由人而非算法解决的。

数据挖掘算法揭示的模式通常不是人类以正常的方式所能认识到的,帮助业务专家解决他们不能单独完成的业务问题。如:通过大数据分析帮学校找到学生学习困难的原因。⑦与猜测提高了信息作用能力

数据挖掘算法揭示的模式通常不是人类以正常的方式所能认识到的。聚类和关联模型也有预测特征。聚类:预测一个个体属于哪个群体。eg:预测个别交易是否为欺诈。关联:基于已知基本属性预测更多属性。eg:预测客户行为。⑧大数据建模的价值不在于预测的准确率

准确性和稳定性是预测模型常用的两个度量。准确性是指正确的预测结果所占的比例;稳定性是指当创建模型的数据改变时,其预测结果变化有多大。一个好的大数据是为了改变企业的行为以及预测的结果来改善企业的行为,会不会适应业务发展需要才是它的衡量标准。⑨模式因业务变化而变化

模式的变化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论