AI驱动的应用开发平台架构_第1页
AI驱动的应用开发平台架构_第2页
AI驱动的应用开发平台架构_第3页
AI驱动的应用开发平台架构_第4页
AI驱动的应用开发平台架构_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、以机器学习为核心的数据驱动型应用开发平台OVERVIEW1Retrospective and Looking Forward大数据与人工智能技术的回顾与展望录AsiaInfo Machine Learning PlatformAura 数据驱动型应用开发平台简介Data-Driven Application Use Cases数据驱动型应用示例Discussion问题与讨论Applications of Big DataExamine the pastDescriptive AnalyticsDiagnostic AnalyticsNow and futurePredictive Analyt

2、icsPrescriptive AnalyticsExamine the PastAd-hocData warehouse OLAPPre-computedBatch (1st gen)n Hadoop for batch processing and reportingLambda (2nd gen) dual pipelinen Hadoop for batch processing and reportingn Storm / Spark Streaming / Samza for real-time processing Kappa (3rd gen) single pipelinen

3、 Real-time computation and query / reporting n Fault-tolerant distributed real-time architecture n Re-playable, real-time event streamsPredictive AnalyticsWhat will happen?Predict the future outcome based on historical eventsPrescriptive AnalyticsActionable - actions to be performed due to the predi

4、ctions and showing the implications of each decision optionMachine learning and deep learningCustomer acquisition (telecom, banking, e-commerce, )Fraud detection (telecom, banking, healthcare, advertising, )Customer churn prevention (telecom, banking, )Object recognition, facial recognition, Now and

5、 FutureDening Ar,cial Intelligence定义人工智能What is AI ?Artificial intelligence (AI) is intelligence exhibited by machines.The theory and development of computer systems able to perform tasks that normally require human intelligence, such as visual perception, speech recognition, decision- making, and t

6、ranslation between languages.In computer science, the field of AI research defines itself as the study of intelligent agents: any device that perceives its environment and takes actions that maximize its chance of success at some goal.2016年3月15日,在人机大战最终局结束后,李世石 独自一人掩面坐在棋盘前。这场比赛主动挑战执黑的 李世石没有能再次展现出“神之

7、一手”,最终180手投子 不敌AlphaGo。而人类VS人工智能(AI,Artificial Intelligence)也最终以1比4落下大幕AlphaGo计算集群1920 个CPU280 个GPU耗时数月完成模型训练Machine Learning is an important area of AI机器学习是人工智能的重要领域Tradional ProgrammingMachine LearningComputerData ProgramOutputComputerDataOutputProgramMachine Learning is about:Automating automatio

8、nGetting computers to program themselvesWriting software is the bottleneck, let the data do the work instead!Artificial neural network is the building blockMimic human brainHigh depth and widthHeterogeneous computing (CPU + GPU)Google “Brain” (2012)IBM “Waston” (2015)百度大脑(2015)NVIDIA DGX-1 (2016)His

9、tory Progress in Deep Learning深度学习的历史进程大数据平台参考架构数据软件安全国际运营商 Telco银行 Banking媒体 Media公安 Public Safety医疗 Healthcare行业及业务范畴智 能 营 销流 失 预 警骗保预测算法 及模型知识库智能推荐算法 及模型知识库用户画像算法 及模型知识库热点业务算法 及模型知识库业务咨询能力自然语言 处理能力数据挖掘能力新技术研究及 业务转化能力医 疗 控 费医 疗 经 验 传 播个 人 客 户 智 能 投 顾支 付 欺 诈 检 测内 容 智 能 推 荐收 费 会 员 画 像公 证 业 务 预 测公 证

10、人 群 画 像AI算法及模型知识库团队核心能力语音及图像识 别能力流失预警算法 及模型知识库Important Factors技术 Tech业务 Business数据 Data人员 Human ResourceOVERVIEW1Retrospective and Looking Forward大数据与人工智能技术的回顾与展望录AsiaInfo Machine Learning PlatformAura 数据驱动型应用开发平台简介Data-Driven Application Use Cases数据驱动型应用示例Discussion问题与讨论Aura Posi,oningAura是基于机器学习和

11、深度学习技术的数据驱动型应用的高效开发 平台。用户能够:应用行业数据应用已有的最佳实践采用图形化或编辑器两种模式开发沉淀企业私有的数据挖掘的探索成果System Reinforcement Loop训练数据 收集/更新基准库 更新模型更新上线测试行业数据标准积累,技术知识与业务知识的充分结合预测结果与业务数据积累在同一平台形成闭环模型自优化,自动评价模型表征,学习新样板数据中 的特征变化,更新模型,提升模型准确度;根据实际效果自优化,根据每一轮实际的效果评估数 据,自动调整模型,不断提升准确度。Aura ArchitectureOrange Cloud + DataFoundry + ML/D

12、L FrameworksAura Learning Services4G新增用户 识别TelecomData platformML platformData-driven applications4G潜在流失 用户识别RT Fraud DetectionAura Visual Pipeline医保控费人流监控SMS SPAMFilteringPredictive Policing电信反欺诈投诉智能预 警智能投顾手机应用智 能推荐量刑规范化Aura Advanced NotebookCommon Data ModelFinanceHealthcarePublic SafetyCustomer A

13、cquisitionData platforML platformData-driven applicationsAsiaInfoCommon Data Model(CDM)TelecomFinancHealthcarPublic洞察/营销/风控eeSafety4G新增用户识别4G潜在流失用 RT Fraud医保控费人流监控 户识别Detection手机应用智能推投诉智能预警智能投顾量刑规范化 荐SMS SPAMCustomerPredictive电信反欺诈FilteringAcquisitionPolicingAura Visual PipelineAura Advanced Noteboo

14、kAura Learning ServicesmOrange Cloud + DataFoundary+ ML/DL FrameworksCommon Data ModelCommon Data Model行业数据模型的定义字段、类型、语义、关系定义不同数据模型之间的关联关系提供上层数据调用的接口和辅助操作行业数据标准和数据质量的校验不同底层数据源的导入和封装多租户、访问控制Visual PipelineVisual Pipeline向导式、规范化的挖掘流程支持按算法框架的维度提供向导式、规范化 的挖掘流程可视化管理和监控模型训练过程监控,进度、异常、错误挖掘结果/评估结果的标准化、可视化展现

15、支持与Advanced Notebook的交互可编辑/展示开发完的模型,定义新的算法 框架支持与Common Data Model的交互可查看、选择以及另存为新的指标集。Aura Learning ServicesOrange Cloud + DataFoundary+ ML/DL FrameworksAura Visual PipelineAsiaInfoCommon Data Model(CDM)TelecomFinanceHealthcarePublic Safety洞察/营销/风控4G新增用户识别4G潜在流失用户RT Fraud识别Detecon医保控费人流监控手机应用智能推投诉智能预

16、警智能投顾量刑规范化 荐SMS SPAMCustomerPredicve电信反欺诈FilteringAcquisionPolicingAdvanced NotebookData-drivenapplicaonsAura Advanced NotebookML plaEormData plaEormAdvanced Notebook整合开源Notebook,兼容40多种编程语 言预置丰富的计算引擎/框架及各类接口, 辅助开发开源包的版本配置即时开发、修改,即时展现结果 支持与Visual Pipeline的交互可编辑/展示Visual Pipeline中已开发完的模型可将Advanced Not

17、ebook中已开发完的 模型发布至Visual Pipeline支持与Common Data Model的交互提供可视化控件可查看、选择以及另存为新的指标集Targeted Users满足三类典型用户及相关需求:用户技术业务 能力要求能力要求潜在需求产品使用者 归属部门产品潜在使用人群2016年2017-2019年E入门级 用户现成数据应用业务部门75%,60%,占比递减趋势基础级 用户借助简易工具 及平台实现业 务部门需求业务支撑部门现场团队20%30%,占比递增趋势进阶及精 通用户功能强大的平 台业务部门(未来)现场团队(未来)5%数据科学家10%,占比递增趋势OVERVIEW1Retro

18、spective and Looking Forward大数据与人工智能技术的回顾与展望录AsiaInfo Machine Learning PlatformAura 数据驱动型应用开发平台简介Data-Driven Application Use Cases数据驱动型应用示例Discussion问题与讨论通过用户历史访问行为, 给用户打上用户偏好标签, 标签颗粒度较粗且更新不 即时用户数字 内容211、用户个性化需求 如何满足:无法得 知感兴趣的地域性 实时事件?也不知 道去哪找合适的数 字内容(比如流量 消耗少、报道及分 析权威的新闻)2、用户与数字内容 如何适配:向哪些 用户推广即时发生

19、 的热点数字内容?现行做法做法及效果快速识别捕获热点内容:按地 域分为国际国内、省内、地市内容源多元化:自有基地、VGOP、定向爬取(如国际/国 内/地市的主流站点及APP)、 新建内容资源平台业务痛点针对即时发生的热点事件, 依据已沉淀的用户偏好标签 ,粗颗粒度选取目标用户, 进行短信push新闻链接四种方案综合运用:1) 基于数字内容分类标签和 用户相似度的协同算法模型;2)集团公司标签;3) 本地流量标签;4)基于业务经验的用户口径界定AI in Telco Use Case I数字内容智慧推荐324用户交互(用户点击 营销短信中网址)【精彩内容推荐】天后王菲隔空示爱神 曲出炉啦!快来点

20、击 http:/139/5fhxxj 免费欣赏神曲爱不可及。 中国移动含WAP链接的短信提示5时机匹配时间:大片上映前行为:曾在疑似影院基站区 域内逗留90分钟以上的客户策略匹配渠道:短信PUSH用户:喜好看电影且非电影院区域 内常驻用户和影院工作人员频次:每用户每月1次基于场景的数字内容运营16营销评估评估指标:点击比(点击用 户量占接触营销短信用户 量之比),点击量(点击用 户量),点击带来的流量进一步优化营销策略推送适配(短信PUSH)场景描述:喜好看电影曾 在疑似影院基站区域内逗 留90分钟以上的客户,在 大片上映前,推送客户关 注的电影相关内容营销短 信。场景: 基用户位置 及偏好的

21、数 字内容营销AI in Telco Use Case I数字内容智慧推荐l 过往月份是否有超套行为l 上月指标简单组合等于用户次月消费特征l 业务经验l 工单流程l 套餐饱和度l 全量指标对比,确保找到影响超套行l 上月指标预测用户次月消费特征l 业务经验+机器学习l 实时评估 为的关键因素00.20.4入网时长用户重点APP流量GPRS连接次数热点应用使用个数最不重要流量超套关键影响因素分析自动给出各档套餐/流量加油包筛选规则建议升档套餐 名称40元手机上 网流量包50元手机上 网流量包100元手机上 网流量包商丘3213人312人42人10人郑州11435人927人249人106人安阳3

22、906人226人52人15人新乡4343人308人57人23人许昌2616人191人41人11人2583人299人39人24人自动给出各档套餐/流量加油包目标用户建议 模式传统 模式AI in Telco Use Case II流量套餐/流量加油包智慧推荐现状:根据套餐饱和度及过往月份是否有超套行为进行推荐,可推荐的用户数少、准确率低。目标:基于全量指标对比和先进的特征选择、决策树等算法,找到影响超套行为的关键因素。即通过数据驱动,找出各档套餐/ 流量加油包的目标用户筛选规则,不再完全依靠业务经验。指标选取用户消费特征工具方法效果评估1推送适配(短信PUSH)324用户订购流量套餐尊敬的用户您

23、好,您当 前使用流浪网页消耗流 量过多,您本月剩余可 用流量不足,建议您订 购X元流量套餐,现在 订购还可参加“达量1G即赠1G”促销短信提示5时机匹配时间:非工作时间行为:用户通过手机终端 浏览器浏览网页且该网页 页面产生流量超过用户剩 余可用流量30%策略匹配渠道:短信PUSH月初生成流量套餐 潜在升档用户明细6营销评估活动参与率;流量套餐订 购率;模型预测准确率进一步优化营销策略场景描述:月初个性 化实时推荐流量套餐 平台已得到一批次月 潜在各档流量套餐升 档用户明细。注:非工作时间:周一至周五(18点20点)、周六、周日(8点20点)场 景 : 基于模型+时机触发AI in Telco

24、 Use Case II流量套餐/流量加油包智慧推荐背景说明终端引领一直是运营商很重要的用户发展手段,终端合约可以帮助运营商吸引客户、留住客户。因 此通过增加对终端合约的用户信用等级评估模型和潜在终端合约用户精确识别模型,可以帮助运营商找到 正确的终端合约潜在订购和续约用户,并向其进行准实时的PUSH营销,以此完成终端合约推荐,增加用 户粘性,提升客户保有和客户价值。应用目标结合标签体系的基础上,分析用户互联网行为,预测用户换机行为,挖掘终端类合约计划潜在订购和续 约用户,并向其进行准精准营销,增加用户粘性,提升客户保有和客户价值。AI in Telco Use Case III终端合约智能推

25、荐基础数据指标筛选预测识别模型匹配模型结果输出客户属性。 入网时长。 客户价值。近三个月用户拨打10010咨询合约信 息的次数。用户紧密通话圈终 端合约的个数。产品品牌。近三个月套餐使用 情况。近三个月查询终端 情况。近三个月用户使用 搜索引擎搜索终端 相关的次数决策树、逻辑回归训练潜在终端合约用户识别模型模型预测结果时间序列、 Logistic回归终端品牌价位匹配模型根据潜在更换 终端的用户群 显示用户偏好 的品牌及价位提取样本数据近三 个月的行为数据(基础信息、上网 行为、通话行为、 资费行为)通过数据清洗、数 据探索,结合指标 的相关性和重要性 进行指标筛选使用样本数据进行 终端合约识别

26、模型 的训练结合预测模型的用 户群进行终端品牌 及价位的偏好匹配AI in Telco Use Case III终端合约智能推荐分析思路:本次终端合约用户挖掘模型是基于全网的订购合约前的上网行为、通话行为等原子属性的分析终端合约用户 的关键特征,结合关键特征预测潜在更换终端的用户群。再根据终端合约包含的原子属性,将潜在更换终端用户进行终端匹配,为用户匹配用户可能偏好的终端品牌。深度学习应用基于Aura平台,我们实现视频图像大数据的智能分析和人脸识别,能快速发现、定位和识别特定目标,并进 一步与位置运营和智慧交通等大数据应用结合,可广泛应用于安防监控、刑侦和反恐等领域;像采 集、 增强、 解 码

27、、人脸识别车辆识别人物动作识别动作轨迹分析视频结构化公安、司法 刑侦破案 反恐维稳重点场所控制 电子证件管理交通、城市车辆违章 套牌车辆识别人流、车流统计政企 门禁 考勤设施运营管理优化应用系统架构IPC视频流分发 NVR/NN采集&摘要 调度器NNRTSPRTSPIPCIPC采集、摘要 DN采集、摘要 DN采集、摘要 DN实时画面Mysql NNHDFS DNTomcat NN实况查询点播结构化处理RTSP运动检测人脸识别 车辆识别 电子围栏 OCR行业应用智慧城市 智慧交通 智慧监狱 智慧安防Aura实时画面RTSP场景应用身份数据人流数据消费行为数据网络电子足迹客户定位智能推送习惯数据热门门店数据位置数据优化布局,运营设施使用情况数据拥堵数据人流数据个体行为数据位置数据交管数据智能交通人/车流疏导车流数据车型数据车辆数据驾驶员数据实时预警智能服务推送“大脑”访客系统行政管理员工出入记录姓名工号部门生日进门时间出门时间张三16789CIT-XXX-XXX1987-XX-XX2016/9/12 8:3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论