


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
【计算机论文】分析:人工智能如何深入人类情感世界
阿里云人工智能科学家闵万里4月8日,在《我是歌手》的第四季总决赛中,出现了一个不速之客,这就是扬言能预测歌王的阿里云人工智能机器人小Ai。总决赛开场前,小Ai预测黄致列夺冠概率第一,尽管最终的歌王是李玟,但小Ai成功预测了前三名。在了解阿里云人工智能机器人小Ai的基本运作过程后,钛媒体认为小Ai的算法其实已经不仅是深度学习,而是在深度学习之上的更高阶算法,并就此向阿里云人工智能科学院闵万里求证,得到的回复:是的。小Ai算法高阶在哪里?尽管阿里云方面没有透露关于小Ai更多算法方面的信息,只说小Ai主要基于神经网络、社会计算(socialcomputing)、情绪感知等原理工作,善于洞察本质和实时预测,并能理解人类情感。但是小Ai挑战歌王预测难点有三:首先,这是在7个歌手之间的混战,并非AlphaGo与李世石之间的两人对弈;其次,唱歌是情感理解加艺术欣赏,不同的唱法、变声、假声等无常法也无定论,现场演唱更是即兴创作;再次,最终结果是湖南卫视节目组、电视观众、500位大众评审、7位歌手共同创造的结果,其中充满了巨大的随机性。简单的理解,用于AlphaGo围棋对弈、语音识别、图像识别等的深度学习算法,主要解决的是单目标优化问题,而小Ai要挑战的本质上是多目标优化问题,这从根本上就“迫使”阿里云选择更高阶的算法。闵万里告诉钛媒体记者,小Ai本身是一个基于概率的决策优化过程,在决策过程中需要多组变量输入,其中的部分变量是通过深度学习优化得来。之前,小Ai的算法已经被阿里云成功用于浙江省交通厅的路况预测,而能解决城市管理和宏观经济问题的人工智能算法都属于多目标优化算法。西方已经在城市综合管理和宏观政策制定等领域长期采用了多目标优化算法,包括模拟退火算法、遗传算法等。闵万里向钛媒体称,小Ai并没有采用现成的多目标优化算法,而是自己开发的算法体系。小Ai之父闵万里那么,小Ai凭什么能够实现高阶算法呢?这必须要提到小Ai之父、阿里云人工智能科学院闵万里。14岁被中科大的少年班录取,闵万里19岁赴美攻读物理学硕士,2004年获得芝加哥大学统计学博士,先后在IBMWatson研究院及Google担任研究员,2013年加入阿里云负责人工智能项目小Ai。闵万里说在IBMWatson研究院的经历让他受益匪浅。IBM最早提出智慧城市战略,也是最早看到未来趋势。2005年,IBM把PC硬件业务卖给联想后,开始自己的转型。这个转型的过程,最缺的就是海量数据分析能力,因此补充了很多相关研究项目,包括海量数据分析、关键信息提取、预测建模、机器学习等,闵万里也借此接触了一线实战案例。之后到了Google,闵万里比较具体地负责移动端广告精准推送优化研究,主要是对海量数据进行研判,这其实已经非常接近今天小Ai要解决的问题了。移动端广告精准推送优化是互联网广告最核心的技术,需要通过大数据分析和机器学习等提升广告的精准推送,从而提高广告的点击率。移动端广告精准推送优化数据分析包括:研判用户当前上下文网页的内容;研判用户所在地理位置——驾车状态下推送短广告、饭馆里推送复杂广告;研判用户对于推送广告的喜爱程度等。这些都属于多情景变量下的实时决策问题,与小Ai要挑战的歌王预测场景极为类似。闵万里长期从事机器学习理论研究与应用算法研发,在脑电波(EEG)解析、高维数据挖掘、随机过程理论、时间序列分析、网络流理论等领域获得多项国际专利。他于2011年发表的道路交通流预测研究,是该领域全球五年来被引用次数最多的论文之一。2013年,有猎头找到闵万里,希望游说他加入阿里云。当时猎头说了一句话,中国有这样一家公司,数据总量比亚马逊、eBay、Paypal加起来还多。“这一句话就已经可以说明一切了,做大数据就要来阿里。”闵万里如此断然加入。小Ai的研发过程从2012年开始,阿里云研发了后来被称为“MaxCompute”的海量数据处理计算引擎,当时叫做ODPS,这是小Ai非常重要的计算基础设施。ODPS是阿里集团30多个事业部唯一的大数据处理平台,在2015世界SortBenchmark排序比赛中,ODPS用377秒完成了100TB的数据排序,打破了此前ApacheSpark创造的1406秒纪录,创造了4项世界纪录。如今,MaxCompute可在6小时内处理100PB数据、相当于1亿部高清电影。值得一提的是ODPS的实时计算系统StreamSQL,后来在阿里云数据加平台被称为“StreamCompute”,可日均处理万亿消息、PB级的数据以及千万级的每秒查询率QPS,适用于根据用户实时行为数据(浏览、成交、收藏等)调整推荐商品的实时推荐系统等。阿里云方面说,小Ai的学习速度是人类的1万倍,人类需要10万小时成为某一领域的专家,小Ai只需要10小时。这其实就是基于MaxCompute和StreamCompute等阿里云大数据分析的实战平台,“阿里云的大数据分析是经过了实战检验,这是与其它平台不一样的地方。”这个平台经历了阿里上万名工程师的实战,其中包括7次双十一的考验。在研发MaxCompute等计算平台的同时,阿里云人工智能小组还在开发深度学习、社交网络情感分析、语意分析、优化算法等人工智能算法体系。到2015年的时候,阿里云的人工智能算法在阿里各个业务场景下实现了成熟的应用,之后被抽象成通用的模块再嫁接到MaxCompute上。“所以阿里云的人工智能模块带有明确的可应用场景,不是闭门造车。也不是我们憋了4年,就为做这件事(挑战《我是歌手》)。这其实是在阿里整个业务生态中,慢慢成长起来的。”闵万里对钛媒体记者说。小Ai的算法体系阿里云于2012年就开始人工智能领域的技术研发和储备。在参加湖南卫视《我是歌手》比赛之前,小Ai已经积累了不少实战经验,比如帮助光伏电厂预估发电产能减少能耗、帮助水利监管部门预测水库水位以预防灾害发生、帮助金融机构客服人员接电话、帮助阿里音乐预测音乐黑马等等。小Ai团队除了工程师、科学家之外,还有多位阿里音乐和专业人士作为教练,学习了几百万首歌提升音乐品味和鉴赏能力。小Ai基于阿里音乐数据库,自动学习音频的重要特征后形成对歌曲的多维度评价,包括音高、能量、语谱、基频等,通过特征来训练小Ai对音频及受欢迎程度之间的关联性思维,不过目前小Ai还没有遍历韩文等外文歌曲。那么小Ai是如何现场预测比赛结果的?小Ai从历史赛事和海量资料中寻找影响比赛结果的变量因子,训练出一个实时动态模型进行预测,包括歌曲、歌手、粉丝、现场氛围、网友讨论等维度,每种维度都通过机器学习提取海量特征。这些特征有静态的,也有跟随比赛而动态变化的,需要现场实时计算。闵万里透露,小Ai眼里的歌手是无数标签的集合,比如李玟就有女歌手、70后、华裔、美国、偶像、性感、奥斯卡、R&B、Soul、粉丝量等标签。而现场影响评委喜好的因素非常多,小Ai需要找到这些影响因素的每一个信息变量,包括歌手演唱相关的曲风、流派、编曲、帮唱嘉宾、舞蹈、歌手颜值等现场热数据,以及场外的各种冷数据信息。再把这些信息通过一定逻辑叠加在一起,形成整体决策机制。总结来说,小Ai要做的是去观察一切可能影响投票结果的因子,整个过程是在全空间、连续、动态地场景中,“理解人类的喜好”、“洞察人类的思考”。与微软小冰的区别作为同样主打“情感算法”的微软小冰,闵万里表示微软小冰与人类的一问一答对话很容易带入上下文情境,之后就可以用语言学等相关的模型进行建模和分析。而小Ai要同时理解7个歌手的混战以及音乐欣赏等超越语言的内容,这是小Ai的不同之处。闵万里举例小Ai的算法难点,比如上一次的孙楠退赛完全出乎意料,小Ai也不可能预料到这样的事件,这对当时的模型训练造成了很大的困扰。在现场比赛的时候,什么状况都有可能发生,不管最后小Ai预测的结果如何,都是一次成功的尝试。此外,在商业模式方面,小Ai看起来也不如微软小冰有一个比较容易的商业化路线,现在微软正把小冰变成整个微软产品与服务的人工智能基础设施。与当前盛行的深度学习算法相比,小Ai的多目标优化算法似乎也难于看到一个清晰的商业化前景。对于商业化模式问题,闵万里说阿里有一个战略:Happiness(幸福)和Health(健康),也就是幸福指数与健康指数。小Ai的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 暑假绘画活动课件设计
- 2025玉柴职业技术学院辅导员考试试题及答案
- 2025绵阳城市学院辅导员考试试题及答案
- 2025福州外语外贸学院辅导员考试试题及答案
- 对外汉语课件设计框架
- 配合急救气管插管
- 推进爱国卫生七个专项行动
- T/ZBH 019-2021玻璃应力测量方法-激光偏振散射法
- 机器人学导论 课件 第5章-操作臂的控制方法
- 浙江宁波市北仑区 (开发区)招聘笔试题库2025
- 《装饰材料与施工》考试复习题库(含答案)
- 中小学生民法典主题班会-民法典宣讲课件
- 第一单元大单元教学设计(表格式) 2023-2024学年统编版语文八年级下册
- (正式版)SHT 3046-2024 石油化工立式圆筒形钢制焊接储罐设计规范
- 小学高段学生数学应用意识培养的实践研究 开题报告
- GB/T 17592-2024纺织品禁用偶氮染料的测定
- GA/T 2015-2023芬太尼类药物专用智能柜通用技术规范
- 唱片行业前景分析
- 新华DCS软件2.0版使用教程-文档资料
- 中职中国历史练习卷8
- 医美整形医院渠道合作协议样本
评论
0/150
提交评论