从大数据认知谈起(共7页)_第1页
从大数据认知谈起(共7页)_第2页
从大数据认知谈起(共7页)_第3页
从大数据认知谈起(共7页)_第4页
从大数据认知谈起(共7页)_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、院士痛批人形机器人:搞个“杨贵妃”在家(ziji)还不如林志玲语音导航原创(yun chun)2015-12-15翔snowman HYPERLINK javascript:void(0); 科技(kj)茱比莉Jubilee“搞个”杨贵妃”在家还不如林志玲语音导航”这是什么语境下的调侃?中国工程院院士、中国人工智能学会理事长李德毅在几天前的IBM中国研究院20周年活动上,以“从大数据认知谈起”为演讲题目,将生命科学中的脑认知与计算机科学中的人工智能跨界结合,给出了很多创新的建议和奇思妙想。当他谈到认知时代的展望时,期望以2014年图灵奖获得者Michael Stonebraker的论文“One

2、 Size Fits All”中的观点来构建机器认知脑,即面对大数据时代应该先“构建特定负载、面向特定目标的系统”。他表示,当千千万万的特定问题域的认知能力局部形式化之后,用人工智能技术可以构建千千万万个特定的机器认知脑,并通过移动互联网、云计算和大数据,是否可以倒逼出一个人造生物脑呢?此时,李德毅院士话锋一转:“社会上很多人都在做人形机器人,我非常着急,这是浪费,你做个“杨贵妃”放在家里,还不如林志玲语音导航认知能力好,我们要把精力放在机器人的认知能力上。”这是精辟点穴的调侃,情急之下的痛批,还是对资源浪费的痛心?总之,机器人在李德毅院士眼中更注重的应该是人工智能,而不是那些哗众取宠的人形外

3、观。同时,李德毅院士在跨界研究脑认知和人工智能后认为,长期以来脑科学研究和人工智能研究是两大科学问题,犹如两天平行线没有交集。然而,一旦碳基的生物脑和硅基的电子脑形成“杂交优势”,将会势不可挡。他还给出了各种全新的思考角度,比如:深度学习吸收了云计算和大数据的红利,大数据认知本质上是互联网时代的群体认知。大数据认知的方法学应该是:实践中的研究可能胜过研究中的实践,由下而上可能要胜过由上而下,数据可能胜过程序,记忆可能胜过计算,价值可能胜过知识,关联可能胜过因果,交叉学科可能胜过传统学科,要更多关注跨界的小众,众多的小众才构成大众。脑认知的本质等同于大数据认知,脑认知的核心是记忆不是计算。记忆不

4、等于存储,感知不等于认知。认知计算也许只有一种算法:相似计算。人的重要特点就是选择性模型,视听学认知计算(j sun)的科学问题,就是选择性注意的功能性记忆。此外,他还对脑科学和人工智能交叉研究载体提出了四个方向(fngxing)的建议:1,利用大数据模拟从正常认知到认知障碍:机器人如何自闭、抑郁(yy)和痴呆?2,利用大数据模拟从认知障碍到正常认知:老年痴呆机器人如何延缓痴呆?3,如何植入生物记忆芯片扩大人的记忆能力?4,可穿戴设备如何提高人的认知能力?以下是李德毅院士的演讲要点与PPT:一位图灵奖获得者的话值得深思:人类走过了几千年的实验科学,几百年的理论科学,几十年的计算科学,现在迎来了

5、数据密集型科学的新时代。我认为,大数据本身既不是科学也不是技术,它仅仅是网络时代的一种客观存在。各行各业的大数据迅速增长,是用传统工具难以认知的、具有更大挑战的数据。今年IEEE国际数据工程大会最大的亮点,是将10年最佳论文授予2014年图灵奖获得者Michael Stonebraker的论文“One Size Fits All”。论文回答了大数据时代的一个基本问题:“是继续构建通用数据库系统,还是构建特定负载、面向特定目标的系统?”作者支持后者。那么,这样一个认知系统怎么构建?我认为当前已经做了一点探索,比如深度学习吸收了云计算和大数据的红利,大数据认知本质上是互联网时代的群体认知。从大数据

6、成功运用于自然语言理解,语音产业、机器翻译和图像识别,人脸识别,我在反思当年五代机的失败。今天并没有出现一个五代机设想的新机器,只有互联网或者移动互联网,为什么却成功了?少做研究中的实践,多做实践中的研究,这就是反思。因此,大数据认知的方法学应该是:实践中的研究可能胜过研究中的实践,由下而上可能要胜过由上而下,数据可能胜过程序,记忆可能胜过计算,价值可能胜过知识,关联可能胜过因果,交叉学科可能胜过传统学科,要更多关注跨界的小众,众多的小众才构成大众。1脑认知长久以来,脑科学(kxu)跟人工智能一直(yzh)是两条平行线,互不交叉。其实,脑认知的本质等同于大数据认知。人脑对客观世界的认知不是一次

7、完成的,需要多次反复。人脑需要在丰富的感知、认知、行动过程中,从大数据中形成相对稳定的认知,形成不确定性中的基本确定性。因此,脑认知是动态(dngti)演化的过程,本质是大数据认知,是统计认知。认知神经性形式化的多尺度描述:从基因到蛋白质,叫微观尺度;脑区域和脑器官和认知行为叫宏观尺度;中间叫结构尺度。按照这个尺度可以划分奥巴马2013年提出“脑计划”的几个脑科学内容。我认为脑认知包括三部分:记忆认知,计算认知和交互认知。2记忆认知记忆认识是脑认知的核心。1,脑认知的核心是记忆不是计算。比如中国最强大脑节目,一个记忆力好,一个计算能力快,哪个更聪明?我想一定是记忆好的更聪明,因为他连算都没算就

8、可以给出答案。记忆是依靠经验获得认知,匹配问题提取答案。2,图灵在几十年前就给了我们重要的启示(qsh),他说“遗忘也是人类智能的显著表现。”为维护脑的正常认知需要积极遗忘,抑制记忆,遗忘不可或缺,否则不堪重负。3,脑认知的记忆分为瞬间记忆、功能记忆和长期记忆。记忆的时间(shjin)特性各不相同,形成记忆的动态演化过程。这里(zhl)又有两点需要强调:1,记忆不等于存储。记忆不是简单的存储,伴随有取舍,取舍的过程就是计算、简约或抽象,记忆和计算同时发生。通常时间越长丢失信息越多,记忆常常有联想和搜索,联想和搜索也是计算。无论语言记忆还是图像记忆,本质上都是统计记忆。可以把语言记忆视为图像记忆

9、的语义标注,越是长期的、大量的、反复的越难遗忘。也有一次性少量的难忘的记忆,比如初恋,但不会多。这个工作太重要,现在做智能测序基本上都会应用。2,感知不等于认知。看到和认出迎面而来的人,代表不同的脑神经功能回路,大脑很多部位都参与了对容貌影像的信息处理。成人脑中有记忆功能的大脑皮层大约有2200平方厘米。这就是为什么全世界为什么做爱因斯坦大脑,因为这个天才的记忆力特别强,他的记忆组织和常人不一样。所以,我想推荐大家三个公式:看到不等于看见,接触不等于感觉,听到不等于听见。因为我完全可以视而不见,熟视无睹。长期记忆是功能记忆的反应抽象,记忆内容的力度不同,时间越长越宏观。我现在71岁,到医院检查

10、老年痴呆?医生会问一个问题,“文革和抗日哪个在前哪个在后?”很简单的问题,但对于老年痴呆症患者就说不清楚。所以我画了一个综合图,就是长期记忆、瞬间记忆和功能记忆之间的关系。理解和计算是什么关系?前馈和反馈是什么关系?归纳和检验是什么关系?3计算认知脑认知(rn zh)也是计算认知。概念(ginin)、判断、推理的形成过程,就是思维的过程,是对多感知信息的觉悟,即计算认知。计算认知是对语言和图像的处理加工,当前感知常常要和记忆中已有的认知相互作用,从感知到认知是抽象,从认知到感知是演绎。这里(zhl)我大胆说一句话,认知计算也许只有一种算法:相似计算。4交互认知交互是脑认知的重要形态。脑认知的一

11、个重要特点就是脑不同区域、不同粒度认知可以在脑神经网络里面,在不同图谱结构形式上往返跳跃、并行处理。大脑皮层中形成的知识积累是长期记忆;海马体当前形成的学习思维问题叫结构记忆;视觉神经中残留的感觉和观察,是瞬间记忆。三者力度不同,也可同时发生交互和关联,不同尺度之间灵活转换。在选择性记忆过程中,前馈的视觉感知刺激视觉驱动,反馈的脑记忆认知视图也刺激驱动,这两个驱动相互作用,形成基于视知觉组织的选择性注意模型。人的重要特点就是选择性模型,我在基金委的项目里面曾经说一句话,视听学认知计算的科学问题,就是选择性注意的功能性记忆。交互认知具有二重性。脑认知的一个重要特点是人脑通过感知和外界交互,通过视

12、觉、听觉、触觉、味觉、嗅觉单模态或者多模态的交互,在交互过程中和其他自然人,机器人,外部世界互动,尤其是理解自然人的表情、意愿、动作等,相互启发、学习、交互的结果使得认知更准确,自己更聪明。这种交互我们有时候叫沟通,有时候叫情商。这种交互很重要,如果没有这样的交互知识,自身难以获得这样的认知。所以,脑认知的坐标系是心理物理学定律。1850年建立了韦伯-费希纳定律:人对外界的一切感觉都是与感觉的强度对数成对比。5机器人认知,认知物理学方法刚才讲的是脑科学的主要成果,现在拿到人工智能里面叫做(jiozu)机器人认知。脑认知的物理学方法,以物理学为基础(jch)的神经成像技术,如核磁共振、脑电图、扫

13、描、信号分析等使得人不用开颅就可以认识大脑。用什么样的物理学方法形式化?尤其是在信号级、符号级、语义级或行为级形式化,人类(rnli)尚不清楚。多年前,我提出用云模型来填补数据与语义之间的鸿沟,创建了定性概念与定量数据双向转换的认知模型,概念的内涵是模型的核,用期望、熵和超熵表示,围绕核云生成的云滴是概念的外延,具有不确定性,表示神经元、连接组、结合子或者智能体的离散型、构造了云模型、云推理、云控制、云进化、云水印、云变换等方法和工具。下面我来讲讲冯诺伊曼计算机的局限性。以图灵模型构造的冯诺伊曼计算机充其量只具有计算智能。计算机的架构中、计算、存储和交互互相分离,导致内存不同区域的数据频繁访问

14、,以及硬盘和内存数据间频繁的访问,成为计算机功耗大的根本原因。而脑认知的构成单元,尤其是视觉神经通路,每层都应该同时具有记忆智能,计算智能和交互智能,大大降低能耗。我对脑科学和人工智能交叉研究载体的建议是以下四个方面:1,利用大数据模拟从正常认知到认知障碍:机器人如何自闭、抑郁和痴呆?2,利用大数据模拟从认知障碍到正常(zhngchng)认知:老年痴呆机器人如何延缓痴呆?3,如何(rh)植入生物记忆芯片扩大人的记忆能力?,4,可穿戴设备如何提高人的认知(rn zh)能力?6认知时代展望展望一,大数据认知的方法学启发我们,脑认知是生物属性和社会属性、先天属性和后天属性相互结合面产生的整合性认知过

15、程。研究生物脑在认知过程中的成长与进化,可称为脑认知正向工程,如认知神经学方法。它有利于脑疾病的治疗;而从脑认知的社会属性研究脑进化,可称为脑认知的逆向工程,如认知物理学方法。它有利于形成机器人认知的形式化约束,完成机器人认知的架构设计和实现。我现在对此乐此不疲。展望二,如果人脑特定问题域的认知能力可以先局部地形式化,哪怕在微观上不具有组织结构的相似性,例如驾驶、栽培、聊天等,当千千万万的特定问题域的认知能力局部形式化之后,用人工智能技术构建特定千千万万个机器认知脑,并通过移动互联网、云计算和大数据,是否可以倒逼并逼近个人造生物脑呢?看到我们社会上很多人都在做人形机器人,我非常着急。这是浪费,你做个“杨贵妃”放在家里,还不如林志玲语音导航认知能力好,我们要把精力放在认知能力上,不要那种所谓的外观人形。展望三,凡悠久强大的学科,如生命科学和物理学,一定都是很有个性的学科,学科壁垒森严,存在“生殖隔离”现象。长期以来脑科学研究和人工智能研究是两大科学问题,犹如两天平行线,没有实质性的交流就是证明。然而,一旦碳基的生物脑和硅基的电子脑形成“杂交优势”,将会势不可挡。展望四,在我们的星球上,机器曾经是人类的工具,而今要迎来机器人“新人类”的时代,他们作为人类的伙伴,给人类带

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论