抽象思维与人工智能_第1页
抽象思维与人工智能_第2页
抽象思维与人工智能_第3页
抽象思维与人工智能_第4页
抽象思维与人工智能_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽象思维与人工智能第一节

抽象的定义与缘起抽象是一种以符号为特征的思维方法,根据Miller法则,人类注意力的极限只能同时集中注意力在7±2个事物上。在抽象思维中,人类脑细胞中出现的是物象的代理符号,所有的分析、判断和结论都体现在对事物的把握和对符号的运算上。人们将每一个需要思考的具体事物都抽象成被赋予了该事物所蕴含全部性质的概念,其名称就是这个事物的符号。我们是一个被称为智人的物种,大约诞生于20万年前的东非大裂谷一带,当时的人属(HOMO)有多个智力发达的物种,欧亚大陆西端盘踞着尼安德特人,更古老的直立人也早已抵达东亚和南洋。在尼安德特人的压制下,一望无际的撒哈拉-阿拉伯沙漠将智人困在非洲十几万年。智人第一次想要冲出非洲的时候还被尼安德特人打得狼狈回家。大约6万年前,智人开始制造先进的工具、创作欣赏优美的艺术,以更加精巧实用的语言和宗教缔造了庞大的社群,并能够进行紧密高效的大规模合作。相比口齿不清的尼安德特人,在远古种群聚落的对抗竞争中取得了极大优势。在大脑细胞能够进行抽象思维以前,必须要发明一定量的、代表各项事物概念的符号,巧合的是人类最早发明的、能够代表事物概念的符号正是语言。语言中的语音代表事物概念的声音符号,人类在用语言进行交流时所说的和所听到的,都是这样的声音符号。一个人在听到某个语音时,将听到的语音所代表的那个事物的信息保存在大脑中进行思维和判断,然后将判断的结果再用相应的语音说出来,而说出来的的语音,就是“判断”的语音符号。如果了解人类制作和使用符号的历史,就会发现人类语言最根本的是作用就是以一个简单具体的声音或符号去说明某一个更加复杂的内容。智人依靠“认知革命”获得了高度抽象的思维能力,在远古时代脱颖而出,成为今天硕果仅存的人类。人类学家们也普遍认同智人就是凭借抽象思维发展出来的语言沟通能力,利用精密发音能够快速准确地传递信息的语言这一独特的优势击败了人属中的其他同类。第二节

从开普勒到牛顿---论抽象的意义自然科学的任务在于探索、研究和揭示自然界的本质及其规律,丹麦天文学家第谷・布拉赫花了二十多年的功夫来观察行星运动,积累了大量的观测材料、具有丰富的实践经验。由于他长于感性观察而短于抽象分析,未能通过数据概括出行星运动的普遍规律。后来他的学生开普勒对老师积累的观察资料进行了全面分析和大胆抽象,从而发现行星沿椭园轨道运行,并提出了符合天体运动的内在联系和客观规律的开普勒三大定律。但这些定律仍然属于唯象理论,虽然可以精确预测天体的运行轨道,天体在特定时间的位置和速度,但无法给出天体运行规律原因的完美解释。在此基础上,科技界的大神牛顿通过引入“力”这个关键抽象概念,建立了基于力学三大定律的牛顿物理学体系,真正解释了天体运行规律背后的秘密,除了蕴含开普勒定律,还可以适用于动力学等其它更广泛领域。理论物理中的广义相对论的建立,也是先从理论进行突破,从而预言了引力波的存在,几十年后人类才真正才实现了观测。更加极端如曲面上的双曲度量,虽然理论上我们知道其存在性,但是它们无法等距嵌入到三维空间之中,因此在现实世界中,我们是无法直接观测到双曲曲面的。以上事实说明了这样一个道理,虽然观察和实验是科学发现的重要条件,但科学家的成果决非与他取得感性材料的多少成正比。只有依靠理性思维的帮助,才能揭示自然界更加深刻的本质。没有实践,就不能获得科学抽象赖以进行的感性材料,科学抽象就成为无米之炊;但科学抽象同时又是一个由概念、判断、推理、假说等等产生和形成的相对独立过程。科学工作者在研究过程中,仅仅通过简单的观察实践以及经验公式无法揭示深刻的自然规律。因此正确地认识科学抽象的作用、过程以及方法具有重大意义。创建超越经验常识的理论,一直是人类智力文化发展的主流。第三节

抽象的层次与思维三要素实际上,由于人脑对信息的处理能力是有限度的,如果信息量超过了人脑的处理能力,人就会失去对这个事物的理解把握能力。抽象层次越高,具体信息就越少,但是概括能力越强,表达能力越丰富,越容易理解。;反之,具体信息越丰富,结果越确定,但相应的概括能力越弱。抽象思维包括概念、判断和推理三种基本形式,其中概念是思维的细胞。在抽象思维中的对象和基础已经是代表事物概念的符号,因此思维的判断和结果也被用符号固定下来了。概念是人们对事物本质的认识,逻辑思维的最基本单元和形式。笛卡尔和莱布尼茨将概念的清晰度和分辨度称为是概念的特征,它是人们用于认识和掌握自然现象之网的纽结,是认识过程中的重要阶段。思维要正确地反映客观现实的辩证运动,概念就必须是辩证的,是主观性与客观性、特殊性与普遍性、抽象性与具体和发展以及概念间的相互依赖、对立和转化,是永恒运动的客观现实在人脑中的近似反映,因而存在着具有客观意义的概念辩证法。概念还必须是灵活的、往返流动的和相互转化的,是富有具体内容的、有不同规定的、多样性的统一。人类对真理的认识,是在一系列概念的形成中,在概念的不断更替和运动中,在一个概念向另一个概念的无数转化中实现的。德国工业标准将概念定义为一个“通过使用抽象化的方式从一群事物中提取出来的反应其共同特性的思维单位”。判断由概念组成,是在实践的基础上反映现实的结果。所作的肯定或否定符合客观实际,判断就是真的,否则就是假的。检验判断真假的唯一标准是社会实践。判断总是表现为句子,总是在关键的时候起作用。同一个判断可以用不同的句子来表示,同一个句子也可以表示不同的判断。推理由一个或几个已知的判断(前提),推导出一个未知的结论的思维过程。推理是研究人们思维形式及其规律和一些简单的逻辑方法的科学。其作用是从已知的知识得到未知的知识,特别是可以得到不可能通过感觉经验掌握的未知知识。其中演绎推理是从一般规律出发,运用逻辑证明或数学运算,得出特殊事实应遵循的规律,即从一般到特殊。而归纳推理是从许多个别的事物中概括出一般性概念、原则或结论,即从特殊到一般。第四节

形成人类抽象能力的物质基础人不仅有求知的本能,也有得到知识的能力。数学的基本概念都是人创造抽象出来的,这些基本概念可以分为对象概念和关系概念两类。那么人为什么能够进行抽象的呢?唯实论数学的几个学派的支持者都强调独立于经验的“直观”的作用,并且认为直观是认识数学的基础。那么人是否真的具有一种先验的、与思维有关的东西呢?现代生物学表明,人的基因和大脑确实具有一种与生俱来的、与思维有关的东西。基因储存了某一个生物物种的近40亿年的生存信息,由A、C、T、G四种碱基对组成的脱氧核糖核酸(DNA),就是一本由这四个字母按一定的规律排列而成的“天书”。DNA储存了合成该物种维持生命性状和生命活动所需蛋白质的全部信息,因此,人类的基因不仅储存了形成人体的生物信息,也提供了形成人的感觉器官、神经系统和大脑的信息,这就是人能够感觉和思维的物质基础,对子代而言,这个物质基础是先验的。现今所有的研究结果都表明人的心灵与人的身体是不可分割的,也就是说人的心灵并不是一个空白无物的白板,而是一个功能齐全的分析器,不仅具有信息的储存功能,也具有信息的分析和判断功能。一门新兴的、被称为“表观遗传学”的学科的研究表明,虽然基因这个物质基础是存在的,但必须在适当的时间给基因一定的刺激,否则基因不能得到充分表达。如果一个人8岁之前不练习说话,那么他以后说话就会不流畅,如果没有在适当的时机对于生存的基因(寻找食物和自我保护)给予适当的刺激,就会使得它们丧失了在自然环境中自我生存的能力。直观能力的存在是先天的,随着经验的积累与不间断地观察、思考、判断的过程中其功能是可能逐渐加强的。不管是感性经验的刺激还是基于逻辑的抽象思维过程都是一种经验,而一个好的直观能力的养成也依赖于经验,如果把这个能力应用于事物的抽象,就形成了抽象能力,因此抽象能力的养成也是依赖经验的。计算机技术的飞速发展让人们感觉到信息科学与技术的强大威力,可是这个威力与人的认知相比还是微不足道的。第五节

守望相助的思维和语言思维和语言是人类反映现实的意识形式中两个互相联系的方面,它们的统一构成人类所特有的语言思维形式。思维是人脑的机能,是对外部现实的反映,是人类处理行为任务的心理过程;语言则是实现思维、巩固和传达思维成果/思想以及交流沟通的有力工具。思维和语言的关系是相互依存、相互促进的。从历史上看,思维的发展推动了语言的发展,语言的进步又促进思维的发展。但是,思维和语言又都有各自的相对独立性和特殊规律。思维”是一个日常语境下常用的词,正是因为其常用,所以它的含义就很模糊,无法精确化的定义。让我们从日常用法出发,看看“思维”这个概念的含义。这里我们可以总结一下一些思维的日常用法。人们通常认为,思维是需要花时间的,在解决复杂任务时会用到的,有一定程序性和系统性的,常常是外显而不是内隐的,最重要的是,思维过程被认为是可以用语言(狭义)表述的。当然“思维”有时候也在一个相当广的含义上使用,任何涉及大脑的过程都被看作是思维,我们甚至还有“无意识思维”、“直觉思维”、“图像空间思维”等等概念。语言除了是思维工具以外还是一种沟通工具。当然数学、逻辑等人工语言其发明最初就是被当作思维工具而不是沟通工具来使用的。自然语言更适合用“发生”而不是“发明”作为谓述。动物有时候被认为是可以思维,有时候被认为不可以思维。人类和其他生物都有认知能力(这里不建议用“思维”这个词),但只有人类有语言,语言是思维的物质外壳,但语言的外壳又总是包含着思维的内容。人类的思维发展,经过了直接行为思维、具体形象思维、抽象思维、逻辑思维等几个主要的阶段,而语言的发展正是这几个阶段的直接反映。象形字、甲骨文、词意表达、词语的形成、语法构造等,都在不同程度受思维形式发展的制约。思维的发生是人类语言形成的动机、基础和必然结果,而语言是思维的工具。GPT-3等语言模型所表现出来的诸如虚构故事、开发程序代码、编写商业备忘录、总结文本等广泛而强大的能力,让我们对此有了更加直观的理解。第六节

从深度学习到深度抽象人工智能技术的发展,本来应该比其他专业科学更具有参照系发展的优势,但很遗憾走的却是两眼一抹黑的茫然试错之路。事实上,人的智慧或者智能等级可以表现为模仿言行、会用知识、会联想、会分析提炼抽象、追求规律,验证真理、积累真知,形成知识体系以指导实践、预见趋势、传播理论这9个级别,分别对应着不同的人群。由于深度学习的突飞猛进,当前AI的发展已经进入了分析提炼抽象这个智能阶段,它是建立在能够对复杂关系实现梳理的能力之上,以会联想为基础前提,同时还必须拥有大量的知识或应用数据。其实现的关键标志是能够做到持续简化判断,或者具有所谓的自我提高决策水平的能力。对人类来说,这个阶段追求的是建立独立的认识和总结。这个阶梯很可能会成为人工智能发展的又一个难以跨越的关口,原因就在于,此时机器对人类智能的模仿,已经从具象思维或者叫形象思维,转向抽象思维,并将不可避免地会遇到模仿人类抽象思维中的深度抽象难题。就人类自身来说,很多人一辈子的智能和学习能力都停留在这个阶段。因为进入这个阶梯以后,人类的感官和意识不能经常的对比联系,在涉及深度抽象对象的时候,认知也开始脱离实际的对照,无法得到直观的检验标准。我们的先贤们也因此而发展出唯心主义者,唯物主义者等等大量形而上的哲学思想。但想要实现强人工智能,就无法回避抽象思维特别是深度抽象思维的模仿。如果机器无法逾越纯抽象判断或者概念的掌握与运用,就是无法实现自我独立意志,无法进一步让机器具有接近人类的智能。当然,如果不追求机器的独立意志,那么机器还是可以依赖人工适当的干预而进入下面几个智能阶梯,并实现弱化版本的更高级人工智能。抽象思维仍然是当代计算机智能的最大一块短板,或者说,目前科学家们还未能找到进入人类高级智能的大门。革命导师恩格斯说:“劳动创造了人”,那么推广到人工智能领域更合适的说法也许就是“任务塑造了智能”,因为人的各种感知和行为,时时刻刻都是被任务驱动的。第七节

如何比较AI智能与人类智能统计学里最重要的理论叫“VC维”理论,所有的统计学习或者机器学习都是建筑在这个理论之上的。它的主要结论就是如果一个机器模型的VC维越高,那它就会越强。无论人的智能还是机器的智能,都可以在这个框架下来比较。这样我们就可以真正的有理论依据的去比较,到底是机器聪明还是人聪明?牛顿是一个物理学的业务专家,他基于很多物理的自然现象,最后总结出物理学的三条业务规则,来刻画物理整个存在的现象。如果让机器干牛顿的事,其实就是要让机器收集大量物理学现象数据,最后用机器学习的方式,在数据里总结出规律。但是机器通常不会像牛顿那样总结出三条规律,因为机器更擅长的不是总结三条,机器不知疲倦地可以总结出3000万,甚至1亿以上的规律。如果机器做牛顿的事,他会把整个自然现象按照速度分成3000万个区间。然后在每一个区间里总结出三条定律。大家都知道牛顿的三大定律,最后得到的反例是在高速区间上不成立。但是如果说机器把它分得足够的细,把低速、高速都考虑了,实际上我们在高速里面总结出的三条定律,和低速是不一样的,就能够做得比人更好。科学家的研究实践表明,在数据充足的情况下,1000万维是衡量机器与人谁更聪明的分水岭。很多情况下,我们能写出业务规则的数量,或者模型VC维的数量,其实和数据量几乎成正比。比方说有一些医疗领域的罕见病我们只能找到100个病人,那这时候我们用机器,可能只能写出100条业务规则。在这个场景下,机器的表现就远不如人。我们确实会面临一些困惑,机器在某些领域会超过人。又过一段时间,发现在另一个场景下,机器比人又差,这是因为人工智能在不同领域所面临的环境是不一样的。2011年的图灵奖的获得者Valiant,他得奖的PAC模型算法主要就是讲规则数或者模型的维度,要和数据量相匹配。也就是说你有多少的数据,就能做多大的模型,数据量越大,能做出的模型越大,结果也就越准确。所以在机器学习中我们收集大量的过程数据就是为了支撑我们做出更好的模型。第八节

人机交互中相互理解的必要条件两个人之间的交流至少要表达五个脑袋minds:我知道的东西、你知道的东西、我知道你知道的东西、你知道我知道的东西以及我们共同知道的东西。人与动物的内心世界反映的外部世界,同时会受到动机任务的影响和扭曲。智能的暗物质,已经属于感知与认知的结合了。而智能研究的未来就是GoDark,BeyondDeep---发掘暗,超越深。MIT认知科学系的科学家们发现人的大脑皮层有一个专门的区,用于感受、推理到别人的想法,包括Ta看到什么了?知道什么了?什么时候知道的?Ta现在在关注什么?这是当前的正在执行的任务。Ta的意图是什么?后面想干什么?预判未来的目的和动机。Ta喜欢什么?有什么价值函数?为了解决这些天量的计算问题,加州大学洛杉矶分校UCLA统计学和计算机科学朱松纯教授提出来的STC-AOG(时空因果的概率与或图)模型是一个合适的智能体知识总体表达与计算的平台。在这个计算模型中,我们看到的眼前每一个例子都是由STC-AOG导出来的时空因果解译图STC-PG。时空因果的概率“与或图”STC-AOG具备表现一个人总的知识,而他对当前时空的一个表达,是一个STC-PG解译图。计算机视觉用它,语言肯定也用它;认知是它,机器人任务规划也是它。如下图,当前的情景situation,由蓝色三角形表示。当前的情况是什么,这也是一个解,表示视觉在0-t时间段之间对这个场景的理解的一个解译图。意向与动作规划图,由上图的绿色三角形表示。这也是一个层次化的解译图,预判他下面还会做什么事情,当前的注意力,由上图的红色三角形表示。描述他正在关注什么。上面说的这个表达,是机器人对某个人内心状态的一个估计,这个估计有一个后验概率,不同的人观察某个人,可能估计都不一样,存在不确定性。假设在一个有N个机器人或者人共同生活的场景里,每个人都有对别人的一个估计,这就有Nx(N-1)个minds表达。我知道你在想什么,你知道我在想什么,这至少是平方级的。你有一百个朋友的话,哪个朋友他脑袋里想什么你心里都有数。关系越近,理解也就越深,越准确。当然,我们这里只是做一阶推理,在复杂、对抗的环境中,人们还不得不用多阶的表达。第九节

如何帮助AI主动创造抽象概念智能是一种现象,表现在个体和社会群体的行为过程中。智能系统的根源可以追溯到物理环境客观的现实与因果链条两个基本前提条件。在不同的环境条件下,智能的形式是不一样的,比如鹦鹉与乌鸦就有很大区别。智能物种都拥有与生俱来的生物进化刚需任务与价值链条,因此任何高智能的机器也都必须理解物理世界及其因果链条以适应这个世界。动物的行为都是被各种任务驱动的,任务代表了价值观和决策函数,这些价值函数很多在进化过程中就已经形成了,包括人脑中发现的各种化学成分的奖惩调制,如多巴胺(快乐)、血清素(痛苦)、乙酰胆碱(焦虑、不确定性)、去甲肾上腺素(新奇、兴奋)等。要构造一个智能系统,如机器人或者游戏环境中的虚拟的人物,我们先给他们定义好身体的基本行动的功能,再定一个模型的空间(包括价值函数)。其实,生物的基因也就只给了每个智能的个体这两点。然后,它就降临在某个环境和社会群体之中,就应该自主地生存。我们人脑时刻都在改变之中,模型的空间通过价值函数、决策函数、感知、认知、任务计划等来表达。通俗来说,一个脑模型就是世界观、人生观、价值观的一个数学的表达。这个空间的复杂度决定了个体的智商和成就。有了这个先天的基本条件(设计)后,下一个重要问题就是什么驱动了模型在空间中的运动、学习的过程?首先是外来的数据,外部世界通过各种感知信号,传递到人脑,塑造我们的模型。观察的数据一般用于学习各种统计模型,这种模型就是某种时间和空间的联合分布,也就是统计的关联与相关性。实践的数据用于学习各种因果模型,将行为与结果联系在一起。其次是由内在的价值函数驱动的行为、以期达到某种目的。我们的价值函数是在生物进化过程中形成的。因为任务的不同,我们往往对环境中有些变量非常敏感,而对其它一些变量不关心,由此形成不同的模型。人脑和机器脑都可以看成一个模型。任何一个模型由数据与任务来共同塑造。人工智能的发展,需要进入一个“小数据、大任务范式,那么,如何定义大量的任务?人所感兴趣的任务有多少,是个什么空间结构?这个问题,心理和认知科学一直说不清楚,写不下来。这是人工智能发展的一个巨大挑战。第十节

寻找生命的基础算法2010年图灵奖获得者,哈佛大学的计算机科学家莱斯利·瓦伦特(LeslieValiant)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论