论信息革命与人类文明进程_第1页
论信息革命与人类文明进程_第2页
论信息革命与人类文明进程_第3页
论信息革命与人类文明进程_第4页
论信息革命与人类文明进程_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

论信息革命与人类文明进程

一、语音是语言的学表现工作创造了人,创造了人使用的语言。一方面,人在劳动中要求紧密合作,彼此了解,产生了对作为交往手段的语言的需要;另一方面,劳动中需要交流信息,又促进了人类发音器官的进化,使人可以自由地运用肺部、声带、以及口(鼻)腔发出复杂多样而清晰响亮的声音,从而在生理上为语言的产生准备了足够的声音材料。同时,劳动也促使人类大脑的神经系统逐渐发达起来,从而促进了思维的产生和发展,形成了语言的意义要素。有了产生语言的社会需要,又有了抽象思维的物质基础——人类高度发达的大脑,以及足够的声音材料作为抽象思维的物质承担者,人类的祖先就把他们从劳动中获得的丰富的感性认识不断地上升为概念,并用一定的声音形式表现出来。这样,语言和思维就产生了,猿人也就变成了真正的人。人类创造了语言,语言也就成了人类的表征,成了人类进行交际与传播的工具,也成了人类认识世界和改造世界的有力武器。语言在人类社会发展中所起的作用是不言而喻的。语言作为一种特殊的社会现象,与社会相互依存,是人类最重要的交际工具,也是人类创造且记载几千年的文明史的根本手段。因为有了语言,人类个体的经验才能得以交流,为社会成员所共享;人类的知识也才能实现代际传授,成为世代相传的精神财富。更为重要的是,语言还从行为到心理对人类进行了全面“武装”,使人类在与其他物种的竞争中永立不败之地,成为人类加速进化的“核能”。所以说,没有语言就无法形成人类社会,没有语言也难有现今的人类文明。语言还是人类进行思维的一种依托,与人的智力活动密切相关,与文化和社会的进步紧密相连,具有最大的信息容量和最高的智力水平。语音是语言的声学表现,即语言信息的载体。语音作为声音和意义的结合体,一方面具有表义功能,语音中除包含实际发音内容的语言信息外,还包括发音者喜怒哀乐等各种信息;另一方面,语音又具有声音的物理属性,不同的音具有各自不同的音质、音高、音强和音长。语音起着进行信息交换的基本作用,这种作用不仅表现在人与人之间,在科技高度发达的今天还表现在人与机器的信息交流上,而且随着科技的进步后者的作用还会进一步凸现。二、语音产生与感知的科学机理人类来自自然,又是自然界中较之于其他动物而言更为重要的特殊组成部分。这一点恩格斯为我们进行了十分精辟的概括:“我们连同我们的肉、血和头脑都是属于自然界,存在于自然界的;我们对自然界的整个统治,都在于我们比其他一切动物强,能够认识和运用自然规律。”人类对自然界的认识,首先是从认识物质的形态开始的,而每种物质形态都有自己的独特结构,并由此决定其特有的功能。人们对于语音的研究也是通过认识人类的发音器官(包括肺、气管、喉、咽、鼻和口等)及听觉器官(耳)等的生理构造开始的,在此基础上才能认识人类语音产生与感知的基本原理。物体只有在运动中才显示出其区别于其它物质的独特属性,因此,只有在物体的相互关系中,在物体的运动中观察物体,才能认识物体。事实上,人类的语音同样也是由人体发音器官在大脑控制下的生理运动产生的。所以,只有通过研究包括脑活动在内的发音器官动作特性和相关的声学信息以及语音的感知过程,才能揭示出语音产生与感知的科学机理。应该承认,人们在认识自然、改造自然的实践活动中,单纯依赖人体器官本身所具有的功能,是远难以达到科学地认识和改造世界的目的的。因此,人类为了克服自身器官在认知能力方面的明显不足与局限,便逐渐制造和使用某些科学仪器,并借助这些仪器研究自然事物的性质和规律。1895年x射线发现不到两年就用于语音研究,第一次看到了发元音时的真实口腔形态。随着现代科学技术的发展,科学仪器在科学认识活动中的作用日趋重要且日益多样化。如,利用视频录像、计算机断层照相和x光微光束等设备,来研究发音器官动作特性。利用核磁共振成像技术观察大脑血流分布的变化,来研究言语产生和感知时大脑的活动等等。由此导致了专门利用各种生理医学实验检查设备,测量发音器官各环节的生理性(力学的、形态学的)的“现代实验语音学”的产生和发展。建立言语产生各环节的模型,并利用模型去设计合成器(如发音器官合成器、各类参数合成器等),通过将合成器输出语音与真实语音进行比较,来检验模型的合理性。随着研究手段的迅速改进——由单纯地靠人的观察、听辨和推断,到使用仪器设备测试乃至用计算机分析,人们对语音产生的机理认识也随之更为深入与系统。伴随着人类对自然的认识与改造,人类自身也在不断地得到认识与改造。在此过程中人类自身是认识主体(人类认识它物)与认识客体(人类自身作为科学的认识对象)的辩证统一体。事实上,包括自然学科和社会科学在内的若干学科都是以人为研究对象的,只是研究的视角不同而已。人对包括自身的自然界认识得越深入,就越有能力改造世界、争得自由。如人类在较为深入地研究语音产生的机理的基础上所建立的语音生成模型,便被广泛地应用于语音识别(计算机把声音变成文字,相当于人耳的功能)和语音合成(计算机把文字变成声音,相当于嘴巴的功能)等领域,从而通过科学技术实现了自身听、说、读、写等潜能的外在化与扩展化,也因此使得人类对于自身和环境的改造能够做到既快速又广泛。同时,在了解发音、听觉器官的构造及其机理的基础上,发明的人工颚和人工电子耳等器官,也给有发音和有听力障碍的残疾者提供了极大帮助。有研究表明,聋哑人失去语言能力会对他的思维能力的发展产生严重的消极影响。因此,帮助聋哑人获得发音和听觉能力,有助于促进他们心智的健康发展。例如,著名的英国物理学家、人称当代爱因斯坦的霍金教授,就是依靠语音合成机器与其他人进行交流的。然而,由于认识对象的复杂性,人类的认识过程还会受到实践能力和认识水平的限制。如一个完整的语音交流过程总是涉及到听和说两个方面。对于听觉系统的复杂结构与信息处理过程,现代科学虽已有所揭示,但对其所涉及的实质性问题还远未完全掌握。再如,对于大脑是如何存储语言信息以及如何识别语音、理解语意等问题,目前的认识还更为肤浅。不过可以预言,随着科技的发展与进步,以及人类实践活动的深入,人类对于自身的认识必将越来越深入与全面。三、应用发展迅速“沃森先生,请立即过来,我需要帮助!”这是1876年3月10日贝尔通过电话成功传出的第一句话,电话从此诞生了,语音处理研究的历史也从此拉开了序幕。电话的发明与19世纪日臻完善的经典物理学理论密切相关,它采用声电、电声转换技术实现了远距离语音通信,实则是人类听觉器官的延长。电话的“波形原则”——尽可能不失真地传送语音波形(常称作“波形编码”),曾经在语音通信领域中长期占据着主导地位。直到1936年产生了一种概念全新的语音通信技术——通道声码器技术。这种声码器打破语音信号的内部结构,使之解体,提取承载信息的参数加以传输,在接收端重新合成语音(即所谓“参数编码”)。这一技术奠定了语音产生模型的基本思想,在语音信号处理领域具有划时代的意义。随后又出现了一种将“波形编码”和“参数编码”技术相结合的编码方案——“混合编码”,这种方案在保留参数编码技术精华的基础上,引用波形编码准则去优化激励源信号,从而可以在较低的数码率上获得较高质量的合成语音。“混合编码”技术近年来发展十分迅速,且已在移动通信等领域得到了广泛应用。除语音压缩编码外,语音处理技术还包括语音识别、说话人识别、语音合成、语音增强和语音理解等几大分支。借助于先进的信息处理理论、技术与工具,语音处理的各个研究领域都已有了突飞猛进的发展。1946年世界上第一台计算机的诞生及其快速发展,为语音信息的自动化处理提供了硬、软件技术支持。从此,语音信号处理技术进入飞速发展时期。一方面,语音识别等的研制采用计算机模拟实验,取代了硬件研制的传统做法,大大加快了方法研究的进展。另一方面,为了使计算机的界面与人更加“友好”,又促使人们开发、使用起最方便最自然的人机语音对话界面。同时,随着计算机的网络化,也出现新的语音通信方式——IP电话。IP电话始于在因特网上从PC到PC的电话,随后发展到通过网关把因特网与传统电话网联系起来,实现从普通电话机通过IP网络传输到普通电话机的IP电话,以及普通电话机与IP互通的IP电话。20世纪以来,把多门科学和技术综合起来来研究同一客体日益成为科研发展的重要形式。这样便不可避免地产生了诸多交叉学科、横断学科、边缘学科,以及有助于这些新学科发展的理论和方法。同时,学科间的相互渗透和相互作用,又进一步提高了人类的综合认识能力。语音处理就是一门涉及面很广的交叉学科,它既与数字信号处理等学科有着非常密切的关系,同时又必然受到这些学科进展的影响并随之发展。特别是近几年来,和它有关的语言学、语音学,以及语音理解、听觉心理和语言感知理论等都有较大发展,加之超大规模集成电路、电子计算机、数字信号处理、人工智能等所取得的突飞猛进的发展,都为语音研究提供了更好的理论支撑和物质基础。人类行为本质上是为人类自身的存在和发展、为人类共同的生活利益服务的。对语音处理技术的研究也不例外,其课题几乎都受到实际应用的驱动。以语音识别技术为例,为了让机器能听懂人类的语言,最终实现人与机器之间的自然语言通信,从1947年Bell实验室发明语谱图仪开始,到1960年用数字计算机实现自动语音识别,再到70年代隐马尔可夫模型、线性预测和矢量量化技术的成功应用,以及80年代以来人工神经网络、模糊集理论、小波理论等的应用和随后的语音识别技术产品化,表明尽管有许多难题尚未解决,但语音识别的研究却总在不停地向前发展。多媒体时代的来临,更加迫切要求解决自动语音识别的难题,因此必然推动语音识别理论和应用研究的发展。从语音识别技术的发展可以看出,科学技术推动了社会发展,满足人们的需求,社会需求也反过来推动科学技术发展。人类开始进入了信息化时代,社会信息化需要借助先进的技术和工具对信息进行加工和处理,而这需凭借计算机技术和通信技术的结合才能实现。因此,计算机技术、通信技术等与社会信息化有着最为密切的相互依赖与相互促进关系:计算机技术和通信技术发展得越高,社会信息化的程度就越高;社会信息化的程度越高,对计算机技术和通信技术发展的要求就越高。在高度发达的信息社会,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储和获取语言信息,这对于促进社会的发展具有十分重要的意义。例如,我们可以应用自动语音识别技术,使手写文稿变成自动听写机操作;把人工查阅各种书面文字资料的操作,变为口呼自动查阅各种各样资料的数据库;可以通过语音压缩编码技术把一些有价值的对话、讲演和广播等语音信息,进行高效率的压缩后再存储和传输;可以采用语音合成技术,将存储的语音或文字资料转化为语音高质量的回放,甚至自动翻译成另一种语言的语音回放或进行文字显示。这就是说,人们的听、说、读、写、查阅信息和语音通信等,都能采用先进的手段高效率地进行。特别是移动通信和个人通信的发展,使地球上任意地区的人都可以随时随地通话,人们的相互联系更加紧密,从而真正实现了所谓的“天涯咫尺”。可见,语音处理技术的发展使人与人之间、人与计算机之间的通信更加方便(人们可以不受时空限制,方便、快捷地获取与交流信息),这对于人类社会信息化进程的推动无疑是功不可没的。纵观人类信息技术的发展史,人类经历过五次信息革命。第一次信息革命是人类语言的诞生。语言是人类最早的信息交流工具,也标志着人类的进化。语言辅以结绳记事、累石记数、掐指计算等极其简单的技术、方法和工具存储信息,用声音符号交流和传播信息。这足以说明有了人类就有了信息和对信息的利用。第二次信息革命是文字的创造。文字是记录语言的书写符号系统,用文字符号记录、存储和传播信息,突破了时空界限,达到了能存储历史信息、能较远距离的传播信息的目的。第三次信息革命是造纸术和印刷术的发明,改善了信息的存储载体和存储方式,增加了信息的存储量,扩大了信息的交流渠道。第四次信息革命是电话、电报、广播、电视的出现,提供了简便、快速、直接、广泛的信息传播方式。第五次信息革命是计算机的发明。这是一个真正意义上的信息革命,即彻底的信息革命是在计算机技术和通信技术的集合之时。由此看来,每一次的信息革命都与语言(书写符号或声音符号)有关。从人类社会的诞生开始,到今天进入信息化时代,对语言信息处理能力的不断增强,从一个侧面反映了人类社会历史的不断前进发展,反映了人类在与自然界斗争中,不断解决人与自然界的矛盾、推动科学的发展、提高改造世界的本领的过程,而这也正反映了人类文明的进程。社会进入到信息化阶段,对信息的收集、存储、加工和利用成为人类关键性的社会活动。这意味着对人的信息素质将提出更高要求,如果每一个人都能通过语言文字等媒介形式,与他人交流自己所掌握的知识,就能极大地节约物质资源和减少劳动耗费,从而最大限度地推动人类社会的迅猛发展。四、计算机语言学研究的现状20世纪中期至今,电子计算机的发明、发展和应用为信息处理提供了最新的理论基础、现代化的技术和工具,使信息处理彻底摆脱了手工操作,实现了信息处理的自动化。为了实现自然的人机语音对话界面,人们迫切需要计算机具有自然的语言能力,就是理解讲话者含义并进行对话的能力。比如人们在说话时,总是在自觉不自觉地思考,经常会打断语言的连续性,插入一些补充性语言,这样的语言,从语法上说经常是不完整的,常规的语音识别系统很难处理这些语音,而如果计算机具有类似于人脑的思维和语言理解能力,就可能正确地识别这些语音。除语音识别外,语音合成也需要用到计算机自然语言理解技术,它的目标是让计算机具备人一样的说话能力。为使计算机合成的语言具有高清晰度和高自然度,必须解决文语转换中的“文本处理”智能化问题,即将现系统中静态的韵律模型改变为与上下文有关的由语义控制的动态模型,将特殊条件下韵律的人工标注改为机器自动标注。为了达到这个目标,计算机必须完全读懂文本中的每一句话。另外,自然语言理解技术的突破不仅存在于计算机人机语音对话中,而且将存在于人工智能(简单而言,人工智能可理解为用计算机代替人的部分思维以及将来可能的人的全部思维)中的一个具有更大意义的领域——机器翻译之中。以机器代替翻译人员对自然语言进行全自动翻译的研究已取得一定进展,近期在日本和英国之间进行的机器翻译通信实验就是这方面的一个有益尝试。与此同时,计算机发展的现实也向我们展示了其总的发展趋势:巨型化、微型化、网络化、智能化。计算机的智能化是计算机技术(硬、软件技术)发展的一个更高目标。智能化是指计算机具有模仿人类较高层次智能活动的能力:模拟人类的感觉、行为、思维过程,使计算机具有“视觉”、“听觉”、“说话”、“行为”、“思维”、“推理”、“学习”、“定理证明”、“语言翻译”等的能力。那么,人工智能是否真的可以对人类智能活动的器官进行直接的模拟呢?从语音处理的角度来说,实现这个目标还需要长期的努力。我们知道,语音信号往往是模糊不清的,它可以归结为五重模糊:语音模糊、音词转换模糊、多义模糊、语义切分模糊和指代性模糊。人类的大脑在语音交流过程中,有天然的解决上述模糊的本领,因此人类可以从模糊的语音

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论