版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 智能写作视角下机器生成文本评价标准的构想 李培菡摘 要 智能写作技术的发展正使得机器生成文本的应用变得越来越普遍,但发展至今始终缺乏一个客观的评价标准。如果选择继续使用已有的文本评价标准,应如何合理地评价机器生成文本?或可将人工智能技术原理和已有的文本评价标准结合,提出一套新的更适用于机器生成文本的评价体系。关键词 智能写作;机器生成文本;客观评价;评价标准中图分类号 g2 文献标识码 a 文章编号 1674-6708(2019)235-0136-02自20世纪70年代维诺格拉德(winogand)通过程序算法成功实现人机对话以来,自然语言
2、处理(nature language processing, nlp)技术已经获得了长足的进步,与之密切相关的智能写作领域也因此不断发展并越来越多的应用在实际社会生活中。如今,机器生成文本已经悄然渗透进人们生活的各个领域,体育新闻、金融资讯、大数据预测甚至是小说出版行业都能见到机器生成文本的身影。随着技术的继续进步、实际应用的继续推广,在可预见的将来,机器生成文本必将会引起全社会的广泛关注。然而,不同于以往由人创作的文本内容,机器生成文本受制于技术的发展水平,机器人写作虽然已在体育新闻、金融速报等某些确定领域拥有了很多成功的实践,但在大多数需要依靠人类情感以及抽象思维能力的创作领域,如诗歌、小
3、说、散文等,仍然与人类作者的写作水平有很大差距;另外,涉及人工智能以及机器人的伦理问题。因此,如果只单一地使用人类目前已有文本评价标准来看待机器生成文本,既会限制智能写作技术的长远发展,也会引发社会在机器人伦理问题上的困惑。提出一个立足于智能写作领域,同时又为大众所理解认可的机器生成文本评价标准势在必行。1 根据已有文本评价标准看待机器生成文本已有的文本评价标准自文字诞生之日起,发展至今已经形成了十分成熟的评价体系,并且衍生出了大量的相关学科,因此本章节主要对已有的文本评价标准进行框架性描述并将之与机器生成文本的评价相结合,从而整理出一条评价机器生成文本的逻辑过程,并且只介绍为大多数学者所接受
4、的主流文本评价标准。1.1 对机器生成文本文体选择的评价在已有的文本评价标准中,要展开对文本的评价首先要对它的“文体”进行区别。文体,指能够独立成篇文本的体制、体裁或样式,是在长久写作实践过程中演变出的某种文本规格和模式。通常情况下,文体被分为文章体裁和文学体裁两大类,针对机器生成文本的评价首先要在区分了文本文体的基础上进行,以文章体裁为区分的文本和以文学体裁为区分的文本拥有不同的创作目的和评价标准,因此是否能够准确选择符合创作目的的文体是评价机器生成文本好坏的重要准则。1.2 以文章体裁进行区分的文本评价文章体裁分为记叙文、议论文、说明文三类,不同的文章类型,拥有的写作目的也就不同,相应的评
5、价标准也不一样。1)记叙文的评价。对记叙文的评价紧紧围绕着所谓记叙文六要素展开,即时间、地点、人物、事件的起因、经过及结果。针对这六要素发展出了多种寫作方法,如叙事线索、叙述顺序、人物描写、环境描写等,这些方法也成为判断一篇记叙文好坏的评价标准。2)议论文的评价。与记叙文类似,对于议论文的评价也是围绕其构成要素展开的。对一篇议论文来说,最核心的是其论点,论点要做到鲜明简洁,整篇文章都围绕论点展开;论据确凿有力,论证过程具有说服性。论点、论据、论证的写作同样拥有许多具体的写作方法,如例证法、对比法等,在此不做赘述。3)说明文的评价。评价一篇说明文的方法简单来说就是,找准说明对象,弄清说明对象的特
6、征,然后用巧妙的方法将说明对象解释清楚。1.3 以文学体裁进行区分的文本评价针对机器人创作的文学文本,可以采用文学批评的方法进行评价。文学批评是一个将科学理性同情感感性相融合的学科,它围绕着文学作品展开,同时也将与之相关的文学活动和现象纳入评价分析的范围,常常带有批评家鲜明的个人烙印。主流观点下,文学批评方法分为六种,对于机器生成的文学文本也应根据这六种批评方法评价。1)社会历史批评:站在历史发展角度,分析文学和社会生活的关系;2)精神分析批评:主要分析作家、作品的无意识内容,特别是对性的欲望;3)语义批评:阐释文本的语言意义,主要针对诗歌体裁;4)叙事批评:对叙事文的叙述结构和叙述方式进行分
7、析;5)性别批评:站在女性意识的角度开展分析;6)读者生产批评:对读者在文学批评过程中发挥的创造性作用进行分析。2 从机器生成文学的角度设定新的评价标准2.1 新标准设定的目的随着智能写作技术的不断发展以及在商业领域越来越广泛的应用,由写作机器人创作生产的文本数量正在不断增加。可以预见,未来由机器生产创作的文本数量必将增长到一个可观的数据规模,并将引发全社会的广泛关注。但作为一件新兴事物,机器生成文本目前处在一个尴尬的境地。因为技术的限制,其生成的文本质量不足以支持将之置于人类已有的文本评价标准之下,另外写作机器人不同于人,这之中还涉及机器人伦理的问题。但同时机器生成文本又缺乏一套被广泛接受且
8、适用于自身特点和发展方向的评价标准,对文本的评价仅仅取决于开发人员和读者个人的主观体验。因此,有必要为机器生成文本设定一套适用于自身特点和未来发展的评价标准,为技术人员的研发提供思路方面的参考;为读者判断一份文本的好坏提供客观的评价体系;促进智能写作技术的发展。2.2 新标准设定原则1)专业性。这份标准应该具备较强的专业性,能够为技术人员评价机器生成文本提供参考和改进思路。2)易读性。考虑到智能写作未来的发展趋势,机器生成文本必将渗透进普通人生活的各个方面。因此,这份标准还应该对普通读者态度友好,能够让普通读者依据这份标准合理评价机器生成文本,并帮助他们更好的理解智能写作技术。3)机器生成文本
9、生产的基本步骤可以被简单地拆分为:依靠硬件设备平台,通过算法处理,输出文本。考虑到评价标准应该兼顾专业性和易读性,因此,该标准评价的重点应放在输出的最终结果即输出文本上,不对硬件设备以及机器算法过多涉及。4)该评价标准只针对机器生成文本,不将读者阅读文本后产生的感想延伸纳入评价。2.3 理论基础1)自然语言处理:natural language generation, nlg旨在让机器基于结构化的文本、数据、音频等生成人类可以理解的自然语言形式的文本。2)符号主义:实现认知的基本单元是符号,认知过程即符号运算过程;人工智能的研究方法为功能模拟法,即通过使用计算机模拟人类认知系统的机理和功能来实
10、现人工智能,主张用逻辑方法来建立人工智能体系。3)联结主义:认为思维的基本单元是神经元,思维过程是神经元并行联结活动的过程;主张用基于神经元的人脑工作模式替换符号主义主张的,基于符号运算的电脑工作模式。4)人工神经网络:一个用大量的简单处理单元经广泛并行联结构成的人工网络。5)语法、语用和语义:语法指,在一种自然语言中用来指出词汇间正确搭配关系以及句子合理结构的一套规则;语义指一个句子所要表达的真实含义;语用指语言使用过程中的外界环境因素。2.4 评价标准1)生成文本能否清晰准确地表达创作目的。具体评价需要对生成文本进行文体选择上的分析、词汇分析、词法分析、句法分析、语义分析以及语用分析。2)
11、针对不同的文体、语境,是否选择了合适的硬件设备及算法。对于应用在体育赛事报道、金融信息资讯、行业简报等相似语境下的机器生成文本,这类文本对内容的逻辑性有很高的要求,而對文章的意境、创新性、启发性等文学元素要求很低。这与符号主义所主张的通过逻辑方法来建立人工智能体系的追求相符合,因此为了节约成本、提高写作速度,这类文本应选择由合适的nlg(nature language generation)算法生成,对硬件设备没有特殊要求。如果对生成文本有较高的文学要求,比如,需要写作机器人创作诗歌、小说或者散文,抽象思维、形象思维以及灵感思维能力则成为了写作机器人不可或缺的功能。参考人脑的生理结构,这些活动的实现与人脑神经细胞之间并行式的生理结构密切相关,在这样的要求下,单纯以串行结构编写而成的二进制算法是无法满足机器生成文本的创作要求的。因此,需要使用特殊的硬件设备来满足这种需要,具有自学习、自适应、自组织、模糊推理、联想等与人脑类似功能的人工神经网络搭配合适的nlg
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教版四年级上册数学第六单元《除数是两位数的除法》测试卷附参考答案【b卷】
- 湖南省岳阳市2023-2024学年高一上学期期末考试化学试题(含答案)
- 诚信售后权益声明
- 询价合同协议书模板
- 语文课件探索婴宁
- 货物订购协议
- 购房合同补充协议的撰写技巧
- 购车合同范本样本样本图片地质
- 购销合同协议格式
- 购销涂料协议文本
- 绿色建筑工程监理实施细则
- 2024年高考真题-化学(贵州卷) 含解析
- 2023-2024学年高中信息技术必修一沪科版(2019)第一单元项目一《探秘鸟类研究-认识数据、信息与知识》教案
- 教学计划(教学计划)-2024-2025学年大象版三年级科学上册
- 2024年便携式储能行业分析报告
- 2024年导游资格考试导游基础知识真题含真题答案
- 《兽医学概论》课件-禽流感
- 人教版高中数学选择性必修第一册第一章空间向量与立体几何章节综合训练(含解析)
- 2024-2034年全球及中国核辐射行业市场发展现状及发展前景研究报告
- 科研伦理与学术规范期末考试试题
- 微测网题库完整版行测
评论
0/150
提交评论