中文信息处理与挖掘知到章节答案智慧树2023年山东交通学院

上传人：题*** IP属地：浙江上传时间：2023-05-08 格式：DOCX 页数：11 大小：16.08KB 积分：6 举报 版权申诉

免费预览已结束，剩余6页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

中文信息处理与挖掘知到章节测试答案智慧树2023年最新山东交通学院第一章测试本课程将详细介绍的自然语言处理应用有哪些（）。

参考答案:

自动问答;情感分析;机器翻译;自动摘要下列那个概念与自然语言处理无关。（）

参考答案:

ComputerVision黏着型语言比较有代表性的语言是日语。（）

参考答案:

对自然语言中最小的有意义的构成单位是（）。

参考答案:

词中文信息处理的第一步是（）。

参考答案:

分词如果打开校正功能，对于一些典型的语法错误、拼写错误以及用词错误就可以自动检测出来。()

参考答案:

对就分词来讲，主要有三类分词方法（）。

参考答案:

基于规则的分词方法;基于词典的分词方法;基于统计的分词方法基于词典的分词方法从匹配的方法来讲，一般使用最大匹配法，而最匹配法又包括（）。

参考答案:

逆向最大匹配算法;双向最大匹配算法;正向最大匹配算法词性标注的主要方法主要有（）。

参考答案:

统计与规则相结合的词性标注方法;基于规则的词性标注方法;基于统计的词性标注方法命名实体识别事实上就是识别出以下三类命名实体。（）

参考答案:

人名;组织机构名;地名第二章测试概率论作为统计语言模型的数学基础，应用到自然语言处理领域，是由于：统计语言处理技术已经成为自然语言处理的主流，而在统计语言处理的步骤中，收集自然语言词汇(或者其他语言单位)的分布情况、根据这些分布情况进行统计推导都需要用到概率论。（）

参考答案:

对设E为随机试验，Ω是它的样本空间，对于E的每一个事件A赋予一个实数，记为P(A)，如果集合函数P(⋅)满足下列哪些条件，则实数P(A)为事件A的概率。（）

参考答案:

规范性;非负性;可列可加性设A、B是两个事件，且P(B)＞0,则称P(A|B)为在已知事件B发生的条件下,事件A发生的（）。

参考答案:

条件概率某一事件B的发生有各种可能的原因n个，B发生的概率是各原因引起B发生概率的总和，也就是（）。

参考答案:

全概率公式贝叶斯公式于1763年由贝叶斯(Bayes)给出，它是在观察到事件B已发生的条件下，寻找导致B发生的每个原因的概率。（）

参考答案:

对在自然语言处理中，以句子为处理单位时一般假设句子独立于它前面的其它语句，句子的概率分布近似地符合以下哪项（）。

参考答案:

二项式分布在概率论和统计学中，一个离散性随机变量的期望值，是试验中每次可能结果的概率乘以其结果的总和，也被称为（）。

参考答案:

期望;均值;数学期望在概率论和统计学中，一个随机变量的方差，描述的是它的离散程度，也就是该变量离其期望值的距离.（）

参考答案:

对以下哪项表示信源X每发一个符号且不论发什么符号所提供的平均信息量。（）

参考答案:

熵哪一项常被用以衡量两个随机分布的差距。（）

参考答案:

相对熵第三章测试以下哪一个属于序列标注问题（）。

参考答案:

命名实体识别在词法分析里，需要处理的最小单位是（）。

参考答案:

词下列（

）形式是最主要的信息载体（）。

参考答案:

文字词性标注的主要方法包括（）。

参考答案:

基于统计的和基于规则的相结合的方法;基于统计的方法;基于规则的方法设输入句子“我爱人工智能”，经过词性标注等得到“我/PN爱/VV人工智能/NR”，其中，PN、VV和NR的含义分别是代词、动词、专有名词；（）是命名实体。

参考答案:

“人工智能”自然语言处理（NLP）通过词、句子、篇章的分析，理解内容。处理一个中文句子（汉字序列）时，在其NLP基本任务中，（）负责将输入的句子转换为单词序列。

参考答案:

分词自然语言处理过程可以有多个层次，包括（）。

参考答案:

句法分析;词法分析;语义分析语言是人类交流思想、表达情感最自然的工具，是思维的载体，也是人类区别其他动物的本质特性。（）

参考答案:

对孤立语就是被孤立的语言。（）

参考答案:

错用“信息熵”来衡量自由度，用“点间互信息”衡量一个词汇内部的凝聚程度。（）

参考答案:

对第四章测试句法分析主要包括两类，分别是短语结构分析和依存关系分析。（）

参考答案:

对重写规则表示取代或扩展的规则，箭头左边代表一个或几个成分构成的序列，右边符号代表单一的结构成分。（）

参考答案:

错一个完整的语法表示，应该包括以下哪些元素（）。

参考答案:

非终结符号集合;终结符号集合;重写规则;一个特殊的非终结符句子形式语法是指面向机器处理的语法，它规定语言中允许出现的结构的形式化说明。（）

参考答案:

对依存树和句法树都属于语法表示方法，二者最大的不同在于句法树上都是终结符结点，依存树上还有非终结符结点。（）

参考答案:

错在引入点规则后，以下属于非活性边的是（）。

参考答案:

NP-＞ran。线图分析算法解决了从输入词串开始，一步步形成线图，使得在一条边可以覆盖全部结点。（）

参考答案:

对在线图句法分析中需要用到的数据结构是（）。

参考答案:

线图（Chart）;活动边集（ActiveArc）;进程表（Agenda）上下文无关文法（PCFG）在满足以下什么条件下，计算分析树的概率可以使用所有规则概率的乘积（）。

参考答案:

祖先无关;位置不变性;上下文无关性下列属于依存句法分析算法的是（）。

参考答案:

决策式分析方法;生成式分析方法;判别式分析方法第五章测试篇章(discourse)又称为语篇或文本.（）

参考答案:

对篇章结构可以是篇章内部关系的不同结构化表达形式,主要包括下列哪些结构。（）

参考答案:

功能结构;修辞结构;话题结构;指代结构话题的完整性从形式和内容两方面分别体现为篇章的两大基本特性,即篇章连贯性和篇章衔接性.（）

参考答案:

对篇章的哪几个基本特征更是有力地促进了自然语言处理研究的发展。（）

参考答案:

连贯性;信息性;衔接性;意图性篇章的（）基本特征已被自然语言处理领域的研究者广为接受。

参考答案:

7个而通过分析篇章的信息性和意图性,则可以挖掘篇章的语义特征。（）

参考答案:

对下列属于Hobbs定义的12类关系的有（）。

参考答案:

并列;背景;结果;详述1898年马建忠的《马氏文通》出版为标志创建了汉语复句理论。（）

参考答案:

对（）是最早研究篇章衔接关系的理论体系。

参考答案:

浅层衔接理论下图哪个例子能构成一个篇章

参考答案:

例2第六章测试下列不属于基于情感词典的情感分析方法优点的是（）。

参考答案:

预测准确率高词语级情感分析又称为方面级情感分析，是一种细粒度的情感分析，它包括方面的提取和方面的情感分析。（）

参考答案:

对以下属于文本情感分析过程的是（）。

参考答案:

特征选择;情感类别的输出;使用分类器进行情感分析;特征表示特征表示是指将文字表示的内容转换成计算机可以处理的数字化特征向量，常见的特征表示方法有one-hot、word2vec。（）

参考答案:

对常见的特征选择方法包括{词频计数模型（N-gram）、词袋模型（TF-IDF）和深度学习方法等。（）

参考答案:

对根据样本数据标签的有无或者多少，可以将机器学习算法主要分为（）

参考答案:

有监督方法;聚类方法;半监督方法朴素贝叶斯是一种分类方法，可以在任何情况下使用此方法进行文本情感分析。（）

参考答案:

错K近邻（KNN）算法是依据最邻近的几个样本的类别来决定待分类样本所属的类别，其中常用的距离公式包括（）

参考答案:

切比雪夫距离;曼哈顿距离;欧式距离;余弦距离BERT使用的是Transformer编码器，由于Self-attention机制，所以模型上下层直接全部互相连接。（）

参考答案:

对LSTM模型和RNN模型都是属于深度学习模型，都可用于情感分析任务中，但是LSTM模型克服了梯度消失问题。（）

参考答案:

对第七章测试不管是贤二机器僧，还是同学们所熟知的QQ小弟、微软小冰，在我们自然语言处理领域，都有一个共同的名字，那就是（）。

参考答案:

自动问答系统以直接而准确的方式回答用户自然语言提问的自动问答系统将构成下一代搜索引擎的基本形态。（）

参考答案:

对问答系统的起源，可以追溯到1950年，A.M.Turning提出的”图灵测试”。（）

参考答案:

对根据问答系统处理的数据格式，将问答系统分为哪几个历史阶段（）。

参考答案:

基于机构化数据的问答系统;基于知识图谱的问答系统;基于自由文本的问答系统;基于问题答案对的问答系统对应问答系统的处理流程，一般问答系统包括哪三个主要部分？（）。

参考答案:

问题分析;答案抽取;信息检索根据问答系统的发展、数据源、提问类型等，将问答系统分为哪几种？（）。

参考答案:

社区问答系统;检索式问答系统;面向知识图谱的问答系统衡量和分析问答系统得复杂性，可以从问题、数据、答案3个维度来评价，同时问答系统根据问题、数据、答案3个维度的不同而属于不同类别。（）

参考答案:

对信息抽取的任务主要包括（）。

参考答案:

事件抽取;实体消岐;关系抽取;实体识别与抽取区别于传统问答式检索系统仅能回答有限类型的问题，社区问答系统的特点是（）。

参考答案:

问题的类型和答案的类型不限定哪一个概念由谷歌2012年正式提出，旨在实现更智能的搜索引擎，并且于2013年以后开始在学术界和业界普及。（）。

参考答案:

知识图谱第八章测试关于文本摘要说法正确的是（）

参考答案:

文本摘要必须保留原文中的重要信息。;文本摘要需尽可能简短精炼。;可以对多文档进行抽取文本摘要。;可以对单文档进行抽取文本摘要。按照输出类型划分文本摘要主要分为哪几类（）

参考答案:

抽取式摘要;生成式摘要下面哪些是文本自动摘要经历的发展阶段（）

参考答案:

基于语言学的自动摘要;启发式自动摘要;基于神经网络的自动摘要;基于统计的自动摘要与单文档摘要相比，多文档摘要有哪些特点（）

参考答案:

多文档摘要比单文档面临更多挑战。;多文档摘要需注意减小句子之间的冗余度。;从多个文档抽取出的句子要确定它们的顺序。;多文档摘要要确定压缩比率，即从每个文档中抽取句子的比例。下面哪些项是影响句子重要性的因素（）

参考答案:

句子中词语的重要性;句子位置;句子是否包括线索词;句子的长度关于生成式摘要常用的一个方法：基于深度学习之序列转换模型的方法说法错误的是（）

参考答案:

输入序列较长时，语义向量中先提取的信息并不会被后提取的信息稀释。下面关于ROUGE说法正确的是（）

参考答案:

ROUGE既是评估自动文摘也是及机器翻译的一组指标。;ROUGE是一种基于召回率的相似性度量方法。;ROUGE要求由多个专家分别生成人工摘要，构成标准摘要集。按照输入类型划分，文本摘要分为抽取式摘要和生成式摘要。（）

参考答案:

错多文档摘要不必关心多个文档中抽取处的句子之间的顺序。（）

参考答案:

错5、

抽取式摘要典型模型一共有以下步骤，请按照先后顺序将步骤进行排序（

）①摘要语句排序②语句重要性计算与排名③文档理解④语句选择

参考答案:

③②④①第九章测试机器翻译可以有多种实现方法。给定源语言句子，对目标语言句子的条件概率进行建模，再用大规模语料库训练模型的方法是（）。

参考答案:

基于统计的机器翻译基于神经网络的机器翻译中，近年引入的（）可以提高长句的翻译质量，它赋予句子中的每个词相同的权重。

参考答案:

注意力机制在人工智能领域，机器翻译属于（）范畴。

参考答案:

自然语言处理近年，神经机器翻译逐渐成为机器翻译的主流技术；通常有两个模块，其中，（）模块把源语言句子转换成中间语义表示.

参考答案:

编码器基于规则的方法由上到下可以分成四个层次，即

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

中文信息处理与挖掘知到章节答案智慧树2023年山东交通学院

文档简介

温馨提示

最新文档

评论

中文信息处理与挖掘知到章节答案智慧树2023年山东交通学院

文档简介

温馨提示

最新文档

评论

相关文档