中文信息处理与挖掘知到智慧树章节测试课后答案2024年秋山东交通学院_第1页
中文信息处理与挖掘知到智慧树章节测试课后答案2024年秋山东交通学院_第2页
中文信息处理与挖掘知到智慧树章节测试课后答案2024年秋山东交通学院_第3页
中文信息处理与挖掘知到智慧树章节测试课后答案2024年秋山东交通学院_第4页
中文信息处理与挖掘知到智慧树章节测试课后答案2024年秋山东交通学院_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文信息处理与挖掘知到智慧树章节测试课后答案2024年秋山东交通学院第一章单元测试

本课程将详细介绍的自然语言处理应用有哪些()。

A:自动问答

B:自动摘要

C:机器翻译

D:情感分析

答案:自动问答

;自动摘要

;机器翻译

;情感分析

下列那个概念与自然语言处理无关。()

A:NaturalLanguageProcessing

B:ComputerVision

C:ComputationalLinguistics

D:NaturalLanguageUnderstanding

答案:ComputerVision

黏着型语言比较有代表性的语言是日语。()

A:对B:错

答案:对自然语言中最小的有意义的构成单位是()。

A:句子

B:篇章

C:字

D:词

答案:词

中文信息处理的第一步是()。

A:确定上下文关系

B:构建句法树

C:词性标注

D:分词

答案:分词

如果打开校正功能,对于一些典型的语法错误、拼写错误以及用词错误就可以自动检测出来。()

A:对B:错

答案:对就分词来讲,主要有三类分词方法()。

A:基于语法的分词方法

B:基于规则的分词方法

C:基于统计的分词方法

D:基于词典的分词方法

答案:基于规则的分词方法

;基于统计的分词方法

;基于词典的分词方法

基于词典的分词方法从匹配的方法来讲,一般使用最大匹配法,而最匹配法又包括()。

A:双向最大匹配算法

B:三向最大匹配算法

C:正向最大匹配算法

D:逆向最大匹配算法

答案:双向最大匹配算法

;正向最大匹配算法

;逆向最大匹配算法

词性标注的主要方法主要有()。

A:统计与规则相结合的词性标注方法

B:基于规则的词性标注方法

C:基于字典的词性标注方法

D:基于统计的词性标注方法

答案:统计与规则相结合的词性标注方法

;基于规则的词性标注方法

;基于统计的词性标注方法

命名实体识别事实上就是识别出以下三类命名实体。()

A:地名

B:别名

C:人名

D:组织机构名

答案:地名

;人名

;组织机构名

第二章单元测试

概率论作为统计语言模型的数学基础,应用到自然语言处理领域,是由于:统计语言处理技术已经成为自然语言处理的主流,而在统计语言处理的步骤中,收集自然语言词汇(或者其他语言单位)的分布情况、根据这些分布情况进行统计推导都需要用到概率论。()

A:错B:对

答案:对设E为随机试验,Ω是它的样本空间,对于E的每一个事件A赋予一个实数,记为P(A),如果集合函数P(⋅)满足下列哪些条件,则实数P(A)为事件A的概率。()

A:规范性

B:唯一性

C:可列可加性

D:非负性

答案:规范性

;可列可加性

;非负性

设A、B是两个事件,且P(B)>0,则称P(A|B)为在已知事件B发生的条件下,事件A发生的()。

A:条件频率

B:似然估计

C:条件概率

D:概率

答案:条件概率

某一事件B的发生有各种可能的原因n个,B发生的概率是各原因引起B发生概率的总和,也就是()。

A:条件概率

B:先验概率

C:后验概率

D:全概率公式

答案:全概率公式

贝叶斯公式于1763年由贝叶斯(Bayes)给出,它是在观察到事件B已发生的条件下,寻找导致B发生的每个原因的概率。()

A:对B:错

答案:对在自然语言处理中,以句子为处理单位时一般假设句子独立于它前面的其它语句,句子的概率分布近似地符合以下哪项()。

A:贝叶斯法则

B:二项式分布

C:最大似然估计

D:期望

答案:二项式分布

在概率论和统计学中,一个离散性随机变量的期望值,是试验中每次可能结果的概率乘以其结果的总和,也被称为()。

A:期望

B:数学期望

C:均值

D:方差

答案:期望

;数学期望

;均值

在概率论和统计学中,一个随机变量的方差,描述的是它的离散程度,也就是该变量离其期望值的距离.()

A:对B:错

答案:对以下哪项表示信源X每发一个符号且不论发什么符号所提供的平均信息量。()

A:熵

B:联合熵

C:条件熵

D:信息

答案:熵

哪一项常被用以衡量两个随机分布的差距。()

A:联合熵

B:相对熵

C:熵率

D:条件熵

答案:相对熵

第三章单元测试

以下哪一个属于序列标注问题()。

A:英文词的形态还原

B:指代消解

C:词频统计

D:命名实体识别

答案:命名实体识别

在词法分析里,需要处理的最小单位是()。

A:词

B:句子

C:短语

D:字

答案:词

下列(

)形式是最主要的信息载体()。

A:文字

B:图像

C:音频

D:视频

答案:文字

词性标注的主要方法包括()。

A:基于规则的方法

B:基于统计的和基于规则的相结合的方法

C:基于统计的方法

D:基于语义的标注方法

答案:基于规则的方法

;基于统计的和基于规则的相结合的方法

;基于统计的方法

设输入句子“我爱人工智能”,经过词性标注等得到“我/PN爱/VV人工智能/NR”,其中,PN、VV和NR的含义分别是代词、动词、专有名词;()是命名实体。

A:“爱”

B:“我”

C:“我”、“人工智能”

D:“人工智能”

答案:“人工智能”

自然语言处理(NLP)通过词、句子、篇章的分析,理解内容。处理一个中文句子(汉字序列)时,在其NLP基本任务中,()负责将输入的句子转换为单词序列。

A:分词

B:词性标注

C:句法分析

D:词法分析

答案:分词

自然语言处理过程可以有多个层次,包括()。

A:语法分析

B:词法分析

C:句法分析

D:语义分析

答案:词法分析

;句法分析

;语义分析

语言是人类交流思想、表达情感最自然的工具,是思维的载体,也是人类区别其他动物的本质特性。()

A:对B:错

答案:对孤立语就是被孤立的语言。()

A:错B:对

答案:错用“信息熵”来衡量自由度,用“点间互信息”衡量一个词汇内部的凝聚程度。()

A:错B:对

答案:对

第四章单元测试

句法分析主要包括两类,分别是短语结构分析和依存关系分析。()

A:对B:错

答案:对重写规则表示取代或扩展的规则,箭头左边代表一个或几个成分构成的序列,右边符号代表单一的结构成分。()

A:对B:错

答案:错一个完整的语法表示,应该包括以下哪些元素()。

A:重写规则

B:终结符号集合

C:一个特殊的非终结符句子

D:非终结符号集合

答案:重写规则

;终结符号集合

;一个特殊的非终结符句子

;非终结符号集合

形式语法是指面向机器处理的语法,它规定语言中允许出现的结构的形式化说明。()

A:错B:对

答案:对依存树和句法树都属于语法表示方法,二者最大的不同在于句法树上都是终结符结点,依存树上还有非终结符结点。()

A:错B:对

答案:错在引入点规则后,以下属于非活性边的是()。

A:NP->ran

B:NP->ran。

C:NP->ra。n

D:NP->r。an

答案:NP->ran。

线图分析算法解决了从输入词串开始,一步步形成线图,使得在一条边可以覆盖全部结点。()

A:错B:对

答案:对在线图句法分析中需要用到的数据结构是()。

A:活动边集(ActiveArc)

B:线图(Chart)

C:进程表(Agenda)

D:链表(LinkedList)

答案:活动边集(ActiveArc)

;线图(Chart)

;进程表(Agenda)

上下文无关文法(PCFG)在满足以下什么条件下,计算分析树的概率可以使用所有规则概率的乘积()。

A:兄弟无关

B:位置不变性

C:上下文无关性

D:祖先无关

答案:位置不变性

;上下文无关性

;祖先无关

下列属于依存句法分析算法的是()。

A:非确定性分析方法

B:判别式分析方法

C:生成式分析方法

D:决策式分析方法

答案:判别式分析方法

;生成式分析方法

;决策式分析方法

第五章单元测试

篇章(discourse)又称为语篇或文本.()

A:错B:对

答案:对篇章结构可以是篇章内部关系的不同结构化表达形式,主要包括下列哪些结构。()

A:指代结构

B:话题结构

C:功能结构

D:修辞结构

答案:指代结构

;话题结构

;功能结构

;修辞结构

话题的完整性从形式和内容两方面分别体现为篇章的两大基本特性,即篇章连贯性和篇章衔接性.()

A:对B:错

答案:对篇章的哪几个基本特征更是有力地促进了自然语言处理研究的发展。()

A:衔接性

B:信息性

C:连贯性

D:意图性

答案:衔接性

;信息性

;连贯性

;意图性

篇章的()基本特征已被自然语言处理领域的研究者广为接受。

A:7个

B:6个

C:5个

D:4个

答案:7个

而通过分析篇章的信息性和意图性,则可以挖掘篇章的语义特征。()

A:对B:错

答案:对下列属于Hobbs定义的12类关系的有()。

A:背景

B:详述

C:并列

D:结果

答案:背景

;详述

;并列

;结果

1898年马建忠的《马氏文通》出版为标志创建了汉语复句理论。()

A:错B:对

答案:对()是最早研究篇章衔接关系的理论体系。

A:话题链

B:浅层衔接理论

C:修辞结构理论

D:汉语复句理论

答案:浅层衔接理论

下图哪个例子能构成一个篇章

A:例1B:两者都不能C:两者都能D:例2

答案:例2

第六章单元测试

下列不属于基于情感词典的情感分析方法优点的是()。

A:预测准确率高

B:有效反应文本结构特点,易于理解

C:通用性强

D:简单易行

答案:预测准确率高

词语级情感分析又称为方面级情感分析,是一种细粒度的情感分析,它包括方面的提取和方面的情感分析。()

A:对B:错

答案:对以下属于文本情感分析过程的是()。

A:特征表示

B:特征选择

C:使用分类器进行情感分析

D:情感类别的输出

答案:特征表示

;特征选择

;使用分类器进行情感分析

;情感类别的输出

特征表示是指将文字表示的内容转换成计算机可以处理的数字化特征向量,常见的特征表示方法有one-hot、word2vec。()

A:错B:对

答案:对常见的特征选择方法包括{词频计数模型(N-gram)、词袋模型(TF-IDF)和深度学习方法等。()

A:错B:对

答案:对根据样本数据标签的有无或者多少,可以将机器学习算法主要分为()

A:聚类方法

B:无监督方法

C:有监督方法

D:半监督方法

答案:聚类方法

;有监督方法

;半监督方法

朴素贝叶斯是一种分类方法,可以在任何情况下使用此方法进行文本情感分析。()

A:错B:对

答案:错K近邻(KNN)算法是依据最邻近的几个样本的类别来决定待分类样本所属的类别,其中常用的距离公式包括()

A:切比雪夫距离

B:曼哈顿距离

C:余弦距离

D:欧式距离

答案:切比雪夫距离

;曼哈顿距离

;余弦距离

;欧式距离

BERT使用的是Transformer编码器,由于Self-attention机制,所以模型上下层直接全部互相连接。()

A:错B:对

答案:对LSTM模型和RNN模型都是属于深度学习模型,都可用于情感分析任务中,但是LSTM模型克服了梯度消失问题。()

A:错B:对

答案:对

第七章单元测试

不管是贤二机器僧,还是同学们所熟知的QQ小弟、微软小冰,在我们自然语言处理领域,都有一个共同的名字,那就是()。

A:问答

B:自动问答系统

C:情感分析

D:机器翻译

答案:自动问答系统

以直接而准确的方式回答用户自然语言提问的自动问答系统将构成下一代搜索引擎的基本形态。()

A:错B:对

答案:对问答系统的起源,可以追溯到1950年,A.M.Turning提出的"图灵测试"。()

A:对B:错

答案:对根据问答系统处理的数据格式,将问答系统分为哪几个历史阶段()。

A:基于自由文本的问答系统

B:基于知识图谱的问答系统

C:基于机构化数据的问答系统

D:基于问题答案对的问答系统

答案:基于自由文本的问答系统

;基于知识图谱的问答系统

;基于机构化数据的问答系统

;基于问题答案对的问答系统

对应问答系统的处理流程,一般问答系统包括哪三个主要部分?()。

A:答案抽取

B:问题分析

C:信息核对

D:信息检索

答案:答案抽取

;问题分析

;信息检索

根据问答系统的发展、数据源、提问类型等,将问答系统分为哪几种?()。

A:面向知识图谱的问答系统

B:社区问答系统

C:检索式问答系统

D:自然问答系统

答案:面向知识图谱的问答系统

;社区问答系统

;检索式问答系统

衡量和分析问答系统得复杂性,可以从问题、数据、答案3个维度来评价,同时问答系统根据问题、数据、答案3个维度的不同而属于不同类别。()

A:对B:错

答案:对信息抽取的任务主要包括()。

A:实体识别与抽取

B:事件抽取

C:关系抽取

D:实体消岐

答案:实体识别与抽取

;事件抽取

;关系抽取

;实体消岐

区别于传统问答式检索系统仅能回答有限类型的问题,社区问答系统的特点是()。

A:问题类型不限定

B:问题的类型和答案的类型不限定

C:答案类型不限定

D:回答者不限定

答案:问题的类型和答案的类型不限定

哪一个概念由谷歌2012年正式提出,旨在实现更智能的搜索引擎,并且于2013年以后开始在学术界和业界普及。()。

A:知识图谱应用

B:大数据

C:知识图谱

D:社区问答

答案:知识图谱

第八章单元测试

关于文本摘要说法正确的是()

A:文本摘要必须保留原文中的重要信息。

B:文本摘要需尽可能简短精炼。

C:可以对多文档进行抽取文本摘要。

D:可以对单文档进行抽取文本摘要。

答案:文本摘要必须保留原文中的重要信息。

;文本摘要需尽可能简短精炼。

;可以对多文档进行抽取文本摘要。

;可以对单文档进行抽取文本摘要。

按照输出类型划分文本摘要主要分为哪几类()

A:跨语言摘要

B:抽取式摘要

C:多文档摘要

D:生成式摘要

答案:抽取式摘要

;生成式摘要

下面哪些是文本自动摘要经历的发展阶段()

A:启发式自动摘要

B:基于语言学的自动摘要

C:基于神经网络的自动摘要

D:基于统计的自动摘要

答案:启发式自动摘要

;基于语言学的自动摘要

;基于神经网络的自动摘要

;基于统计的自动摘要

与单文档摘要相比,多文档摘要有哪些特点()

A:多文档摘要比单文档面临更多挑战。

B:多文档摘要需注意减小句子之间的冗余度。

C:多文档摘要要确定压缩比率,即从每个文档中抽取句子的比例。

D:从多个文档抽取出的句子要确定它们的顺序。

答案:多文档摘要比单文档面临更多挑战。

;多文档摘要需注意减小句子之间的冗余度。

;多文档摘要要确定压缩比率,即从每个文档中抽取句子的比例。

;从多个文档抽取出的句子要确定它们的顺序。

下面哪些项是影响句子重要性的因素()

A:句子中词语的重要性

B:句子的长度

C:句子位置

D:句子是否包括线索词

答案:句子中词语的重要性

;句子的长度

;句子位置

;句子是否包括线索词

关于生成式摘要常用的一个方法:基于深度学习之序列转换模型的方法说法错误的是()

A:输入序列较长时,语义向量中先提取的信息并不会被后提取的信息稀释。

B:解码器通过语义向量和前面已经生成的摘要序列来预测当前时刻的单词。

C:编码器会输出特征提取后的语义向量。

D:该方法使用的是编码器-解码器模型。

答案:输入序列较长时,语义向量中先提取的信息并不会被后提取的信息稀释。

下面关于ROUGE说法正确的是()

A:ROUGE要求由多个专家分别生成人工摘要,构成标准摘要集。

B:ROUGE是一种外部评价标准。

C:ROUGE既是评估自动文摘也是及机器翻译的一组指标。

D:ROUGE是一种基于召回率的相似性度量方法。

答案:ROUGE要求由多个专家分别生成人工摘要,构成标准摘要集。

;ROUGE既是评估自动文摘也是及机器翻译的一组指标。

;ROUGE是一种基于召回率的相似性度量方法。

按照输入类型划分,文本摘要分为抽取式摘要和生成式摘要。()

A:对B:错

答案:错多文档摘要不必关心多个文档中抽取处的句子之间的顺序。()

A:对B:错

答案:错5、

抽取式摘要典型模型一共有以下步骤,请按照先后顺序将步骤进行排序(

)①摘要语句排序②语句重要性计算与排名③文档理解④语句选择

A:③②

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论