




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1页共4页期末考试试题B卷(开卷)适用班级:人工智能2001/2002专业:人工智能技术服务考试时长:120分钟得分阅卷人一、选择得分阅卷人1.自然语言处理的发展大致分为3个阶段:(),20世纪70年代和21世纪。A.19世纪晚期B.19世纪中期C.19世纪早期D.20世纪50年代2.以下哪个不属于文件对象的方法?()A.file.read([size])B.file.write(str)C.file.readline()D.file.close()3.为了保证无论是否出错都能正确地关闭文件,可以使用()来实现。A.breakB.for循环语句C.try…finallyD.if...else4.目前的分词方法主要有三种:基于规则的分词方法、基于统计的分词方法以及()。A.基于语法的分词方法B.基于语种的分词方法C.基于语言的分词方法D.基于语义的分词方法5.采用jieba搜索引擎模式对“南京市长江大桥”进行分词,得到的结果为()A.南京\市长江大桥B.南京市/长江大桥C.南京/南京市/京市/市长/长江/长江大桥/大桥D.南京/京市/南京市/长江/大桥/长江大桥6.词性标注的正确与否会直接影响到之后的()、语义分析,是中文自然语言处理的基础之一。A.词法分析B.语言分析C.句子分析D.句法分析7.关于Stanfordparser下面说法不正确的是:()Stanfordparser的底层是由Java实现的,因此需要确保安装JDK。Stanfordparser的Python封装是在NLTK库中实现的,因此,需要安装NLTK库。NLTK是一款Python的自然语言处理工具,但主要针对中文。Stanfordparser基于概率统计进行句法分析。8.RNN的应用场景不包括()。A.生成图像描述B.语音识别C.视频标记D.自动拍照9.当处理序列问题发现,当前时刻的输出既与前面时刻输入有关,又与未来时刻输出有关,应选择哪个模型更为合适()A.CNNB.RNNC.双向LSTMD.GMM10.关于one-hot编码说法不正确的是()。A.one-hot编码是一位有效编码B.每个状态都有自己独立的寄存器位C.随着语料库词语的增加,词向量的维度高且稀疏D.计算词与词之间的相似性11.基于主题模型方法使用的算法是()。A.TF-IDF算法B.LDA算法C.TextRank算法D.KNN算法12.TF-IDF算法中使用哪个函数对数据集进行分词,去停用词()。A.posB.corpus_pathC.preprocessD.idf_dic13.根据代码确定fit_prior:为True的含义()。classsklearn.naive_bayes.MultinominalNB(alpha=1.0,fit_prior=True,class_prior=None)不去学习类别先验概率训练模型追加训练模型用模型进行预测14.基于词典的情感分析方法的最大特点是()。A.简单B.方便C.复杂D.快速15.自然语言理解的简称是什么?()。10.6A.NLPB.ANNC.NLUD.APL得分阅卷人二、判断题(对的打‘√’,错的打‘×’得分阅卷人1.句法分析的主要任务是:识别出句子所包含的句法成分,以及这些成分之间的关系。()2..jieba分词工具提供了词性标注功能。jieba分词是结合规则和统计的方式,也就是说同时使用词典匹配和HMM。()3.Stanfordparser的底层是由python实现的。()4.re.match尝试从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,就返回none。()5.re.match尝试从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,就返回none。()6.自然语言处理(NaturalLanguageProcessing,NLP)是计算机科学领域以及大数据领域的一个重要的研究方向。()7.基于语义的分词方法通常包括三个部分:分词子系统、句法语义子系统、总控部分。()8.条件随机场(CRF)也是一种基于马尔科夫思想的统计模型。之前的模型都假设每个状态均只与它前面的状态有关。()9.命名实体识别(NER)的目的在于识别语料中人名、地名、组织机构名等命名实体。()10.LTP的主要模型中SentenceSplitter是分句模型。()得分阅卷人三、填空得分阅卷人自然语言处理的发展历程分别是:19世纪早期、、。2.目前的分词方法主要有三种:基于规则的分词方法、以及基于语义的分词方法。3.命名实体识别分为和基于统计的命名实体识别。4.的目的在于识别语料中人名、地名、组织机构名等命名实体。5.根据句法结构的表示形式不同,最常见的句法分析任务可以分为以下三种:、依存句法分析以及深层文法句法分析。6.LSTM的三重门分别是:、和。7.GRU中有两个门,决定前一状态有多少信息写入到当前候选集上,决定前一时刻的状态信息写入到当前状态中的程度。8.在Python中,匹配下面生成词典的正确函数是:dict=corpora.([words])从实现上考虑自动文摘所采用的方法可以分为和。影响聚类算法结果的主要因素有、、。11.基于词典的情感分析方法的分类效果取决于。12.基于词典的情感分析方法的最大特点是。13.聊天机器人按照功能需求来划分,可以分为两种,分别为和。得分阅卷人四、综合应用得分阅卷人请采用了今日头条公开的分类数据作为训练语料库,进行Word2vec训练。得分阅卷人得分阅卷人.将以下内容保存为txt文档,并使用TextRank算法对以下内容进行文本摘要。我与父亲不相见已二年余了,我最不能忘记的是他的背影。那年冬天,祖母死了,父亲的差使也交卸了,正是祸不单行的日子,我从北京到徐州,打算跟着父亲奔丧回家。到徐州见着父亲,看见满院狼藉的东西,又想起祖母,不禁簌簌地流下眼泪。父亲说,“事已如此,不必难过,好在天无绝人之路!”回家变卖典质,父亲还了亏空;又借钱办了丧事。这些日子,家中光景很是惨淡,一半为了丧事,一半为了父亲赋闲。丧事完毕,父亲要到南京谋事,我也要回北京念书,我们便同行。到南京时,有朋友约去游逛,勾留了一日;第二日上午便须渡江到浦口,下午上车北去。父亲因为事忙,本已说定不送我,叫旅馆里一个熟识的茶房陪我同去。他再三嘱咐茶房,甚是仔细。但他终于不放心,怕茶房不妥帖;颇踌躇了一会。其实我那年已二十岁,北京已来往过两三次,是没有甚么要紧的了。他踌躇了一会,终于决定还是自己送我去。我两三回劝他不必去;他只说,“不要紧,他们去不好!”我们过了江,进了车站。我买票,他忙着照看行李。行李太多了,得向脚夫行些小费,才可过去。他便又忙着和他们讲价钱。我那时真是聪明过分,总觉他说话不大漂亮,非自己插嘴不可。但他终于讲定了价钱;就送我上车。他给我拣定了靠车门的一张椅子;我将他给我做的紫毛大衣铺好坐位。他嘱我路上小心,夜里警醒些,不要受凉。又嘱托茶房好好照应我。我心里暗笑他的迂;他们只认得钱,托他们直是白托!而且我这样大年纪的人,难道还不能料理自己么?唉,我现在想想,那时真是太聪明了!我说道,“爸爸,你走吧。”他望车外看了看,说,“我买几个橘子去。你就在此地,不要走动。”我看那边月台的栅栏外有几个卖东西的等着顾客。走到那边月台,须穿过铁道,须跳下去又爬上去。父亲是一个胖子,走过去自然要费事些。我本来要去的,他不肯,只好让他去。我看见他戴着黑布小帽,穿着黑布大马褂,深青布棉袍,蹒跚地走到铁道边,慢慢探身下去,尚不大难。可是他穿过铁道,要爬上那边月台,就不容易了。他用两手攀着上面,两脚再向上缩;他肥胖的身子向左微倾,显出努力的样子。这时我看见他的背影,我的泪很快地流下来了。我赶紧拭干了泪,怕他看见,也怕别人看见。我再向外看时,他已抱了朱红的橘子望回走了。过铁道时,他先将橘子散放在地上,自己慢慢爬下,再抱起橘子走。到这边时,我赶紧去搀他。他和我走到车上,将橘子一股脑儿放在我的皮大衣上。于是扑扑衣上的泥土,心里很轻松似的,过一会说,“我走了;到那边来信!”我望着他走出去。他走了几步,回过头看见我,说,“进去吧,里边没人。”等他的背影混入来来往往的人里,再找不着了,我便进来坐下,我的眼泪又来了。近几年来,父亲和我都是东奔西走,家中光景是一日不如一日。他少年出外谋生,独力支持,做了许多大事。那知老境却如此颓唐!他触目伤怀,自然情不能自已。情郁于中,自然要发之于外;家庭琐屑便往往触他之怒。他待我渐渐不同往日。但最近两年的不见,他终于忘却我的不好,只是惦记着我,惦记着我的儿子。我北来后,他写了一信给我,信中说道,“我身体平安,惟膀子疼痛利害,举箸提笔,诸多不便,大约大去之期不远矣。”我读到此处,在晶莹的泪光中,又看见那肥胖的,青布棉袍,黑布马褂的背影。唉!我不知何时再能与他相见!得分阅卷人六、综合应用题三得分阅卷人编写Python代码实现垃圾邮件分类。《Python文本与语音应用设计》期末考试
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030自闭症谱系障碍的诊断与治疗行业发展趋势分析与未来投资战略咨询研究报告
- 2025至2030中国商业保理行业发展趋势分析与未来投资战略咨询研究报告
- 图木舒克职业技术学院《现代生物医药研究进展》2023-2024学年第一学期期末试卷
- 2025至2030高纯度3乙氧基丙酸乙酯行业市场占有率及投资前景评估规划报告
- 2025至2030铝钛硼合金行业市场占有率及投资前景评估规划报告
- 2025至2030轨道交通装备产业市场深度调研及发展趋势与战略报告
- 分形图像压缩技术:原理、挑战与创新应用研究
- 初三数学上册学生提升计划
- 2025-2025年部编版五年级语文上册教学课程设计计划
- 2026届安徽省瑶海区中考考前最后一卷数学试卷含解析
- 二升三数学综合练习 暑假每日一练60天
- 2025年机械制造行业技能考试-制动钳工(客车)历年参考题库含答案解析(5套100道单选题合辑)
- 兵团连队综合管理办法
- 骨科快速康复护理课件
- (零诊)成都市2023级(2026届)高中毕业班摸底测试化学试卷(含答案)
- (高清版)DB11∕T 509-2025 房屋建筑修缮工程定案和施工质量验收规程
- 基于杀伤链的开放式作战体系设计与应用
- 智算中心及算力产业集群项目节能评估报告
- 水利工程竣工验收监理评估报告
- 数学新教师入职培训
- 2025年广西中考地理试题(含答案)
评论
0/150
提交评论