2024年10月自考02139计算机信息检索押题及答案_第1页
2024年10月自考02139计算机信息检索押题及答案_第2页
2024年10月自考02139计算机信息检索押题及答案_第3页
2024年10月自考02139计算机信息检索押题及答案_第4页
2024年10月自考02139计算机信息检索押题及答案_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.以下网站中集百科全书、字典、地图集和年鉴于一体的是

A、InfopleaseB、EuropaWorldC、中国年鉴网D、Almanac

2.全球最大的科技与医学文献出版发行商是

A、JSTORB、ElsevierC、SpringerLinkD、Wiley

3.在国内推出第一个全旅游搜索引擎的是

A、智联B、酷讯C、搜房D、优酷

4.万维网的英文缩写是

A、wwwB、HTTPC、URLD、HTML

5.互联网上最大、最著名的图书及音响制品销售公司是

A、当当网上书店B、卓越网C、Barnes&NoblesD、亚马逊网上书店

6.目前世界上最好的黄白页信息查询工具是

A、WhowhereB、InteliusC、IAFD、AnyWho

7.一般情况下,网络目录的层次结构的层次数的最大值是【】

A、4B、6C、8D、9

8.可对旅游地点的历史、人文等信息提供全方位查询的最佳参考信息检索工具是

A、百科全书B、旅游网站C、网上地图D、白页

9.以下学科信息门户中,收录范围覆盖所有学术领域的是

A、BUBLLINKB、SOSIGC、ScicentralD、Infomine

10.下列选项中属于用户组信息资源的是

A、RSSB、BlogC、TwritterD、Email

11.信息检索中,查询连接到指定url的网页,需要使用的通用字段是

A、appletB、likeC、linkD、host

12.针对某一特定领域的搜索引擎是

A、通用搜索引擎B、元搜索引擎C、垂直搜索引擎D、目录搜索引擎

13.使操作符后的关键词在检索结果不出现的布尔逻辑操作符是

A、ORB、AFTERC、ANDNOTD、*

14.基于内容的图像检索技术的英文简称是【】

A、CBRB、TBIRC、CBIRD、QBIC

15.互联网信息资源的特点不包括

A、互斥性B、多样性C、共享性D、广泛性

16.以下选项中,属于检索功能的评价指标之一的是

A、检索范围B、检索限定C、检全率D、检准

17.号称“世界上最好用的图形搜索工具”是

A、FlickrB、SmugmugC、PicscarchD、GoogleImages

18.基于统计的自动分类方法,将相同或相近特征的对象定义为一类的是

A、归类B、聚类C、匹配D、索引

19.以下选项中属于垂直搜索引擎检索特点的是

A、一次提交多个数据库B、搜索引擎的最小单位是结构化的数据C、服务多样化D、将信息资源进行有序整理

20.类似于传统文献检索中的“追溯检索”的信息检索方法是【】

A、偶然发现B、顺“链”而行C、多元搜索引擎D、网络目录

21.用户提供一个查询图片,搜索引擎在数据库中搜索相似图片的查询模式是

A、按绘查询B、按描述查询C、按例查询D、按需求查询

22.下列属于元搜索引擎的是

A、GoogleB、BaiduC、Yahoo!D、Someta

23.使用操作符时,用于截词检索的布尔逻辑操作符是

A、引号操作符B、括号操作符C、通配符D、Near操作符

24.适合于对某一课题的网络资源进行快速调查、摸底、综览的检索工具是【】

A、搜索引擎B、网络目录C、多元搜索引擎D、Archie

25.中国标准信息的网上检索可以访问的网址有

A、ISOOnlineB、CSSNC、ANSID、CNKI

26.被誉为最大、最全的在线汉语词典是

A、汉辞网B、汉语词典C、百度词典D、在线新华词典

27.以下查询算法模型中最简单的是

A、扩展布尔模型B、布尔检索模型C、向量空间模型D、概率检索模型

28.下列选项,不属于Web信息资源的是

A、超本传输协议B、主页C、浏览器D、Telnet

29.下列搜索引擎中以自然语言检索为特色的是

A、DogplieB、AC、GoogleD、Lycos

30.在因特网上查找当代著名人物最好使用的检索参考源是

A、白页信息B、维基解密C、人物传记资料D、网络资源目录

31.世界各地图书馆的公共检索目录是

A、CALISB、ERICC、OPACD、CETIN

32.全球最大的中文搜索引擎是

A、搜狗B、百度C、爱问D、搜搜

33.以下是社会科学信息资源检索工具的是【】

A、ESRCB、SOSIGC、JISCD、EU

34.出自官方并具有权威性、可靠性特点的互联网信息是

A、科研信息B、媒体信息C、教育信息D、政府信息

35.下列选项不属于因特网信息检索特点的是

A、检索范围大B、信息冗余小C、检索工具强大D、检索效率高

36.被称为“工具书之王的是

A、辞典B、传记C、白页信息D、百科全书

37.超文本标记语言是【】

A、HttpB、HTMLC、URLD、LINK

38.信息需求的描述中可以用5W1H来梳理,其中的T指的是

A、HOLDB、HOWC、WHEND、WHAT

39.被称为“工具书之王”的参考信息检索工具是【】

A、地理资料B、百科全书C、传记资料D、机构名录

40.下列图书不属于工具图书的是【】

A、科技专著B、字典C、手册D、年鉴

41.万维网上最早、最著名的网络资源目录是

A、DmozB、YahooC、GalaxyD、haol23,

42.当今世界信息量最大的电子、工程类信息资源是

A、IELB、ECOC、ProQuestD、ACM

43.下列选项不属于网络信息资源的一般评价方法的是

A、从URL中得到信息B、直接咨询C、从链接中获取信息D、参考他人的评价

44.世界上最大的音乐交流平台是

A、Last.fmB、MP3.comC、AllMusicD、KazaaMediaDesktop

45.由北京大学方正公司开发的数字图书系统是

A、读秀知识库B、Apabi数字资源平台C、书生之家D、书同文古籍书库

46.以下属于并发式元搜索引擎的是

A、iTools!B、.haol23C、DogpileD、飓风搜索通

47.信息资源经过系统的组织和有序化整理的是

A、垂直搜索引擎B、新闻搜索引擎C、手机APPD、门户网站

48.不属于WEB信息资源检索工具的是【】

A、搜索引擎B、网络目录C、多元搜索引擎D、Archie

49.专用于查找因特网用户个人信息的特殊工具是

A、人物传记资料B、黄页信息C、白页信息D、网络资源目录

50.以下不属于常用图像搜索引擎的是

A、images.GB、image.YC、images.SD、image.B

51.用来标识文档类型及其所在网络地址的字符串称为

A、LinkB、HomePageC、FTPD、URL

52.适合于检索特定的信息及较为专、深具体或类属不明的课题信息的工具是【】

A、搜索引擎B、多元搜索引擎C、网络目录D、WAIS

53.中国知识产权网的网址是

A、/zljsB、C、D、ki/index.htm

54.下列属于常用Al-in-onc式元搜索引擎的是

A、www.iTB、www.DC、www.GD、www.G

55.因特网上最受欢迎的信息交流形式是【】

A、FTPB、GopherC、用户组D、Telnet

56.当前世界上规模最大、内容更新最快的期刊数据库之一是【】

A、OCLCB、ArchieC、CARLD、Yahoo

57.由微软公司提供的电子地图服务是

A、Bing地图B、Baidu地图C、MapABCD、Google地图

58.中国标准服务网的网址是

A、B、C、D、ki/index.htm

59.全球最大的中文搜索引擎之一,拥有全球独有的“超链分析技术的是【】

A、GoogleB、MSNC、YahooD、Baidu

60.以事物分类,并有利于对交叉学科进行主题揭示的分类方式是

A、分面组配法B、图书分类法C、主题分类法D、学科分类法

61.以下音频检索工具中,专门用来查找歌剧信息的是

A、音乐极限B、九天音乐C、八宝音乐盒D、OPERABASE

62.世界上最庞大、最完整、收录图书馆最多的联合目录是

A、WorldCatB、OPACC、CALISOPACD、Amazon

63.授予专利的时候给出的编号是

A、公告号B、发明号C、专利号D、公开号

64.被认为是分众分类法的图像搜索工具是

A、B、images.GC、D、image.B

65.世界上最大的非政府标准化专门机构是

A、ISoB、美国国家标准协会C、中国标准服务网D、国家标准化管理委员会

66.能直接影响因特网信息检索工具信息检索的检全率、检准率等的核心指标的是

A、检索效率B、检索范围C、检索技术D、检索限定

67.被称为“工具书之王”的参考信息检索工具是

A、地理资料B、传记资料C、百科全书D、黄页资料

68.将网络检索工具分类成综合型、专业型和特殊型的标准是

A、检索对象B、检索领域C、运行环境D、检索机制

69.下列选项中属于基于内容的图像搜索引擎的是

A、QBICB、C、D、

70.下列选项中属于通用搜索引擎的是

A、搜房B、搜狗C、优酷D、iTools

71.下列可用基于文本的搜索原理进行搜索的文件格式是

A、*.ExeB、*.BmpC、*.pdfD、*.Zip

72.以下是国际标准化组织的是【】

A、CNKIB、CACPC、ISOD、SOSIG

73.世界上最大的中文新闻搜索平台是

A、有道热闻B、搜狗新闻C、百度新闻D、即刻新闻

74.以下网站中能够提供各种有关旅行的拍卖信息的是

A、LonelyPlanetB、VirtualTouristC、ED、SkyAuction

75.收录超过140万位人物传记资料的网站是

A、B、C、D、

76.目前可以用来处理图像的主要特征包括

。A、正确

77.国际组织

78.目录型网络检索工具主要适用于什么检索情况?请列举有代表性的网络资源目录,国内外各两个。

79.基于内容的图像检索(CBIR)

80.是指用户发出与要查找的声音相的声音来表达检索要求

81.试述目录型网络检索工具与搜索引擎的区别。

82.什么是元搜索引擎?它如何工作?它与普通搜索引擎主要的区别是什么?

83.是美国和加拿大最大的连卖出版物和目录数据库。

84.是地理信息的核心,可以用来查找古今中外的地名及所代表的地理、历史、人文等简况。

85.常用的互联网信息检索模型有哪些?各自的优缺点是什么?

86.网络资源目录

87.试述基于文本的图像搜索和基于内容的图像搜索各自的特点及查询方案。

88.参考信息

89.搜索引擎按检索机制可分成哪些类型?谷歌(Google)和雅虎Yahoo)分别属于哪种类型?

90.简述元搜索引擎的优点。

91.词典

92.简述搜索引擎的主要工作步骤。

93.简述搜索引擎的信息索引技术。

94.简述互联网检索工具的性能评价指标。

95.是基于镜头和视频对象的时间特征进行检索。

96.简述互联网信息资源的特点。

97.什么是垂直搜索引擎?主要特征是什么?其关键技术主要有哪两项?

98.什么是用户组信息资源?它的主要优点是什么?

99.是指按规定程序制订,经公开权威机构或主管机关批准的一整套在特定领域内必须执行的规格、规则、技术要求等规范性文献。

100.已发展成为当今世界最大的信息平台,也是最大的信息宝库。

101.又可称为统一入口式、并发式元搜索引擎。

102.简述互联网信息检索的特点。

103.有严格的数学理论基础采用了相关反馈原理克服不确定性推理的缺点。

104.互联网信息检索具有近似无限的检索范围,

105.百度的“hao123”和搜狗的“网址导航”属于

106.搜索引擎

107.会议文献

108.简述图书馆馆藏目录检索系统的检索途径。

109.元搜索引擎

110.互联网检索工具的性能评价主要从哪5个方面进行?其中反映检索系统效率的主要指标是什么?

111.试述搜索引擎的“瓶颈”。

112.信息组织

113.试述网络信息检索中的法律风险。

114.简述目录型网络检索工具的使用方法。

115.是个语言、内容开放的网络百科全书计划。

116.简述关键词选取的步骤。

117.按照一定的评价标准对被评估站点的各方面特征、质量做出主观评判的评价方法叫做

118.简述目录型网络检索工具的分类体系及常见类型。

119.互联网黄页本质上就是一种

120.具有专、精、深的特点,具有行业色彩。

121.较高的

122.搜索引擎以关键词匹配为特征。

123.试述搜索引擎的关键技术和发展趋势。

124.学位论文

125.在独立网站上运行,以互联网信息内容为检索对象的常规检索工具叫

126.黄页信息

127.用户组信息资源

128.检索关键词为:“神舟飞船title:航天image:神舟十号text:航天工程domain:.netur:news”,请说明其中含有的通用字段检索语法意义,并解释该检索关键词的检索目的。

129.简述元搜索引擎的缺点。

130.简述互联网信息资源的局限性。

131.链接(Link)

132.超文本传输协议(HTTP)

133.超文本传输协议

134.试述互联网信息资源的评价标准。

135.网上白页

136.市场调查、市场研究和分析预测信息在网上属于

137.年鉴

138.万方数据知识服务平台的学位论文库主要收录

139.词典

1.答案A

解析InfoPlease是一个免费的权威百科全书式网站,提供年鉴、地图集、字典、词库,包含体育、娱乐、科技、教育、国际新闻以及美国历史事实,同时提供万年历、拼写检查工具等常用工具。

2.答案B

解析荷兰爱思唯尔(Elsevier)出版集团是全球最大的科技与医学文献出版发行商之一,已有180多年的历史。

3.答案B

解析2006年,张一鸣为旅游搜索网站酷讯研发出国内第一个全旅游搜索引擎。

4.答案A

解析“万维网WWW是WorldWideWeb的简称,也称为Web、3W等。”

5.答案D

解析亚马逊书店()是世界上销售量最大的书店。它可以提供310万册图书目录,比全球任何一家书店的存书要多15倍以上。

6.答案C

解析IAF:为用户提供极为优质的黄白页检索服务,是目前世界上最好的黄白页信息查询工具之一。

7.答案A

解析无

8.答案A

解析百科全书:“工具书之王”对旅游地点的历史、人文等信息提供全方位查询。(2019.10选择题)

9.答案D

解析无

10.答案D

解析用户组信息资源:由一组对某一特点事物或主题有共同兴趣的网络用户组成的邮件群或电子论坛。是一种有组织的电子邮件系统,用户在其间通过电子邮件进行一对多的交流。

11.答案C

解析link:url查询连接到指定url的网页例如,link:www.lib.bnu.edu.cn,可以找到所有连接到北京师范大学图书馆网站的网页。

12.答案C

解析垂直搜索引擎是针对某一特定领域、某一特定人群或某一特定需求提供的信息搜索和相关服务,其特点是专、精、深,且具行业色彩。

13.答案C

解析无

14.答案C

解析无

15.答案A

解析互联网信息资源的特点:1)广泛性;2)多样性;3)共享性;4)新颖性;5)互动性;6)经济性。

16.答案B

解析检索效果的评价指标克兰弗登(Cranfield)在分析用户基本要求的基础上,提出了6项检索系统性能的评价指标,它们是收录范围、查全率、查准率、响应时间、用户负担和输出形式。

17.答案D

解析无

18.答案B

解析自动聚类是指从待分类对象中提取特征,再将提取的全部特征进行比较并按一定原则将具有相同或相近特征的对象定义为一类,

19.答案B

解析无

20.答案B

解析追溯法可以利用原始文献新附的参考文献追溯检索;还可以利用专门编制的引文索引进行追溯查找。

21.答案C

解析无

22.答案D

解析无

23.答案C

解析无

24.答案B

解析无

25.答案B

解析无

26.答案D

解析无

27.答案B

解析布尔(Boolean)模型是基于集合论和布尔代数的一种简单检索模型。它的特点是查找那些与某个查询词返回为“真”的文档。

28.答案D

解析web信息资源,又称WorldWideWeb(简称WWW),是因特网信息资源的最主要最常见的形式。它是指建立在超文本、超媒体技术的基础上,集文本、图像、图形、声音为一体,并以直观的图形用户界面(GUI)展现和提供信息的网络资源形式。

29.答案B

解析无

30.答案C

解析无

31.答案C

解析OPAC-OnlinePublicAccessCatalogue,“联机公共目录查询系统”。

32.答案B

解析百度(Nasdaq:BIDU)是全球最大的中文搜索引擎、最大的中文网站。

33.答案B

解析无

34.答案D

解析政府信息:网上最具有价值的一部分信息,由于出自官方,所以具备权威性,可靠性等特点。

35.答案B

解析无

36.答案D

解析百科全书是系统概述人类各个知识门类或某一知识门类的基本知识,按词典形式编排的大型工具书,被誉为“工具书之王”“精简的图书馆”“没有围墙的大学”。

37.答案B

解析HTML,超文本标记语言,是一种用来制作超文本文档的简单标记语言。自1990以来HTML就一直被用作WWW的信息表示语言,使用HTML语描述的文件需要通过Web浏览器显示出效果。

38.答案B

解析无

39.答案B

解析百科全书是系统概述人类各个知识门类或某一知识门类的基本知识,按词典形式编排的大型工具书,被誉为“工具书之王”“精简的图书馆”“没有围墙的大学”。

40.答案D

解析无

41.答案B

解析Yahoo()Yahoo是世界上最著名的网络资源目录。Yahoo的魅力,就在于它的可浏览式等级主题目录。

42.答案A

解析IEE/IEE.简称IEL,是一套由IEEE和IEE出版的全文数据库,是当今世界信息量最大的电子、工程类信息源之一。

43.答案B

解析无

44.答案A

解析Last.fm音乐分享网站的鼻祖,世界上最大的社会音乐平台(有中文)。

45.答案B

解析2002年12月该公司推出方正Apabi数字图书馆,由北京大学方正电子有限公司开发。

46.答案C

解析无

47.答案D

解析学科信息门户(Subjectbasedinformationgateways)是经过组织、有序化和人工处理、与家排选、定期检查处理的学科信息导航系统,其资源都是有效的。

48.答案D

解析Web检索工具的类型主要包括:(1)网络资源目录;(2)搜索引擎;(3)多元搜索引擎。

49.答案C

解析白页指网上专门用于查找用户个人信息的特殊工具,这些个人信息包括电话号码,E-mail,邮编,甚至家庭地址等等。

50.答案C

解析无

51.答案D

解析URL是一个用以标识文档类型及其所在网络地址的字符串,用统一的方式指明因特网上具体信息资源及其位置。

52.答案A

解析搜索引擎:是对互联网上的信息资源进行搜集整理后供用户查询的系统,包括信息搜集、信息整理和用户查询三个组成部分。

53.答案C

解析中国知识产权网。中国知识产权网建站于1999年,由知识产权出版社有限责任公司创办,建站最初目的是为了方便公众检阅中国专利文献,后逐渐发展成为集行业资讯、视角解读、政策法规、案例评析、产品服务、学院培训、资源分享、社区论坛为一体的覆盖知识产权全产业链的一站式服务平台。

54.答案A

解析无

55.答案C

解析用户通信或服务组是因特网上最受欢迎的信息交流形式。

56.答案A

解析OCLC(OnlineComputerLibraryCenter)即联机计算机图书馆中心,是世界上最大的提供文献信息服务的机构之一,数据库绝大多数由一些美国的国家机构、联合会、研究院、图书馆和大公司等单位提供,并高频率地进行更新。数据库的记录中有文献信息、馆藏信息、索引、名录、全文资料等内容。资料的类型有书籍、连续出版物、报纸、杂志、胶片、计算机软件、音频资料、视频资料、乐谱等。

57.答案A

解析必应地图BingMaps是微软公司推出的Bing服务中线上地图服务。

58.答案C

解析中国标准服务网()创建于1998年,是中国标准化研究院主办的国家级标准信息服务网站。

59.答案D

解析百度(Nasdaq:BIDU)是全球最大的中文搜索引擎、最大的中文网站。

60.答案C

解析无

61.答案D

解析无

62.答案A

解析WorldCat:世界上最庞大、最完整、收录图书馆最多的联合育目录。

63.答案C

解析专利号是在授予专利权时给出的编号,是文献号的一种。

64.答案A

解析Flickr被认为是分众分类法的典范,也是第一个使用标签云的网站。

65.答案A

解析ISO国际标准化组织(英文:International-Organization-for-Standardization,简称ISO)是世界上最大的非政府性标准化专门机构,成员包括162个国家。

66.答案A

解析信息检索效率,不仅是影响信息检索系统价值的主要因素,还是人们评价信息检索质量的重要指标。

67.答案C

解析百科全书是系统概述人类各个知识门类或某一知识门类的基本知识,按词典形式编排的大型工具书,被誉为“工具书之王”“精简的图书馆”“没有围墙的大学”。

68.答案B

解析无

69.答案A

解析无

70.答案B

解析所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。

71.答案C

解析无

72.答案C

解析1946年10月14日至26日,中、英、美、法、苏共25个国家的64名代表集会于伦敦,正式表决通过建立国际标准化组织(ISO)。于1947年2月23日宣告正式成立。

73.答案C

解析百度是全球最大的中文搜索引擎,是中国最大的以信息和知识为核心的互联网综合服务公司,更是全球领先的人工智能平台型公司。百度新闻搜索——全球最大的中文新闻平台。

74.答案D

解析无

75.答案D

解析名人传记资源中心.收录CompleteMarquisWho‚sWho的一百多万位人物传记资料。

76.答案B、错误

解析A

77.答案

国际组织也称国际团体或国际机构,是具有国际性行为特征的组织,是3个或3个以上国家(或其他国际法主体)为实现共同的政治经济目的,依据其缔结的条约或其他正式法律文件建立的有一定规章制度的常设性机构。

78.答案

目录型网络检索工具主要适用于:(1)用户进行较笼统的主题浏览和检索。允许用户从等级类目中任意选择检索范围,对不同深度的主题类目进行浏览或检索;(2)当用户尚未形成很精确的检索概念时,采用主题指南作为检索起点非常有效。搜索引擎主要适用于:有代表性的网络资源目录,国外的代表有:Yahoo、Galaxy。国内的代表:搜狗网址导航、新浪分类目录。

79.答案

为了克服基于文本图像搜索的不足,出现了对图像的媒体视觉特征、内容语义,如图像的颜色、形状、纹理和空间布局等可视化内容进行分析和检索的图像检索技术,即基于内容的图像检索,简称CBIR技术。

80.答案

正确。

81.答案

以下从两者的适用性、优势与不足以及发展趋势等角度进行比较。1、适用性目录型网络检索工具主要适用于:(1)用户进行较笼统的主题浏览和检索。允许用户从等级类目中任意选择检索范围,对不同深度的主题类目进行浏览或检索;(2)当用户尚未形成很精确的检索概念时,采用主题指南作为检索起点非常有效。搜索引擎主要适用于:适用于检索难以查找的冷僻、稀有、最新信息或一些比较综合、模糊、无确切分类的主题。2、优势与不足目录型网络检索工具优点是:①其收录的网站经过专家的人工精选、信息质量较为稳定;②人工干预提高了其返回结果的相关性,提高了检索的查准率;③直观易用,适合多数网络用户和新手;④用户从目录搜索得到的结果更具参考价值。目录型网络检索工具缺点是:①搜索范围较小,信息更新速度也相对较慢;②限制了网络信息资源的容量;③收录的网页数量和标引深度相对不足,很难检索到较专业、深入的信息;④难于控制主题等级类目的质量,各系统的分类体系和标引方式不统一、不规范、导致一定的误查和漏查。搜索引擎的优点是:查询全面而充分,方便快捷。搜索引擎的缺点是:①信息查询的命中率、准确率、查全率不太令人满意,信息噪音太大;②由于没有分类目录那样清晰的层次结构,令用户感觉繁杂;③信息资源缺乏规范控制,降低了可靠性。3、目录型网络检索工具与搜索引擎的发展理想的检索工具是能在目录型网络检索工具主题分类结构下实现搜索引擎的全文检索,将两者的优势结合起来,使检索结果更为全面、准确。强大的搜索引擎检索功能和科学的网络目录分类体系相结合,是网络信息检索工具的发展趋势,只有将二者结合起来,才能提供更完善的检索服务。

82.答案

元搜索引擎又称集合式搜索引擎、并行搜索引擎或搜索引擎之搜索引擎。它是将多个搜索引擎集成在一起,并提供一个统一的检索界面。元搜索引擎将多个搜索引擎进行集合,通过统一的检索界面接受用户的检索提问,用户只需递交一次检索请求,元搜索引擎就可根据知识库中的信息,将用户的检索请求转换为多个搜索引擎所能识别的格式,自动地分发、提交给多个独立的搜索引擎,同时进行多个数据库的检索,最后元搜索引擎再把从各个搜索引擎返回的检索结果收集起来,进行比较分析,合并冗余、去除重复信息,并以一定的格式返回给用户。其核心要义是通过提供“一站式“的检索,既搞乱在检索范围,又节省用户在不同搜索引擎之间转换的时间,使用户检索的综合性、完整性有所提高,并努力提高查全率。元搜索引擎与普通搜索引擎的区别体现在4个方面:(1)元搜索引擎可以将一次提问提交多个数据库。用户的一次查询可以同时检索多个独立搜索引擎,并根据不同独立搜索引擎的要求按不同的形式提交同一查询。(2)元搜索引擎没有自己独立的资源库。一般的搜索引擎有独立的网络资源采集标引机制和相应的数据库,而元搜索引擎没有自己独立的数据库和采集程序,它以一个代理的角色接受用户检索请求。(3)元搜索引擎的结果是基于独立搜索引擎结果的二次加工。元搜索引擎的结果基于独立搜索引擎的查询结果,少数简单的直接调用原始的结果页面,但都实现了对独立搜索引擎查询结果的二次加工,如重复结果的删除、结果的再度排序等。(4)元搜索引擎标明结果记录的来源搜索引擎及其相并度。在定制结果输出形式的元搜索引擎中,检索结果一般都标明记录的来源搜索引擎及其相关度。

83.答案

正确。

84.答案

正确

85.答案

1、布尔检索模型布尔检索模型是最简单的检索模型,也是其他检索模型的基础。其优缺点是:布尔检索模型原理简单易理解,容易在计算机上实现并且具有检索速度快的优点,但最终给出的检索结果没有相关性排序,不够精确,不能反映不同的索引项对一个文档的重要程度的差异。2、扩展布尔模型:是对布尔模型的改进。其基本思想是将非此即彼的相关判断方式改为计算相似度。3、向量空间模型向量空间模型的基本思想是:文档和检索提问都可以用向量表示,检索过程就是计算文档向量与检索提问向量之间的相似度,可以根据相似度值的不同,对检索结果进行排序;还可以根据检索结果,做进一步的相关检索。向量空间模型的优点:使用简便,并且在模型中有许多可调整的计算方式。向量空间模型的弱点:欠缺理论的支持与验证。4、概率检索模型概率检索模型有严格的数学理论基础,采用了相关反馈原理克服不确定性推理的缺点。概率检索模型的缺点是参数估计的难度比较大,文件和检索的表达也比较困难。

86.答案

网络资源目录,又称网络目录、分类站点目录、站点导航或主题指南等。是由开发者将网络资源收集后,按某种分类体系进行组织整理,并和检索方法集成的一种可供分类浏览和检索的等级结构式目录。

87.答案

图像搜索(搜索引擎):通过搜索图像的文本表示或者视觉特征,为用户提供互联网上相关图像资料检索服务的专业搜索引擎系统。TBIR(Text-basedImageRetrieval)是基于文本的图像检索技术,从图像名称、图像尺寸、压缩类型、作者、年代等方面标引图像,忽视图像的底层特征,如颜色、纹理、布局等对正确识别图像有着重要意义的元素。TBIR目前在互联网图像信息检索系统中占据主导地位。目前可通过网页文字赋予图像一定的上下文意义并进行检索,如:(2分,任意给出2点及以上均给2分)1)图像文件名及网址;2)图像的替代文字;3)图像周围的文字;4)图像所在页面的标题;5)图像的超链接;6)图像所在网页彼此的链接。CBIR(Content-basedImageRetrieval)是基于内容的图像搜索,是对图像的媒体视觉特征、内容语义,如图像的颜色、形状、纹理和空间布局等可视化内容进行分析和检索的图像检索技术。基于内容的图像检索技术主要处理的是图像的底层特征和中层特征,主要特征包括:颜色、纹理、形状,査询模式主要有以下3种:1)按例査询;2)按绘査询;3)按描述査询。(3分,全部给出主要特征,或者给出全部査询模式,都可以给3分。)上述回答若意思匹配,但语句不尽相同,酌情给全部或部分分数。适当阐述再给3分。

88.答案

参考信息即指人名、地名、机构、事件、统计数据等一类数据、事实信息,是人们在工作研究和日常生活中经常要查考、引用的信息。

89.答案

搜索引擎按检索机制可划分为:(3分,每个类型给1分):1)目录型;2)索引型;3)混合型。按检索机制谷歌(Google)是索引型,雅虎(Yahoo)是目录型(注意回答二者均是混合型,也视为正确,给分!因为目前二者主要分别是索引型和目录型,但实际上也有额外的检索方式。)上述回答若意思匹配,但语句不尽相同,酌情给全部或部分分数。

90.答案

1、信息覆盖面大,检索效率高。2、检索工具扩展性能强。3、服务多样化。、4、无须考虑网页索引数据库的建立和维护。

91.答案

词典是根据一定的编撰目的汇集词语(或词语的某些成分),并加以描述、说明、通常按字顺排列,供人们查找语词信息的工具书。

92.答案

搜索引擎工作原理的四步骤:(1)抓取——从互联网上抓取网页:搜索引擎的信息搜集基本上是自动的。利用能够从互联网上自动抓取网页的“蜘蛛”程序,自动访问互联网,并沿着任何网页中的所有链接跳转到其他网页,重复这个过程,并把访问过的网站中符合收录要求的网页收集回来。(2)索引——建立索引数据库:此过程即为搜索引擎对搜集到的网页信息进行系统整理的过程。(3)搜索、排序——在索引数据库中搜索排序:用户输入关键词进行检索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页,计算关键词的相关度排序,相关度越高排名越靠前。(4)显示——对搜索结果进行处理排序:搜索引擎定期对网页进行重新访问,更新数据库信息,同时根据网页文字和链接关系的改变重新进行排序。最后由页面生成系统将搜索结果的链接地址和页面内容等信息组织起来返回给用户。

93.答案

1、 信息语词切分和语词词法分析。2、 进行词性标注及相关的自然语言处理3、 建立检索项索引4、检索结果处理技术:搜集引擎确定相关性的方法有概率方法、位置方法、摘要文件和分类或聚类方法。

94.答案

1、收录范围2、检索功能3、检索效率4、检索结果的处理和展示5、用户界面设计

95.答案

正确

96.答案

互联网信息资源的特点:1)广泛性;2)多样性;3)共享性;4)新颖性;5)互动性;6)经济性;(答对1点给1分,全部答对给7分)上述回答若意思匹配,但语句不尽相同,酌情给全部或部分分数。

97.答案

所谓垂直搜索引擎(Verticalsearchengine),是针对某一特定领域、某一特定人群或某一特定需求提供的信息搜索和有一定价值的相关信息服务,其特点就是专、精、深,且具有行业色彩。垂直搜索引擎的关键技术:(1)“主题爬虫”技术(2)Web信息提取技术垂直搜索引擎的特征:(1)信息采集(2)信息加工(3)信息检索

98.答案

用户组信息资源是由一组对某一特定主题事物有共同兴趣的网络用户组成的邮件群组或电子论坛,是一种有组织的电子邮件系统,用户在其间通过电子邮件(Email)进行一对多的交流。其优点包括:(1)直接交互(2)全球互联(3)主题鲜明

99.答案

错误,题中“专利”应改为“标准”。

100.答案

正确

101.答案

正确

102.答案

1、无限的检索范围,动态的检索对象2、丰富的检索内容,新兴的检索领域3、强大的检索工具,低廉的检索费用

103.答案

正确

104.答案。

正确。

105.答案。

错误。百度搜索引擎属于索引型网络检索工具。

106.答案

搜索引擎(SearchEngine)是一种能够通过互联网接受用户的查询指令,帮助用户迅速地从网上查找所需要的信息,并向用户提供符合其查询要求的搜索结果列表及相关信息的检索系统。

107.答案

会议文献是在各种学术会议上所发表的论文、报告、讲演等的统称。其主要特点是时效性强、反映新成果较快,质量较高,专业性较突出,往往代表着某一学科或专业领域的最新研究水平。

108.答案

检索某个图书馆目录有多种途径:首先,直接访问高校主页,点击图书馆即可。其次,可以利用各类网络目录中的“图书馆”目录。最后,利用通用搜索引擎直接查询某图书馆的名称,链接其主页后即可点击使用其馆藏目录。

109.答案

元搜索引擎又称集合式搜索引擎、并行搜索引擎或搜索引擎之搜索引擎。它是将多个搜索引擎集成在一起,并提供一个统一的检索界面。

110.答案

互联网检索工具的性能评价主要有5个方面:1、收录范围2、检索功能3、检索效率4、检索结果的处理和展示5、用户界面设计反映检索系统效率的主要指标是:(1)检全率;(2)检准率。

111.答案

1、搜索引擎的索引能力搜索引擎的索引量或称覆盖率对搜索结果的相关性、时效性和查全率等都具有深远的影响,Google的数据库成为公认的全球最庞大的网络资源索引。搜索引擎数据库的规模不能说明搜索结果相关度的高低,搜索引擎拥有庞大的索引库并不意味着用户能够在优先看到的搜索结果中得到最恰当的网页。2、迎战“深网”“深网”又称暗网。主要指那些通过搜索引擎难以发现、索引、检索到信息内容的网页。产生“深网”的原因有很多:(1)一些网站出于对版权和隐私权的保护,不愿意其某些网页被搜索引擎抓取,而采取技术措施屏蔽搜索引擎;(2)互联网本身缺少统一规则,很多网站在数据结构、内容组织等方面自成一体,导致搜索引擎的蜘蛛程序无法识别这些网站内容并抓取;(3)很多站点的全部或部分内容是需要登录才能阅读的,也就是说需要先输入账号和密码,但蜘蛛程序不可能在每个网站都注册账号,所以它也没办法访问这些网页。(4)存在大量的动态网页。即在网站服务器中并不存在这个页面,只有当用户输入某个变量以后它们才会生成。3、搜索结果的排序与输出能否把与用户检索需求最相关的高质量文档纳入结果排序的前列是衡量搜索引擎性能的关键指标之一。目前,不同的搜索引擎使用了不同的相关度排序方法,比较常见的有:(1)链接分析法,即基于超链分析的排序算法,其出发点是认为,一个网页被链接的次数越多说明此网页的质量越高,并且从更重要、更权威的页面发出的链接有更大的权重。(2)词频统计法,即以索引项的词频和位置作为相关度的判定标准,采用词频加权方法来计算相关度。

112.答案

信息组织就是把数据按照一定的结构、顺序、排列方式组织起来,或者说是按照信息查询的需要,对数据根据其特征进行组织。上述回答若意思匹配,但语句不尽相同,酌情给全部或部分分数。

113.答案

1、版权风险在搜索引擎强大的搜索能力下,大量拥有版权的网站、网页、书籍、报刊、论文、图片、音频、视频等被纳入到搜索范围中,因此,版权成为搜索引擎面临的主要法律风险之一。一般来说,搜索行为本身并不构成侵犯版权,但某些搜索引擎采用了嵌套链接技术,隐藏了来源网站的真实链接,并在搜索引擎的平台上直接将来源网站中的内容展示给用户,这就超出了搜索引擎应有的服务范围,就有可能带来侵权的风险。2、侵犯隐私的风险“人肉搜索”即指利用人工参与来完成搜索或提纯搜索引擎所提供信息的一种机制。“人肉搜索”被用来搜索某个人的相关信息时会引起很大的社会反响和争议。3、搜索引擎营销的法律风险在搜索营销中,搜索引擎既是广告发布者,又是广告经营者,要对所产生的后果负责。因此,搜索服务商要完善管理机制和相关技术,自觉规避相关风险,才能保证可持续发展。4、避风港原则为帮助网络信息服务商(ISP)规避部分侵犯著作权的风险,美国1998年通过的《数字千年版权案》制定了“避风港”(SafeHarbor,或称作安全港)条款。该条款规定:在发生著作权侵权案件时,当ISP只提供空间服务,并不制作相关内容,如果ISP被告知侵权,则有删除的义务,否则就视为侵权。如果侵权内容既不在ISP的服务器上存储,又没有被告知哪些内容应该删除,则ISP不承担侵权责任。

114.答案

1、采用广度优先查询法。2、注意了解各个检索工具的收录特点,选择适当的工具。3、掌握各目录型检索工具的分类体系。4、关注热门主题和常用目录。5、关注开放目录型检索工具。

115.答案

正确。

116.答案

1、抽取基础关键词,排除常用词。2、考虑基础关键词的同义词。3、考虑上位词和下位词。4、考虑相关词。5、总结审视。

117.答案。

错误。把“定量评价”改成“定性评价“

118.答案

目录型网络检索工具的分类体系主要包括以下四种:(4分,每个体系1分)1)主题分类法;2)学科分类法;3)图书分类法;4)分面组配法。目录型网络检索工具的类型可分为常见3种类型:(3分,每个体系1分)1)网络资源目录;2)学科信息门户;3)搜索工具门户上述回答若意思匹配,但语句不尽相同,酌情给全部或部分分数。

119.答案。

正确

120.答案

错误。把“通用搜索引擎”改成“垂直搜索引擎”

121.答案可以节约用户从数据库中查找相关信息的时间。

错误。把”检准率“改成”检全率“

122.答案

错误。第二代搜索引擎以关键词匹配为特征。

123.答案

搜索引擎的关键技术如下:1)信息收集和存储技术:一般分为人工和自动两种;(1分2)信息预处理技术含关键词提取技术、垃圾信息消除技术、链接分析技术、网页重要性计算技术;3)信息索引技术含信息语词切分和语词词法分析、进行词性标注及相关的自然语言处理、建立索引项索引、检索结果处理技术。搜索引擎的发展趋势,共6项:(6分,每项1分)1)自然语言检索技术;2)目录导航检索与关键词检索相结合;3)智能化和个性化检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论