第5-11章练习.doc_第1页
第5-11章练习.doc_第2页
第5-11章练习.doc_第3页
第5-11章练习.doc_第4页
第5-11章练习.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章1、元搜索引擎的概念?原理?分类?元搜索引擎,通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。(最大的优点是省时;最大缺点是检索准确性较差且速度慢。)2、元搜索引擎分类: 在可以检索的目标搜索引擎、检索提问的处理方式以及如何编译和显示结果方面,元搜索引擎有着很大的差异。有些元引擎一个接一个的搜索目标搜索引擎,另一些则同时进行搜索。有些搜索引擎将检索提问转变成目标搜索引擎的提问语言,而有一些则原封不动的发送给目标引擎。按功能划分,元搜索引擎包括并行检索式搜索引擎和All-in-One式搜索引擎;按运行方式的差异可分为在线搜索引擎和桌面搜索引擎。3、什么是桌面元搜索引擎、All-in-One式元搜索引擎、并行检索式元搜索引擎?桌面元搜索引擎:不是通过网上调用,而是直接在用户的计算机上运行,相当于用户自己拥有一个元搜索引擎。All-in-One式元搜索引擎:称搜索引擎元目录,将主要的搜索引擎集中起来,编排组织成目录,根据需求选择搜索引擎,并将用户导引到相应的工具去检索。并行检索式元搜索引擎:是将多个搜索引擎集成在一起,提供统一的检索界面,用户提问被同时发送给多个独立搜索引擎,输出结果是经过聚合之后反馈的多个独立搜索引擎查询结果的综合。4、元搜索网络资源采集机制?(元搜索引擎的原理)我们可将元搜索引擎看成具有双层客户机服务器结构的系统,用户向元搜索引擎发出检索请求。元搜索引擎再根据该请求向多个搜索引擎发出实际检索请求;搜索引擎执行元搜索引擎检索请求后将检索结果以应答形式传送给元搜索引擎,元搜索引擎将从多个搜索引擎获得的检索结果经过整理再以应答形式传送给实际用户。当然,某些元搜索引擎具有略微不同的机制。5、列举不少于5种常见的多元搜索引擎。 答: CYBER411 MetaFind SAVVYSEARCH DOGPILE INFERENCEFIND MetaCrawler(答对其中任意一个给1分,答对五个就可给全分:7分)6、元搜索引擎与普通搜索引擎的区别?(1)普通搜索引擎拥有独立的网络资源采集标引机制和相应的数据库。(2)元搜索引擎一般没有自己独立的数据库,却更多的是提供统一连接界面,形成一个由多个分布的、具有独立功能的搜索引擎构成的虚拟整体,用户通过元搜索引擎的功能实现对这个虚拟整体中各独立搜索引擎数据库的查询显示等一切操作。(3)元搜索引擎能方便地检索多个搜索引擎,扩大了范围;局限性明显的缺点是:检索功能简单;元搜索引擎检索的准确性也要相对差一些。7、多元搜索引擎,又称为集合式搜索引擎(1分),是将多个搜索引擎集成在一起并提供一个统一的检索界面的检索工具(2分)。可分为搜索引擎目录和多元搜索引擎两类(1分)。第六章1、什么是CBIRCBIR (content based image retrieval)是一种新的检索技术,它指除了利用传统的数据库对图像描述的文字信息进行存储管理外,还利用图像的颜色、文理(texture)、形状等特征检索。2、简述CBIR的主要特点 答:直接从图像中提取语义线索和特征,并根据这些线索从大量存储在数据库的图像中查找、检索出具有相似特征的图像数据; 以相似匹配Similarity代替精确匹配match方式; 提问方式直观,检索交互性强; 多层次的高效检索。 3、CBRCBR(content based retrieval,基于内容的检索)被广泛的应用于万维网上的多媒体信息搜索引擎。4、什么是音频?对声音进行数字化处理得到的结果称为音频。5、基于内容的图象检索引擎有哪些? (1)QBIC,/IBM公司开发的一个图像和动态影像检索系统。是基于内容的图像检索系统,并支持基于WEB的图像检索服务,是较早使用content-based技术并且功能全面的典范。(2)VisualSEEK的WebSEEK,:8008/该系统由哥伦比亚大学研制。 VisualSEEK提供一系列查询万维网视图信息的搜索工具, WebSEEk是其中功能强大的特色工具。高效率的Web图像信息检索是其特点。它采用了先进的特征抽取技术;用户界面功能强大、操作简单、查询途径丰富;结果输出画面生动,支持用户直接下载。收录范围 WebSEEk本身就是一个独立的万维网可视化信息编目工具。已收录至少65万幅图像和1万个影像片段进行编目。检索特点 WebSEEk是基于内容的图像、影像目录和搜索引擎,典型的万维网图像搜索引擎。提供主题分类、文本和图像检索。提供两种检索方式:目录浏览和视觉特征检索。 目录浏览:是万维网对视频信息进行编目的突破,分为20个大类。 视觉特征检索:可以检索视频,彩图,灰度图,图形,或者选择所有途径进行组合检索。评价WebSEEk的分类浏览和视觉特征检索方式使其成为一个优秀的视频检索工具。(3)IIDR,www.unn.ac.uk/iidr内容了解见课本P135第七、八章1、综合性学术信息检索系统?包括:(1)国外检索系统 (2)中文检索系统2、国外检索系统?(1)ISI Web of Knowledge平台的重要组成部分包括内容、工具和技术3部分。(2)OCLC FirstSearch,girstsearch,是一个非营利,成员制的联机计算机图书馆服务,也是世界上最大的文献信息服务机构之一。(3)Proquest,美国ProQuest Information and Learing(原UMI公司)创建开发。(4)OVID (5)EBSCOhost (6)Springer3、中文检索系统CNKI平台中国学术期刊(光盘版)电子杂志社、清华同方知网(北京)技术有限公司主办,是基于中国知识资源总库的全球最大的中文知识门户网站,具有知识的整合、集散、出版和传播功能。 CNKI 亦可解读为“中国知网”( China national knowledge internet )的英文简称。中国知识资源总库(简称总库)是中国知网的核心资源。CNKI 是全球信息量最大、最具价值的中文网站。据统计, CNKI 网站的内容数量大于目前全世界所有中文网页内容的数量总和,可谓世界第一中文网。 CNKI 的信息内容是经过深度加工、编辑、整合、以数据库形式进行有序管理的,内容有明确的来源、出处,内容可信可靠,比如期刊杂志、报纸、博士硕士论文、会议论文、图书、专利等等。因此, CNKI 的内容有极高的文献收藏价值和使用价值,可以作为学术研究、科学决策的依据。CNKI 是知识搜索引擎,主要资源有国中国期刊全文数据库、中国优秀博士硕士论文全文数据库、中国重要报纸数据库。4、工程技术信息检索EI(Engineering Index,工程索引)创刊于1884年,是美国工程信息公司 (Ei)出版的著名工程技术类综合性检索工具。它是工程技术领域的综合性检索工具,涵盖工程技术的各个分支学科,如:土木工程、能源、环境、地理、生物、电气、化学、矿业、金属和燃料工程、机械、自动化、计算机等学科领域。5、工程技术信息检索工具的哪些?如Ei Village,Engineering Electronic Library和中国工程技术信息网等6、教育信息检索ERIC数据库 ERIC数据库是一个提供教育相关文献的国家信息系统,1996年由美国教育部与国家教育图书馆共同创建。获取其服务的方式很多种,包括WWW方式,Telnet方式,Gopher方式等。7、社会科学信息资源检索工具社会科学是以社会为研究对象的科学,是研究并阐述各种社会现象及其发展规律的科学。其专门的检索工具是SOSIG。SOSIG是由ESRC,JISC和European Union三方投资组织创建的一个有关社会科学信息资源的搜索引擎。其聘请专家对其数据库中的信息进行筛选,保证了其信息的高质量和高品位。SOSIG由Search SOSIG(信息检索)、Browse SOSIG(信息浏览)、whats New(最新消息)、Add new Resource(添加新资源)和help(帮助信息)五部分组成。8、经济学信息检索工具EconWPA:是由华盛顿大学生经济学院组织创建的一个经济学资源网络搜索引擎,可以免费经检索经济学领域的学术文献。9、法律信息检索工具LexisNexisLexisNexis由Reed Elseviser集团下属的LexisNexis公司创建,为专业人士,企业界、政府以及法律机构等提供全方位的信息服务,在信息产业界居于领先的地位。10、什么是专业检索工具?是由专业性信息机构、专业学会/协会或网络资源专家在广泛收集、整理、组织本专业信息资源的基础上编制的主题分类树型导航系统或检索网站。11、通用搜索引擎与专业搜索引擎的区别?(1)通用搜索引擎绝大多数属于综合性,这种综合性往往会带来一些局限性。诸如信息量虽然大,但针对某一主题略显不足,检索功能比较复杂等。(2)专业搜索引擎是由专业性信息机构、专业学会/协会或网络资源专家在广泛收集、整理、组织本专业信息资源的基础上编制的主题分类树型导航系统或检索网站。(3)专业搜索引擎在解决实际问题时要比通用搜索引擎有效。专业检索工具的价值在于为研究人员和学习者提供定期更新的、面向具体研究领域和学科的、经过学科专家和图书情报人员精心挑选的网络信息。12、中国工程技术信息网(CETIN)中国工程技术信息网是国防科工委牵头等有关部建设的联合信息网络。它是我国工程技术系列的重要信息网站。13、列举出网目录、搜索引擎、学术引擎?目录检索:较为典型有Yahoo!、LookSmart、InfoMine等。搜索引擎:较为典型的搜索引擎有AltaVista、HotBot、Excite、Infoseek、Lycos等。学术引擎:SCI(科学引文索引)、ISTP(科学技术会议录索引)、EI(工程索引)和CSCD(中国科学引文数据库)。14、网上书店有哪些?ABarned and Nobles,当当网上书店,卓越,15、电子图书有哪些?超星数字,书生之家,北大方正Apabi数字图书馆,书同文,榕树下,16、什么是期刊检索系统CNKI?中国期刊网是中国知识基础设施工程CNKI的一个重要组成部分,于1999年6月正式启动。它的数据库主要有:中国期刊全文库(CJD)、中国重要报纸全文库(CCND)、中国优秀博硕士论文全文库(CDMD)、中国基础教育知识库(CFED)、中国医院知识库(CHKI)、中国期刊题录数据库(免费)、中国专利数据库(免费)等。17、列举任意5个国内外的期刊数据库?国内:中国学术期刊;万方数据库资源系统数字/periodical;维普期刊数据库; 中国人民大学报刊资料全文数据库;上海图书馆的社科报刊篇名数据库国外:UnCover, JSTOR,http: Kluwer Online Elsevier Spring Link 18、近年来世界各地的图书馆在开发、建设数字图书馆系统的进程中,已将传统的图书馆目录发展为“联机图书馆公共可检索目录”(Online Public Access Catalog-OPAC),即一个基于网络的书目检索系统。第九章1、参考信息检索概念?类型? 参考信息即指人名、地名、机构、事件、统计数据等一类数据、事实信息,是人们在工作研究和日常生活中要经常要查考、引用的信息。 类型:1、百科知识检索网站 2、人物信息检索网站 3、地理信息检索网站 4、时事、新闻信息检索服务 5、机构信息检索网站 6、语词信息检索网站 7、统计信息检索网站2、什么是白页信息服务?年鉴?黄页?白页信息服务:网上白页是专用于查找因特网用户个人信息的特殊工具,这些个人信息包括电话号码、E-mail地址、邮政编码甚至家庭住址等。在国外人们对网络白页的使用是很频繁的。目前网络上开始流行利用网络白页寻找多年未联系的亲人、朋友,甚至存在很多商业机构声称能提供“更为精确”的检索服务。年鉴:是指“每年出版的统计数据和事实的汇编,兼有现期性和回溯性内容。其包含的地区和学科领域可能较为宽广,也可能限于某一特定国家或特定的主题。黄页:黄页原是国际通用按企业性质和产品类别编排的工商电话号码簿,相当于一个城市或地区的工商企业的户口本。黄页信息被搬到网上后,被称为“网上黄页”。(黄页是网络上查找机构信息的另一大途径)第十章1、关键词检索灵魂?(论述题)(1)足够多的关键词是快速定位目标信息的关键:提供足够的检索关键词将是成功检索的第一步,也是第一个检索技巧。(2)停用词和常用词:检索时应当避免使用停用词和单独使用过于常用的词,这是第二个检索技巧.(3)关键此词的分类和对象的关键词:在检索提问中避免使用行为关键词,谨慎使用关键词.(4)截词检索和通配符:截词检索对于中文检索的意义不大,但是我们需要使用英文或者别的西方文字进得检索时,截词检索就很重要了.在适合的情况下利用截词检索精简检索提问这是四个检索技巧.(5)选定适合的关键词级别:选定合适的关键词级别,因为大而宽泛的主题范围将带来大量的检索结果,专精而狭窄的主题范围则往往只有少量的检索结果,这是第五个技巧. 要了解关键词的级别,先了解两个概念:上位词和下位词上位词,指概念上外延更广的关键词,或者每一个关键词所覆盖的信息范围都是它的上位词所覆盖信息范围的子集.例:”鸟”是”鸽子”的上位词.下位词:则是指概念上内涵更窄的关键词,例:”乱世佳人”是”小说”的下位词. (6)同义词:使用一定数量的同义词参加检索,以覆盖目标信息的范围.一般情况下个人的常识足以提供若干同义词,如果对目标主题很不熟悉,则可能需要先参考一定的资料或咨询他人,这是第六个技巧.(7)词组检索:第七个技巧是尽量使用词组检索.关键词是检索的灵魂,对象词是关键词的重点和核心,而检索时最强有力的关键词则是词组,词组检索强制检索结果必须与词组的形式完全一致,限制的更严,检准率也更高.如果不加上双引号的限制的话,检索工具会默认为检索词的顺序和位置是任意组合.当使用词组检索的时候,某些细微的地方必须引起注意.(8)使用英文专业术语检索:提高搜索结果质量的重要途径.2、网络信息检索的8个技巧 (论述题)(1)检索技巧,提供足够的检索关键词是成功检索的第一步.(2)检索技巧,检索时应当避免使用停用词和单独使用过于常用的词.(3)技巧,检索提问中避免使用行为关键词,谨慎使用修饰关键词.(4)检索技巧,在合适的情况下利用截词检索精简检索提问.(5)检索技巧,选定合适的关键词级别,因为大而宽泛的主题范围将带来大量的检索结果;专精而狭窄的主题范围则往往只有少量的检索结果.(6)检索技巧,使用一定数量的同义词参加检索,以覆盖目标信息的范围。一般情况下个人的常识足以提供若干个同义词,如果对目标信息主题很不熟悉,则可能需要先参考一定的资料或咨询他人。(7)检索技巧,尽量使用词组检索.(8)检索技巧,尽量使用英文专业术语检索,这是提高搜索结果质量的重要途径.3、首先考虑检索策略?(如何制定检索策略?)(1)确定自己的问题是否适合Internet检索。(2了解Internet信息检索的特殊性。(3了解可用的检索工具。(4)他细分析自己的信息需求并选择合适的工具。(5)根据检索结果调整检索策略。(6)检索必须找对地方。(7)选择合适的提问方式4、检索策略(论述题)在实际检索中,检索策略是最先应该被考虑的,它包括如INTRTNE T何分析信息需求,如何选择检索工具,如何根据检索结果调整策略以及对信息资源,对检索工具的深入思考等等.(1) 确定自己的问题是否适合INTRTNET检索:虽然现在的INTRTNET检索工具功能已经很强大,但所谓巧妇难为无米之炊,它们也不可能检索到网上没有的内容,即使是索引数据库最大的搜索引擎,其覆盖的网页范围也仅有INTRTNET网页总数的15%-20%.所以在搜索以前,先想一下:我 要找的东西在网上可能有吗?如果有,可能在哪里?是什么样子?网页上会含有哪些关键词?(2)了解INTRTNET信息检索的特殊性:在万维网上找到自己想要的文档,有时是一件很简单的工作,但更多的时候几乎是”不可能的任务”.原因之一万维网上文档数量的庞大据UCBerkeley图书馆的统计,目前万维网的文档数量已经超过30亿。另一个原因就是现有的万维网文档没有用一个统一的标准进行标识,这和图书馆的目录有很大的不同。检索WEB文档的时候,经常需要猜测某个词是不是出现在自己想要的文档里。所谓的“WEB检索”并不是直接在万维网上寻找某个文档,直接检索万维网是不可能的。(3了解可用的检索工具:目前通用的网络检索工具大致可分为4种类型:搜索引擎,元搜索引擎,网络资源目录和专门数据库。每一种网络检索工具都有自己的特色,应该运用不同的检索策略去使用不同的检索工具,这样才能最大限度地利用检索工具的功能。(4)仔细分析自己的信息需求并选择合适的工具:在检索之前先考虑自己要找的是什么,并且把它用纸笔记下来以一些问题的形式,对于INTRTNET信息检索新手来说这绝对是个好习惯。它的重要性在于能够明确自己信息需求的界限,不至于在后面的检索中迷失目标。根据自己对检索主题的已知部分和需求检索部分的了解,可以从几种类型的网络检索工具开始。(5)根据检索结果调整检索策略:一次成功的检索有两个部分组成:一个设计优秀的检索提问和一批准可信的检索结果。一次成功的检索也经常是由好几次检索组成的,如果对自己的检索的内容不熟,即使是检索专家,也不能保证第一次检索就能找到想要的内容。检索专家会先用简单的关键词测试,不会忙着仔细看各条检索结果,而先从检索结果里寻找更多的信息,在设计一个更好的关键词重新检索。(6)检索必须找对地方:不要以为INTRTNET信息检索就等于使用搜索引擎,事实上,对于很多问题,是无法用搜索引擎解决的。(7)选择合适的提问方式:没有人会知道所有的问题的答案,检索者所能做的是如何问出好问题,这是查找到满意答案的最关键的影响因素。如果运用一个特殊关键词没有发现足够的信息,就应该转向概念更宽泛的一个层面。如果发现太多的信息,就应该用特殊的关键词。还可以根据信息需求调节检索范围。当仅仅需求一个确切的答案时,应该从最特殊的关键词开始,以保证找到的文档和主题完全相关,这可以称为狭窄检索。它的风险是,某些相关信息中并不含有检索时使用的关键词,因此可能错过这些相关信息。当没有明确的检索目标,仅有一些零散的背景知识时,通常应从最宽泛的关键词开始搜索,一旦发现有价值的信息,可利用它,找到更多相关信息,这可以称为宽泛检索。它的风险是,找到大量无效结果。5、什么是上位词?下位词?上位词:指概念上外延更广的关键词,或者可以说是一个关键词所覆盖的信息范围都是它的上位词所覆盖信息范围的子集。例如:“鸟”是“鸽子”的上位词,“动物”是“鸟”的上位词,“小说”是“乱世佳人”的上位词,宽泛地说,一个关键词所表达概念的任何一种属性、任何一种归类方式,都可以是它的上位词。例如:“甲A”的上位词可以是“中国足协”、“足球比赛”、“体育新闻”、“球迷协会”、“转播权”。下位词:是指概念上内涵更窄的关键词。例如:“甲A” 的下位词包括“上海申花”、“北京国安”、“深圳健力宝”。“乱事佳人”是“小说” 的下位词,也是“玛格丽特”的下位词。6、避免使用检索关键词、停用词、常用词。关键词有几个值得注意的地方:首先,一些修饰词本身也可以作为名词,其次,同一个意思可以用许多方式表达,第三,通常情况下我们并不知道别人将怎样描述同一件事,所以,在检索提问中避免使用行为关键词,谨慎使用修饰关键词。检索工具常常会忽略一些太常用的词,因为他们的信息价值很低,检索这些关键词不公无助于缩小查询范围,而且会大降低搜索速度。除了一些所谓的Vulgar word,意思是过于普通的词,虽然他们不属于停用词,但使用得实在这于广泛,以至于出现在成百上千万的网页中,使得他们事实上不能被用来帮助找到什么有用的信息,Internet检索工具一般都有一个停用词表,如果检索提问中包含停用词表中的词汇,检索工具将自动忽略这些词,所以检索工具将自动忽略这些词。所以检索时应当避免使用停用词和单独使用过于常用的词。7、行为修饰词?能够很容易用其他词代替,而且它们本身所能表示的意义也很多。比如“红色”既可以表示一种颜色,也可以是一个政治特色的词语,表示一种意识形态,它还可以用“赤色”、“朱”之类的词代替。8、关键词检索等技巧?(1)提供足够的检索关键词(2)应当避免使用停用词和单独使用过于常用的词(3)在检索提问中避免使用行为关键词,谨慎使用修饰关键词(4)在合适的情况下利用截词检索精简检索提问(5)选定合适的关键词级别(6)使用一定数量的同义词参加检索,以覆盖目标信息的范围(7)尽量使用词组检索(8)使用英文专业术语检索9、截词检索?截词检索(是指利用计算机特有的指定位对比判断功能,使不完整词能与标引词进行比较、匹配的一种检索,主要用于西文中词干相同的派生词的检索,可大大提高查全率和检索效率。可分为后截断、中截断和前截断三种类型。)(截词检索对于中文检索意义不大,但是当我们需要使用英文或者另的西方文字进行检索时,截词检索就很重要了。)10、什么词适合截词检索?首先这些词的词干应该比较长;而它们的复数形式是比较简单的-s或-es的形式,而不是-ies这样的形式;它们的词干不能也是其他很常见的词干。只要满足这些条件,就可以放心地使用截词检索。(在合适的情况下利用截词检索精简检索提问,是检索的技巧之四。)11、AND操作符 (应用题)AND是“且”或“与”意思。在两个关键词之间加上AND,可以缩小检索范围,得到较准确的结果。例如:“花木兰 AND 迪斯尼”,可以找到迪斯尼电影花木兰的信息;dogs and cats,可以找到同时介绍猫和狗的信息。12、AND NOT操作符(应用题)AND NOT操作符从结果中去除包含特定关键词(词组)的文档。例如:“湖南省AND NOT 长沙”,会找到除长沙以外的有关湖南的资料。13、利用网页快照 网页快照中存储了搜索引擎的spider访问到该网页时复制的一个备份,虽然后来源立足点的文档被删除或改名了,但在搜索引擎的数据中该备份还会被保留一段时间。因此通过网页快照往往能找到一些已经不存在的网页。第十一章1、网络信息检索面临的困难与挑战?(论述题 见课本P352)网络信息从无法检索到现在开成了一套强大而有序的检索方法,工具和技术集合。正所谓进展越大,遭遇新的问题也越多,问题的研究和解决,极大丰富了网络信息检索的内容。一、搜索引擎的“瓶颈”1、搜索引擎更新慢:搜索引擎抓取和索引大数量网页需要时间,因此存在信息滞后性。从用户的角度看就可能带来相关信息检索不到和“死链接”的问题。一些搜索引擎采用部分网页快速更新的方法,让SPIDER程序更频繁地访问那些信息更新速度快的重要站点,但只能在一定程度上缓解,索引更新的问题是目前“大服务器中心搜索引擎”模式所无法克服的问题。2、检索结果的排序仍然不能令人满意引入了超链分析核技术之后,尽管搜索引擎结果的排序突破了过去只能依靠关键词出现频率来排序的局面,便得结果排序的准确性有了质的提高,但现实而言,目前的结果排序距离用户的要求还有很在的差距,一方面,用户经常抱怨无法在前几十个检索结果中找到需要的信息,另一方面,一些网页制作都尤其是兜售广告的商家想尽办法让自己的网页在搜索引擎的检索结果中排序靠前,排序问题几乎是每一次搜索引擎调查中用户反映最为突出的问题。3、搜索引擎不能查找动态生成的网页早在因特网出现前,站点内容都是以HTML静态页面形式存放在服务器上,访问者浏览到的页面都是这些实际在的静态页面。二、网络信息检索中的法律问题1、侵犯隐私的风险网络信息检索工具的日渐强大带来的也不都是好消息,在个人隐私越来越受到重视和保护的今天,网络信息工具如何在扩大自己检索范围的同时避免侵犯他人的隐私,确实是一个难题。2、搜索技术本身的争议和“安全港”的规定通过搜索引擎的检索的结果,可以链接到一些非法或侵权的站点乃至深度链接到非法页面本身,这几乎是所有上网用户都经历过的事情。如果要求搜索引擎对找到的结果的合法性负责,那么所有搜索引擎目前都面临法律问题,很可能各种各样的诉讼淹没,用户也将只能茫然无助地面对因特网信息海洋,而不再能享受到深层连接带来的方便快捷。3、网页缓存功能的争议搜索引擎页面缓存问题的核心是一个包含核心网络技术的棘手的法律问题:复制其他网站内容多长时间是可以接受的?临时复制是不是可以接受?目前法律对于商业性网页存服务尚没有任何规定。4、搜索引擎营销中的法律纠纷通过出售关键词,开展“竞价排名”服务,是搜索引擎走向商业化和盈利的重要举措,在这项服务中,企业可以通过向搜索引擎公司支付一定的广告费用,从而“买下”一些关键记号 ,当用户对这些关键词进行搜索时,这些企业的网页将被放在搜索结果中最显著的位置。如何从法律上对检索工具进行规范和约束,确保其对人类信息获取的公正性,是一个更深层次的问题。2、网络信息检索面临的困难与挑战?(简答题)(一)搜索引擎的“瓶颈”1、搜索引擎索引更新慢2、检索结果的排序仍然不能令人满意3、搜索引擎不能查找动态生成的网页(二)网络信息检索中的法律问题1、侵犯隐私的风险2、搜索技术本身的争议和“安全港”的规定3、网页缓存功能的争议4、搜索引擎营销中的法律纠纷3、网络信息检索中的法律问题检索工具和检索行为面临一定的法律风险。 (1)侵犯隐私的风险:在个人隐私越来越受到重视和保护的今天,网络信息检索工具如何在扩大自己检索范围的同时避免侵犯他人的隐私,确实是一个难题。(2)搜索技术本身的争议和“安全港”的规定搜索技术本身的争议和“安全港”规定:搜索引擎自动抓取信息,不可能进行权利状态判断,要求网络服务提供商提供结果中承担责任,不合适的。搜索引擎ISP在不知情的情况下遭控告,立即将侵权作口的外国投资撤消,即可进入“安全港”,得到负责保护。(3)网页缓存功能的争议:搜索引擎保存网页的做法影响访问流量,它包括两个阶段:一是搜索引擎从其他网站下载网页,二是搜索引擎将其下载的,网页提供给不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论