版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
文献检索课第5章网络信息资源检索第5章网络信息资源检索5.1搜索引擎5.2开放网络信息资源检索在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资源的利用是终身学习的需要,也是个人信息素养中的重要内容。相对与本馆纸质文献信息资源和数字资源的检索利用,其对人的影响更为深远。引言发现、使用、共享、扩展
——yahoo对未来搜索使命的理解网络信息资源概念、类型、特点概念:网络信息资源是一切投入互联网的电子信息资源的统称。狭义的网络信息资源是指可在计算机技术、通信技术及多媒体技术相互融合而形成的网络上发布、查询与存取利用的信息资源的总和。按信息内容的表现形式和内容划分可分为全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等;事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等;数值型信息:主要是指各种统计数据;数据库类信息:如DIALOG,万方等,是传统数据库(如光盘数据库)的网络化;微信息(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等。其它类型:投资行情和分析,图形图象,影视广告等。网络信息资源概念、类型、特点按所采用的网络传输协议可分为:WWW网络资源:因特网信息资源的主流,它使用http协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。FTP信息资源:它使用ftp协议,该协议主要用于连网计算机之间传输文件。FTP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和文件的主要方法。TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。许多机构都提供远程登录的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。用户服务组资源:包括新闻组,电子邮件组等。这些电子通信组形式所传递和交流的信息资源是网络上最自由、最具有开放性的资源。网络信息资源概念、类型、特点按网络信息资源的主题划分:新闻信息资源商业信息资源法律信息资源教育信息资源娱乐信息资源…网络信息资源概念、类型、特点网络信息资源的特点:信息使用成本低
网络信息绝大部分可免费使用,低费用的网络信息资源有效地刺激了用户的信息需求。非线性网利用超文本链接,按知识单元及其关系建立起的立体网络结构,完全冲破传统的知识线性组织的局限,通过各个知识点把整个网络上的相关知识链接起来。通过各种搜索引擎信息检索变得方便快捷,阅读信息时可以以跳跃的方式进行。信息共享程度高由于信息存储形式及其数据机构具有通用性、开放性和标准化的特点,在网络环境下,时间和空间范围得到了最大限度的延伸和扩展。用户同时可以共享同一份信息资源。信息数量巨大而庞杂因特网是一个基于TCP/IP协议联接各国、各机构数十万个计算机网络,集各种信息资源为一体的信息资源网,由于政府、机构、企业、个人都可以在网上发布信息,因此成为海量的、庞杂的信息源。
信息类型多、范围广网络信息无所不包,而且类型丰富多样,覆盖不同学科、不同领域、不同地区、不同语言的信息资源,在形式上包括文本、图象、声音、软件、数据库等;内容包括学术信息、商业信息、政府信息、个人信息等。
网络信息资源概念、类型、特点网络信息资源的特点:分布式、跨平台使网络信息资源存放在不同国家、不同地区的各种服务器上,各种信息数据库基于的系统、平台不同,形成了分布式、跨平台的特点。这个特点要求检索系统能跨网、跨库、跨系统、跨平台、跨语言的操作与检索应用。信息动态性高信息网上信息具有高度动态性,不但各种信息处于不断生产、更新、不断淘汰的状态,它连接的网络、网站、网页也都处在变化之中,任何网络资源都有可能在短时间建立,更新、更换地址或者消失的可能,使得网上的信息瞬息万变。质量良莠不齐网络上大部分资源并不象图书和期刊那样经过编辑和出版部门的审核,而且网络资源的提供不受任何组织和制度的控制,导致网上资源质量参差不齐。信息有序与无序并存
从某个局部来看,如某个网站、网页、数据库,信息是有控制的、相对集中、有序和规范的;但从宏观来看由于互联网上的信息没有统一的控制,网上信息是分散、无序、不规范的。这种局部有序总体无序的特点,凸现了网络信息组织与整合的重要性。网络信息资源概念、类型、特点5.1搜索引擎常用搜索引擎5.1.1定义
搜索引擎(searchengines)是www环境下一种信息检索的工具。它利用某种软件(如网络“蜘蛛”spiders)对互联网上的信息进行自动跟踪和发掘,把收集到的所有网页进行分类存储和标引,并向用户提供查询入口。用户通过这个查询入口在浩如烟海的信息海洋中找到自己所需的信息。5.1.1定义5.1.2搜索引擎分类目录式搜索引擎搜索式搜索引擎(1)综合搜索引擎(2)专业搜索引擎元搜索引擎目录式搜索引擎目录式搜索引擎是指把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类,形成可供浏览的树状结构,类似图书馆的分类主题目录,用户可以不进行关键词查询,通过层层点击浏览也可以找到所需要的信息。目录索引类搜索引擎以Yahoo雅虎为代表,国内还有搜狐、新浪、网易等,国外有OpenDirectoryProject(DMOZ)、LookSmart、About等。其特点是由于加入了人的智能,所以信息准确、查准率高,但是搜索范围较小,查全率低,在检索学科专业属性特征明显的信息时利用这种方式极为方便,但搜索引擎信息归类的质量和用户对信息类别了解程度将直接影响到查询结果。(网页)型搜索引擎搜索(网页)型搜索引擎是最常见的。指能够对各网站的每个网页中的每个词进行搜索的引擎,使用关键词(Keywords)匹配方式检索。用户使用关键词对网页进行搜索时,系统通过蜘蛛机器人自动在选定范围内进行检索,并将所检索到的信息自动标引导入索引数据库中,匹配所检索中的网页,并输出匹配结果。有代表性的如Google、百度、AltaVista、AllTheWeb等。该类型搜索引擎并不对网页文本的内容进行分析,只是根据单词在网页标题和文本中的位置和出现的频度来决定所在网页在包含同一单词或者意义相似的单词的所有网页中的排列级别。如当搜索单词computer时,一个在正文中出现18次computer的网页会排在出现5次computer的网页前,而一个用computer作为标题的网页在搜索结果中的级别高于标题中没有computer的网页利用关键词搜索速度快,用户易学易用,但其不对内容处理的工作方式导致搜索结果数量庞大,这就要求用户在设计构造检索表达式及对反馈结果的限制选择上作一定的技术处理,因而对用户的检索能力要求相对来说反而高些。搜索引擎:水平门户_综合搜索引擎[中文]中文常用搜索引擎百度中文搜索引擎:http:///
Google中文搜索引擎:/
搜狐搜狗搜索:http:///
雅虎:/
新浪:/
网易:/
TOM搜索:http:///
北大天网搜索引擎:http:///
奇虎/
国外英文常用搜索引擎Google—以搜索精度高、速度快成为最受欢迎的搜索引擎,是目前搜索界的领军人物。Fast/AllTheWeb—总部位于挪威的搜索引擎后起之秀,风头直逼google。AltaVista—曾经的搜索引擎巨人,目前仍被认为是最好的搜索引擎之一。Overture—最著名的搜索引擎广告商,竞价排名的始作俑者,也是全文搜索引擎。Lycos—发源于西班牙的搜索引擎,网络遍布世界各地。HotBot—隶属于LycosNetworks,搜索结果来自其他搜索引擎及目录索引。搜索引擎:水平门户_综合搜索引擎[外文]搜索引擎:垂直搜索引擎——专业搜索引擎垂直搜索引擎:即专业或专用搜索引擎,它专门用来检索某一主题范围或某一类型信息,追求专业性与服务深度是它的特点。垂直搜索引擎不但可保证此领域信息的收录齐全与更新及时,而且检索深度和分类细化远远优于综合搜索引擎。垂直搜索引擎的检出结果虽可能较综合搜索引擎少,但检出结果重复率低、相关性强、查准率高,适合于满足较具体的、针对性强的检索要求。目前已经涉及到购物,旅游,汽车,工作,房产,交友等行业。垂直搜索引擎举例找工作的搜索引擎:http:///
google学术搜索:http:///
google图书搜索:/
比价购物搜索引擎:/
TheMusicFinder
Singingfish(只能搜寻声音和录像)http://
旅行TripAdvisor
http://
图像搜索引擎:http:///[图像词典]RSS源[RSSfeed]搜索引擎单个站点:新华网:
http:///rss.htm
天极网:
http:///
计世网:
http:///
网典:
http:///
搜索引擎:中文RSS搜索引擎:http:///
八方搜索引擎/
博客中国http:///[feed,订阅数据源和单篇]
看天下http:///rssindex/[feed,订阅数据源]
看天下搜索引擎:http:///search/[单篇]
RSSSearchEnginehttp:///
综合搜索引擎GOOGLE图书搜索
/
GOOGLE学术搜索:
http:///Google图片搜索http:///Google地图搜索/百度MP3搜索百度地图百度图片搜索http://
AllTheWeb[能专门对图像、多媒体信息。]
搜狗(Sogou)[人物、音乐、购物、图片、地图]
http:///gengduo.htm新闻类检索工具Google资讯中国版/百度新闻搜索http:///
中搜新闻搜索http:///
雅虎资讯http:///
搜狗新闻搜索/爱问新闻搜索/网易新闻搜索/新华网搜索/search/index.html搜网综合新闻搜索http:///xw.htm图片检索工具百度图片搜索http:///
Google图片搜索http://雅虎图片搜索/中搜图片搜索http:///
搜狗图片搜索/图像词典网图http://www/地图搜索引擎搜狗地图http:///
百度地图http:///
爱问本地搜索/中搜地图http:///
我要地图网/
Google地图/maps图行天下网上电子地图MapBlast音乐搜索引擎百度MP3搜索/雅虎MP3搜索/中搜Mp3搜索/搜狗音乐搜索/SoGua
/search/搜网MP3强力音乐大搜索
/mp3search.htm其他:各种音乐网站
论坛搜索引擎Google网上论坛http://奇虎·论坛社区搜索http:///Teein
中文论坛搜索引擎/中搜论坛-全球中文论坛门户
http:///Chinabbs.Com
帖子搜索(非全文)
/SOSO论坛搜索http:///
FTP资源搜索引擎天网
星空搜索/ftpsearch/search.htmlFTPSearch
http://BT搜索引擎BT特工http:///
BT@China联盟/飞客BT搜索引擎贪婪大陆-动漫搜索频道http:///
BT下载工具:http:///bt.aspx
BT@China联盟搜索引擎:射手网(字幕下载)http:///
元搜索引擎(MetaSearchEngine)这类搜索引擎没有自己的索引数据,它将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。如万纬搜索、Search、Dogpile等优点:能同时搜索多个搜索引擎,能在一定程度上提高查询的广度。缺点:因为有时后并不能对一个搜索引擎全部查完,有时后也会漏掉一些重要信息。早期的中文元搜索引擎
1、metaFisher中文元搜索引擎http:///fish/做的较早,核心功能较弱,没有现代主流搜索引擎的界面风格。
2、万纬搜索http:///功能上和第一个元搜索引擎一样,核心功能很弱,制作一般
3、多元搜索http:///做得较早,虽然号称整合的搜索引擎最多,但实际使用效果很差,查询速度也慢,返回结果基本未作处理。
新近出现的元搜索引擎
1、一家搜http:///对相似结果的处理有点特色
2、bbmao
http://是国内唯一具有自动聚类功能的元搜索引擎,技术和功能上都比较强
3、狠搜http:///可以定制源搜索引擎,同时提供商业信息搜索,核心功能一般元搜索引擎(MetaSearchEngine)语法“…”全文搜索语法define:——定义语法filetype:——查特定文件类型.ppt.pdf.ps.doc.txt.xls.swf.rtf.lwp.mw.wri.ans.wdb语法site:(指定网域查找).语法fy——中英文词典翻译语法“link:”(友情链接)语法inurl:intitle:网址中搜索网页标题中搜索语法Info:(查询与某链接相关信息)语法“cache:”——查缓存页面用来搜索google服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。示例:查找google缓存的中文yahoo首页
搜索:“cache:”搜索引擎使用技巧精确检索词要明确检索目标,为什么检索,以确定检索词的范围大小。多利用反映具有个性和特征的概念作为关键词,使用更特定的词汇。注意搜索引擎对关键词识别上的特殊规定,是否区分字母大小写,是否有不支持停用词和过滤词(如中文“的”、“地”、“和”)。根据需要,适当增加关键词数量精确检索,使用2到3个以上的特征关键词。选用高级检索功能
你得到什么答案,取决于您怎么提问。提问表达式的构造质量将直接影响检索质量,而检索工具是通过利用其高级检索功能来反映对提问表达式的精确与深度构造,所以从某种程度上讲,高级检索功能是反映其总体搜索水平高低的重要指标。所以要学会用布尔逻辑、限制检索等高级检索的技术。搜索引擎中有一些特殊的语法命令,掌握它们可以使检索更高效。
搜索引擎使用技巧不总是Google(Baidu)
每种搜索引擎具有不同的特点,用不同的搜索引擎进行查询得到的结果常常有很大的差异,只有选择合适的搜索工具才能得到最佳结果。搜索引擎使用技巧学习搜索的经验多向高手学习、多查询介绍搜索技术的信息,多交流、多总结优秀搜索工具和数据库,在利用搜索工具前先阅读一下引擎相关指令、自身的操作、定义符及规则。中文搜索引擎指南网搜索研究院搜索引擎直通车搜索引擎使用技巧学科信息门户学科信息门户
(SubjectInformationGateway,SIG),也称为“学科门户”,是针对特定学科或者某一主题领域,按照一定的资源选择和评价标准,规范的资源描述和组织体系,对具有一定学术价值的网络资源进行搜集、描述和组织,并提供浏览、检索和导航等增值服务的专门性信息门户。简单地说,就是将Internet上与该学科或者领域相关的知识要闻、国际动态、开放资源、专家学者个人网站、会议论坛、学术指南、学术期刊网络版、学术站点、国内外著名大学和科研机构、以及大量分散在各个BBS、公告栏上的网络零次文献等的URL,集中组织在一个页面,供用户检索,浏览。
学科信息门户与搜索引擎最大的区别是它提供的信息是高质量的,是系统的,是受控的。学科信息门户有计划、有针对性地由专业人员搜集信息,对信息源进行质量鉴别后进行取舍,给纳入学科门户的信息使用受控语言和关键词必要的内容描述,最后进行系统的组织,一般都从学科属性、资源类型角度多重揭示。这些都是搜索引擎无法作到的。通过学术信息门户可以迅速把握一个学科领域的主要信息源,不必用搜索引擎盲目查找,也不会受无用信息的干扰,对科学研究有着重要的作用。学科信息门户介绍(国内)清华大学学科网络导航(http:///infoweb/index.jsp) 包括CALIS重点学科网络导航、清华大学资源网和清华大学学科网络资源导航三大块,涉及生物、工程、计算机等学科。CALIS重点学科网络导航(68/cm/main.jsp)该系统由CALLS成员共同建成,现建成265个学科导航系统,其学科几乎覆盖了社会科学(75个),自然科学(190个)的各个学科领域。其中工程技术类重点学科导航是由上海交通大学图书馆负责,文理类由北京大学图书馆负责,农业类由中国农业大学图书馆负责、医学类由上海医科大学图书馆负责。北京大学图书馆“INTERNET学术资源学科分类导航”(http:///zixun/zixun_xkdh.htm) 包括哲学、数学、图书情报学、工商管理、历史学、环境科学等学科。香港科技大学图书馆学术资源导航(http://library.ust.hk/res/beyond/)
包括商业与管理、工程、人文与社会科学、自然科学、参考资源、新闻等14个大类,参考资源中涉及传记、辞典、目录、年鉴、手册、指南等。中国法律资源网(/index.asp)
该网站搜集了法律文化资源、法律知识专栏、行业法律法规、法律报纸、法律图书、法律年会、法律出版社、法律期刊、法律书店、法律频道、法律学术机构等详细的网上法律资源。方略管理知识系统()
包括93个一个级学科的知识要闻、国际动态、人物、学术站点、研招资料、会议中心、学术指南、必读书目、知识库等资源。学科信息门户介绍(国内)美国加州图书馆的LII导航系统()
国外最早的网络学术资源导航系统,有美国加州伯克利数字图书馆sunSTIE维护。包括艺术人文、商业金融、政治法律、教育、新闻媒体、区域研究、社会学专题等14个大类,上百个子类学科导航。英国的互联网公共图书馆IPL()
包括参考资源、艺术人文、电脑网络、教育、新闻、法律政治、科学与科技、社会科学等十多个大类的网络资源。美国伯克利加州大学的互联网学科分类导航(http://)
是一个学科门类十分丰富的、综合全面性的大型导航系统,分人文科学与区域研究、社会科学、自然科学三大门类,涉及90多个学科领域,每个学科的导航内容均很丰富。包括学科内的各种书目、电子资源、电子参考资源以及精选的网站链接(专利、公司、产品等)。学科信息门户介绍(国外)5.2开放的网络信息资源检索开放获取信息资源的概念开放获取(OpenAccess)是国际学术界、出版界、图书情报界为了推动科研成果利用互联网自由传播而采取的运动。其目的是促进科学及人文信息的广泛交流,促进利用互联网进行科学交流与出版,提升科学研究的公共利用程度、保障科学信息的长期保存,提高科学研究的效率。开放获取数字资源是网络上重要的共享学术信息资源,提供期刊论文全文的免费阅读,是获取学术信息的一种新模式。国外的一些研究表明,在很多学科领域,开放获取的文章比非开放获取的文章具有更大的研究影响力。经过多年来不断的发展,截止到2004年12月底,开放获取期刊数量已经多达1400余种。OpenAccess的标准定义
2002年2月14日发表的《布达佩斯开放存取计划》(BudapestOpenAccessInitiative),对OpenAccess(开放获取,以下简称OA)的定义如下:“开放获取”是指“可以在公共因特网上免费地获取文献,允许任何的用户阅读、下载、复制、发布、打印和查找,或者提供对这些论文文本的链接、对他们进行索引、将它们作为素材纳入软件、以及其它任何法律许可的应用。以上这些使用没有任何财务、法律或者技术方面的障碍,除非是因特网自身造成数据获取的障碍”。“有关复制和分发方面的唯一约束以及版权所起的唯一作用,就是应该确保作者本人拥有保护其作品完整性的权利,如果他人引用此作品应该表达适当的致谢并注明出处”。※
freeaccess≠openaccessOpenAccess的由来
OpenAccess运动主张所有的科技和学术文献能够通过Internet免费获取。OA概念最早可以追溯到1963的“超文本”(hypertext)。
OA的产生主要有以下几个方面的原因:古老学术传统和崭新技术(因特网)的结合科技和学术文献作者对现有商业出版模式的不满和突破作者对自己学术成果版权和创新权的重视开放获取信息资源的由来
OA的雏形出现于1963年,但直到20世纪90年代末,以BiomedCentral为代表的OA出版社开始出版生物医学方面的期刊,才使OA运动得到了巨大的发展。从2001年开始,OA运动在全球范围内出现了飞跃。2001年12月1-2日,TheOpenSocietyInstitute(OSI)在布达佩斯召开小型会议,呼吁加强国际间的合作,加速OA的发展;2002年2月14日,发布了《布达佩斯开放获取计划》(BudapestOpenAccessInitiative);2003年发布了《关于自然科学与人文科学资源的开放获取的柏林宣言》(BerlinDeclarationonOpenAccesstoKnowledgeintheSciencesandHumanities);2004年5月,中国科学院院长路甬祥教授、国家自然科学基金委员会主任陈宜瑜院士代表中国科学院和国家自然科学基金委员会签署了《柏林宣言》,表明中国科学界和科研资助机构支持开放获取的原则立场。
OpenAccess的发展OA资源一站式检索平台介绍学术开放信息资源获取的三个途径开放获取期刊(OpenAccessJournals)
a)出版提供信息开放获取的杂志,或者将原有杂志改造为信息开放获取的杂志。
b)期刊运行经费来源:一种是主办者全部筹集资金,杂志对作者和读者都是免费的。电子预印本
a)作者自愿提交:作者按照一定的格式将论文进行排版后,通过网络、E-mail等方式,按学科类别上传至相应的目录或库中。
b)文责自负:送入预印本库中的论文是不经过任何审核的,也没有任何先决条件决定某一论文能否送入库中。只要作者所投论文遵守国家相关法律,有一定学术水平,符合系统的基本投稿要求。开放获取仓储(OpenAccessRepository)
a)对于有版权,但是出版社允许进行自存储(self-archiving)的作品,作者可以放到信息开放存取仓库中,例如论文、专著等。
b)对于没有版权的作品,作者可以直接放到信息开放存取仓储中,例如讲义、PPT等。香港科技大学OA仓储http://repository.ust.hk/dspace/是由香港科技大学图书馆用Dspace软件开发的一个数字化学术成果存储与交流知识库,收有由该校教学科研人员和博士生提交的论文(包括已发表和待发表)、会议论文、预印本、博士学位论文、研究与技术报告、工作论文和演示稿全文。浏览方式有按院、系、机构(Communities
&
Collections)、按题名(Titles)按作者(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《数字电子技术基础》课程教学大纲
- 2024年低价物高价抵押合同范本
- 2024年出售叠加别墅合同范本
- 2024年承接土方垫资合同范本
- 浙江省宁波市镇海区部分学校2024-2025学年二年级上册语文期中试卷(含答案)
- 医药代表培训
- 培训拼音教学的课件
- 乡镇四所环保监察培训
- 卫生院秋季传染病培训
- 2024个人标准借款合同范本下载
- 【课件】第七单元能源的合理利用与开发新版教材单元分析-九年级化学人教版(2024)上册
- 《新能源汽车维护与保养》课件-任务2 新能源汽车二级维护
- 第一单元《圆》(单元测试)-2024-2025学年六年级上册数学北师大版
- 《快乐读书吧》(教学设计)2024-2025学年统编版语文五年级上册
- 陕煤集团榆林化学有限责任公司招聘笔试题库2024
- GB/T 2423.65-2024环境试验第2部分:试验方法试验:盐雾/温度/湿度/太阳辐射综合
- 小学英语“教学评一体化”实施
- “电解池”教学设计第1课时
- 遥感概论课件
- JB-T 10833-2017 起重机用聚氨酯缓冲器
- YST 544-2009 铸造铜合金锭
评论
0/150
提交评论