网络信息资源检索与利用_第1页
网络信息资源检索与利用_第2页
网络信息资源检索与利用_第3页
网络信息资源检索与利用_第4页
网络信息资源检索与利用_第5页
已阅读5页,还剩110页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络信息资源检索与利用第1页,课件共115页,创作于2023年2月一.网络信息资源概述1.网络信息资源定义2.网络信息资源类型3.网络信息资源特征第2页,课件共115页,创作于2023年2月1.网络信息资源定义到目前为止,网络信息资源尚没有统一的名称,类似的名称很多,如:“因特网信息资源”、“Internet信息资源”、“万维网资源”、“网上电子信息资源”、“网上数字信息资源”等等。在本课程中,我们为了便于同学们学习,统一用得到国内外大多数专家认可的名称——“网络信息资源”来作为我们本章的名称,并给他下一个定义,以帮助同学们理解其含义。网络信息资源的定义:网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。具体的说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。第3页,课件共115页,创作于2023年2月2.网络信息资源类型网络信息资源极其丰富,包罗万象,其内容涉及到农业、生物、化学、数学、天文学、航天、气象、地理、计算机、医疗和保险、历史、大学介绍、法律、政治、环境保护、文学、尚贸、旅游、音乐和电影等几乎所有专业领域,它是知识、信息的巨大集合,是人类的资源宝库。

关于网络信息资源的种类,从不同的角度给予了不同的分类:第4页,课件共115页,创作于2023年2月WWW信息资源FTP信息资源Telnet信息资源Usenet/Newsgroup用户服务组和新闻组信息资源LISTSERV/MailingList(列表服务器/邮件列表服务器)是处理预定的邮件列表并按照列表中的成员名字分发新信息新闻信件或其他的信件给所有的用户。(列表服务器不应该与邮件服务器弄混,邮件服务器为互联网用户处理接受和发送电子邮件的任务。)

Gopher信息资源WAIS广域信息查询系统(1)、按传输方式划分

2.网络信息资源类型(续)第5页,课件共115页,创作于2023年2月正式出版电子图书、电子期刊、数据库、计算机软件、图书馆公共查询目录等非正式出版电子邮件、电子公告版(BBS)、论坛、博客(Blog)等开放获取开放获取(openaccess)期刊收藏库

2.网络信息资源类型(续)(2)、按交流方式划分第6页,课件共115页,创作于2023年2月一次出版信息网上图书、期刊、报纸、专利、政府出版物、会议资料等二次出版信息文摘索引数据库、搜索引擎、网站导航等三次出版信息百科全书、手册指南等参考型网站

2.网络信息资源类型(续)(3)、从内容加工角度划分第7页,课件共115页,创作于2023年2月2.网络信息资源类型(续)博客(BLOG)播客(PODCASTING)书签(Tag)真正简易聚合(RSS):RSS订阅即时通讯(InstantMessenger,简称IM),典型代表为MSN和QQ。社会性网络软件(SocialNetworkSoftware,简称SNS)WIKI(维基):全称Wikipedia,中文译名:维基百科。“维基百科”可引申为因特网中装载人类基础知识的百科全书,是一种采用wiki协作系统的在线百科。

(4)、网络应用的新形式Web2.0第8页,课件共115页,创作于2023年2月3.网络信息资源特征3.1存储数字化

信息资源由纸张上的文字变为磁性介质上的电磁信号或者光介质上的光信息,是信息的存储和传递,查询更加方便,而且所存储的信息密度高,容量大,可以无损耗地被重复使用。以数字化形式存在地信息,既可以在计算机内高速处理,又可以通过信息网络进行远距离传送3.2表现形式多样化传统信息资源主要是以文字活数字形式表现出来的信息。而网络信息资源则可以是文本,图像,音频,视频,软件,数据库等多种形式存在的,涉及领域从经济,科研,教育,艺术,到具体的行业和个体,包含的文献类型从电子报刊,电子工具书,商业信息,新闻报道,书目数据库,文献信息索引到统计数据,图表,电子地图等第9页,课件共115页,创作于2023年2月3.网络信息资源特征(续)3.3以网络为传播媒介传统的信息存储载体为纸张,磁带,磁盘,而在网络时代,信息的存在是以网络为载体,以虚拟化的姿势状态展示的,人们得到的是网络上的信息,而不必过问信息是存储在磁盘上还是磁带上的。体系那了网络资源的社会性和共享性。3.4数量巨大,增长迅速

CNNIC一年两次发布的《中国互联网络发展状况统计报告》,全面反映和分析了中国互联网络发展状况,以其权威性著称。从本次报告中可以看出,截至到2002年12月31日,我国上网计算机数量为2083万台;CN下注册的域名数量达到17.9万个;网站数量达到了37.1万个;国际出口带宽总量为9380M。

第10页,课件共115页,创作于2023年2月3.网络信息资源特征(续)2.5传播方式的动态性

网络环境下,信息的传递和反馈快速灵敏,具有动态性和实时性等特点。信息在网络种的流动性非常迅速,电子流取代恶劣纸张和邮政的物流,加上无线电和卫星通讯技术的充分运用,上传到网上的任何信息资源,都只需要短短的数秒钟就能传递到世界各地的没一个角落。

2.6信息源复杂

网络共享性与开放性使得人人都可以在互联网上所取和存放信息,由于没有质量控制和管理机制,这些信息没有经过严格编辑和整理,良莠不齐,各种不良和无用的信息大量充斥在网络上,形成了一个纷繁复杂的信息世界,给用户选择,利用网络信息带来了障碍。第11页,课件共115页,创作于2023年2月二.网络信息资源检索方法浏览(Browsing)偶然发现(网上冲浪,随意性阅读)顺“链”而行;(Bookmark、Hotlink,、Hotlist)基于目录型网络检索工具(分类目录树)的资源导航,如:Yahoo!或其它专业性网络资源指南(ResourceGuide)检索(Searching)利用搜索引擎等网络检索工具,输入关键词、短语、词组等进行检索基于超文本的信息查询基于目录的信息查询基于搜索引擎的信息查询第12页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)1、基于超文本的信息查询基于超文本的浏览模式是浏览查询信息的一种最基本的方式,用户只需以一个节点(网络主页)作为入口,根据节点中镶嵌在各个超文本内容中的热链接(超链接)指向的主题,用户就可以轻松地跳转到自己感兴趣的节点进一步浏览查询到自己所需的信息。从一个www服务器到另一个www服务器,从一个目录到另一个目录,从一篇文章到另一篇文章,浏览查找所需信息。通过超文本链接可逐步遍历庞大的Internet。

第13页,课件共115页,创作于2023年2月点击“篇名”就可以跳转到该新闻的内容点击“中国工商银行图片”

就可以跳转到中国工商银行天津分行的主页中国工商银行天津分行的主页第14页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

2、基于目录的信息查询为了帮助Internet用户方便地查询到所需要的信息,人们按照图书馆管理书目的方法设置了目录。网上目录一般以主题方式来组织,大主题下又包括若干小主题,这样一层一层地查下去,直到比较具体的信息标题。目录存放在www服务器里,各个主题通过超文本的方式组织在一起,用户通过目录最终可得到所需信息的网址,即可到相应的地方查找信息,这种通过目录帮助的方法获得所需信息的网址继而查找信息的方法称为基于目录的信息查询方法。有许多机构专门收集Internet上的信息地址,并编制成目录提供给网上用户。Yahoo就是一个非常著名的基于目录帮助的网站,其目录按照一般主题组织,顶层按资讯、娱乐、体育、财经、社区、通讯等分成许多大的目录,每一大的目录又分成若干子目录,层层递进。见下图:第15页,课件共115页,创作于2023年2月目录军事目录下的子目录第16页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

3、基于搜索引擎的信息查询风靡全球的因特网是全球规模最大的信息源基地,但因特网上的信息像原子裂变迅速膨胀,要想在浩瀚无边的信息海洋中迅速而准确地获取自己需要的信息,如没有专门的搜索工具,任何人只能望网兴叹。在这种情况下,网络搜索引擎应运而生。那么什么是搜索引擎?怎样使用搜索引擎?(1)、什么是搜索引擎?所谓搜索引擎,简单地说,就是采用信息自动跟踪、标引等技术,在因特网上建立专门提供网络信息资源导航服务的检索工具。搜索引擎其实也是一个网站,只不过该网站专门为你提供信息“检索”服务,它使用特有的程序把因特网上的所有信息归类以帮助人们在浩如烟海的信息海洋中搜寻到自己所需要的信息。第17页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)(2)、搜索引擎的组成其功能是在因特网漫游和搜集信息搜索器

检索器索引器输入用户查询内容、显示查询结果并提供用户相关性反馈机制用户接口其功能是理解搜索器所搜索的信息,从中抽出索引项用于表示文档以及生成文档库的索引表进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制第18页,课件共115页,创作于2023年2月(3)、搜索引擎工作原理:

从互联网上抓取网页→建立索引数据库→在索引数据库中搜索。

二.网络信息资源检索方法(续)第19页,课件共115页,创作于2023年2月(3)、搜索引擎工作原理(续)

搜索引擎由网上机器人(Spider或Robot)自动在网页上按某种策略进行远程数据的搜索与获取,并生成本地索引。Spider或Robot是一种软件,它沿着WWW文件的链接在网上漫游,记录URL、文件的简明摘要、关键字或索引,形成一个很大的数据库,这种数据库包括标题、摘要、关键词和URL、文件的大小、语种以及词出现的频率。一些搜索引擎搜索网页的每一个单词,而另一些搜索引擎则只搜索网页的前二百至五百个单词。当用户输入关键词(Keyword)查询时,该搜索引擎会告诉用户包含该关键词信息的所有网址,并提供通向该网络的链接。二.网络信息资源检索方法(续)第20页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(4)、搜索引擎的种类检索型搜索引擎:它使用自动索引软件来发现、收集并标引网页,建立数据库,并以Web形式让用户找到所需信息资源。比较著名的有:Google、百度、天网、悠游、AltaVista等。目录型搜索引擎:这类引擎将信息系统地分门归类,经过人工整理后形成庞大而有序的分类目录体系,用户可以在目录体系的导引下通过逐级浏览,发现、检索到有关的信息。雅虎就是以卓越的分类目录型导航服务而称誉全球混合型搜索引擎:它兼有检索型和目录型两种方式。如:新浪、搜狐、网易、中华等门户网站。多元搜索引擎:也称为集合型搜索引擎。它是将多个搜索引擎集成在一起,通过统一的检索界面进行网络信息多元搜索的检索工具。按照工作方式的不同可分为并行处理式和串行处理式两大类。著名的有:Dogpile、Mamma和万维搜索(Http:///)等。第21页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(5)、搜索引擎的一般查询规则用此方法进行查询的有Google、百度、雅虎()、3721(

)用此方法进行查询的有新浪、搜狐、网易、找到啦、中华网和常青藤等1)使用逻辑运算算符:AND/

+/&

/*或空格,OR/“,”/“|”,NOT/“–”;引号(“”)的作用是括在其中的多个词被当作一个短语来检索。2)使用位置算符如用AltaVista查询BaijingNEAR/3Olympic查询时,这两个词之间的单词数不超过3个3)使用字段限定Intitle表示只包含要查询的关键词。如“intitle安徽工业大学工商学院”则只输出安徽工业大学工商学院的信息,其他学院的信息则不显示,不是检索的结果.Site限定在某个网站搜索、filetype限定文件类型、inurl限定域名搜索按关键词进行精确查询

检索式的运算符号自动将关键词拆分进行模糊查询第22页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(6)、有代表性的中英文搜索引擎百度天网/中国搜搜狗一搜,/新浪查博士//Google,AltaVista

()HotBot()Lycos()

InfoseekGExcite(

)AskJeeves,Inktomi,NorthernLight,()WisenutYahoo第23页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(7)、常用搜索引擎介绍——googleGoogle的香港站点主页.hk/第24页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(7)、常用搜索引擎介绍——google1、概述Google是由两个斯坦福大学博士生LarryPage(拉里·佩吉)与SergeyBrin(谢尔盖·布林)于1998年9月发明,GoogleInc.于1999年创立。Google来源于“googol”,它表示1的后面跟100个零,Google用这个词表示该公司想征服网上无穷无尽的资料的雄心。Google现在是Yahoo、网易等的搜索引擎。Google支持多达132种语言,包括简体中文和繁体中文;自动检索操作系统的语种。其优势在于掌握的信息量以及检索模型和检索速度。它可为世界各地的用户提供适需的搜索结果,而且搜索时间通常不到半秒。搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介。Google采用全文标引方式,提供每日更新。现在,Google可以查询的网址达80多亿个,图片10亿张。智能化的“手气不错”功能,提供可能最符合要求的网页。“网页快照”功能,能从Google服务器里直接取出缓存的网页第25页,课件共115页,创作于2023年2月Google的查询界面设置搜索偏好,包括每个网页上默认的搜索结果数量、界面语言,以及查询语言直接进入最符合搜索条件的网页第26页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(7)、常用搜索引擎介绍——google2、检索功能基本检索:(布尔检索功能)逻辑“与”:检索框中的两个关键词之间用空格隔开则默认为是“AND”(“与”运算)连接逻辑“非”:用“—”(减号)表示,同时要求在减号前保留一个空格逻辑“或”:用“OR”表示双引号、连字号、斜线、问号、等号、省略号都可以作为短语的连接符号查找名言或专有名词指定网域:利用site:可以在某个特定的网站或域中进行搜索指定文件类型:filetype:文件类型,可以在一类文件中进行搜索,比如,filetype:pdf,filetype:ppt等第27页,课件共115页,创作于2023年2月逻辑与功能第28页,课件共115页,创作于2023年2月逻辑非功能第29页,课件共115页,创作于2023年2月逻辑或功能第30页,课件共115页,创作于2023年2月专用语查询功能“”、“-”、“\”、“+”、“=”、“,”“'”第31页,课件共115页,创作于2023年2月指定网域第32页,课件共115页,创作于2023年2月指定文件类型第33页,课件共115页,创作于2023年2月2、检索功能(续)网页快照如果原地址打开很慢,那么可以直接查看Google缓存页面,因为Google服务器速度极快如果原链接已经死掉或者因为网络的原因暂时链接不通,那么可以通过网页快照看到该页面信息。当然,快照内容不是该页最新页面如果打开的页面信息量巨大,一下子找不到关键词所在位置,那么可以通过网页快照,因为快照中Google用黄色表明关键字位置第34页,课件共115页,创作于2023年2月2、检索功能(续)集成化的工具条为了方便搜索者,Google提供了工具条,集成于浏览器中,用户无需打开Google主页就可以在工具条内输入关键字进行搜索工具条还提供了许多其它功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在Google主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。安装Google的工具条,可以访问“http://toolbar.G/”,按页面提示可以自动下载并安装第35页,课件共115页,创作于2023年2月点击下载第36页,课件共115页,创作于2023年2月第37页,课件共115页,创作于2023年2月2、检索功能(续)其它功能网页目录网上博克搜索学术搜索图书搜索……第38页,课件共115页,创作于2023年2月第39页,课件共115页,创作于2023年2月学术搜索引擎第40页,课件共115页,创作于2023年2月使用Google时应注意的问题Google不区分英文字母的大小写,所有字母均作小写对待。例如:输入“georgewashington”(乔治·华盛顿),或是“GeorgeWashington”,再或是“gEoRgEwAsHiNgToN”,结果都是一样的通配符问题。Google对通配符的支持有限,只能用“*”代替单个字符,而且必须将检索词用引号引起来,如“以*治国”搜索引擎忽略的字符与强制检索。Google对一些出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。如果检索词中包含这些字符,必须进行强制检索,在这些字符前后用“+”,如“+www+的历史”,或用英文的引号第41页,课件共115页,创作于2023年2月强制搜索第42页,课件共115页,创作于2023年2月第43页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(8)、常用搜索引擎介绍——百度第44页,课件共115页,创作于2023年2月

李彦宏徐勇第45页,课件共115页,创作于2023年2月百度,2000年1月创立于北京中关村,是全球最大的中文搜索引擎。2000年1月1日,公司创始人李彦宏、徐勇携120万美元风险投资,从美国硅谷回国,创建了百度公司。2000年5月,百度首次为门户网站——硅谷动力提供搜索技术服务,之后迅速占领中国搜索引擎市场,成为最主要的搜索技术提供商。2001年8月,发布B搜索引擎Beta版,从后台服务转向独立提供搜索服务,并且在中国首创了竞价排名商业模式,2001年10月22日正式发布Baidu搜索引擎。2005年8月5日,百度在美国纳斯达克上市。(1)、概况第46页,课件共115页,创作于2023年2月“百度”二字取自辛弃疾的《青玉案》“众里寻她千百度”。现在百度已成为世界上最大的中文搜索引擎,用户能够访问超过10亿的中文网页.(2)、特点第47页,课件共115页,创作于2023年2月第48页,课件共115页,创作于2023年2月(3)、网页搜索功能百度快照相关搜索拼音提示错别字提示英汉互译词典计算器和度量衡转换专业文档搜索股票、列车时刻表和飞机航班查询高级搜索语法高级搜索、地区搜索和个性设置天气查询第49页,课件共115页,创作于2023年2月3.1百度快照每个被收录的网页,在百度上都存有一个纯文本的备份,称为“百度快照”。百度速度较快,您可以通过“快照”快速浏览页面内容。如果无法打开某个搜索结果,或者打开速度特别慢,“百度快照”能帮您解决问题。第50页,课件共115页,创作于2023年2月第51页,课件共115页,创作于2023年2月3.2相关搜索搜索结果不佳,有时候是因为选择的查询词不是很妥当。您可以通过参考别人是怎么搜的,来获得一些启发。百度的“相关搜索”,就是和您的搜索很相似的一系列查询词。百度相关搜索排布在搜索结果页的下方,按搜索热门度排序。

第52页,课件共115页,创作于2023年2月第53页,课件共115页,创作于2023年2月3.3专业文档搜索很多有价值的资料,在互联网上并非以普通的网页形式出现,而是以Word、PowerPoint、PDF等文档格式存在。百度支持对Office文档(包括Word、Excel、PowerPoint)、AdobePDF文档、RTF文档的全文搜索。方法为在搜索的关键词后面加一个“filetype:”文档类型限定。“filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL包含所有文件类型。第54页,课件共115页,创作于2023年2月第55页,课件共115页,创作于2023年2月3.4高级搜索把搜索范围限定在网页标题中——intitle标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。第56页,课件共115页,创作于2023年2月第57页,课件共115页,创作于2023年2月3.4高级搜索(续)把搜索范围限定在特定站点中——site有时候,您如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。

第58页,课件共115页,创作于2023年2月第59页,课件共115页,创作于2023年2月3.4高级搜索(续)把搜索范围限定在url链接中——inurl

网页url中的某些信息,常常有某种有价值的含义。于是,您如果对搜索结果的url做某种限定,就可以获得良好的效果。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词

第60页,课件共115页,创作于2023年2月第61页,课件共115页,创作于2023年2月3.4高级搜索(续)精确匹配——双引号“”和书名号《》如果输入的查询词很长,百度给出的搜索结果中的查询词可能是拆分的。如果给查询词加上双引号,就可以精确检索。被书名号扩起来的内容,也不会被拆分,比如,查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具——手机,而加上书名号后,《手机》结果就都是关于电影方面的了。第62页,课件共115页,创作于2023年2月第63页,课件共115页,创作于2023年2月3.4高级搜索(续)要求搜索结果中不含特定查询词——减号-

如果您发现搜索结果中,有某一类网页是您不希望看见的,那么用减号语法,就可以去除所有这些含有特定关键词的网页。注意,前一个关键词,和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。第64页,课件共115页,创作于2023年2月第65页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(9)、常用搜索引擎介绍——中文多元型搜索引擎多元搜索引擎又称为集合式搜索引擎。它是将多个搜索引擎集成在一起,通过一个统一的检索界面方便、快速、全面获取网络信息的检索工具。万维搜索引擎(http://):是上海万维信息技术有限公司2000年推出的多元搜索引擎。网络灯塔:/steelk/navigator/gbindex.htm):集成了50多个中文搜索引擎,分别提供简繁体中文网站、网页和新闻的多元信息搜索服务。第66页,课件共115页,创作于2023年2月第67页,课件共115页,创作于2023年2月万维网的高级搜索界面1、输入关键字2、选择检索词之间的逻辑关系3、选择结果显示的个数4、点击“搜索”还可以扩展检索第68页,课件共115页,创作于2023年2月网络灯塔主页第69页,课件共115页,创作于2023年2月网络灯塔主页续-下半页第70页,课件共115页,创作于2023年2月第71页,课件共115页,创作于2023年2月第72页,课件共115页,创作于2023年2月第73页,课件共115页,创作于2023年2月第74页,课件共115页,创作于2023年2月第75页,课件共115页,创作于2023年2月第76页,课件共115页,创作于2023年2月第77页,课件共115页,创作于2023年2月第78页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(10)、常用搜索引擎介绍——英文多元型搜索引擎Dogpile():是因特网上最早出现也是影响最大的多元搜索引擎。Dogpile集成了21个不同类型的搜索引擎,按照检索对象可以将这些检索工具分成6种类型:Web页、图像、FTP文件、新闻组、多媒体。系统支持的运算功能与运算符主要有4种:AND,+;OR;NOT,-;词组短语(用双引号)。MetaCrawler()

:是因特网上最有影响的多元搜索引擎之一,也是最典型的综合型集成搜索引擎。第79页,课件共115页,创作于2023年2月输入检索词选择要搜索内容的类型第80页,课件共115页,创作于2023年2月第81页,课件共115页,创作于2023年2月选择要搜索内容的类型第82页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(11)、常用搜索引擎介绍——

CERNET内的主要的

FTP搜索引擎北大天网的FTP搜索引擎星空互联之FTP星空搜索/ftpsearch/search.html南京理工大学的“一网打尽”搜索引擎西安交通大学思源搜索引擎北京科技大学幻想FTP搜索中国科技大学天狼中英文搜索引擎第83页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(12)、常用搜索引擎介绍——非CERNET的主要的FTP搜索引擎中国自由软件库/freesoft.html中国下载(原名“金蜘蛛”软件下载中心)第84页,课件共115页,创作于2023年2月二.网络信息资源检索方法(续)

(13)、常用搜索引擎介绍——国外FTP搜索引擎.tw/GaisFtp收录台湾大学里面的FTP站点,可以限定前方一致和区分英文大小写。自称全球最大的FTP搜索引擎。

第85页,课件共115页,创作于2023年2月国内其他FTP站点中国下载FTP服务器:/黄金眼FTP服务器:2EastDoor亦多下载中心FTP服务器:20深圳热线FTP服务器:中国经济信息网FTP服务器:中经网自由软件FTP服务器:第86页,课件共115页,创作于2023年2月三.开放获取资源检索1.开放存取出版模式及其产生背景2.开放存取的两种主要实现途径3.开放存取学术资源利用平台简介

第87页,课件共115页,创作于2023年2月1.开放存取出版模式及其产生背景学术期刊是学术交流体系的主要媒介。与商业出版领域的作者不同,研究人员发表成果的目的不是为了经济报酬,而是希望在尽可能大的范围内传播研究成果,取得同行的认可和提高自己的学术地位。而目前学术期刊市场的出版控制权主要掌握在商业出版者手里。为了解决这个问题,学术界、图书馆界和出版界共同提出了开放存取出版模式,创建一个真正服务于学术的信息交流系统。开放存取(OpenAccess,简称OA)是国际科技界、学术界、出版界、信息传播界为推动科研成果利用Internet自由传播而发起的运动。以此促进科学信息的广泛传播、促进学术信息的交流与出版、提升科学研究的公共利用程度、保障科学信息的长期保存。第88页,课件共115页,创作于2023年2月1.开放存取出版模式及其产生背景(续)开放存取的特征是作者付费出版或提交网络服务器、读者免费享用。在这种模式下,学术信息可通过互联网免费获取,即允许任何用户进行阅读、下载、复制、分发、打印、检索、链接到全文、用于编制索引、作为软件数据使用或者其他合法目的,没有其他的经济、法律以及技术方面的任何限制。版权在此所起的作用是应该保证作者拥有保护其作品完整性的权利,并要求他人在使用作者的作品时注明引用出处。可以说,开放存取是一种学术信息共享的自由理念和出版机制,在这种模式下,学术成果可以在全球实现无障碍地传播,任何研究人员可以在任何地点和任何时间不受经济状况的影响,平等免费地获取和使用学术成果。第89页,课件共115页,创作于2023年2月开放存取的倡导者认为,研究人员的非赢利的信息传播动机和利用需求是开放存取赖以存在的基本前提,这种前提也决定了开放存取一般只局限于学术出版领域。同时,随着计算机和网络技术在出版领域中的应用和普及,在线出版和在线传播的总成本已经大大降低。因此,开放存取是一种既有效又可行的学术出版模式。1.开放存取出版模式及其产生背景(续)第90页,课件共115页,创作于2023年2月2.开放存取的两种主要实现途径实现开放存取出版的主要途径为以下两种:OA期刊(开放存取期刊)和OA仓储(开放存取仓储)。

2.1OA期刊(开放存取期刊)OA期刊与传统期刊的区别不在于期刊的载体是纸本还是电子,而在于对期刊的访问方式和访问权限。传统的期刊(包括印本期刊和电子期刊)采用用户付费的商业模式,一般先由图书馆等机构团体购买,然后为其成员提供检索全文服务;或者由用户个人直接定购整刊或某篇特定文章。尽管有些电子期刊允许用户免费访问文摘或部分论文全文,但OA期刊提倡的是用户利用Internet就可以不受限制地访问期刊论文全文。第91页,课件共115页,创作于2023年2月2.1OA期刊(开放存取期刊)(续)在网络环境下,期刊的出版和传播成本大为降低,但这并不意味着不需要成本(尤其是开展同行评审工作)。为提供基本运行费用,OA倡导者提出了多种成本弥补途径,包括争取相关机构的赞助、广告收入和为用户提供增值服务收入等,但最主要的是作者付费模式,即作者从项目或课题中抽取部分经费用于出版研究成果,因为作者付费模式具有合理性并可以保证开放存取出版的可持续发展。目前OA期刊正处于不断发展和壮大阶段:首先,期刊的数量一直在稳步增加,包括新创办的OA期刊和由传统基于订阅出版模式的期刊转变而来的OA期刊。其次,期刊所覆盖的学科范围突破自然科学领域,社会科学和人文科学领域的OA期刊开始出现。第92页,课件共115页,创作于2023年2月2.1OA期刊(开放存取期刊)(续)OA期刊发展的另外一个重要现状便是OA期刊开始得到传统的文摘索引服务商的认可并成为它们收录的对象。OA期刊的快引指数(ImmediacyIndex)相对而言都比较高,OA期刊的快引指数相对比较高一方面说明了OA期刊由于免费访问的特点比传统期刊能更及时有效地被科研人员所利用,另一方面也说明了OA期刊也在逐渐被科研人员所认可。第93页,课件共115页,创作于2023年2月2.2OA仓储(开放存取仓储)1990年代初,为了解决传统期刊出版模式滞后于学术研究发展的问题,在物理学、计算机科学、天文学等学科领域,研究人员采用预印本(preprint)进行学科领域的同行交流,一些学术组织把这些用于共享的学术信息存放于服务器中供用户免费访问和使用。这些服务器就是早期的OA仓储,OA仓储有时也被称为OA文档库(OpenAccessArchives)。需要说明的是,目前有些OA仓储不仅存放预印本,而且也提供后印本(postprint)。后印本是相对于预印本的一种电子文献类型,指已经在期刊或其他公开出版物上发表的研究成果。第94页,课件共115页,创作于2023年2月2.2OA仓储(开放存取仓储)(续)从目前的发展情况来看,OA仓储主要有两种类型:学科OA仓储和机构OA仓储。早期的OA仓储多为学科OA仓储,其中最具代表性的要数arXiv电子印本文档库。由于各个学科研究人员接触网络的时间迟早和使用网络的熟练程度的不同,早期学科OA仓储往往只限于自然科学领域(比如天文学、物理学、计算机科学、化学以及数学等),最近几年以来,社会科学和人文科学领域的OA仓储已经开始出现。机构OA仓储相对于学科OA仓储而言,起步比较晚,但发展速度很快,一般由大学、大学图书馆、研究机构、政府部门等创建和维护。第95页,课件共115页,创作于2023年2月2.2OA仓储(开放存取仓储)(续)OA期刊和OA仓储是目前实现开放存取的两种主要途径,其存在和发展为重建以研究人员为中心的学术交流体系发挥了重要作用。此外,在网络环境下,研究人员为了快速有效地与同行交流最新的研究成果,也利用了一些其他有别于传统学术期刊的交流途径,比如个人网站、电子邮件、服务列表、主题论坛以及新兴的Blog(博客)等。这些方式也都是开放存取出版的实现途径,但由于存在规模有限、不易检索、缺乏规范等问题没有在大范围内得到广泛应用。而OA期刊和OA仓储则由于经济而实用的优势日益被学术界认同并得到相当广泛的应用,成为目前实现开放存取出版的主要途径。第96页,课件共115页,创作于2023年2月3.开放存取学术资源利用平台简介随着网络技术的发展,开放存取资源得到了空前的发展。OA期刊和OA仓储为研究人员获取学术资源提供了一条崭新的途径。但是,许多OA资源是分散存放在世界各地不同的服务器和网站上的,因此用户很难直接全面地检索到这些资源。目前在OA资源揭示方面,比较有代表性的成果是:cnpLINKer、Socolar、DOAJ、OpenDOAR和OpenJ-Gate,在进行OA期刊和OA仓储的整理工作上各有所长。第97页,课件共115页,创作于2023年2月3.1中图链接服务(cnpLINKer):

(/index.jsp

)第98页,课件共115页,创作于2023年2月3.1、中图链接服务(cnpLINKer)(续)cnpLINKer(cnpiecLINKservice),即中图链接服务,是由中国图书进出口(集团)总公司开发并提供的国外期刊网络检索系统,于2002年底开通运行。目前本系统共收录了国外1000多家出版社的25500多种期刊的目次和文摘数据,并保持时时更新。截止2008年9月8日,cnpLINKer收入的OA期刊已有13787种,包含文章数7365082篇,可供用户免费下载全文。除为用户提供快捷灵活的查询检索功能外,电子全文链接及期刊国内馆藏查询功能也为用户迅速获取国外期刊的全文内容提供了便利。全新改版的cnpLINKer系统,优化了查询检索性能,并在完善原有系统服务功能的基础上,增加了更为个性化的功能栏目,旨在为国内广大用户提供一个统一的检索、获取国外期刊的网络信息服务平台。第99页,课件共115页,创作于2023年2月

3.2

OA资源一站式检索服务平台(Socolar):

(/

第100页,课件共115页,创作于2023年2月3.2

OA资源一站式检索服务平台(Socolar)(续)Socolar是由中国教育图书进出口公司对世界上重要的OA期刊和OA仓储资源进行全面的收集、整理并提供统一检索的集成服务平台。是目前最大的开放存取资源集成检索平台,截止2008年9月8日,Socolar收入的OA期刊已有7297种,包含文章数11133911篇,OA仓储数目975个,包含文章3283398篇,平台收录文章总计:14417309篇。目前,这些数字还在增长。通过Socolar,可以检索到来自世界各地、各种语种的重要OA资源,并提供OA资源的全文链接服务。在按刊物学科主题进行浏览时,采用了国内较为通行的中图法方式导航。第101页,课件共115页,创作于2023年2月3.2

OA资源一站式检索服务平台(Socolar)(续)Socolar最终目标是实现以下功能:

1)、OA资源的检索和全文链接服务功能:全面系统收录重要的OA资源,包括重要的OA期刊和OA仓储,为用户提供题名层次(title-level)和文章层次(article-level)的浏览、检索及全文链接服务;

2)、用户个性化的增值服务功能:根据用户的个性化需求,为用户提供OA资源各种形式的定制服务和特别服务;

3)、OA知识的宣传和交流功能:建立权威的OA知识宣传平台和活跃的OA知识交流阵地。用户可以通过该平台,了解OA的基本知识和发展动态,也可以与他人进行互动交流;

4)、OA期刊的发表和仓储服务功能:为学者提供学术文章和预印本的OA出版和仓储服务。第102页,课件共115页,创作于2023年2月3.3

DOAJ

(DirectoryofOpenAccessJournals开放存取期刊目录):

(/

是由瑞典隆德大学图书馆2003年5月推出的开放获取期刊的检索系统,目前已提供2700余种开放获取期刊的访问

,涵盖哲学和宗教、商业和经济学、农业和食物科学、生物和生命科学、数学、化学、历史和考古学、法律和政治学、语言和文献等17类学科主题领域,其中829种期刊提供文章级的检索,包括139702篇文章(数据截至2007年7月10日)DOAJ的目标是:“让开放途径的科技期刊能够更广泛和更方便的被读者看到,使它们的作用能得到更大发挥”。目前DOAJ不仅提供开放存取期刊的列表和网络链接,并且提供系统内期刊检索和文章检索服务,并通过专栏特别推荐最近30天收录的开放存取期刊。截止2008年9月8日,DOAJ收录的期刊已有3614种,包含文章数208771篇。第103页,课件共115页,创作于2023年2月第104页,课件共115页,创作于2023年2月3.4

OpenDOAR

(DirectoryofOpenAccessRepositories开放存取仓储目录)

(/)第105页,课件共115页,创作于2023年2月3.4

OpenDOAR(续)OpenDOAR是由英国的诺丁汉(Nottingham)大学和瑞典的伦德(Lund)大学图书馆在OSI(OpenSocietyIn2situte)、JISC(JointInformationSystemCommittee)、CURL(ConsortiumofResearchLibraries)和SPARC(TheScholarlyPublishingandAcademicResourcesCoalition)欧洲部等机构的资助下于2005年2月共同创建的开放存取机构资源库、学科资源库目录检索系统;用户可以通过机构名称、国别、学科主题、资料类型等途径检索和使用这些知识库,它和开放存取期刊目录(DOAJ)一道构

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论