第六讲-网络信息检索方法.ppt_第1页
第六讲-网络信息检索方法.ppt_第2页
第六讲-网络信息检索方法.ppt_第3页
第六讲-网络信息检索方法.ppt_第4页
第六讲-网络信息检索方法.ppt_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络信息检索,一.网上资源简介,网络信息检索网上资源简介,网上资源种类:计算机中存储的信息计算机自身系统资源网上资源的类型:字符、图形、多媒体、超文本(超媒体)网上资源的主题:自然科学、工程技术、农业、医学、建筑、文化教育、历史、财经、商业、文体等,网络信息检索网上资源简介,Internet信息传播方式:(1).WWW万维网(2).Email电子邮件(3).InternetPhone网络电话(4).Telnet远程登录(5).Usenet网络论坛(6).FTP文件传输,二.网络信息检索常用方法,搜索引擎介绍专题信息资源指南网络文献数据库数字图书馆,网络信息检索搜索引擎介绍,1.概念:以WWW网站形式存在的索引数据库,其索引数据库的信息资源以WWW信息为主,还包括Email地址、新闻论坛文章、FTP、Gopher等资源2.组成:数据采集机制数据组织机制用户检索机制,网络信息检索搜索引擎介绍,3.Internet搜索引擎分类:分类目录式(网站级):数据库中保存的是网站的标题、内容简介和网址。用户输入关键词后,系统在数据库中查找与用户输入匹配的信息,检索结果为网站名、内容提要和网址,适合查找某一类的信息。全文式(网页级):在数据库中保存的是各网站的每个网页内容的标引结果。用户输入关键词后,系统自动在全部网页中查找相关信息,检索结果为网页地址和一段文字(一般为网页开头部分),适合查找比较具体的信息。,网络信息检索搜索引擎介绍,单语种搜索引擎:指搜索时只能用一种语言查询,如雅虎多语种搜索引擎:在同一搜索引擎中可以使用多种语言查询,如lycos,网络信息检索搜索引擎介绍,独立搜索引擎:亦称单一式搜索引擎,如Yahoo!,sohu等多搜索引擎:即MetaSearch,输入检索词后,同时在多个搜索引擎中查找,此类搜索引擎分为两类,串行处理引擎和并行处理引擎,如Mamma(),网络信息检索搜索引擎介绍,4.搜索引擎的检索技巧:基本检索功能(1)布尔逻辑检索(使用与、或、非)(2)截词检索(3)邻近检索(位置算符)和短语检索(4)准字段检索(5)区分大小写,网络信息检索搜索引擎介绍,高级检索功能(1)加权检索(“+”与“-”)(2)自然语言检索(输入自然语言的句子)(3)相关信息反馈(如“morelikethis”)(4)模糊检索(忽略用户输入错误)(5)概念检索(同一概念的不同词汇),网络信息检索搜索引擎介绍,5.搜索引擎的评价标准:资源规模结果的满意度数据库的更新速度查询功能的使用便利性对于分类目录式搜索引擎,其分类的合理性、分类的深度和广度对于中文搜索引擎,能否自动进行内码转换,网络信息检索搜索引擎介绍,6.英文搜索工具Yahoo!()简介:主要收集网页、网站、新闻论坛文章,提供关键词查询和分类浏览两种检索方式使用方法:从分类目录逐级查询使用关键词查询:可使用查询语法,有以下两种模式:(1)基本查询:在检索框中输入关键词(以空格分隔),检索结果按与关键词字符串的相关度排序(2)高级查询:可以对查询范围、搜索模式、时间、结果进行限制,网络信息检索搜索引擎介绍,Yahoo!查询语法:利用+,-进行限制:将“+”放在关键词前,表示必须出现此关键词将“-”放在关键词前,表示不能出现此关键词限定关键词出现的字段:将“t:”放在关键词前,表示仅在网站名称中查询将“u:”放在关键词前,表示仅在网址(URL)中查询使用引号“”进行限制:用“”将关键词括起来,表示词组检索使用截词符:用*实现后截词操作,网络信息检索搜索引擎介绍,影响相关度的因素:和关键词字符串相同的字符串越多,相关度越高和关键词字符串完全符合,相关度高于部分符合和关键词字符串符合的字符串位置,出现在网站名称中,其相关度高于出现在网址中,网络信息检索搜索引擎介绍,Google简介:除一般网页外,Google现在还可以查找Adobe的可移植文档格式(PDF)文件,提供关键词查询和网页分类目录两种检索方式.特色:查找PDF文件网页快照功能类似网页功能按链接搜索(link:显示所有指向该网址的网页)指定网域(site:在某个特定的域或站点中搜索)手气不错(将自动进入Google查询到的第一个网页),搜索应注意:,搜索网页链接的其它网页上的相关内容自动使用“and”进行查询(关键词中间留空格)忽略最常用的词和字符(英文双引号可将忽略词强加于搜索项)Google运用智能型汉字简繁自动转换系统只搜索与输入的关键词完全一样的字词Google搜索不区分英文字母大小写,网络信息检索搜索引擎介绍,7.中文搜索引擎搜狐(SOHU)()简介:主要收集网页、网站,采用树型结构对站点进行层次式分类,将所有的网页分为18个类别,提供分类查询和关键词查询两种方式。使用方法:从分类目录逐级查询使用关键词查询,网络信息检索搜索引擎介绍,中文雅虎()简介:中文雅虎是Yahoo!公司开发的中文搜索引擎,以中文网站目录为主;有两种版本,即支持国标码的简体中文版和支持大五码的繁体中文版;用人工建立索引数据库;使用方法:主要有分类查询、关键词查询及两者相结合的方法(类似英文Yahoo!的查询方法)(1)使用分类列表(2)使用关键词查询,可使用字段限制及限制选项,搜索引擎介绍专题信息资源指南网络文献数据库数字图书馆,网络信息检索信息资源指南,信息资源指南:按分类或主题目录组织起来的网上信息导引,以WWW方式提供访问分类:综合类和专题类查找信息资源指南的方法:(1)使用searchengine(2)查询网上图书馆,网络信息检索信息资源指南,1.综合虚拟图书馆2.工程虚拟图书馆http:/eevl.icbl.hw.ac.uk/3.法律信息指南/v-lib/4.环保资源指南/Environment.shtml,搜索引擎介绍专题信息资源指南网络文献数据库数字图书馆,网络信息检索网络数据库介绍,网络数据库:基于Web方式的联机数据库检索著名网络数据库:EiVILLAGE,OCLC,UNCOVER,INSPEC,CSA,PQDD,IEEE全文库,中国期刊网,网络信息检索网络数据库介绍,免费专利数据库:德温特世界专利库,网络信息检索网络数据库介绍,OCLCfirstSearchOCLC系统简介:FirstSearch简介:该系统是OCLC提供的联机信息检索服务,可通过互联网进行信息检索,信息覆盖面包含书籍、期刊、会议论文等,共有65个常用数据库FirstSearchWeb:/概述:数据库分为13大类,涵盖各专业;文献记录中包含有一次文献的馆藏地点;可提供全文;按检索次数收费;支持布尔算符和模糊查找等可检字段:主题(su)、标题(ti)、作者(au)、文摘(ab)、来源(so)、叙词(de),网络文献检索网络数据库介绍,FirstSearch检索方法:限制功能:用出版年代、语种或数据库特有的限制项缩小检索结果利用词表(wordlist):用于核对检索词邻接操作符:WITH和NEAR布尔算符:AND、NOT、OR固定短语:由一个字段中所有的词组成,固定在一起,作为一个单独的检索词,网络信息检索网络数据库介绍,全文获取方式:(1)联机阅读:部分数据库可联机阅读全文(2)文献传送:从文献提供商处订购全文(3)通过OCLC资源共享:从OCLC成员馆处获得全文我国用户获得OCLCfirstsearch的方法:一般用户:购买检索卡付费检索(清华大学)CALIS成员:通过校园网以专线方式免费检索(仅限于检索13个数据库),网络信息检索网络数据库介绍,Uncover数据库Uncover数据库简介:收录各学术领域的2万种期刊的最新文献,目前有800万篇文献,每天新增文献约5000篇如何获取:互联网用户可免费检索该数据库(流量费自负),网络信息检索网络数据库介绍,Uncover数据库检索方法:(1)关键词检索:输入单词或词组,可用逻辑算符和截词符,在关键词索引中查找布尔算符:and、or、andnot、butnot截词符:可使用右截断符*(2)刊名浏览:输入刊名,可浏览期刊的目次(3)作者检索:输入作者姓名(4)索引字段检索:输入检索词,系统在关键词索引、刊名索引、作者索引中自动查找,网络信息检索网络数据库介绍,中国科技信息网()简介:主要包括信息资源服务、网络通讯服务、超级计算服务和全国域名注册服务信息资源包括:科学数据库、科技成果、科技管理、技术资料和文献情报等,网络信息检索网络数据库介绍,中国工程技术信息网()简介:主要提供在线数据库检索、电子读物、信息频道、国防信息服务与订购、全球快讯、电子书库、国内外站点等信息资源包括:馆藏文献检索、电子读物、站点导航等,搜索引擎介绍专题信息资源指南网络文献数据库数字图书馆,数字图书馆,数字图书馆是以数字形式存贮和处理信息的图书馆,它代表了未来图书馆的发展方向。它以数字化资源、网络化存取和分布式管理为主要特征。,数字图书馆,数字图书馆是采用现代高新技术所支持的数字资源系统,是下一代因特网网上信息资源的管理模式,是没有时空限制的、便于使用的、超大规模的知识中心,学科数字图书馆,以学科为主线,系统整合与学科有关的信息资源(学术信息和教学信息),将各类各种媒体的信息数字化,经过科学的组织和管理,形成相互关联的知识网络,为用户提供“一站式”信息服务。,建设现状,1.数字资源的引进2.自建特色数据库3.数字资源的整合4.实验型数字图书馆,已提供服务的数字图书馆,清华大学建筑学数字图书馆北京大学古籍数字图书馆上海数字图书馆,特种文献及其检索工具,特种文献及其检索工具,科技报告会议文献学位论文专利文献,科技报告概述,科技报告是研究单位向主管部门和资助单位提交的研发成果或进展情况的技术文献,产生于二战时期。科技报告内容专深、新颖,往往涉及尖端学科或世界最新研究课题,它可以是科研成果的总结,也可以是科研进展情况的实际记录。许多最新的研究成果,尤其是尖端学科的最新探索往往出现在科技报告中;多为保密文献;技术上有较高可靠性;文献数量巨大,形式多样,每年产生80万件以上(其中美国约占87.2%)。,美国的四大报告,PB侧重于民用工程技术;AD侧重于军事工程技术;DOE侧重于能源技术;NASA报导航空航天技术。,PB报告和AD报告,PB报告:早期由美国商务部出版局(PublicationBoard)收集报导,后由国家技术情报服务处(NTIS)出版发行。收录范围偏重各种民用科学技术,每年发行约1万件。主要是专题报告,有少量会议文献、专利、标准及学位论文(均冠以PB号码)。,AD报告:由国防部技术情报中心(DTIC)收集报导,主要报道国防部所属研究机构及各个合同户的研究成果,设多个发行密级,AD-A和AD-B较易得到。除科技报告外,还收录期刊、图书、会议录和学位论文,每年发行约2万件(均冠以AD号码)。,PB和AD的主要检索工具,GRANAS1.26;169445)报告号Avail:NTISHCA03/MFA01CSCL05j原文提供者Requirementsforhighlevelsofhumanperformanceintheunfamiliarandstressfulenvironmentsassociatedwithspacemissions摘要,STAR的索引体系,1.SubjectIndex题目、报告号、NASA入藏号2.PersonalAuthorIndexNASA入藏号3.CorporateAuthorIndex题目、报告号、NASA入藏号4.Contract/AccessionNumberIndex同一个合同号的所有报告5.Report/AccessionNumberIndexNASA入藏号,国际航宇文摘IAA,内容编排和著录格式(期文摘本)(1)目次:(2)使用说明:(3)分类表(TABLEOFCONTENTS)(3)正文:文摘正文部分:(4)辅助索引:主题索引(SUBJECTINDEX)著者索引(PERSONALAUTHORINDEX)合同号索引(CONTRACTNUMBERINDEX会议论文和报告号索引入藏号/登记号索引(5)附录部分:会议出版物指南(INTHISISSUE),IAA正文编排格式按目次表类目顺序排列,AIAA登记号A87-10519*#Optimalflightpathsthroughmicroburstwindprofiles.R.F.Stengel(PrincetonUniversity,NJ)andM.L.Psiaki,(Atmos-phericFlightMechanicsConference,12th,Snowmass.CO.August19-21,1985TechnicalPaper.P.494-503)JournalofAircraft(ISSN0021-8669),Vol.23,Aug.1986,p.629-63517refs,FAA-supportedresearch;GrantNGL-31-001-252资助单位和合同号,NASA报告(航空航天文献)检索工具数据库,美国政府报告NTIS航空航天文献AEROSPACE,可提供检索的联机系统,dialog国际联机检索系统STN国际联机检索系统CSA剑桥科学文摘检索系统,科技报告原文的获取,NTIS订购号是获得科技报告原文的主要依据,由订购号可以向NTIS直接订购报告的复印件、缩微件。另外也可向国内的收藏单位索取。我国从60年代初引进科技报告,数量逐年增加。从60年代中期开始,科技报告的引进逐步从书本型改为缩微片的全套订购。中国科学技术信息研究所是我国引进科技报告最主要的单位;上海科技信息研究所也有四大报告的原文馆藏;中国国防科技信息中心收藏有大量的AD和NASA报告,AD报告的公开、解密部分的收藏量已达40多万件,占其全部出版总量的80%;中国科学院文献中心是收藏PB报告最全的单位;核工业部情报所收藏有较多的DOE报告。,特种文献及其检索工具,科技报告会议文献学位论文专利文献,会议文献概述,随着科学技术的迅速发展,各个国家的学会、协会、研究机构及国际学术组织越来越多,为了加强科学家之间的信息交流,各学术组织每年都定期或不定期地召开学术会议。据美国科学情报所(ISI)统计,全世界每年召开的学术会议约1万个,正式发行的各种专业会议文献5000多种。因此,会议文献是传递和获取科技信息的一种极为有效的重要渠道。学术会议按其组织形式和规模区分,一般可分为以下五大类:国际性会议、地区性会议、全国性会议、学会或协会会议、同行业联合会议。会议文献是指在各种学术会议上宣读的论文、产生的记录及发言、论述、总结等形式的文献,包括会议前参加会议者预先提交的论文文摘、在会议上宣读或散发的论文、会上讨论的问题、交流的经验和情况等经整理编辑加工而成的正式出版物。许多学科中的新发现、新进展、新成就以及所提出的新研究课题和新设想,都是以会议论文的形式向公众首次发布的。,会议文献概述,文献类型:学术会议、学术报告会、专题研讨会等(conference、congress、symposium、colloquium、convention、seminar、workshop)检索特点:获取科技文献的第二大信息源出版方式:会前文献(预印本Preprints和论文摘要)会后文献(以图书和期刊的方式出版)会议录,会议文献的检索工具,1.WorldMeeting:预报两年内召开的国际会议2.ConferencePaperIndex:报道科技、工程、医学、生物学方面的会议文献3.IndextoScientificandTechnicalProceedings:美国ISI(科学信息研究所)出版,ISTP为检索会议文献的权威工具4.各学术学会的网站可提供会议预告及会议文献检索,查找会议论文的检索工具,若要了解各种出版物上收录了哪些会议论文,需要利用此类检索工具。1、会议论文索引2、科技会议录索引3、中国学术会议文献通报4、国外科技新书简报,会议论文原文的获取,如果想进一步阅读原文,就需要了解会议文献在何处有收藏。除了向发行单位订购或本人联系外,可以利用当地图书馆的馆藏目录、各大图书馆或情报所的馆藏目录和联合目录,查得馆藏索引号,即可借阅或复制会议文献。此外,还可以查阅有关的其它检索工具。会议论文预印本的获取:如果所需要的会议论文只有预印本一种形式,由于一般图书馆大都没有收藏,因此应向中国科技情报所、中国科学院图书馆等国内大型情报所和图书馆联系复制。国内的会议文献大都收录在中国科技情报所主办的中国学术会议文献通报和中国科学院文献情报中心的馆藏国内学术会议资料目录中;国外的会议文献收录在中国科技情报所编辑的国外科技资料馆藏目录中。,会议论文原文的获取,以图书形式出版的会议文献的获取:如果所需要的会议论文发表在已知的会议录中,应首先查阅本单位、本地区图书馆的馆藏图书目录。如果缺藏,可利用西文科技会议录联合目录进行查找。西文科技学术会议联合目录:北京图书馆联合目录组编,书目文献出版社出版。已经出版三册:第一册报道1976-1978年的全国129个图书馆收藏的西文科技学术会议录4976种;第二册报道1979-1980年的全国113个图书馆收藏的西文科技学术会议录3957种;第三册是前两册的续集,收录了全国94个图书馆入藏的西文科技会议录7100余种(其中有少数会议录曾在前两册中被收录)。包括英、德、法、意、西、波、捷、罗、匈等文种。是查找我国各大图书馆收藏的西文科技会议录的大型目录。可利用该联合目录查出收藏单位并进行借阅和复制。以期刊形式出版的会议文献的获取:如果所需要的会议论文发表在已知的期刊中,应首先查阅本单位、本地区图书馆的馆藏期刊目录。如果缺藏,可利用西文期刊联合目录进行查找。,特种文献及其检索工具,科技报告会议文献学位论文专利文献,学位论文概述,学位是对专业人员根据其专业学术水平而授予的一种称号。学位制起源于12世纪欧洲的意大利,随后风行于法国和英国。现代许多国家都实行了学位制。尽管各国学位的设置不尽相同,但多数国家采用的是三级学位制,即学士(Bachelor)、硕士(Master)和博士(Doctor)制度。学位论文是伴随着世

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论