数字咨询服务与数据库检索技巧.ppt_第1页
数字咨询服务与数据库检索技巧.ppt_第2页
数字咨询服务与数据库检索技巧.ppt_第3页
数字咨询服务与数据库检索技巧.ppt_第4页
数字咨询服务与数据库检索技巧.ppt_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字参考咨询服务与数据库检索技巧,数字参考咨询服务,reference work(1891) reference service 19世纪70年代 1883 波士顿图书馆诞生第一个全日制参考馆员 网络技术;商业咨询服务对图书馆咨询业务带来威胁;搜索引擎的便利,使 得咨询量下降;图书馆本身资源的数字化,用户获取方便。 背景 图书馆的核心业务;数字资源越来越多,各项信息服务也在网上开展。 20世纪80年代,美国华盛顿大学健康科学图书馆和马里兰巴尔迪大学健 康服务图书馆第一个网上参考咨询服务EARS 1987 加州大学 Apple Video Phone kit 第一个实时交互功能的参考咨询服务 1987年英国公共图书馆联盟启用Ask A Librarian 最早出现的虚拟参考咨询的合作系统 2002年6月 美国国会图书馆与OCLC联合开发了合作虚拟参考咨询系统:VRSQP (question point ) 1998年,中国国家图书馆建立网上咨询台,数字参考咨询服务的对象,可以提问一些最基本的问题,像图书馆的信息导航,也可以提出深层次的问题,为用户提供定题服务,或是专家咨询,如企业,行业的最新动态和研究成果等。对信息资源知识化管理,包括显性知识的管理和隐性知识的管理。图书馆开展的数据库建设,信息系统建设,网络化建设,形成知识库,为用户提供检索服务,提高咨询服务的效率。图书馆咨询员之间要相互交流,对存在的信息要深入的挖掘,使隐性的信息资源显性化,对用户提出的问题进行合理的整理,形成知识库,提高资源和知识的利用率,方便以后的用户检索。 近年来OCLC的一个新的产品FirstSearch检索系统发展迅速,深受欢迎。目前通过OCLC的FirstSearch检索系统可查阅70多个数据库,涉及广泛的主题范畴,覆盖社会生活的各个领域和学科。 1 艺术和人文学科 8 综合和参考 2 工商管理和经济 9 生命科学 3 会议和会议录 10 医学和健康学 4 消费者事务和人物 11 新闻和时事 5 教育 12 公共事务和法律 6 工程和技术 13 社会科学 7 普通科学,/zhcn-asiapacific/home.html,OCLC,Online Computer Library Center,Inc.,即联机计算机图书馆中心,总部设在美国的俄亥俄州,是世界上最大的提供文献信息服务的机构之一,它是一个非赢利的组织,以推动更多的人检索世界上的信息、实现资源共享并减少使用信息的费用为主要目的。,天津师范大学图书馆信息咨询服务,数据库使用培训、使用中发现的问题 图书馆电子资源远程访问 学位论文提交、检索 SCI&EI 文献查收查引 信息咨询服务 文献传递,可以使用的数据库,数图中心联采和本馆自行采购数据库共97-86个,其中中文数据库49-42个,西文数据库48-44个,目前提供数图中心试用数据库链接,共含试用数据库239个。,莫扎特钢琴协奏曲 k 466 钢琴伴奏,http:/www.prestoclassical.co.uk/search.php?searchString=MOZART+Piano+Concerto+No.+20+orchestral+backing ,数据库检索技巧,高级检索 布尔逻辑运算符 通配符 位置运算符 等等 更多存在于西文数据库,通用检索 关键词检索 组合检索 搜索建议 百度、谷歌 各类学术搜索引擎,数据库检索的原理,检索效果的评价,查全率与查准率是检索质量的两个重要的评价指标。 查全率(recall ratio)=检出的相关文献量/检索系统中相关文献总量。即检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比。 查全率高说明有用的东西都被你检中了,但对于数量巨大的数据库而言,要达到100%的查全率是不可能的,在网络条件下尤其如此。 查准率(precision ratio)=检出的相关文献量/检出的文献总量。 指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 准确率高说明你检出的东西都是有用的东西。一般地说,很少能达到100%的查准率。 在查全与查准两个方面一般难以两全,为了获得很多有用的东西(达到高的查全率),需要较少的限制检索条件,但这样检出的无用的东西就会很多(查准率不高),反之亦然。,高级检索,布尔逻辑运算符: “and”( 逻辑与) 、“or”( 逻辑或) 、“not”( 逻辑非) 3 种布尔逻辑运算符, 逻辑运算符字母大小写均可。若输入的检索词间有空格系统会自动进行“and”运算, 并可配合括号使用。如不加括号, 会按照从左至右的顺序进行运算。 通配符(论文查重原理) 可以使用一对一的问号“? ”和一对多的星号“*”通配符。通符可以用在检索词的尾部或中间。如输入“electri?”可以检出“electric”一词, 输入“wom?n”可将“woman”、“women”全部检出, 输入“electric*” 则可以检出“electric”、“electricity”、“electrical”、“electrically”、“electrified”等词。,位置运算符 位置运算符有2 个: “N”和“W”。位置运算符用于计算检索词之间能容纳的最大单词数, “N”或“W”与阿拉伯数字组配, “N”只限定检索词之间的单词数, 而不限制检索词的顺序, “W”既限定检索词之间的单词数, 又要求命中记录用词顺序与输入完全一致。如输入“law n3 legislative”, 则表示“law”与“legislative”两词之间最多有3 个词, 先后顺序无所谓。输入“law w1 legislative”, 表示“law”与“legislative”两词之间最多有1 个词, 前后顺序不能颠倒。,额外事项,大小写字母的处理; 名词单、复数的处理 标点符号的处理 双引号与精确匹配检索 查询词组时, 可用双引号将词组括起来进行精确匹配查询。 如输入“power plant”, 选择“TI Title”, 只有文章题目中完全包含“power plant”的记录才会被命中, 并且词序、位置均不变。但不能使用停用词, 若词组中包括停用词, 检索结果只能是无。,停用词表因数据库的不同而变化, 在检索过程中应避免使用 停用词, 常用的停用词有: a 、an 、and 、are 、as 、at 、be 、because 、been 、but 、by 、for 、however 、if、in 、is 、not 、of 、on 、or 、p 、so 、the 、there 、to 、was 、were 、whatever、whether、would。 美国工业分类系统 NAICS 是North American Industry Classification System 即美国工业分类系统, NAICS 在1997 年取代了SIC( 美国工业分类系统) EBSCO Publishing 的期刊与杂志按其内容有相应的NAICS 代码 DN(DUNS Number) , 即邓白氏编号或称邓氏编码, 全称是Data Universal Numbering System, 是一个得到国际认可的、常用的公司 识别符号, 使用DN 检索可以了解某一公司的基本情况。如公司名称、地址、所在省市、电话、业务范围、雇员人数、销售额等信息; TK( Ticker Symbol) 的含义是股票代码。,各种算符在数据库中的实际应用,1)EI NEAR Bridge NEAR Piling* 表示这两个词要彼此接近,前后顺序不限。 W/n Pig*W/2pine*表示两个词的距离不能超过n个单词 Adj Channel adj tunnel表示含有这两个词,两个词相邻,位置一定 2)ISI Proceedings 用同句算符(SAME):如Channel same tunnel,表示channel 和tunnel 出现在同一句子中才符合检索条件。 3)CSA:within “X“ 表示两词之间不得多于x个词,前后位置任意 如“women within 8 movement” (顺序不定) 4)Elsevier: ADJ表示两词相邻,前后顺序固定,与“词检索“的结果相同;NEAR或NEAR(N),表示两词相邻,中间可插入少于或等于n个单词,前后顺序可以发生变化,如果不使用(N),系统默认值为10,5)PQDD W/n (两词间距小于n个单词,且前后位置任意),Pre/n (两词间距小于n个单词,且前后位置一定) 6)ProQuest W/n(表示连接两个词之间可以插入n个词 ,前后位置可颠倒) 如:Education w/5 intenet 表示education和internet之间可以插入5个词 ,并且前后位置可以颠倒。 Pre/n(表示前后两词之间最多插入n个词,前后位置一定 ) 如:U.S pre/n economic policy可检出U.S aid economic policy,or U.S wartime economic policy 。 还有括号检索、截词符或通配符、短语检索(phrase search)、自然语言检索(natural language search) 参见各个数据库的帮助系统或蓝页,百度搜索,加书名号 搜索 加双引号 搜索 加双引号的意思呢,就是你所搜索的关键字不会被拆分 filetype: 搜索 关键字 + 空格 filetype: +文件后缀 intitle 搜索 这个语法就是把搜索的内容限制在网页的标题上面,这个有什么作用呢?,网页标题一般就是对一个网页的总结,这样搜索出来的结果比较精确。(intitle:+关键词) 搜索。 直行双引号 这个搜索是查找论坛的工具。 Site、inurl、减号,“-”,/, ,把文档看作一系列词(Term),每一个词(Term)都有一个权重(Term weight),不同的词(Term)根据自己在文档中的权重来影响文档相关性的打分计算。 于是我们把所有此文档中词(term)的权重(term weight) 看作一个向量。 Document = term1, term2, ,term N Document Vector = weight1, weight2, ,weight N 同样我们把查询语句看作一个简单的文档,也用向量来表示。 Query = term1, term 2, , term N Query Vector = weight1, weight2, , weight N 把所有搜索出的文档向量及查询向量放到一个N维空间中,每个词(term)是一维。如图:,【两个向量之间的夹角越小,相关性越大】计算夹角的余弦值作为相关性的打分,夹角越小,余弦值越大,打分越高,相关性越大。,总结,在分析检索课题,明确检索要求的基础上,必须综合考虑检索系统的特点、收录的学科范围、各数据库的专业范围、主题内容、数据来源与文献类型、技术含量、数据的存贮年限、更新频率、检索费用以及使用方法。 分析检索课题:分析检索课题的中心内容和所属学科范围,以便准确选择反映文献内容特征的主题词、关键词,确定出所属学科的学科性质 明确检索需求,即弄清检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论