中文数据库及信息检索技术_第1页
中文数据库及信息检索技术_第2页
中文数据库及信息检索技术_第3页
中文数据库及信息检索技术_第4页
中文数据库及信息检索技术_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、黄艳娟Huangyanjuan 中文数据库检索 信息检索技术与过程信息检索索技术与与策略CNKI检索维普检索万方检索CNKI检索CNKI资源总体体介绍1数据库检检索与使使用方法法2CNKI资源总体体介绍1我校购买买的资源源包括:CNKI资源总体体介绍1该库收录录1915年至今国国内出版版的近7000种学术期期刊,其其中核心心期刊、重要评评价性数数据库来来源期刊刊近2600种。内容容覆盖自自然科学学、工程程技术、农业、哲学、医学、人文社社会科学学等各个个领域,全文文文献总总量2200多万篇。该库收录录1999年至今全全国420家博士培培养单位位的博士士学位论论文。累累积出版版博士学学位论文文全文

2、文文献6万多篇。该库收录录1999年至今全全国652家硕士培培养单位位的优秀秀硕士学学位论文文。累积积出版硕硕士学位位论文全全文文献献44万多篇。收录2000年以来国国家二级级以上学学会、协协会、高高等院校校、科研研院所、学术机机构等单单位的论论文集,年更新新约10万篇论文文。累积积出版会会议论文文全文文文献73万篇。CNKI数据库登登录CNKI使用指南南数据库检检索与使使用方法法2CNKI数据库登登录需要注意意的是:偶尔会提提示输入入用户名名和密码码。请记记住:用户名:DX0437密码:hrbgcCNKI数据库登登录CNKI使用指南南数据库检检索与使使用方法法2CNKI使用指南南:认识CNK

3、I检索平台台利用CNKI查找有关关“机械械手自由由度”的的文献认识检索平台台A通用菜单单在各个总总库平台台首页和和检索结结果页都都提供了了通用菜菜单B统一检索索平台可进行跨跨库检索索C总库文献献出版报表表D文献资源源统一导航航利用CNKI查找有关关“机械手自自由度”的文献CNKI的检索方方式:跨跨库检索索还是进进入单库库检索?如何选择择,这就就需要分分析检索索人的需需求跨库:可可以同时时检索多多个子库库,获取取更多更更全面的的结果,而且省省时省力力单库:一一次只检检索一个个类型的的文献,避免结结果过多多造成的的困扰检索人的的需求是是什么?是为了获获取关于于某一内内容的系系统的全全面的信信息,还

4、还是只是是想搜索索特定类类型的文文献信息息?跨库检索索检索字段段检索词机械手布尔逻辑辑算符自由度检索结果果检索字段段信息检索索途径检索途径径是用户户根据需需要,以以文献信信息的外外部特征征和内容容特征来来确定的的检索入入口。根据信息息的外部特征:题名途径径、著者者途径、序号途途径根据信息息的内容特征:分类途径径、主题题途径信息检索索途径(检索字字段)责任者途途径题名途径径分类途径径主题途径径序号途径径引文途径径信息检索索途径1题名(题题目、标标题等)途径2责任者(作者、编者等等)途径径3序号(ISBN号等)途途径4分类途径径5主题途径径(主题题词)6关键词途途径ISBN是国际标标准书号号(In

5、ternational Standard BookNumber)的简称,是是国际通通用的图书或独立的的出版物(除定期期出版的的期刊)代码。出版社可以通过过国际标标准书号号清晰的的辨认所所有非期期刊书籍籍。一个个国际标标准书号号只有一一个或一一份相应应的出版版物与之之对应。ISSN(国际标准准连续出出版物编编号,InternationalStandardSerialNumber)是根据国国际标准准ISO3297制定的连连续出版版物国际际标准编编码,其其目的是是使世界界上每一一种不同同题名、不同版版本的连连续出版版物都有有一个国国际性的的唯一代代码标识识。信息检索索技术布尔逻辑辑检索位置算符符检索

6、截词检索索与词根根检索精确检索索与模糊糊检索布尔逻辑辑检索最常用的的信息检检索技术术布尔逻辑辑检索(Boolean logical)就是利利用布尔尔逻辑算算符进行行检索项项的逻辑辑组配,用以表达达检索者者的提问问概念。布尔逻辑辑(台湾译布林逻逻辑)得得名于乔治布尔,他是爱尔兰科克的皇后学学院的英英国数学学家,他他在十九世纪纪中叶首次次定义了了逻辑的的代数系系统。现现在,布布尔逻辑辑在电子子学、计计算机硬硬件和软软件中有有很多应应用。使使用集合代数数作为介绍绍布尔逻逻辑的一一种方式式。还使使用文氏图来展示各各种布尔尔逻辑陈陈述所描描述的集集合联系系。布尔逻辑辑检索逻辑“与”逻辑“或”逻辑“非”逻

7、辑“与”:用“AND”或“*”表示。用用于连接接概念交交叉和限限定关系系的检索索词。功功能:以以缩小检检索范围围,有利利于提高高查准率率。逻辑“或”:用“OR”或“+”表示。用用于于连接并并列关系系的检索索词,功功能:以以扩大检检索范围围,防止止漏检,有利于于提高查查全率。逻辑“非”用“NOT”或“-”号表示,用于连接接排除关关系的检检索词,功能:即即排除不不需要的的和影响响检索结结果的概概念,以提高查查准率。逻辑与检检索式构构造举例例如:查找找“胰岛岛素治疗疗糖尿病病”的检检索式为为:insulin (胰岛素)anddiabetes(糖尿病病)逻辑或检检索式构构造举例例如:查找找“肿瘤瘤”的

8、检检索式为为:cancer(癌)ortumor(瘤)orcarcinoma(癌)orneoplasm(新生物物)逻辑非检检索式构构造举例例如:查找找“动物物的乙肝肝病毒(不要人人的)”的文献献的检索索式为:hepatitisBvirus(乙肝病病毒)nothuman(人类)。2位置算符符检索位置检索索也叫邻近检索索。位置算算符检索索是用一一些特定定的算符符(位置置算符)来表达达检索词词与检索索词之间间的邻近近关系。表示两词词之间的的位置邻邻近关系系,常用用到的位位置算符符有(W)(nW)(N)nN)等。W算符W算符是word或with的缩写,表示在在此算符符两侧的的检索词词必须按按输入时时的前

9、后后顺序排排列,而而且所连连接的词词之间除除了有一一个空格格或一个个标点外外不得夹夹有其他他的单词词或字母母。information2Wmanagement可包括Informationtechnologiesand management和Informationmanagement N算符N算符是near的缩写,表示在在此算符符两侧的的检索词词必须紧紧密相连连,词序序可颠倒倒。nN表示两检检索词之之间最多多可以插插入n个单词,且词序序可颠倒倒。informationN retrievalinformation2Nretrieval3截词检索索截词检索索就是用用截断的的词的一一个局部部进行的的检索

10、,并认为为凡满足足这个词词局部中中的所有有字符(串)的的文献,都为命命中的文文献。按按截断的的位置来来分,截截词可有有后截断断、前截截断、中中截断三三种类型型。不同的系系统所用用的截词词符也不不同,常常用的有有?、$、*等。分为有有限截词词(即一一个截词词符只代代表一个个字符)和无限限截词(一个截截词符可可代表多多个字符符)。(1)后截断断,前方方一致。如:comput?表示computer,computers,computing等。(2)前截断断,后方方一致。如:?computer表示minicomputer,microcomputers等。(3)中截断断,bas?s=basisbasesc

11、olo?r包含colour(英)和和color(美)模糊检索索与精确确检索模糊检索索(fuzzysearch)是与“精准检索索”相对应的的一个概概念,是是指搜索索系统自自动按照照用户输输入关键键词的同同义词进进行模糊糊检索,从而得得出较多多的检索索结果。同义词由由系统的的管理界界面配置置。如配配置了“电脑”与“computer”为同义词词后,检检索“电脑”,则包含含“computer”的网页也也会出现现在检索索结果中中。模糊糊检索也也就是同同义词检检索,用用户在检检索页面面中输入入同义词词中任何何一个词词检索时时,只要要选中“模糊检索索”复选框,则该关关键词的的所有同同义词信信息也都都被检索索

12、出来。精确检索索精确检索索是指检索索词与检检索字符符串完全全相等。如检索作作者马智,仅检索索出作者者为马智智的文献献 ,作作者为“马智勇”的就不会会被检索索出来。模糊检索模糊检索索结果精确检索进入单库库检索请看检索索举例视视频期刊导航航使用CAJ阅读器和和PDF阅读器2020-02-1139同方知网网(北京京)技术术有限公公司浏览器下下载点击文章章篇名,进入知知网节页页面:CAJ下载的优优势:占用空间间小下载速度度快内嵌专业业词典即时工具具书释义义个性化编编辑文献献文档定位位功能打开大部部分PDF文档并进进行个性性化编辑辑 2020-02-112020-02-11机械手以“学术术趋势”为例:2

13、020-02-112020-02-11信息检索索过程分析需求求确定检索索词选 择信信息息 源确定检索索途径和和方法1234实施检索索获取原原始文献献信息检索索过程是是从确立立检索需需求到信息需求求得到满满足的全全过程。过程一:分析析需求,确定检检索词1明确检索索目的*需要关于于某方面面的系统统详尽的的信息*需要关于于某方面面的最新新信息*了解一些些片段信信息,解解决一些些具体问问题2明确课题题的主题题或主要要内容要形成若若干个既既能代表表信息需需求又具具有检索意义的的关键词(检索词词),确定检索索词之间间的关系系3涉及的学学科范围围4所需信息息的数量、语语种、年年代范围围等需求分析析:课题一:

14、 “赟赟”这个个字的读读音课题二:中西关关系发展展综述课题三:机械手手的定义义课题四:近2年气动机机械手的的新技术术研究课题五:新中国国60年城镇化化发展综综述北大政府府管理学学院老师师燕继荣荣的联系系方式及及近3年发文情情况过程一:检索词词的确定定信息检索索语言分析课题题的概念念隐含概念念的分析析核心概念念的选取取选取检索索词应注注意问题题主题检索索语言常用的就就是关键词关键词:从文献献的题目目、正文文或摘要要中抽出出的能表表达文献献主题内内容的具具有实质质意义的的语词。确定关键键词的步步骤:a.分析课题题,提取取概念b.整理概念念,扩充充同义词词汇c.运用分析析所得词词汇试查查,确定定课题

15、适适用的关关键词主题检索索语言叙词:又又称主题题词语言言,是指指从自然然语言中中优选出出来并经经过规范范化处理理的名词词术语。“沪产脚脚踏车”“上上海”、“自行行车”自然语言言主题词确定检索索词分析课题题的概念念隐含概念念的分析析核心概念念的选取取选取检索索词应注注意问题题分析课题题的概念念选择所涉涉及的主主要概念念,并找找出能代代表这些些概念的的若干个个词或词词组,进进而分析析各概念念之间的的上、下下、左、右关系系,以便便制定检检索策略略。如课课题“政策与行行政学的的关系”可选“政策”、“行政学”作为关关键词。隐含概念念的分析析有些课题题的实质质性内容容很难从从课题的的名称上上反映出出来,其

16、其隐含的的概念和和相关内内容需从从专业的的角度做做深入的的分析,才能提提炼出确确切反映映课题内内容的检检索概念念。如“知识产权权保护”概念中中的“知知识产权权”一词词隐含着着“著作权”和“版权”、“工业产权权”等概念念。核心概念念的选取取有些检索索词概念念已体现现在所使使用的数数据库中中,这些些概念应应予以排排除。如如WorldTextiles中“世界界”一词词应排除除。另外外有些比比较泛指指、检索索意义不不大的检检索概念念,如“发展”“现状状”“趋趋势”等等在不是是专门检检索综述述类信息息时也应应予以排排除。检索词选选取时应应注意的的几个问问题。检索词词的选取取应适当当,具有有专指性性,涵盖

17、盖主要主主题概念念,意义义明确。一般应应优先选选择规范范化主题题词做检检索词,但为了了检索的的专指性性也可选选用关键键词配合合检索。尽可能能地考虑虑其相关关的同义义词、近近义词作作为检索索词,以以保证查查全率。如同一一概念的的几种表表达方式式,同一一名词的的单、复复数,动动名词、过去分分词形式式,上位位概念词词与下位位概念词词,化学学物质的的名称、元素符符号,植植物和动动物名的的英文、拉丁名名等。过程二:选择信息源明确了信信息需求求之后,信息源源的选择择尤为重重要,它它直接影影响着检检索的效效率。工工欲善其其事,必必先“选选”其器器,信息息源选择择得当,就会给给人以愉愉悦的搜搜索体验验,能够够

18、收到事事半功倍倍的效果果。一 北京京大学政政府管理理学院硕硕士招生生信息二 该院院导师三某一导导师的姓姓名、联联系方式式四 该导导师的发发文情况况,近3年第一项可可以选择择搜索引引擎查找找二三项可可以进入入北大政政府学院院网站查查找第四项需需要使用用CNKI等数据库库过程三:选择检检索途径径和方法法检索途径径信息检索索技术检索式的的构造与与调整信息检索索途径(检索字字段)责任者途途径题名途径径分类途径径主题途径径序号途径径引文途径径检索式的的构造与与调整检索式:是检索索策略的的逻辑表表达式,是用来来表达用用户检索索提问的的,由基基于检索索概念产产生的检检索词和和各种组组配算符符构成。(篇名=聚氯乙烯烯orPVC)and年代=2005-2009过程四:实施检检索获取取原始文文献问题:北大政府府管理学学院老师师燕继荣荣的联系系方式及及近3年发文情情况可分为2个问题:A北大政府府管理学学院老师师燕继荣荣的联系系方式B北大政府府管理学学院燕继继荣近3年发文情情况A北大政府府管理学学院老师师燕继荣荣的联系系方式利用搜索索引擎找找到北大大政府管管理学院院网页浏览找到到燕继荣荣的联系系方式北大政

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论