计算机检索概论课件_第1页
计算机检索概论课件_第2页
计算机检索概论课件_第3页
计算机检索概论课件_第4页
计算机检索概论课件_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机检索概论参考教材:P74-80计算机检索概论参考教材:P74-80计算机检索相对手工检索的优势速度快,耗时少途径多种类齐全数据更新快组配灵活结果输出多样周满英信息检索机检概论计算机检索相对手工检索的优势速度快,耗时少周满英2计算机检索目前主要方式1.光盘检索(1980’s-)光盘的优点是存贮量大、稳定性好、使用方便、成本低廉等,能存贮数据、文字、图象、声音、动画等各种信息,且不受通信线路的影响。

2.网络检索(1990’s-)因特网具有广泛性、方便性,还增加了许多新的动态信息服务,同时以搜索引擎为核心的网络搜索技术也日益发展。周满英信息检索机检概论计算机检索目前主要方式1.光盘检索(1980’s-)3计算机检索的原理计算机信息检索就是利用计算机进行信息的存储和检索的过程,存储和检索对应于数据库的建立和利用。将大量的文献信息加工处理,以一定的结构有序地存储在计算机的存储介质上,建成数据库,这是计算机的存储过程。将检索需求以一定的方式输入计算机中,由计算机对其进行处理,与已存储在数据库中的信息进行查询和匹配,并按要求的格式输出检索结果的过程,就是计算机的检索过程。周满英信息检索机检概论计算机检索的原理计算机信息检索就是利用计算机进行信息的存储和4计算机检索原理图信息存储信息检索信息源主题概念文献标识数据库信息需求提问概念检索提问式检索结果分析标引存储匹配分析检索检索语言规范周满英信息检索机检概论计算机检索原理图信息存储信息检索信息源主题概念文献数据库信息5数据库的类型书目数据库包括文摘、目录、题录等书目数据,如文章的标题、作者、文献出处(刊名、年、卷期、页码)、馆藏单位、文摘信息等,又称二次文献数据库。如:PubMed、CBM(中国生物医学文献数据库)全文数据库提供原始文献的全文,实现检索的一次到位。如:OVID、维普数据库、CNKI期刊全文数据库

数值数据库提供数值、参数、公式等信息,包括统计数据、实验数据、人口数据、化学品理化参数等如:美国国立生物技术信息中心(NCBI)的Genbank(基因库)、世界卫生组织的统计信息系统(WHOSIS)

周满英信息检索机检概论数据库的类型书目数据库周满英信息检索机检概论6数据库的类型事实数据库提供事实信息,如人物、机构、事件、疾病的诊断和治疗、药物的用法和不良反应等。如:疾病诊疗数据库、中国非处方药数据库

图像数据库以图像为信息主体,配有文字解释,如解剖图谱、中草药图谱、诊断图谱、手术图谱等。如:美国国立医学图书馆的TheVisibleHumanProject(可视人计划)、哈佛大学医学院的TheWholeBrainAtlas(全脑图谱)多媒体数据库将文字、数值、声音、图像等不同信息形式进行统一处理和管理的数据库

周满英信息检索机检概论数据库的类型事实数据库周满英信息检索机检概论7常见的生物医学文献数据库中文

中国生物医学文献数据库(CBM)

中文科技期刊数据库(重庆维普,VIP)

中国期刊全文数据库(清华同方,CNKI)

万方数据库资源系统

外文

Medline/PubMedOVIDEM(荷兰的《医学文摘》)BA(美国的《生物学文摘》)CA(美国的《化学文摘》)周满英信息检索机检概论常见的生物医学文献数据库中文周满英8数据库的结构字段(field)

是组成记录的数据项,如篇名、著者、来源、主题词等。记录(record)

由字段组成,每条记录都描述了原始信息的外部特征和内容特征,一条记录代表一篇文献。文档(file)

是数据库中一部分记录的集合。周满英信息检索机检概论数据库的结构字段(field)周满英信息检索机9数据结构举例周满英信息检索机检概论数据结构举例周满英信息检索机检概论10常用的记录字段AB

文摘

MH主题词AD

地址(第一著者)

PP

出版地AU著者PY

出版年TI

文章标题PT

文献类型TT

翻译标题CN

分类号TA刊名CT特征词TW

关键词CRF

参考文献LA

语种PG

页码MMH

主要主题词IS

ISSN(国际标准连续出版物编号)

SO

出处(刊名、年、卷、期、页)周满英信息检索机检概论常用的记录字段AB文摘11常用计算机的检索途径自由词途径主题词途径分类浏览著者检索引文检索索引检索期刊检索基本检索高级检索专业检索周满英信息检索机检概论常用计算机的检索途径自由词途径主题词途径12计算机的检索技术布尔逻辑检索截词检索限制检索位置算符周满英信息检索机检概论计算机的检索技术布尔逻辑检索周满英信息检索机13布尔逻辑检索

反映概念之间交叉和限定关系的一种组配,常用“AND”或“*”表示。

表示检索结果中的每一条记录必须同时包含有检索词A和B。AB逻辑与周满英信息检索机检概论布尔逻辑检索14举例

查找“冠心病的舌诊研究”方面的文献

冠心病AND舌诊

查找“吸烟与肺癌关系”的文献吸烟*肺癌

周满英信息检索机检概论举例周满英信息检索机检概论15布尔逻辑检索

反映概念之间并列关系的一种组配,常用“OR”或“+”表示。

表示一篇文献中A、B两者中有一即可,也包括两者同时存在。AB逻辑或周满英信息检索机检概论布尔逻辑检索AB逻辑或周满英信息检索机检概论16举例

查找“消渴”方面的文献消渴+糖尿病查找“维生素C”方面的文献

维生素COR抗坏血酸周满英信息检索机检概论举例周满英信息检索机检概论17布尔逻辑检索

是从原检索中排除一部分,常用“NOT”或“–”表示。

表示检索结果中每一条记录必须包含检索词A,但不能包含检索词B。BA逻辑非周满英信息检索机检概论布尔逻辑检索18举例

查找“非儿童哮喘”方面的文献哮喘-儿童

查找“肝炎非流行病学”方面的文献

肝炎NOT流行病学周满英信息检索机检概论举例周满英信息检索机检概论19优先级说明

可以在一个检索式中同时使用多个逻辑运算符,还可以用括号来改变运算次序:()>NOT>AND>OR

例如:检索有关“微量元素铜、铁、锌与儿童营养不良”方面的文献。(铜OR铁OR锌)AND(婴儿OR幼儿OR儿童)AND营养不良周满英信息检索机检概论优先级说明可以在一个检索式中同时使用多个逻辑运20截词检索用符号取代检索中部分字母,保留检索词中的相同部分。常用的截词符号有“*”、“?”。不同的检索系统中采用不同的符号。按照截断的字符数量,可分为无限截断和有限截断两种。按照截词的位置,可分为前(左)截断、中间截断、后(右)截断。周满英信息检索机检概论截词检索用符号取代检索中部分字母,保留检索词中的相同部21截词检索有限截断

一般用“?”表示有限截断,一个“?”表示一个字符或零个字符。

如:输入“computer???”来检索,可以查到含有computer、computers、computering的记录,但对含有computerization的记录检索无效。无限截断

一般用“*”表示无限截断,一个“*”表示0~N个字符。

如:输入“immun*”来检索,可以查到含有immune、immunology、immunodeficiency等所有以“immun”开头的单词。周满英信息检索机检概论截词检索有限截断周满英信息检索机检概论22限定检索将检索范围限定在某个特定字段或某一时间范围进行检索。常用表达形式有:字段标识符=检索词,检索词in字段标识符,字段标识符[检索词]常用的限制符有:“in”、“=”。EnglishinLA,表示限制检索结果的语种为英语。PY=1998,表示把结果限定在1998年。等同于PY[1998]

周满英信息检索机检概论限定检索将检索范围限定在某个特定字段或某一时间范围进行23位置算符反映两个检索词在文献中的邻近关系。不同的检索系统的位置算符是不一样的。常见的有near、with两个。with表示检索词在同一个字段中。near表示检索词在同一个句子中,词序可以颠倒,可以在near后面加上数字来限定两个词语之间可以插入的词的数目。周满英信息检索机检概论位置算符反映两个检索词在文献中的邻近关系。周满英24计算机的检索策略分析课题,明确检索要求选择数据库和检索途径确定检索词,构建检索式上机检索操作和反馈调节整理检索结果,获取原始文献周满英信息检索机检概论计算机的检索策略分析课题,明确检索要求周满英25检索结果的反馈与调整分析课题,明确检索需求选择数据库,确定检索途径确定检索词,编写检索式输入计算机,进行匹配运算浏览检出文献,结果是否满意输出检索结果分析失败原因调整检索式YESNO检索周满英信息检索机检概论检索结果的反馈与调整分析课题,明确检索需求选择数据库,确定检26检索效率检全率在进行某一检索时,检出的相关信息量与系统信息库中相关信息总量的比率。检全率高则漏检少,但是有可能误检率高。检准率在进行某一检索时,检出的相关信息量与检出的信息总量的比率。检准率高则误检少,但是可能漏检。周满英信息检索机检概论检索效率检全率周满英信息检索机检概论27检索要领有主题词的数据库,尽量选择主题词检索。进行主题词检索时,要尽量借用副主题词的限定来使文献查准,要注意用下位词扩检来避免文献的漏检。用关键词和自由词检索时应选择有实质意义的词,同时要全面考虑其同义词,避免漏检。当检出文献太多或太少时要考虑逻辑运算或者增加或减少同义词、检索词以及限定。周满英信息检索机检概论检索要领有主题词的数据库,尽量选择主题词检索。周满英28缩小检索范围选用专指性较强的下位词或限定副主题词。增加and连接,进一步限定主题概念。用字段限定检索范围,如篇名字段、主题词字段、年份字段等。用位置运算符将检索词限定在一个句子中或者同一字段中用not排除无关概念。周满英信息检索机检概论缩小检索范围选用专指性较强的下位词或限定副主题词。周满英29扩大检索范围从词表或检出文献中选同义词、相关词补充,用OR连接在检索式中。采用截词符,把所有不同后缀的词都作为检索词。进行族性检索,可采用分类检索,网罗所有同一类目的文献。取消某些限制过严的限制检索。对主题词或副主题词进行扩展检索。周满英信息检索机检概论扩大检索范围从词表或检出文献中选同义词、相关词补充,用OR连30思考题以下检索式中,哪个查出文献最多,哪个最少?AandB(AorB)andCAandBandCAandBorC周满英信息检索机检概论思考题以下检索式中,哪个查出文献最多,哪个最少?周满英31计算机检索概论参考教材:P74-80计算机检索概论参考教材:P74-80计算机检索相对手工检索的优势速度快,耗时少途径多种类齐全数据更新快组配灵活结果输出多样周满英信息检索机检概论计算机检索相对手工检索的优势速度快,耗时少周满英33计算机检索目前主要方式1.光盘检索(1980’s-)光盘的优点是存贮量大、稳定性好、使用方便、成本低廉等,能存贮数据、文字、图象、声音、动画等各种信息,且不受通信线路的影响。

2.网络检索(1990’s-)因特网具有广泛性、方便性,还增加了许多新的动态信息服务,同时以搜索引擎为核心的网络搜索技术也日益发展。周满英信息检索机检概论计算机检索目前主要方式1.光盘检索(1980’s-)34计算机检索的原理计算机信息检索就是利用计算机进行信息的存储和检索的过程,存储和检索对应于数据库的建立和利用。将大量的文献信息加工处理,以一定的结构有序地存储在计算机的存储介质上,建成数据库,这是计算机的存储过程。将检索需求以一定的方式输入计算机中,由计算机对其进行处理,与已存储在数据库中的信息进行查询和匹配,并按要求的格式输出检索结果的过程,就是计算机的检索过程。周满英信息检索机检概论计算机检索的原理计算机信息检索就是利用计算机进行信息的存储和35计算机检索原理图信息存储信息检索信息源主题概念文献标识数据库信息需求提问概念检索提问式检索结果分析标引存储匹配分析检索检索语言规范周满英信息检索机检概论计算机检索原理图信息存储信息检索信息源主题概念文献数据库信息36数据库的类型书目数据库包括文摘、目录、题录等书目数据,如文章的标题、作者、文献出处(刊名、年、卷期、页码)、馆藏单位、文摘信息等,又称二次文献数据库。如:PubMed、CBM(中国生物医学文献数据库)全文数据库提供原始文献的全文,实现检索的一次到位。如:OVID、维普数据库、CNKI期刊全文数据库

数值数据库提供数值、参数、公式等信息,包括统计数据、实验数据、人口数据、化学品理化参数等如:美国国立生物技术信息中心(NCBI)的Genbank(基因库)、世界卫生组织的统计信息系统(WHOSIS)

周满英信息检索机检概论数据库的类型书目数据库周满英信息检索机检概论37数据库的类型事实数据库提供事实信息,如人物、机构、事件、疾病的诊断和治疗、药物的用法和不良反应等。如:疾病诊疗数据库、中国非处方药数据库

图像数据库以图像为信息主体,配有文字解释,如解剖图谱、中草药图谱、诊断图谱、手术图谱等。如:美国国立医学图书馆的TheVisibleHumanProject(可视人计划)、哈佛大学医学院的TheWholeBrainAtlas(全脑图谱)多媒体数据库将文字、数值、声音、图像等不同信息形式进行统一处理和管理的数据库

周满英信息检索机检概论数据库的类型事实数据库周满英信息检索机检概论38常见的生物医学文献数据库中文

中国生物医学文献数据库(CBM)

中文科技期刊数据库(重庆维普,VIP)

中国期刊全文数据库(清华同方,CNKI)

万方数据库资源系统

外文

Medline/PubMedOVIDEM(荷兰的《医学文摘》)BA(美国的《生物学文摘》)CA(美国的《化学文摘》)周满英信息检索机检概论常见的生物医学文献数据库中文周满英39数据库的结构字段(field)

是组成记录的数据项,如篇名、著者、来源、主题词等。记录(record)

由字段组成,每条记录都描述了原始信息的外部特征和内容特征,一条记录代表一篇文献。文档(file)

是数据库中一部分记录的集合。周满英信息检索机检概论数据库的结构字段(field)周满英信息检索机40数据结构举例周满英信息检索机检概论数据结构举例周满英信息检索机检概论41常用的记录字段AB

文摘

MH主题词AD

地址(第一著者)

PP

出版地AU著者PY

出版年TI

文章标题PT

文献类型TT

翻译标题CN

分类号TA刊名CT特征词TW

关键词CRF

参考文献LA

语种PG

页码MMH

主要主题词IS

ISSN(国际标准连续出版物编号)

SO

出处(刊名、年、卷、期、页)周满英信息检索机检概论常用的记录字段AB文摘42常用计算机的检索途径自由词途径主题词途径分类浏览著者检索引文检索索引检索期刊检索基本检索高级检索专业检索周满英信息检索机检概论常用计算机的检索途径自由词途径主题词途径43计算机的检索技术布尔逻辑检索截词检索限制检索位置算符周满英信息检索机检概论计算机的检索技术布尔逻辑检索周满英信息检索机44布尔逻辑检索

反映概念之间交叉和限定关系的一种组配,常用“AND”或“*”表示。

表示检索结果中的每一条记录必须同时包含有检索词A和B。AB逻辑与周满英信息检索机检概论布尔逻辑检索45举例

查找“冠心病的舌诊研究”方面的文献

冠心病AND舌诊

查找“吸烟与肺癌关系”的文献吸烟*肺癌

周满英信息检索机检概论举例周满英信息检索机检概论46布尔逻辑检索

反映概念之间并列关系的一种组配,常用“OR”或“+”表示。

表示一篇文献中A、B两者中有一即可,也包括两者同时存在。AB逻辑或周满英信息检索机检概论布尔逻辑检索AB逻辑或周满英信息检索机检概论47举例

查找“消渴”方面的文献消渴+糖尿病查找“维生素C”方面的文献

维生素COR抗坏血酸周满英信息检索机检概论举例周满英信息检索机检概论48布尔逻辑检索

是从原检索中排除一部分,常用“NOT”或“–”表示。

表示检索结果中每一条记录必须包含检索词A,但不能包含检索词B。BA逻辑非周满英信息检索机检概论布尔逻辑检索49举例

查找“非儿童哮喘”方面的文献哮喘-儿童

查找“肝炎非流行病学”方面的文献

肝炎NOT流行病学周满英信息检索机检概论举例周满英信息检索机检概论50优先级说明

可以在一个检索式中同时使用多个逻辑运算符,还可以用括号来改变运算次序:()>NOT>AND>OR

例如:检索有关“微量元素铜、铁、锌与儿童营养不良”方面的文献。(铜OR铁OR锌)AND(婴儿OR幼儿OR儿童)AND营养不良周满英信息检索机检概论优先级说明可以在一个检索式中同时使用多个逻辑运51截词检索用符号取代检索中部分字母,保留检索词中的相同部分。常用的截词符号有“*”、“?”。不同的检索系统中采用不同的符号。按照截断的字符数量,可分为无限截断和有限截断两种。按照截词的位置,可分为前(左)截断、中间截断、后(右)截断。周满英信息检索机检概论截词检索用符号取代检索中部分字母,保留检索词中的相同部52截词检索有限截断

一般用“?”表示有限截断,一个“?”表示一个字符或零个字符。

如:输入“computer???”来检索,可以查到含有computer、computers、computering的记录,但对含有computerization的记录检索无效。无限截断

一般用“*”表示无限截断,一个“*”表示0~N个字符。

如:输入“immun*”来检索,可以查到含有immune、immunology、immunodeficiency等所有以“immun”开头的单词。周满英信息检索机检概论截词检索有限截断周满英信息检索机检概论53限定检索将检索范围限定在某个特定字段或某一时间范围进行检索。常用表达形式有:字段标识符=检索词,检索词in字段标识符,字段标识符[检索词]常用的限制符有:“in”、“=”。EnglishinLA,表示限制检索结果的语种为英语。PY=1998,表示把结果限定在1998年。等同于PY[1998]

周满英信息检索机检概论限定检索将检索范围限定在某个特定字段或某一时间范围进行54位置算符反映两个检索词在文献中的邻近关系。不同的检索系统的位置算符是不一样的。常见的有near、with两个。with表示检索词在同一个字段中。near表示检索词在同一个句子中,词序可以颠倒,可以在near后面加上数字来限定两个词语之间可以插入的词的数目。周满英

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论