版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息检索(研究生)全册配套课件信息检索
本课程学习的内容学术信息检索的作用学术信息的分类学术信息检索语言各种学术信息的表现形式各种学术信息源的检索技巧结合学术信息检索的论文写作绪论一、我们日常接触的信息有哪些?
观察交流检索阅读生活信息学术信息军事信息经济信息生活信息:天气、车票、购物......经济信息:GDP、利率、贸易……学术信息:期刊、学位论文、会议投稿……军事信息二、学术信息检索对我们做研究有哪些帮助?检索是获取学术信息的主要途径三、检索学术信息需要做哪些准备工作?1、多渠道地了解学术信息源是是高效检索并获取信息的前提。2、熟练掌握学术信息的分类与特征是筛选有用信息的必要手段。3、扎实的专业基础和广泛地阅读是充分利用学术信息的根本保证。
学术信息源的分类学术信息源搜索引擎专业数据库开放式资源
(1)利用网络搜索引擎辅助检索弥补传统检索方式的“盲区”
传统检索所用的数据库在资源存储形式、学科范围、检索方式上都有一定的限定。而搜索引擎则是全方位,多角度搜索,能搜索各种格式的文件,没有学科的限制,边界很广,这正好弥补了对检全率的需求。对于某些特殊的检索,如要求查某种产品的参数,要求比较产品的外形,搜索引擎的图片查询功能就有用武之地了。有些搜索引擎不但能搜到图片,甚至连多媒体、网站链接都可以搜索,这将会对某些特殊的检索起到关键作用。提高传统检索方式的时效随着新产品、新技术更新速度加快,传统数据库更新速度已显得相对滞后,检索期刊的滞后期少则一个月,多达半年。搜索引擎以其更新及时的特点正好弥补了传统数据库的不足。在检索传统数据库的基础上,利用Internet搜索引擎进行检索,可以弥补传统数据库的时差问题,尤其是在新产品查询时,更应该进行传统数据库之外的Internet上的信息查询。降低传统检索方式的成本
搜索引擎基于互联网上的免费资源,在检索方法中有效运用搜索引擎,能够大大降低成本,提高效率。1谷歌Google典型的网络搜索引擎介绍用Google辅助举例:
有时项目查新要对技术指标进行新颖性分析,若仅使用传统的数据库检索方式,往往会出现检索结果为“零”的尴尬结果。从科技发展的继承性上看,任何一项科技活动,都是在前人研究基础上的发展,这个结果是有悖现实的。此时,可另辟蹊径,使用搜索引擎进行检索往往会收到良好的效果。参考:杜津萍,王磊.搜索引擎在科技查新中的应用[J].图书馆工作与研究,2007,3项目:BDQ10/24便携式液压多功能钳客户给出的技术特征:“高强韧性”、“高强度”和“防止剪料崩溅”由于这些特征均不明显,若按照该技术特征查找文献,符合要求的文献会很多,但真正密切相关的文献却几乎没有。查新员通过客户交流,得到了该多功能钳的具体技术指标,包括工作压力、扩张力、扩张距离和剪切能力等,然而根据这些指标进入各大数据库查询,结果仍不理想。通过Google搜索引擎,输入检索词“BDQ10/24”及“多功能钳”,搜索到某他公司主页,通过参数比较,对该产品研究水平有了直观了解。进而输入关键词“hydraulic”(液压)和“cutter”(钳),找出了相关英文网页,对检索到的相关产品进行对比,发现符合条件的文献还是很多。返回检索页面,仍用这两个检索词,利用Google的图片搜索功能,搜索到相关图片两千多张,再根据检索结果调整检索策略和检索词,不断缩小范围,最终找到几个液压多功能钳的专业网站,从而实现了和国外新产品技术指标的对比。利用搜索引擎的特殊的图片搜索功能,解决了传统数据库搜索结果“全”而不“准”的问题。经客户检查,发现Google搜索到的这几个专业网站是他们以前所不知道的。通过搜索引擎的检索,既解决了产品技术参数的分析比较,也拓宽了客户的视野,收到了良好的效果。运用GoogleScholar辅助举例项目:碎裂玄武岩夹凝灰岩型铁路单线隧道综合技术研究关键词:玄武岩;夹凝灰岩;隧道结果:学术谷歌5条;维普1条、CNKI1条这是因为专业数据库的索引库只有:文摘、标题、关键词、著者、机构等文摘型内容,所以会漏检。学术谷歌是扫描全文,有效地保证了查全率。引自徐勇.学术搜索引擎在科技查新中的应用[J].浙江高校图书情报工作.2009,1
由ElsevierScience公司于2001年4月1日推出,是专为搜索高度相关的科学信息而设计的搜索引擎。Scirus是一位古希腊的先知,Elsevier命以此名喻意Scirus将会帮助人们成为科学先知。
Scirus能够精确地找到普通搜索引擎所找不到的免费或者访问受限的科学信息资源2科学搜索引擎Scirus
Scirus索引每月更新,可以将检索结果按照相关度进行排序,也可按照日期排序。提供的期刊资源可以免费查看题录和文摘,获取全文需要预先注册并支付费用。运用Scirus辅助举例项目:真空碳热还原氧化镁矿提取金属镁据查新点,用scirus检索到的专利文献如表所示引自徐勇.学术搜索引擎在科技查新中的应用[J].浙江高校图书情报工作.2009,1结果:Scirus查找了8条文献,但Dialog无法查到。wiki利用网络搜索引擎的注意事项只能作为辅助手段由于网络搜索引擎涵盖的内容过于宽泛、发布信息的方式过于随意、信息量过于庞杂,因此,搜索引擎只能作为检索的辅助手段,不能替代传统检索方式。只是在某些特殊的查新课题上,可以借助搜索引擎了解与查询课题有关信息,增加对课题把握度,辅助解决“查全率”和“查准率”问题。对网络搜索引擎进行可信度分析在运用搜索引擎进行辅助查询时,必须要对检索到的信息进行可信度分析,了解信息发布人、发布时间、发布地点、发布原因等情况,对信息的引证素材、论证方法、观点结论等进行评价,从信息源、信息传播渠道、信息时效性等方面来检验信息的可信度。根据检索需求,把握不同搜索引擎的特点各种搜索引擎在覆盖范围、排序方法、检索途径等方面各不相同,在使用搜索引擎进行查询之前,应该对搜索引擎的特点进行了解,把握其优势、劣势,将不同的搜索引擎配合使用,使其“扬长避短”,优势互补。(2)网络开放资源
当前,网络上的免费全文信息资源不计其数,但真正符合科技查新要求的,必须是正规出版机构提供的数据库资源,这种资源即为所谓的“开放资源”。开放资源是针对传统的基于订阅的出版模式而言的,是利用网络条件为科研人员提供免费的全文文献,实现科研成果的广泛共享。北京大学信息管理系的李武将开放资源归纳为两种形式:开放期刊和开放仓储。
参考:李武.开放存取出版的两种主要实现途径[J].大学图书馆学报,2005,4
1网络免费期刊文献MEDLINE是美国国家医学图书馆出版的产品,提供全球生物医学文献的题录与摘要以供免费检索;ElsevierScience建立了基于Web的数字化出版平台ScienceDirect将约2000种期刊全文数字化上网,提供免费的目次、文摘检索,同时提供全文检索,并可联网订购索取全文;类似的出版商还有Springer、John
&Wiley、Blackwell、ACS等。
利用免费简要信息的网络资源MEDLINEScienceDirect2网络免费专利文献主要存在于专利数据库中,比如中国专利数据库,包括发明、实用新型和外观设计3种专利的著录项目及摘要,免费检索且数据更新及时;中国知识产权网与中国专利信息网也提供部分专利文献的免费检索服务;欧洲专利局提供的esp@cenet提供50多个国家的专利信息,信息量大且免费检索。此外,美国、日本、俄罗斯、加拿大等国的专利管理机构也提供本国专利数据库的网上免费检索服务。3网络免费会议文献各种大型的学术团体或政府机构通常都会在网上提供文献服务。如SPIE会议录通过“国际光学工程协会”的网站提供会议文献的免费检索服务;中国国家科技图书文献中心也通过网站提供题名、作者姓名、作者单位、会议录、文集名、关键词、语种、文摘内容等会议文献的免费检索信息;IEEE每年报道300多个生物医学技术和通讯技术、计算机工程、电力、宇航、电子及其他技术领域的会议信息,提供会议日期、关键词、国家、城市、登记号、主办者等项目的免费信息检索。4网络免费标准文献
国际标准化组织通过网站提供ISO标准文献数据库的免费检索。美国国家标准协会也为用户免费提供检索工业标准、国际标准、美国政府标准、美国国家标准以及一些正在拟定的标准。中国标准服务网、日本标准协会等网站也提供标准文献免费检索。
中国科技论文在线()是经教育部批准,由教育部科技发展中心主办的科技论文网站。依托35位中国科学院和中国工程院院士组成的顾问委员会为网站提供学术指导,是一个完全公益性的科技论文网站。免费资源之一:中国科技论文在线arX电子预印本档案是美国能源部资助美国高能物理研究所的一个项目。主要包括物理学,数学,生物工程,能源科学与技术,计算机科学与软件工程,电子信息工程等学科。免费资源之二:arXarXarX免费资源之三:国家科技图书文献中心
国家科技图书文献中心(NationalScienceandTechnology,简称NSTL)是经国务院领导批准,于2000年6月12日成立的一个基于网络环境的科技信息资源服务机构。中心由中国科学院文献情报中心、国家工程技术图书馆(包括中国科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院和中国化工信息中心)、中国农业科学院农业信息研究所、中国医学科学院医学信息研究所、中国标准化研究院标准馆和中国计量科学研究院文献馆组成。
/NSTL/免费资源之四:doaj
DOAJ(DirectoryofOAJ)是由瑞典的隆德大学图书馆LundUniversityLibraries为OA资源做的一个目录系统。它设立于2003年5月,最初仅收录350种期刊,截至2006年3月收录的开放存取期刊超过2000种、文章9万多篇。
该系统收录的均为学术性、研究性期刊,一般都是经过同行评审,或者有编辑作质量控制的期刊,具有免费、全文、高质量的特点,对学术研究有很高的参考价值。该目录及其收录期刊、论文可自由存取,任何人可以使用,不反对商业用途。该目录的目标是包含各种语言、各个主题的期刊。学科范围:生命科学、农业、食品、经济、化学、环境科学、历史、艺术、法律、工程、社会科学HighWirePress是斯坦福大学图书馆的分支机构,出版777种自然科学方面的网络版期刊,提供2000多种高影响力期刊(包括JournalofBiological
Chemistry、Science、PNAS)的免费访问。免费资源之五:HighWirePress免费资源之六:/美国四大科技报告(AD,PB,NASA,DOE)
AD报告也产生较早,1951年开始出版。现由美国国防技术情报中心(DTIC:DefenceTechnicalInformationCenter)负责收集整理和出版。报告内容以国防部各个合同户的研究报告为主,其报告号冠以AD,A原先为Armed、D则为Document之意,现在则可理解为入藏报告(AccessionDocument)。PB报告产生于二战(WORLDWARII)结束之后,当时美国政府为了整理和利用从战败国获得的数以千吨计的秘密科技资料,于1945年6月成立了一个专门的出版局,即美国商务部出版局(PublicationBoard),负责收集、整理、报导利用这些资料。免费资源之七:STAR是美国国家航空航天局NASA(NationalAeronauticsandSpaceAdministration)科技情报处编辑、出版的专业性检索刊物,它是检索航空航天科技报告的重要工具。EnergyResearchAbstracts,简称ERA,是美国能源部DOE(DepartmentOfEnergy)技术情报中心编辑出版的半月刊。ERA收录能源部部属科研机构和各大学等一切与能源有关的科技文献,但以科技报告为主。1、NTIS:http:///2、DTIC:/3、DOE:.my/4、NASA:/国防技术情报中心(DefenceTechnicalInforma-tionCentre,DTIC)
美国1945年建立。1979年改现称,是国防部科技和管理情报中心。向承担国防科研任务的单位提供研究报告,开展咨询、检索、定题、专利评审等项服务。收藏文献150余万件,建立数据库4种,出版物有8种,并管理10个情报分析中心。工作人员约450人。地址:弗吉尼亚州。NASANationalAeronauticsandSpaceAdministration美国国家航空航天局的缩写,NASA全称美国国家航空航天局,是世界上最大的民用航天机构。1958年10月1日NASA正式成立。总部位于华盛顿哥伦比亚特区。兰利研究中心、刘易斯研究中心、艾姆斯研究中心飞行研究中心(爱德华空军基地实验室)海军研究实验室有关先锋计划的部分马歇尔航天飞行中心肯尼迪航天中心、约翰逊航天中心、太空飞行器中心国家技术情报服务局(NationalTechnicalInfor-mationService,NTIS)
美国1970年建立。负责搜集、加工、印发美国政府研究报告,馆藏资料150余万件,建有NTIS文献库、世界引文索引数据库、正在进行中的联邦研究项目数据库等。开展联机检索服务、出租磁带、提供缩微品、答复咨询等服务活动。工作人员370余人。年度预算约3000万美元。地址:弗吉尼亚州。利用以上信息源我们可以做什么?例如,进行专利检索1、避免重复开发2、规避设计3、借鉴他人技术再开发4、及时发现竞争对手动向5、完善方案6、停止某些无效项目信息检索的学科属性是什么?发展历程…
…信息检索的学科基础——情报学学科目的:1、最佳标引
2、最少查找时间克劳德·香农(ClaudeElwoodShannon,1916-2001)1916年4月30日诞生于美国密西根州的Petoskey。香农理论的重要特征是熵(entropy)的概念,他证明熵与信息内容的不确定程度有等价关系。熵曾经是波尔兹曼在热力学第二定律引入的概念,我们可以把它理解为分子运动的混乱度,信息熵也有类似意义。在20世纪中叶,人类终于对三个非常重要的概念:质量、能量、信息量都有了定量的计量办法。
H=∑-pilogpi《AMathematicalTheoryofCommunication》1948布拉德福(1878~1948)Bradford,SamuelClement
他在1934年提出了布拉德福定律,指出“若将期刊按其刊载某专业论文数以递减顺序排列,再将期刊划分为载文量相等的三个区域,则可得出期刊数量比约为1:α1:α2的关系”。即:
某一学科的大部分论文往往高度集中在少数期刊中,而其少数论文则分散于大量期刊上。1955年,在美国新泽西州一个鸡舍改造的工作间中,尤金·加菲尔德(EugeneGarfield)博士首次提出“引文索引”概念,1961年试编成了《科学引文索引》,1963年,SCI正式创刊。1925.9.25~662024/9/4信息检索基本知识及技巧
Theprinciplesandskillsoninformationretrieval主讲人:施亮Lecturer:caesar,shi672024/9/4目录outline信息检索的定义、分类及其作用二检索语言三检索的效率、手段和方法682024/9/4信息检索的定义、分类及其作用1.1信息检索的定义信息检索(InformationRetrieval):,是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(InformationStorageandRetrieval),这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(InformationSearch)。692024/9/41.2信息检索的手段(1)手工检索eg:美国工程索引(2)光盘检索eg:medline(3)网络检索eg:springerlink702024/9/41.3信息检索的对象(1)文献检索(DocumentRetrieval):是以文献(包括题录、文摘和全文)为检索对象的检索。可分为全文检索和书目检索两种。
(2)事实检索(FactRetrieval):是以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索。
(3)数据检索(DataRetrieval):是以数值或数据(包括数据、图表、公式等)为对象的检索。
712024/9/41.4信息检索的作用(1)信息检索是获取知识的捷径
eg:princeton的学生约翰·菲利普利用图书馆公开资料设计原子弹。
(2)信息检索是科学研究的向导
eg:(美)阿波罗飞船的燃料箱的重复研究问题。(3)信息检索是终身教育的基础
unesco:可以防止知识老化,不断更新知识722024/9/4二信息检索的要素
(1)前提——信息意识/信息素养informationliteracy新闻阅读:《武汉的士起步价调为两公里16元12月1日起执行》
看到标题,能联想到什么?
从信息认知、信息情感和信息行为三个方面进行分析!732024/9/4(2)基础——信息源A、信息的载体:
印刷型
缩微型机读型声像型742024/9/4B、信息的内容和加工级次:
一次文献
二次文献三次文献752024/9/4C、信息的出版形式:图书期刊会议资料学位论文专利标准报告百科全书、类书762024/9/4图书的检索途径主要用到:
书名作者出版社ISBN关键词
期刊的检索途径主要用到:
刊名篇名作者关键词ISSN772024/9/4
会议论文的检索途径主要用到:
会议名称主办单位会议地点关键词作者会议文章篇名
学位论文的检索途径主要用到:
作者学位授予单位导师姓名关键词论文篇名782024/9/4
专利资料的检索途径主要用到:
关键词专利权人发明人国际专利分类号公开号
标准资料的检索途径主要用到:
标准编号标准名称发布单位发布日期关键词792024/9/4
报告资料的检索途径主要用到:
报告号关键词作者报告单位合同户报告代码
百科全书、类书资料的检索途径主要用到:
音形义802024/9/4(3)核心——信息利用能力掌握各种信息源掌握检索语言熟练使用检索工具对检索结果的评价,判断812024/9/4附:期刊的指数计算(1)影响因素=该年引用该刊前两年文章的总次数当年该刊所发表文章的总数即年指标前两年该刊所发表文章的总数=一特定年度对该刊当年发表文章的引用次数影响因素是一种期刊中论文的平均被引率特定年度的影响因素用于测度一种期刊被利用的速度,也是测度期刊重要性的依据即年指标822024/9/4自引率与被引率
自引率是指一种期刊中引用本刊的参考文献对全部参考文献之比;被自引率是一种期刊被本刊中文章引用的次数与该刊被引用的总次数之比。=自引率某刊自引的引文量该刊全部引文量被引率
=某刊自引的引文量某刊被引用的总次数832024/9/4二检索语言2.1按表现形式划分的检索语言
外表特征语言内容特征语言842024/9/4外表特征:就是文献上记明的、显而易见的特征。
外表特征语言(书目引文语言)题名(书名、篇名)著者姓名文献序号(如:ISBN、ISSN、专利号、报告号等)书目引文出版事项文献类型852024/9/4
内容特征语言非句法语言句法语言等级制体系分类法标题词关键词叙词单元词加标志的叙词组面词(如:组面分类法)短语文献全文的自然语言862024/9/42.2按应用功能划分的检索语言
分类语言主题语言872024/9/42.21分类语言
是用分类号和相应的分类款目名称来表达信息内容的主题概念,并按学科体系的逻辑次序将信息资源系统地加以划分和组织的语言。分类语言能反映事物的从属派生关系,便于按学科门类进行族检索。882024/9/4杜威十进分类法——
DeweyDecimalClassification,DC/DDC美国M.杜威编制的综合性等级列举式分类法。分为详、简两种版本,详本于1876年问世,取名为《图书馆图书小册子排架及编目适用的分类法和主题索引》,1951年的第15版改名《杜威十进分类法》000总论
100哲学
200宗教
300社会科学
400语言
500自然科学和数学
600技术(应用科学)
700艺术、美术和装饰艺术
800文学
900地理、历史及辅助学科
第一层展开层630农业
631农业经营
631.5作物栽培
892024/9/4
通用十进制图书分类法——UniversalDecimalClassificationUDC十进制图书分类法由两位比利时书目专家(PaulOtlet、HenrilaFontaine)19世纪末在杜威十进制图书分类法的基础上继续研发的分类方法。此种分类方法由数字和特殊符号组成,把涉及各种知识体系及学科的书籍予以分类。介于数字和符号无语言障碍的特性,该分类法在世界各地的图书馆中被广泛应用。
总分类0总汇1哲学,心理学2宗教,神学3社会学,政治,经济,法律,教育,人类学4暂无(由图书馆具体添加)5自然学科,数学6实用学科,医学,科技,企业经济学,计算机
7艺术,手工艺品,音乐,竞技,体育8语言学,文学9地理,生物,历史902024/9/4附加+:并列符(例:178.1+33酒精主义者和国民经济)::关系符(例:178.1:33酒精主义对国民经济的影响)
/:包含符(例:592/599系统动物学,从592到599)
=:语言符(例:=71拉丁语)(0...):书类符(例:(042)演讲,讲义)(...):地域符(例:(234.3)阿尔卑司)912024/9/4美国国会图书馆图书分类法
——LibraryofCongressClassification
922024/9/4第一层932024/9/4末层942024/9/4中国图书馆图书分类法——ChineseLibraryClassification,
CLC
中国图书馆分类法,简称《中图法》。包括“马列主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书五大部类,22个基本大类,具体如下:952024/9/4中国科学院图书馆图书分类法简称科图法。1958年由中国科学院图书馆编写,1974年、1979年、1994年分别进行了修订。分为25大类。中国科学院图书馆图书分类法962024/9/4国际专利分类法——InternationalPatentClassification,IPC
《关于国际专利分类斯特拉斯堡协定》与1975年10月7日生效,它为发明专利,包括出版的专利申请书、发明证书说明书、实用新型说明书(一下简称为“专利文献”)提供了一种共同的分类。分类表示使各国专利文献获得统一分类的一种工具。它的基本目的是作为各专利局以及其他使用者在确定专利申请的新颖性、创造性(包括对技术先进性和实用价值作出评价)而进行的专利文献检索是的一种有效检索工具。
972024/9/4982024/9/4992024/9/41002024/9/41012024/9/41022024/9/41032024/9/41042024/9/41052024/9/41062024/9/41072024/9/41082024/9/41092024/9/4技术主体的分析1102024/9/42.22主题语言
1112024/9/41122024/9/4
INSPEC叙词表举例:Locomotive
NT①
diesel-electriclocomotiveBT
②vehicles
TT③
vehiclesRT
④railtrafficrailwaystractionCC⑤
B8520-nC3360DFC
⑥
b8520-nc3360DeDI
⑦January19731、下位叙词2、上位叙词3、族首词4、相关词5、INSPEC数据库使用的分类号6、输入到INSPEC
数据库使用的分类号7、该叙词的启用日期英国电气工程学会(InstituteofElectricEngineering简称IEE)下设的国际物理和工程信息服务部(InternationalInformationServicesforthePhysicsandEngineeringCommunities,简称INSPEC)1132024/9/4三检索的效率、手段和方法3.1检索效率评价1142024/9/43.2索引语言中改善查全率的措施(1)同义词控制法
是指当一个概念具有多个同义词的时候,为了保证标引与检索的一致性,避免文献的分散和漏检,指引词汇的使用者从其他的同义词找到一个被专门选择作为正式主题词的词的用法。例如:用符号USE、SEE、Y(用)从正式词引见非正式的词,则用USEFOR、D(代)1152024/9/4(2)词的关联法索引词的关联,最普通的形式是等级上的关联。例如:A、由专指词到较泛指的词,使用符号
BT(broaderterm),或者S(属)
B、由泛指词到较专指的词,使用符号
NT(narrowerterm),或者F(分)
C、由指向近义的词,使用符号
RT(relatedterm),或者C(参),或seealso(参见)
1162024/9/4《汉语主题词表》词的关联举列
交流发电机F同步发电机异步发电机S发电机
交流换向电机D交流整离子电机S交流电机Z电机C调速电动机异步电动机1172024/9/4(3)字形的控制法
即把具有同一词根的字组合在一起。当然这不是提供标引的措施,而是提供检索用的辅助手段。在计算机检索中,是采用截词实现的:例如:“反射”、“反射波”、“反射性”、“反射望远镜”等。都有reflect,用reflect进行截词检索,就能检索出与“反射”有关的所有文献。1182024/9/4(4)聚类法
在对检索词进行统计的基础上,将有关的索引次进行聚类,可以查出更多的文献,从而改善查全性。例如:“枯萎”是与“庄稼”、“植物生长”联系在一起的,如果“锈菌”也是常与“植物生长”等词联系在一起的话,我们就可以推断“枯萎”与“锈菌”之间存在某种联系。1192024/9/43.3索引语言中改善查准率的措施组配即两个或两个以上概念的组合,有两种组配形式,先组和后组。
先组式是指概念之间的组合是在词表编制阶段就已经定义好的,组配后的符合概念成为供标引的完整索引词。
心理声学(是心理学与声学的组配)蒸发冷却(是蒸发与冷却的组配)
后组式是指在检索阶段把两个或两个以上的有关索引词进行组合。
“计算机”与“设计”1202024/9/4
先组式有助于提高索引词的专指度,减少标引到每个词的文献数量,减少和避免假组配,从而有利于查准率。但是先组式的词在数量上是有限的,不能适应各种角度和深度的符合概念检索。
后组式便于各种角度和深度的检索,有利于查准率的提高,但是可能出现假组配,致使误检的增多。对于先组和后组式的评价1212024/9/43.4计算机检索语言(1)布尔逻辑检索功能逻辑或(OR、+)检索项A、B
若用“逻辑或”组配,则逻辑式为“AORB”,或者“A+B”AB表示被检索的文献只要包含有其中的一个检索项,或者同时含有这两个检索项,那么它就会被命中。1222024/9/4逻辑与(AND、*)检索项A、B
若用“逻辑与”组配,则逻辑式为“AANDB”,或者“A*B”AB表示被检索的文献必须同时含有两个检索项才能被命中1232024/9/4A逻辑非(NOT、—)检索项A、B
若用“逻辑与”组配,则逻辑式为“ANOTB”,或者“A—B”B表示被检索的文献在含有A检索项而不含有B检索项是才能被命中。1242024/9/4(2)截词符截词符可以避免逐词输入带来的麻烦,还可以扩大查全率,截词可以截前、截后、中间截断。例如:?S
Comput?结果为:computablecomputationcomputecomputer?Scon*t结果为:connectconvert1252024/9/4六、计算机检索语言OptimizationmodelsGeraldineHeilpornEuropeanJournalofOperationalResearchANDAND选择布尔逻辑符号输入检索主题词标题作者来源选择主题词的限定字段(3)布尔逻辑在数据库检索中的应用1262024/9/4{testbed}wn
ALLAND{atmnetworks}wn
TI
(windowwn
TIANDsapphirewn
TI)ORSakamoto,K*wn
AU
美国工程索引的专家级检索方式第三章检索系统的结构、评价指标及内容划分检索系统的结构检索系统的衡量指标检索内容的划分一、检索系统的构成(一)结构图文献源被选文献概念分析将概念翻译成系统语言文献款目的集合(书目数据库)提问表达式将概念翻译成系统语言概念分析情报提问情报用户情报存储输入情报检索输出标引匹配检索策略系统词表一、检索系统的构成1、按文献选择子系统的特征来分,可分为:书目检索系统数据检索系统文本检索系统综合性检索系统专科性检索系统2、按照词表子系统的特征来分,可分为:控制词汇的检索系统非控制词汇的检索系统3、按照查询子系统的特征来分,可分为:布尔逻辑检索系统人工查询系统二、检索系统的衡量指标为了说明与衡量检索效率,目前在文献检索理论中流行着几个指标:即检全率(recallfactor)检准率(pertinencyfactor)漏检率(omissionfactor)误检率(noisefactor)N
收录的文献总量X
有关文献量M
检出的文献量W
检出的有关文献量二、检索系统的衡量指标检全率(recallfactor)=WX=检出的有关文献量有关文献量检准率(pertinencyfactor)=WM=检出的有关文献量检出的文献量漏检率(omissionfactor)=1—WX误检率(noisefactor)=1—WM
查全率与查准率彼此有反变的关系。在同一个检索系统中,查全率提高,检准率就会降低,反之亦然。查全100507525255075100查准三、检索内容的划分
文献的类型是多种多样的,而人们检索文献的角度、深度和广度更是复杂多样。不同的检索需求,不可能由一种检索内容来解决。为适应人们的多种信息查询要求就产生了多种多样的检索内容。
一般来讲,分为以下几种类型:(一)目录(Bibliography)
目录是对图书或者其他出版的文献特征的记载和描述,其特点是:按种为单位进行记录与报道,对文献的描述比较简单,只记录其外部特征,按一定的方法组织排列成各种不同种类的目录。比较重要的目录有:国家书目出版社与书店目录馆藏目录
联合目录专题文献目录1、国家书目
这是对一个国家出版的全部图书所作的登记统计性书目,可以反映一个国家文化、科学和出版事业的水平。2、馆藏书目
包括图书馆、情报部门的文献馆、资料室等等的藏书目录,它不仅包含从市场采购的公开发行的资料,也包括用交换等方式得到的非卖品资料不仅包括现在发行的新书刊,而且包括一定历史时期累积起来的全部资料,这对广泛地检索文献是很重要的3、联合书目
是汇总若干个图书馆或其他收藏单位所藏文献的目录,从检索角度来说,它可以免去分别查阅各个馆藏目录的麻烦,扩大文献的获取范围。(二)索引(Index)
所谓索引,就是将书籍、期刊等文献中所刊载的论文题目、作者以及所讨论的或者涉及到的学科主题、人名、地名、名词术语、分子式、所引用的参考文献等等,根据一定的需要,经过分析,分别摘录出来,著名其所在书刊中的页码并按一定的原则排列起来的工具。索引大致可以分为两种:1、篇目索引:主要揭示的是期刊,报纸等文献中的文章,并把文章的著者、篇名按字顺排列起来。2、内容索引:是将图书、文章中所包含的事物、人名、地名、学术名词等内容要项摘录出来而编成的索引。(三)文摘(Abstract)
文摘是通过描述文献的外部特征和简明深入地摘录文献内容的要点来报道文献的一种检索工具,其特点是以简练的形式,将某一学科或专业的原始文献的主题范围、目的、方法等作简略、准确的摘录。文摘的类型主要有以下两种:1、报道性文摘(informativeabstract)
是对文献中情报的浓缩,,它基本上客观地反映原文创造性本分的全部内容。例如,各种研究方法和数据。2、指示性文摘(indicativeabstract)
是根据原文编写的,带有评价性的摘述,它主要介绍作者的写作目的和讨论的主题范围,只是引读者去查阅原文不引述具体的事实和数据。英文文摘第四章:数据库检索方法介绍一、数据库的分类1、按语种中文数据库外文数据库2、按收录类型文摘数据库全文数据库视听数据库全文数据库又可分:(1)期刊全文(2)学位论文全文(3)图书全文(4)标准全文(5)综合全文
……全文数据库举例:中国学术期刊网扫描图册数据库举例:博看网电子图书数据库举例:超星数字图书馆视频数据库举例:知识视界外文数据库举例:EIVILLAGE外文数据库举例:EIVILLAGE用作者单位用:huazhong*技术标准(technicalstandard)技术标准是对产品和零部件的质量、规格、检验方法等所作的技术规定,是从事生产和建设的一个共同依据。技术标准作为一种规范性的技术文献,具有一定的法律约束力。标准按使用范围划分,分为:国际性标准、区域性标准、国家标准、部门标准和企业标准等标准按内容划分,分为:基础标准、产品标准、方法标准、安全与环境保护标准等UL是英文保险商试验所(UnderwriterLaboratoriesInc.)的简写。UL安全试验所是美国最有权威的,也是界上从事安全试验和鉴定的较大的民间机构。它是一个独立的、非营利的、为公共安全做试验的专业机构。其业务包括:有关材料、工具、产品、设备、构造、方法和系统筹对是否危及人的生命财产的安全进行实验。三、文献的主要出版类型API是美国石油学会(AmericanPetroleumInstitute)的英文缩写。API建于1919年,是美国第一家国家级的商业协会,也是全世界范围内最早、最成功的制定标准的商会之一。ASME是AmericanSocietyofMechanicalEngineers(美国机械工程师协会)的英文缩写。美国机械工程师协会成立于1880年,在世界各地建有分部,是一个有很大权威和影响的国际性学术组织。DOT,是美国交通部(USDepartmentofTransportation)的英文缩写。美国交通部成立于1967年,总部位于华盛顿,下设联邦公路管理局(FHWA)、联邦航空管理局(FAA)、联邦机动车安全管理局(FMCSA),海运管理局(MARAD)、全国公路交通安全管理局(NHTSA),总检察官办公室(OST)等部门。
ASTM系美国材料与试验协会的英文缩写,其英文全称为AmericanSocietyforTestingandMaterials。ASTM前身是国际材料试验协会(InternationalAssociationforTestingMaterials,IATM)。19世纪80年代,有人提出建立技术委员会制度,由技术委员会组织各方面的代表参加技术座谈会,讨论解决有关材料规范、试验程序等方面的争议问题。IATM首次会议于1882年在欧洲召开,会上组成了工作委员会。当时,主要是研究解决钢铁和其它材料的试验方法问题。1902年在国际材料试验协会分会第五届年会上,宣告美国分会正式独立,取名为美国材料试验学会(AmericanSocietyforTestingMaterials)。
美国国家标准学会(AmericanNationalStandardInstitute,ANSI)是美国非营利性民间标准化团体。自愿性标准体系的协调中心。
CPSC(ConsumerProductSafetyCommittee)是美国消费品安全委员会的缩语。他是美国联邦政府机构,主要职责是对消费产品使用的安全性制定标准和法规并监督执行。CE两字,是从法语“Communate
Europpene”缩写而成,是欧洲共同体的意思。欧洲共同体后来演变成了欧洲联盟(简称欧盟)。CE代表欧洲统一(CONFORMITEEUROPEENNE)。英国标准学会(BritishStandardsInstitution;BSI)世界上第一个国家标准化机构。英国政府承认并支持的非营利性民间团体。成立于1901年,总部设在伦敦。目前共有捐款会员20000多个,委员会会员
20000多个。
GS是德文“geprüfteSicherheit”(安全性已认证)的缩写,是德国整机类产品安全标志,GS认证以德国产品安全法(SGS)为依据,按照欧盟统一标准EN或德国工业标准DIN进行检测的一种自愿性认证,是欧洲市场公认的德国安全认证标志。
E/eMark也就是欧洲共同市场,对汽.机车及其安全零配件产品,噪音及废气等,均需依照欧盟法令【EECDirectives】与欧洲经济委员会法规【ECERegulation】的规定,通过产品符合认证要求,即授予合格证书,以确保行车的安全及环境保护之要求。E-Mark依认证国别不同,所授予之编号也不同。例如向丹麦提出申请,其E-Mark标志为E18/e18。
FCC为FEDERAL
COMMUNICATIONCOMMISSION(美国联邦通信委员会)的简称。FCC认证是关于电磁兼容方面的测试认证,美国FCC对于工作频率在9KHZ以上的电子产品所产生的电磁干扰均有管制。电子电器类产品销往美国,需申请FCC认证,并标注FCC标注。Oeko-TexStandard100是1992年德国Hohenstein研究协会和维也纳-奥地利纺织品研究协会制定的。现在有13个检测协会,它们的主要任务是检测纺织品的有害物质已确定它们的安全性。Oeko-TexStandard100现在是使用是为广泛的纺织品生态标志。位于德国奥芬巴赫的VDE检测认证研究所(VDETestingandCertificationInstitute)是德国电气工程师协会(VerbandDeutscherElektrotechniker,简称VDE)所属的一个研究所,成立于1920年。作为一个中立、独立的机构,VDE的实验室依据申请,按照德国VDE国家标准或欧洲EN标准,或IEC国际电工委员会标准对电工产品进行检验和认证。VDE直接参与德国国家标准制定,是欧洲最有经验的在世界上享有很高声誉的认证机构之一。法国标准化协会(AFNOR)是根据法国1901年法令于1926年成立的公益性非营利,并由政府承认和资助的全国性标准化机构。协会是法国标准化体系的核心,其任务是:
•推动并协调标准的制定;
•在欧洲和国际标准化机构中代表并维护法国的利益;
•发布标准;
•推动并便利标准的采用;
•开展产品服务和体系的认证以及NF标志的认证。NF产品认证:包括工业产品、大众消费品、生态标签和农产食品。
美国全国卫生基金会(NationalSanitationFoundation,NSF)成立于1944年,是一个独立的,不以营利为目的的非政府组织。NSF专致于公共卫生、安全、环境保护领域的标准制订、产品测试和认证服务工作,是公共卫生与安全领域的权威机构。NSF
的宗旨在于制订公共卫生以及服务、研究与教育环境方面的管理规划并加以实施。作为一个可靠的中立组织,NSF为政府,产业界以及广大消费者提供解决有关公众健康与环境问题的服务。
IAPMO是英文InternationalAssociationPlumbingandMechanicalOfficials的简称,它的总部设于美国加利福尼亚州,是一个非盈利性质的机构。自1926年成立以来,IAPMO一直从事于建筑给排水行业以及建筑通风系统之安全使用规范和标准的制订,并对有关产品进行检测、认证。目前,该机构为社会提供的服务主要有以下几个方面:
1、指定、出版、发行各种安全使用规范,其中包括
UPC、UMC等,这些规范,在美国建筑业极具权威性。
2、发展会员,并为从事相关行业的政策部门检验人员举办种类研讨会,颁发检验人员资格证书。
3、产品检验、认证。IAPMO的认证部门可对行业内的有关产品,根据UPC和UMC的要求,给予认证,该项认证,通常是政府有关部门接受使用该类产品的基本要求。
4、提供ISO9000体系认证。
FM全球公司通过其所属的“FM认可”(FMApprovals)机构向全球的工业及商业产品提供检测及认证服务。“FM认可”证书在全球范围内被普遍承认,他向消费者表明该产品或服务已经通过美国和国际最高标准的检测。三、文献的主要出版类型FM所提供的检测认证服务项目包括:1.产品认证——FM向防火器材、电子电器设备、危险场所设施、火场勘测、信号设备、建筑材料等产品的生产商颁发认证证书;
标准检测——FM向生产商提供产品单一特性的标准检测服务;
ISO9000注册——FM是ISO9000的注册机构,可以为企业进行ISO9000体系审核;
EOTA是欧洲技术认可组织(EuropeanOrganisationforTechnicalApprovals)的英文缩写,该组织由与欧盟成员国及欧洲自由贸易协议成员国提名的欧洲技术认可认证机构组成。
EOTA的主要职责是编写ETA指导方针,并负责与ETA认证相关的一切活动。EOTA与欧洲的EC,EFTA,CEN等组织都有紧密的联系与合作关系。
ETOA是在欧盟安全CE建筑产品指令(ConstructionProductsDirective)89/106/EC(CPD)的背景下产生的,其目的是解除欧洲对于建筑建材产品的不同标准而导致的技术壁垒。
通过ETA认证的产品,满足符合性证明的规定,可以标注EC标志并在欧洲自由贸易协议成员国市场上自由流通。序号代号含义管理部门1GB中华人民共和国强制性国家标准国家标准化管理委员会2GB/T中华人民共和国推荐性国家标准国家标准化管理委员会3GB/Z中华人民共和国国家标准化指导性技术文件国家标准化管理委员会我国国家标准代号我国行业标准代号序号代号含义管理部门1BB包装中国包装工业总公司包该办2CB船舶国防科工委中国船舶工业集团公司、中国船舶重工集团公司3CH测绘国家测绘局国土测绘司…………58YZ邮政国家邮政局计划财务部行业标准分为强制性和推荐性标准,表中给出的是强制性的标准,推荐性标准是在强制性标准后加“/T”,例如,包装行业的推荐标准BB/T我国地方标准代号序号代号含义管理部门1DB+*中华人民共和国强制性地方标准代号省级质量技术监督局2DB+*/T中华人民共和国推荐性地方标准代号省级质量技术监督局注:*表示省级行政区划代码前两位我国企业标准代号序号代号含义管理部门1Q+*中华人民共和国企业产品标准代号企业注:*表示企业代号《中国标准文献分类法》一级类目表
A综合00/09标准化管理与一般规定
10/19经济、文化
20/39基础标准
40/49基础科学
50/64计量
65/74标准物质
75/79测绘
80/89标志、包装、运输、贮存
90/94社会公共安全
B农业、林业00/09农业、林业综合
10/14土壤与肥料
15/19植物保护
20/29粮食与饲料作物
30/39经济作物
40/49畜牧
50/59水产、渔业
60/79林业
90/99农、林机械与设备
C医药、卫生、劳动保护00/09医药、卫生、劳动保护综合
10/29医药
30/49医疗器械
50/64卫生
65/74劳动安全技术
75/79劳动保护管理
80/89消防
90/99制药、安全机械与设备
D矿业
00/09矿业综合
10/19地质矿产勘察与开发
20/29固体燃料矿
30/39黑色金属矿
40/49有色金属矿
50/59非金属矿
80/89地质勘探设备
90/99矿山机械设备
E石油00/09石油综合
10/19石油勘探、开发与集输
20/29石油、天然气
30/49石油产品
60/69石油产品添加剂
90/99石油勘探、开发与集输设备
F能源、核技术00/09能源、核技术综合
10/19能源
20/29电力
40/49核材料、核燃料
50/59同位素与放射源
60/69核反应堆
70/79辐射防护与监测
80/89核仪器与核探测器
90/99低能加速器
G化工00/09化工综合
10/14无机化工原料
15/19有机化工原料
20/29化肥、农药
30/39合成材料
40/49橡胶制品及其辅助材料
50/59涂料、颜料、染料
60/69化学试剂
70/79化学助剂、表面活性剂、催化剂、水处理剂
80/84信息用化学品
85/89其他化工产品
90/99化工机械与设备
H冶金00/09冶金综合
10/19金属化学分析方法
20/29金属理化性能实验方法
30/34冶金原料与辅助材料
40/59钢铁产品
60/69有色金属及其合金产品
70/74粉末冶金
80/84半金属与半导体材料
90/99冶金机械设备
J机械00/09机械综合
10/29通用零部件
30/39加工工艺
40/49工艺装备
50/59金属切削机床
60/69通用加工工艺
70/89通用机械与设备
90/99活塞式内燃机与其他动力设备
K电工
00/09电工综合
10/19电工材料和通用零件
20/29旋转电机
30/39低压电器
40/49输变电设备
50/59发电用动力设备
60/69电气设备与器具
70/79电气照明
80/89电源
90/99电工生产设备
L电子元器件与信息技术00/09电子元器件与信息技术综合
10/34电子元件
35/39电真空器件
40/49半导体分立器件
50/54光电子器件
55/59微电路
60/69计算机
70/84信息处理技术
85/89电子测量与仪器
90/94电子设备专用材料、零件、结构件
95/99电子工业生产设备
M通信、广播00/09通信、广播综合
10/29通信网
30/49通信设备
50/59雷达、导航、遥控、遥测、天线
60/69广播、电视网
70/79广播、电视设备
80/89邮政
N仪器、仪表00/09仪器、仪表综合
10/19工业自动化仪表与控制装置
20/29电工仪器仪表
30/39光学仪器
40/49电影、照相、缩微、复印设备
50/59物质成分分析仪器与环境监测仪器
60/69实验室仪器与真空仪器
70/79试验给予无损探伤仪器
90/99其他仪器仪表
P工程建设
00/09工程建设综合
10/14工程勘察与岩土工程
15/19工程抗震、工程防火、人防工程
20/29工程结构
30/39工业与民用建筑工程
40/44给水、排水工程
45/49供热、供气、空调及制冷工程
50/54城乡规划与市政工程
55/59水利、水电工程
60/64电力、核工业工程
65/69交通运输工程
70/79原材料工业及通信、广播工程
80/84机电制造业工程
85/89农林业及轻纺工业工程
90/94工业设备安装工程
95/99施工机械设备
Q建材
00/09建材综合
10/29建材产品
30/39陶瓷、玻璃
40/49耐火材料
50/59碳素材料
60/69其他非金属矿制品
70/79建筑构配件与设备
80/89公用与市政建设器材设备
90/99建材机械与设备
R公路、水路运输
00/09公路、水路运输综合
10/19公路运输
20/29水路运输
30/39船舶维护与修理
40/49港口装卸
50/59救助、打捞与潜水
60/69航道与航标
80/89交通管理
S铁路00/09铁路综合
10/29铁路建筑设备
30/39机车车辆通用标准
40/49机车
50/59铁路车辆
60/69铁路信号
80/84牵引供电
T车辆
00/09车辆综合
10/19汽车发动机
20/29汽车底盘与车身
30/34车辆通用零部件
35/39车用电子、电气设备与仪表
40/49汽车
50/59专用汽车
60/69拖拉机
70/79挂车
80/89摩托车
90/99无轨电车与其他车辆
U船舶00/09船舶综合
10/19船舶总体
20/29舾装设备
30/39船舶专用装备
40/49船用主辅机
50/59船舶管路附件
60/69船舶电气、观通、导航设备
V航空、航天00/09航空、航天综合
35/49航空器及其附件
50/59航空运输与地面设备
W纺织00/09纺织综合
10/19棉纺织
20/29毛纺织
30/39麻纺织
40/49丝纺织
50/54化学纤维
55/59纺织制品
60/69针织
70/79印染制品
90/99纺织机械与器具
X食品
00/09食品综合
10/29食品加工与制品
30/34制糖与糖制品
35/39制盐
40/49食品添加剂与食用香料
50/59饮料
60/69食品发酵、酿造
70/79罐头
80/84特种食品84/89制烟
90/99食品加工机械
Y轻工、文化与生活用品
00/09轻工、文化与生活用品综合
10/19钟表、自行车、缝纫机
20/29日用玻璃、陶瓷、搪瓷、塑料制品
30/39造纸
40/44日用化工品
45/49皮革加工与制品
50/59文教、体育、娱乐用品
60/69家用电器、日用机具
70/74五金制品
75/79服装、鞋、帽与其他缝制品
80/84家具
85/89工艺美术品与其他日用品
90/99轻工机械
Z环境保护00/09环境保护综合10/39环境保护采样、分析测试方法50/59环境质量标准60/79污染物排放标准国际标准简介标准的缩写(按英文字首排列)CD:委员会文件,ISO的技术委员会制定的最初标准草案。CEN:欧共体标准化委员会。CENELEC:欧洲电工标准化技术委员会。DIS:国际标准草案,ISO的技术委员会制定的标准草案。DP:建立的草案,在委员会内提议的国际标准草案。DS:丹麦标准协会。DS/ENISO:等同采用欧洲标准和ISO标准的丹麦国家标准。DS/INF:作为指南的文件,还没有作为标准发布。EN:欧洲标准;
IEC:国际电工委员会;PREN:提议的欧洲标准,需由CEN成员对其进行投票表决。TC176:ISO的技术委员会(质量管理和质量保证技术委员会)。WG:ISO中的工作组。WI:ISO
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2019版广西师范版 高中体育与健康 必修 10~12年级下篇 《第一章 健康行为的养成》大单元整体教学设计2020课标
- 《课电机正反转》课件
- 《级ACCESS数据库》课件
- 主题活动吃火锅真暖和
- 三年级数学五千以内加减混合两步运算题竞赛考核练习题
- 妇女节主题班队活动
- 危重患者突发事件应急处理
- 知觉的整体性微电影分库周欣然
- 住院病案首页数据质量评分表
- 医疗废物培训
- 断路器失灵保护及远跳详解
- 草诀百韵歌原文及解释
- 肺癌的护理常规(PPT课件)
- 化工厂工程设备安装施工方案.doc
- 自动分板机操作指导书
- 同位角内错角同旁内角专项练习题有答案
- 新能源汽车电机与驱动系统教案系列项目四驱动电机管理系统任务
- 项目请款单模板样板
- 四分钟倒计时
- 反激变压器的准谐振模式= QR计算
- 《水利工程设计变更管理办法》
评论
0/150
提交评论