第2讲 信息检索的基本知识_第1页
第2讲 信息检索的基本知识_第2页
第2讲 信息检索的基本知识_第3页
第2讲 信息检索的基本知识_第4页
第2讲 信息检索的基本知识_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024/3/19信息检索的基本知识信息检索第2讲张光磊课程信箱:xinxijiansuo2014@163.com人类社会发展的三大支柱资源物质、能源、信息信息资源是信息大量累积与信息技术进步的产物,可以帮助人类创造更多的物质财富与精神财富。随着计算机网络的不断普及,面对爆炸式增长的信息量,如果不及时、有效地获取自己所需要的信息,人们就犹如逆水行舟、寸步难行。

2024/3/193?要进行信息获取和利用有人做过假设:一个化学专家,懂30国语言、4种杂志/小时、40个小时/周,读完当年全部文献,需要10年之久!(书、刊、告、专、会、….)《纽约时报》一天的信息量等于17世纪一个人一生所能得到的信息的综合。因特网平均每隔30秒就有一台计算机加入。Google所索引的网页数量已经超过1万亿。——信息的海洋2024/3/194?要进行信息获取和利用1982年,美国通用汽车公司和中科院在钕铁硼磁铁和磁性材料领域同时获得重大研究突破。通用抢先申请了专利,并于83、86年申请了另外的两项相关专利。Magnequench公司收购了这3项专利,对微软、东芝、菲力普、宏基等几十家公司提起专利侵权诉讼。尽管中科院也是该技术的发明人,但通用抢先在中国申请专利后,除通用以外的任何人使用都是侵权人,造成进口、使用、销售东芝、微软等相关产品的中国下游厂商都属于侵权人。缺乏信息意识,没有意识到专利是一种很重要的可以占据商业先机的信息资源,会造成巨大的损失。2024/3/195?如何提高信息利用能力

掌握信息的获取、检索能力掌握信息的分析、整理能力避免重复研究或走弯路我国某研究所用了约十年时间研制成功“以镁代银”新工艺,满怀信心地去申请专利,可是美国某公司早在20世纪20年代末就已经获得了这项工艺的专利,而该专利的说明书就收藏在当地的科技信息所。研究人员在选题开始就必须进行信息检索,了解别人在该项目上已经做了哪些工作,哪些工作目前正在做,谁在做,进展情况如何等。这样,用户就可以在他人研究的基础上进行再创造,从而避免重复研究,少走或不走弯路。!提高信息查找能力的意义节省研究人员的时间是获取新知识的捷径德国柏林图书馆门前有这样一段话:“这里是知识的宝库,你若掌握了它的钥匙,这里的全部知识都是属于你的。”这里所说的“钥匙”即是指信息检索的方法。!提高信息查找能力的意义2024/3/198本讲内容1信息、信息资源2文献信息及分类3信息检索及原理4信息检索的步骤、方法及技术5原始文献的获取2024/3/1991信息、信息资源信息的含义信息的特征信息资源及构成信息资源的类型各类人员的信息需求及特点2024/3/19101信息、信息资源信息的含义

有多种理解:申农:信息是用来减少不确定性的东西;哈特莱:信息是选择通信符号的方式。发信者所发出的信息,就是他从通信符号表中选择符号的具体方式。……信息就是消息,信息就是信号,信息就是数据,信息就是知识,信息是控制的指令。如何理解才能比较全面??

信息从发出端到接收端经历哪些过程?发出端接收端感知识别处理变换表示存储传递检索再生传递人们出于不同的认识和思维方式,站在不同层面或角度来考察与理解,就会给出各种不同的概念。1信息、信息资源2024/3/1912案例分析从案例出发在美英联合攻打伊拉克期间,M月N日X栋的房屋被摧毁,Y架桥梁被炸断,Z架战机在空中飞行、W颗子弹穿梭不断.信息的发出端:摧毁的房屋、炸断的桥梁、向目标俯冲的飞机、穿梭不断的子弹等等,通过自身的变化不断地显示着战争的状况。感知、识别、记忆、记录:参战者、战地记者、目睹者通过对战事的感知、识别、记忆、记录手段等反映和报道伊拉克的战况。传递:媒体借助各种渠道传递着有关伊拉克的事件变化。接受端:人们通过报纸、广播、电视、Internet等渠道了解伊拉克战事的动态。通过发出信息、传递信息和接收信息,使世界各地及时了解和研究伊拉克的战争。2024/3/19131信息、信息资源信息的含义

信息的简单理解:信息不是事物本身,而是由事物发出的消息、指令、数据等包含的内容。——如“这是一个苹果”,“每天吃一个苹果有益于健康”2024/3/19141信息、信息资源信息的含义

信息的深层理解:本体论层次的含义:信息是一种客观存在的现象,是事物运动的状态和状态变化方式的自我表述/自我显示。认识论层次的含义:是指主体所感知或表述的关于事物的运动状态及其变化方式,包括状态及其变化方式的形式、含义和效用,是反映出来的客观事物的属性。2024/3/19151信息、信息资源信息的特征

一种事物区别其他事物的根本属性

1)普遍性2)表征性3)动态性4)相对性5)依存性6)可传递性7)可干扰性8)可加工性9)可共享性2024/3/19161信息、信息资源信息资源及构成

信息资源是所有可利用的信息的集合。三个方面构成:

信息内容信息内容的表达和组织方式信息表达所依附的载体和传递的媒介口语信息资源体语信息资源实物信息资源文献信息资源2024/3/19171信息、信息资源信息资源的类型是指人类以口头语言表述出来但未被记录下来的信息资源,也被称为零次信息资源。

是指人类以手势、表情、姿态等方式表述出来但未被记录下来的信息资源,是在特定环境与特定文化背景下的一种信息表现形式。

是指通过人类创造性劳动以实物形式表述并固化存储和传递的信息资源,如产品样本、模型、碑刻、雕塑等。

是指以文字、语言、数字、图像、声频、视频等方式表达出来,记录在特定载体上的信息资源。

信息表达形式和所依附的载体

——人们对信息的需求,通常转化为对文献信息的需求。2024/3/19182文献信息及分类文献信息的特点记录性——有一定的保存和传递的记录方式

存储性

交流性

时效性

社会性

可整理加工性2024/3/19192文献信息及分类按照记录方式和记录载体材料分类

书写型文献信息印刷型文献信息缩微型文献信息机读型文献信息声像型文献信息多媒体文献信息2024/3/19202文献信息及分类按照信息被加工的层次分类

零次文献信息

一次文献信息

二次文献信息

三次文献信息

未公开于社会即未经正式发表的原始的文献;没正式出版的各种书刊资料,如书信、手稿、记录、笔记等;通过公开正式的订购途径所不能获得的内部书刊资料直接以自己的生产、科研、社会活动等实践经验为依据生产出来的原始文献,记载全部内容数量最大、种类最多、所包括的新鲜内容最多、使用最广、影响最大的文献,如图书、期刊论文、专利文献、科技报告、会议录、学位论文、标准、产品资料、政府出版物等零次文献一次文献2文献信息及分类2024/3/19222文献信息及分类十大文献

图书

(Book)

期刊(报纸)(Journal/Magazine/Newspaper)

报告(Science&TechnicalReport)

会议论文(ConferenceDocument)

学位论文(Dissertation)

政府出版物(GovernmentPublication)

标准文献(StandardLiterature)

专利文献(PatentDocument)

公司产品资料(Company&ProductsData)

档案资料(archives)2024/3/19232文献信息及分类

图书——一种论章成册的公开出版物,篇幅至少有48页的非期刊型出版物,是保存与传递信息的最古老、最主要的手段之一。

期刊——一种有固定名称、定期或按照宣布的期限出版,并计划无限期出版的连续出版物。

报纸——主要刊登新闻,出版周期最短的定期连续出版物。

报告——指对科学研究、技术研究、市场研究、经济研究等研究结果的报告或者是研究进度的记录。

会议论文——是指在各种会议上宣读和交流的论文和其他有关资料。

2024/3/19242文献信息及分类

学位论文——高等院校或者研究机构的学生为取得各级学位,在导师指导下完成的科学研究、科学试验、调查分析、软件开发等成果的书面报告。

政府出版物——由政府机构制作出版、或者由政府机构编辑并授权指定出版商出版的文献,如政府法规文件、经济决议、调查统计分析资料等。

标准文献——按照程序制定、经公认的权威机构批准的一整套在特定范围(领域)内须执行的规格、规则、技术要求等规范性文献,也包括与标准工作有关的一切档案、推广宣传资料等。2024/3/19252文献信息及分类

专利文献——专利说明书,专利是受法律保护的技术发明与创造。由于专利具有创造性、新颖性和实用性特点,所以世界上许多新的技术与发明首先是通过专利文献发布的。

公司产品资料——也是产品说明书,用以说明产品的规格、性能、构造原理、用途、使用方法和操作规格等,对科技人员选型、设计、进口国外产品和设备具有参考价值。

档案资料——国家、社会组织以及个人在参与社会各种活动过程中直接形成的具有保存价值、可以进行考证的原始记录,包括文字、图表、声像、照片、实验记录等形式的记录。2024/3/1926各种类型信息来源的辨析,主要以信息来源出处的基本外部特征作为区分标志。

图书

书名:网络信息资源检索与利用

作者(编者):王曰芬李晓鹏丁晟春

出版社:南京:东南大学出版社

出版时间:2003年9月

国际标准书号(ISBN):7-81089-322-X

语种:中文

关键词:计算机网络信息资源情报检索信息利用

中图法分类号:G354.4

摘要:本书从系统性、权威性、新颖性、实用性和可操作性原则出发,全面地介绍了与网络信息资源相关的基本知识、信息检索技术及发展、信息检索的基本原理与方法;

…..2文献信息及分类2024/3/1927学位论文2文献信息及分类2024/3/1928篇名:景德镇陶瓷品牌发展研究作者:郭建晖王毅成陈斌作者所在的单位:景德镇陶瓷学院摘要:根据陶瓷业发展的趋势,对景德镇市陶瓷品牌的发展进行了研究,归纳出景德镇市陶瓷品牌发展过程中存在的问题,并对这些问题进行了详尽的分析,提出了解决这些问题的具体对策。关键词:陶瓷品牌发展研究中图法分类号:TQ174来源:陶瓷学报2005,Vol.21No.3,179-185期刊2文献信息及分类2024/3/1929论文题名:.一种基于WEB应用的领域本体的构建方法研究.作者:冯兰萍等会议名称:第十九界全国计算机信息管理学术研讨会论文集时间:2005地点:中国,宜昌举办者:国防计算机信息管理学会会议文献2文献信息及分类2024/3/1930

数据库名:发明专利数据库

专利名称:

彩绘陶瓷品及其生产方法

专利号:

cn94201345

申请号:

94100766.9

申请日:1994.01.29

审定号:1174179

审定日:1998.02.25

分类号:C04B33/34(InternationalPatentClassification)

申请人:邢良坤

发明人:

邢良坤

通讯地址:116013辽宁省大连市中山区秀月街挺进巷13号

机构代码:大连科技专利事务所

代理人:贾汉生

CD索引号:9809

专利类型:发明专利专利文献2文献信息及分类2024/3/1931文摘:

一种平面网釉装饰的彩绘陶瓷品及其制作方法。底胎在1300℃下烧制8~10小时

,冷却后用中、低温色釉均匀涂上,于窑内烧制3~4小时,冷却至100℃出窑,在形成

裂纹处涂以不同颜色的中、低温釉,再于窑内烧制2~3小时、降温即成。这种工艺陶瓷品

似有一张着色网将其包裹住,手感平滑,但有立体感。

要求保护的范围……提供单位:国家知识产权局出版社

上网日期:2001年12月20日专利文献2文献信息及分类2024/3/1932数据库名:英国国家标准库

标准名称:

与食品接触的材料和物品.硅化表面.第1部分:测定从陶瓷品中释放的铅和镉

记录标识:302047

英文名称:Materialsandarticlesincontactwithfoodstuffs.Silicatesurfaces.Determinationofthereleaseofleadandcadmiumfromceramicware

发布单位:BSI

分类号码:TS20

专业分类:67.250

国标分类:X08主题词:陶瓷,烹调器,萃取分析法,扁平餐具,硅酸盐,镉,陶瓷釉,餐具,凹形餐具,厨房用容器,原子吸收分光光度测定法,陶瓷制品,接触食品的材料,铅,含量测定,试样制备,日用瓷器,试样,化学分析和试验,工业瓷器,给养设备。标准文献2文献信息及分类2024/3/1933标.准.号:

BSEN1388-1-1996

发布日期:1996-07-15

实施日期:1996-07-15

标准说明:ST

正文语种:英语

采用关系:EN1388-1-1995,IDT

馆藏标志:*

排序号码:BSEN0000138800000001000019960000000000000000

馆藏单位:国家质量技术监督局

国别:英国ATOMICABSORPTIONSPECTROPHOTOMETRY,PORCELAIN,COOKINGVESSELS,EX,TRACTIONMETHODSOFANALYSIS,MATERIALSINCONTACTWITHFOOD,FLATWARE,CHEMICALANALYSISANDTESTING,

SPECIMENPREPARATION,CATERINGEQUIPMENT,CHINAWARE,CERAMICGLAZES,TABLEWARE,LEAD,HOLLOW-WARE,SILICATES,CERAMICS,KITCHENSTORAGEVESSELS,CADMIUM,TESTSPECIME,NS,DETERMINATIONOFCONTENT,POTTERY标准文献2文献信息及分类2024/3/1934ReportTitle:Systemsafetyanalysisofanautonomousmobilerobot.CorporatorAuthor(Institutional):FernaldEnvironmentalRestorationManagementCorp.,Cincinnati,OH.FernaldEnvironmentalManagementProject.;DepartmentofEnergy,Washington,DC.

ProductType:ConferenceproceedingsNTISOrderNumber:

DE94015815PageCount:67pagesDate:1994PersonalAuthor:R.J.BartosAnalysisofthesafetyofoperatingandmaintainingtheStoredWasteAutonomousMobileReportNumber:

FEMP-2341,CONF-9407104-1ContractNumber:

AC05-92OR21972NTISannouncementissue:9503科技报告2文献信息及分类只记录一部分信息:题目、文摘、出处/原文线索…将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用,如目录、索引、检索系统、网络搜索引擎等。具有明显的汇集性、系统性和可检索性,它汇集的不是一次文献本身,而是某个特定范围的一次文献线索重要性在于使查找一次文献所花费的时间大大减少,二次文献是科学研究工作中检索文献所利用的主要工具二次文献2文献信息及分类是选用大量有关的文献,经过综合、分析、研究而编写出来的文献属于这类文献的有百科全书、字典、手册、综述、评论、评述、进展、动态等三次文献在科学研究工作中,可以充分利用反映某一领域研究动态的综述类文献,在短时间内了解其研究历史、发展动态、水平等,以便能更准确地掌握待研究项目的技术背景,把握研究的重点和趋势。通常是围绕某个专题,利用二次文献检索搜集大量相关文献,对其内容进行深度加工,从而形成对现有成果加以评论、综述并预测其发展趋势的文献,具有较高的参考价值2文献信息及分类2024/3/19372文献信息及分类信息资源的组织形式和管理系统

数据库是指在计算机存储设备上合理存放的相互关联的数据集合如全文数据库、目录型数据库、文摘型数据库、联机型数据库,数值型数据库、图像型数据库、音频型数据库、软件型数据库、多媒体数据库等。

文件资源包括文字文件、图像文件、音响文件、计算机程序软件文件等如Excel文件、HTML文件、XML文件、PDF文件、JPEG文件、MP3文件等。2024/3/19382文献信息及分类按照服务方式和传播手段分类

单机服务资源

联机服务资源

封装式服务资源(如光盘)

网络信息资源网络信息资源是将文字、图像、声音、动画等多种形式的信息,以数字化形式存贮,并借助计算机与网络通讯设备发布、收集、组织、存储、传递、检索和利用的信息资源。同样,网络信息资源也是由信息内容、信息内容的表达和组织方式、信息表述所依附的载体三部分构成。

按其对应的非网络信息资源划分按人类信息交流的方法划分按信息存取方式划分按网络信息资源的层次划分2024/3/19392文献信息及分类网络信息资源的特点数量巨大,增长迅速内容丰富庞杂,形式多样动态性强,自主发布结构复杂,分布广泛传播范围广,影响大

交互性强2024/3/19402文献信息及分类网络信息资源的发布和提供

大学、科研院所网站

公司、企业网站/

专业信息服务机构网站

政府机构网站/

商业性网站

2024/3/19413各类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论