版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
4网络信息资源检索4.1网络信息资源概述4.2搜索引擎4.3开放获取4.4慕课4.1网络信息资源概述1.网络信息资源的定义字面理解:
“通过计算机网络可以利用的各种信息资源的总和”。具体理解:以数字化形式记录的,以多媒体形式表达的,分布式存储在网络计算机的存储介质以及各类通信介质上,并通过计算机网络通信方式进行传递的信息内容的集合。主体是internet2.网络信息资源的特点(1)数量庞大,增长迅速;(2)内容丰富,形式多样;(3)变化频繁,价值不一;(4)结构复杂,分布广泛;(5)信息分散、无序;3.Internet信息资源类型网络信息资源的种类很多,根据不同的分类标准,可以将网络信息资源分为不同的类型。第一,按网络传输协议划分:WWW信息资源,TELNET信息资源,FTP信息资源,新闻组信息资源,电子邮件信息资源,Gopher信息资源等。第二,按照网络信息资源的组织方式划分,可分为文件方式,超文本/超媒体方式、数据库方式等。第三,依据信息源的信息内容则可将网络信息资源分为以下类型:网络数据库、网络出版物、社会信息、软件资源等。4.网络信息资源检索的一般方法
网络信息检索方法分类目录偶尔发现
顺“链”而行主题检索RSS阅读网上浏览(目录型检索工具)搜索引擎(1)布尔逻辑检索技术就是布尔检索是将多个关键词按照一定的逻辑关系组合在一起形成的组合检索.
这是计算机信息检索中最基本的也是最常用的技术。5.计算机检索技术布尔逻辑运算符逻辑“与”逻辑“或”逻辑“非”
逻辑“与”————————————————AB用符号“and”或“*”表示,其逻辑表达式为:
A*B或AandB
其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。
逻辑“或”AB用符号“or”或“+”表示,其逻辑表达式为:
AorB或A+B
其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。
逻辑“非”
AB用符号“not”或“-”,其逻辑表达式为:
AnotB或A-B
其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。举例:
要检索“非儿童的心理测试”,对用户来说,需要包含“心理测试”的文献,但去掉那些包含儿童研究的文献。在心理学数据库可检索到:心理测试43150
儿童11560
心理测试NOT儿童
1500
从图中可以看出:逻辑“与”的组配缩小了检索的范围。参加逻辑“与”的检索词越多,检索的结果范围限制得越小,命中的文献也就越少。逻辑“或”的关系扩大了检索范围。用逻辑“或”组配相当于增加了检索词的同义词和近义词,从而扩大了检索范围。逻辑“非”的检索也是一种缩小检索范围的组配方式。但是使用逻辑“非”的组配时需要特别小心,常常会把有用的文献也排除掉。
(2)截词检索技术
截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。截词检索是一种常用的检索技术,是防止漏检的有效手段。特别是在西文检索中,更是广泛使用。西文的构词比较灵活,在词干上加上不同性质的前、后缀就可以派生出许多新的词汇,而且这些词汇在意义上都比较相近。按截断的位置区分,可以有后截断、前截断以及中间截断(中间屏蔽)。
也叫做右截断,即将一个词的后方或右方截去有限或无限个字符,后截断检索也叫“前方一致”检索。
如:comput*为无限后截断,可以检索包含以下词汇的文献:
computable、computation、compute、computer、computers、computing、computerise、computerize……后截断如:comput???则表示有限后截断,截0—3个字母,可检索出包含compute、computer、computers、computing等词汇的文献
前截断也叫左截断。前截断的检索方法也叫“后方一致”检索。前截断检索常用于复合词。
如:*magnetic(有磁性的,有吸引力的):为无限前截断的表达式,可检出包含下列词汇的文献:
magnetic、electromagnetic、electro-magnetic、paramagnetic(顺磁的)、thermo-magnetic(热磁的)等。前截断如:??经济则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献。前截断与后截断也可以组合起来使用。如:*chemi*可以检出下列词汇:
chemical、chemistry、chemist、eletrochemical、electrochemistry、physicochemistry、thermochemistry等。
就是将提问字符串中间的字符用通配符代替,主要用于英式美式不同拼法的英文单词,或单复数不同的单词。如:
manwomanorganizationdefensemenwomenorganisationdefence
检索时为防止漏检可用中间屏蔽的检索方法:
m?nwom?norgani?ationdefen?e中间屏蔽注意:无论是前截断、后截断和中间屏蔽,从根本上来说,它们是逻辑“或”的运算,因此能扩大检索范围,提高查全率。此外还能减少输入检索词的工作量,简化检索步骤,节省机时和费用。在中文数据库中使用最多的是后截断检索。截词检索在不同的计算机检索系统中规定不同,使用时请注意。
(3)字段限制检索
在检索系统中,为了提高检索的查准率,缩小检索的范围,通常有一些限制的手段和方法。使用这些方法进行的检索通常称为限制检索。常用的限制方法是字段限定。数据库中每条记录都有许多字段,将检索词限定在特定的字段中进行检索就叫做字段限定检索。各个检索系统的字段限制符可能并不一样,字段的标识符也有不同。有的系统不分前缀后缀限定,一律采用前缀或后缀检索。在菜单式驱动检索界面中,通常用户不需使用限制符,只要在下拉菜单中选择某个字段名称,在提问框中输入检索词,就可完成字段限定检索。
4.2搜索引擎1.什么是搜索引擎?搜索引擎其实是一个网站,只不过该网站专门为你提供信息“检索”服务,是对互联网上的信息资源进行搜集整理,并提供查询的系统。它包括信息搜集、信息整理和用户查询三部分。用户系统用户接口搜索器索引器检索器WWW信息资源FTP信息资源Telent信息资源Ghopher信息资源WAIS信息资源用户服务组信息资源搜索引擎网络网络2.搜索引擎的构成及工作原理
搜索引擎有两个主要的功能:
1、收集网络信息资源,对其进行索引并建立数据库。
2、提供网络的信息导航与检索服务(主要的功能)。
3.搜索引擎的发展历史第一代搜索引擎是基于人工分类目录搜索,以早期的Yahoo、AltaVista和Infoseek等为代表第二代搜索引擎的主要特征是运用“符号计算”,基于关键词搜索以及以关键词组合为基础的全文搜索和模糊搜索。以Google、DirectHit等为代表。基于关键词搜索的优势是使用方便,搜索速度快,直接搜索内容,这是第一代搜索引擎无法比拟的。第三代搜索引擎。不仅索引规模大,而且更多地结合了自然语言理解、个性化等智能化技术4.发展中的搜索引擎整合搜索
社区搜索
移动搜索
垂直搜索物联网搜索:不仅仅是你找东西,甚至还有可能东西找你5.搜索引擎的种类
按信息搜集方法和服务提供方式目录型搜索引擎关键词型搜索引擎元搜索引擎(1)目录型搜索引擎
以人工方式或半自动方式搜集信息,人工形成信息摘要,并将信息置于事先确定的分类框架中。使用户能通过浏览该目录,发现、检索到有关的信息。这种目录索引并非严格意义上的搜索引擎,仅仅是按一定标准分类的网站目录列表链接而已。这种目录浏览服务,信息大多面向网站。(2)关键词型(索引型)搜索引擎
是通过用户录入关键词来查找有关信息,这种方式直接方便,并可使用逻辑运算符编制检索式,对选定条件的资源准确定位。优点
范围广更新快,能及时向用户提供新增信息检索方便、直接缺点
检索结果准确性差有较多重复、虚假信息不同的搜索引擎检索界面、检索策略的构造和输入方式不同(2)关键词型(索引型)搜索引擎适合于检索特定的信息及较为专、深、具体或类属不明确的课题。典型代表:
百度/Googlehttp://www.google.com
没有独立的数据库,只提供一个统一界面,把多个具有独立功能的引擎组合起来。万纬搜索引擎:
超搜索:(已停用)
(3)元搜索引擎6.
百度1999年底由李彦宏、徐勇创建于美国硅谷。2001年10月22日,百度正式发布Baidu搜索引擎。先进的超级链接分析技术;内容相关度评价技术;WAP与PDA搜索服务;17.
谷歌谷歌公司成立于1998年9月4日,由拉里·佩奇和谢尔盖·布林共同创建,被公认为全球最大的搜索引擎公司。谷歌是一家位于美国的跨国科技企业,业务包括互联网搜索、云计算、广告技术等,同时开发并提供大量基于互联网的产品与服务,其主要利润来自于AdWords等广告服务。
1999年下半年,谷歌网站“Google”正式启用。
2010年3月23日,宣布关闭在中国大陆市场搜索服务。
2017年2月,BrandFinance发布2017年度全球500强品牌榜单,排名第一。
主要业务Google搜索引擎主要的搜索服务有:网页,图片,音乐,视频,地图,新闻,问答。GoogleBookSearch。该工具可以在搜索页面提供由内容出版商提供的书本内容的搜索结果,并提供连向购买书本的网页以及内容相关广告。谷歌地图提供各种地图服务,包括局部详细的卫星照片。GoogleAnswers是传统搜索功能的扩展-用户不用自己搜索内容,他们请专家搜索然后付费。顾客问问题,并为问题提供一个相应的价钱,然后研究者们回答他们的问题。2004年11月,谷歌发布“GoogleScholar”这是一个学术文献资源搜索引擎.
谷歌翻译谷歌免费的在线语言翻译服务可即时翻译文本和网页,但功能还有待改进。设置搜索偏好,包括每个网页上默认的搜索结果数量、界面语言,以及查询语言Google的查询界面直接进入最符合搜索条件的网页其他搜索搜狗/新浪资料搜索/百度网盘知乎简书果壳慕课网果壳网
果壳网是一个泛科技主题网站,于2010年创立,致力于向公众倡导科技理念,提供负责任、有智趣的科学普及类内容。果壳网现有科学人、小组、问答、MOOC学院等板块,由专业科技团队负责编辑,网站主编为拇姬。依兴趣关注不同小组,阅读有意思的科技内容;在“果壳问答”里提出困惑你的科技问题,或提供靠谱的答案;关注各个门类和领域的果壳达人,加入兴趣讨论,分享智趣话题。在“MOOC学院”选择感兴趣的课程、对学过的课程进行点评、用笔记记录作业、资料和学习心得,与同学们一起分享,相互帮助探讨问题。知乎
知乎是北京智者天下科技有限公司于2011年1月26日上线的一个网络问答社区。知乎连接各行各业的用户,为用户提供社区服务,使用户能围绕着某一感兴趣的话题进行相关的讨论,同时可以关注兴趣一致的人。知乎首页,大致有四个功能区。“最新动态”主要呈现用户所关注人的最新提问及回答等信息。除了查看最新问题及回答之外,也可以通过“设置”、“关注问题”、“添加评论”、“分享”、“感谢”和“收藏”等功能参与到自己感兴趣的问题中。用户相关行为管理信息有“我的草稿”、“我的收藏”、“所有问题”、“我关注的问题”和“邀请我回答的问题”。“邀请好友加入知乎”,用户可以通过电子邮件和新浪微博邀请自己朋友加入到知乎社区中。为用户关注或感兴趣话题或用户推荐板块。知乎可能根据用户关注话题信息汇总,可能通过用户在知乎网络相关行为数据记录统计,达到相当准确推荐和汇总。“话题广场”板块中,知乎网将所有话题分类标签呈现,为用户除搜索和导航之外,有一种不错的获取信息方式。简书
简书是一个创作社区,任何人均可以在其上进行创作。用户在简书上面可以方便的创作自己的作品,互相交流。简书成为国内优质原创内容输出平台。产品功能享受沉浸式的创作体验,随时随地可以进行创作,同时支持离线保存支持高清图片秒传丰富的官方推荐专题打开创作思路支持一键生成图片分享支持私信、打赏、评论、点赞等社交功能支持专题汇聚文章功能检索技巧明确检索目的和要求,确定查询策略选择合适的网络检索工具
1、更换搜索引擎;
2、区分学术性检索工具和商业性检索工具,如GoogleScholar/网络数据库。网络信息检索技巧提高检索的精度、准确性
1、选择合适的检索词,尽量使用专指词、特定概念或非常用词,避免普通词、泛指概念;
2、构造恰当的检索提问,学会利用检索工具所规定的AND、OR、NOT等逻辑符、引号等检索符号。
3、使用限定条件、限定词,充分利用检索界面上提供的限制条件,如语种、时间、类型、数量等。
4、利用进阶、精练检索功能,“Refine”或“二次检索”。网络信息检索技巧扩大检索范围
1、使用同义词、近义词;
2、使用多个搜索引擎或者元搜索引擎(All-In-One);
3、利用某些搜索引擎的自动扩检功能,如“Morelikethis”、“相关网页”等网络信息检索技巧加快检索速度
1、直接进入相关站点;平日的积累收藏夹和书签的利用
2、利用特殊型网络检索工具和一些特色服务站点;新闻、天气、交通、地图等
3、多窗口浏览、检索;4.3开放存取开放存取(OpenAccess)是国际科技界、学术界、出版界、图书馆界为推动科研成果自由传播而发起的运动,其目的是促进科学信息的广泛传播,促进学术信息的交流与出版,提升科学研究的公共利用程度,保障科学信息的长期保存。美国研究图书馆协会(AssociationofResearchLibraries,简称ARL)将开放存取解释为在基于订阅的传统出版模式以外的另一种选择,即通过新的数字技术和网络化通信,任何人都可以及时、免费、不受任何限制地通过网络获取各类文献,包括经过同行评议过的期刊文章、参考文献、技术报告、学位论文等全文信息,用于科研教育及其他活动,从而促进科学信息的广泛传播和学术信息的交流与出版,提升科学研究的被利用程度,保障科学信息的长期保存。开放存取主要实现途径开放存取期刊
开放存取知识库
4.4慕课慕课(massiveopenonlinecourses,MOOC)即大型开放式网络课程。MOOC是一种全新的在线教育形式,无论在世界的任何角落,只要有网络,任何人都能免费注册,自由选择想要修读的课程,享受高等教育优质教学资源。MOOC具有与线下课程类似的作业评估体系和考核方式,按时完成作业和考试的学习者还可以获得课程证书。
4.4慕课1.中国大学MOOC()2.学堂在线()3.好大学在线()4.Coursera()5.edX()上机实习题1、利用搜索引擎检索本专业某一专题的doc/pdf/ppt格式的文件各1篇(要求写出检索表达式并注明命中文献的题名、作者、详细网址)。2、利用搜索引擎搜索本校网站内有关“毕业论文”的所有信息,共有几条?写出检索检索步骤和表达式。3、通过bbmao、Google分别检索与专业相关的某一专题,写出检索表达式及检索结果数;再用GoogleScholar检索同一表达式,记录检索结果数,浏览并比较检索结果内容,说明其差别。4.检索了解OCLC、Dialog系统。(要求用200以内汉字介绍其概况)。网络数据库检索5.1CNKI数据库5.2维普数据库系统5.3万方数据资源系统5.4超星数字图书馆5.1CNKI数据库1.CNKI基本情况介绍2.使用方法(初级检索、高级检索、期刊导航、跨库检索应用举例及cnki的一些辅助功能)1.CNKI基本情况介绍CNKI即中国知识基础设施工程(ChinaNationalKnowledgeInfrastructure)
,又称中国知网,是目前世界上信息量最大、信息内容最全的中文数字图书馆。内容涵盖了我国自然科学、工程技术、人文、社科类期刊、博硕士论文、报纸、图书、会议论文等全文资源。主要产品包括:
1.中国期刊全文数据库
2.中国博士学位论文全文数据库
3.中国优秀硕士学位论文全文数据库
4.中国重要报纸全文数据库
5.重要会议论文全文数据库2.使用方法网址:http://或http:///(1)初级检索需要专门的阅读器上课前的例子:检索篇名为“对图书馆信息化建设的思考”其他控制条件知网节知网节(2)高级检索(3)专辑导航按照专辑导航的方式查看企业经济理论和方法这种方法可以和初级检索、高级检索结合起来使用(4)期刊导航(5)二次检索检索篇名为经济发展的文献二次检索相当于高级检索小技巧:保存题录查看引证文献(6)跨库检索(7)应用举例搜索兰州工业高等专科学校十一五以来在核心期刊发表的文章(8)cnki知识搜索5.2维普数据库系统维普资讯网(
)建成于2000年,是中国最大的综合性文献服务网,是GoogleScholar最大的中文内容合作网站,中国最大的数字期刊数据库,目前拥有2000余家集团用户,网站注册用户数超过200余万。网站内容服务:包括9000余种/2000万篇中文期刊全文;30余个国家/11300余种/800余万条外文期刊文献;400多种重要中文报纸
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关于诚信的主题班会主持词
- 六级辅导专题-六级考试之简介
- 江苏省靖江市名校2025届高三12月阶段质量检测语文试卷及参考答案
- 《盘点程序说明会》课件
- 黄金卷05-【赢在中考·黄金8卷】备战2023年中考生物全真模拟卷(全国2024)(原卷版)
- 房屋安全管理
- 仓库人员管理
- 金融行业博士分析师聘用合同
- 旅游小镇照明规划
- 办公空间通风系统安装合同
- 中班科学教案:省力的轮子
- 改革开放史智慧树知到期末考试答案2024年
- 文化传媒公司招聘笔试题
- 零售业收银员操作培训
- 信息安全职业生涯规划
- 新能源技术的前沿研究与应用探索
- 装配式结构监理细则
- 工作无纸化总结汇报
- 初中美术八年级上册服装设计(全国一等奖)
- 2024年医院口腔科护理带教计划
- 二年级科学上册跨学科项目化学习案例做一个小鸟餐厅
评论
0/150
提交评论