版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章网络信息及其检索第一节因特网基础知识第二节网络信息资源简介第三节网络信息获取的一般方法第四节网络信息检索工具——搜索引擎第一节互联网基础知识2、互联网发展的进程1960年,美国国防部为支持国防研究项目而建立了一个试验网(ARPA),把几所大学和研究机构的计算机联接到一起。1973年ARPA网扩展成互联网,第一批接入的有英国和挪威计算机。1986年,美国国家科学基金会(NationalScienceFoundation,NSF)建立了大学之间互联的骨干网络NSFnet,这是因特网历史上重要的一步。1994年,NSFNET转为商业运营。九十年代开始,整个网络向公众开放。1994年我国正式接入因特网。
(一)互联网的发展与组成1、互联网(internet)的定义与功能定义:计算机网络是将地理位置不同、功能独立的多个计算机利用通信设备和线路互连起来,以功能完善的网络软件实现网络中资源共享和信息传递的系统。
功能:计算机用户可以和其他连到网络上的用户一起共享网络资源,如硬盘上的文件和打印机等设备,也可以和他们互相交换数据信息。
3、互联网的组成
互联网是通过一种分层结构来实现的,从上到下分为四层:一、物理网二、协议三、应用软件四、信息4、网络协议定义:计算机通信网络中两台计算机之间进行通信所必须共同遵守的规定或规则。主要的协议有:TCP/IP协议:保证各种不同类型的计算机网络实现相互通信一套规则或协议。IP协议:是定义Internet上计算机之间的路由选择,把不同网络的物理地址转换为Internet地址。常用的应用协议:超文本传输协议Http和文件传输协议FTP(二)网络地址和域名网络地址Uniform
Resource
Locator(URL)是信息在网上的地址,用来定位和检索WWW上的文档。由四部分组成:
服务器标识符(通信协议:http、ftp、news)、web服务器域名、文件路径、文件名例如:/library/content.htm域名
为了使用和记忆方便,因特网采用了域名管理系统,简称DNS(DomainNameSystem),它是由代表一定意义的英文单词的缩写构成
域名由若干部分组成,各部分之间用小数点分开,例如我校主机的域名是:“”。
域名与网络信息资源的关系
由于Internet最初是在美国发源的,因此最早的域名并无国家标识,人们按用途把它们分为几个大类,它们分别以不同的后缀结尾。随着Internet向全世界的发展,除了edu、gov、mil、一般只在美国专用外,另外三个大类com、org、net则成为全世界通用,因此这三大类域名通常称为国际域名。由于国际域名资源有限,各个国家、地区在域名最后加上了国家标识段,由此形成了各个国家、地区自己的国内域名,如:
.
中国的商业.org.hk
香港的组织.net.jp
日本的网络
com商业机构org非营利组织
edu教育机构gov政府部门
net网管组织int国际组织
mil军事部门info信息机构地址的标识技术——IP地址每一台计算机都事先分配一个类似于电话号码一样的标识地址,称作网络协议地址形式:四组小于256的十进制表示。如:3
湖南工程学院图书馆技术部保存维普数据库的一台服务器的IP地址。分为动态IP地址和静态IP地址两种。动态IP地址指的是每次连线所取得的地址不同,静态IP地址是指每次连线均为同样固定的地址。通常一经设定,变动较少。(三)互联网提供的主要服务环球网(WWW/Web)电子邮件(E-Mail)远程登录(Telnet)文件传输(FTP)电子公告板(BBS)即时通讯(IM)博客与维客(blog/Winki)环球网(WWW/Web)
即是万维网(WWW-WorldWideWeb):是基于超文件的、方便用户在因特网上搜索和浏览信息的信息服务系统。它将位于全世界因特网上不同地点的相关数据信息有机地纺织在一起。媒体形式可以是文本、图片、动画、声音等,可以跳转,“网上冲浪”。
万维网,英文全称为worldwideweb简写WWW或web,它是internet提供的一种信息服务,它把位于世界各地的相关信息有机地组织在一起。电子邮件(E-Mail)电子邮件(electronicmail,简称E-mail,标志:@,)是Internet应用最广的服务,通过网络的电子邮件系统,用户可以非常快速的方式,与世界上任何一个角落的网络用户联系,这些电子邮件可以是文字、图像、声音等各种方式。同时,用户可以得到大量免费的新闻、专题邮件。远程登录(Telnet)
远程登录是Internet上较早提供的服务。用户通过Telnet命令使自己的计算机暂时成为远地计算机的终端,直接调用远地计算机的资源和服务。利用远程登录,用户可以实时使用远地计算机上对外开放的全部资源,可以查询数据库、检索资料,或利用远程计算完成只有巨型机才能做的工作。此外,Internet的许多服务是通过Telnet访问来实现的。
文件传输(FTP)
FileTransferProtocol(文件传输协议)的英文简称。用于Internet上的控制文件的双向传输。FTP的主要作用,就是让用户连接上一个远程计算机(这些计算机上运行着FTP服务器程序)察看远程计算机有哪些文件,然后把文件从远程计算机上拷到本地计算机,或把本地计算机的文件送到远程计算机去。BBS(电子公告板)BBS的英文全称是BulletinBoardSystem,翻译为中文就是“电子公告板”。BBS最早是用来公布股市价格等类信息的,当时BBS连文件传输的功能都没有,而且只能在苹果计算机上运行。BBS在国内一般称作网络论坛,通过BBS系统可随时取得最新的信息,也可以通过BBS系统来和别人讨论各种有趣的话题。也可以交流信息资源。
即时通讯(IM)即时通讯(InstantMessaging的缩写),这是一种可以让使用者在网络上建立某种私人聊天室的实时通讯服务。目前在互联网上受欢迎的即时通讯软件包括:QQ、MSN、百度hi、ICQ、飞信、Skype、新浪UC、GoogleTalk、阿里旺旺、天翼Live、网易泡泡等。博客(Blog)博客(Blog):由web和log两个单词组成,按字面意思就为网络日记。一个对信息发布人无技术门槛的网络平台,是一种通常由个人管理、不定期张贴新的文章的网站。博客上的文章通常根据张贴时间,以倒序方式由新到旧排列。维客(Winki)维客(Winki):Winki指一种超文本系统。这种超文本系统支持面向社群的协作式写作,在维客页面上,每个人都可浏览、创建、更改文本,系统可以对不同版本内容进行有效控制管理,所有的修改记录都保存下来,不但可事后查验,也能追踪、回复至本来面目。这也就意味着每个人都可以方便地对共同的主题进行写作、修改、扩展或者探讨。网络硬盘(在线存储)又叫网络U盘,网盘等,是网络上提供给用户在线存储服务。它向用户提供文件的存储、访问、备份、共享等文件管理功能。你可以把它看成一个放在网络上的硬盘,不管你是在家中、单位或其它任何地方,只要你连接到因特网,你就可以存取、管理、编辑网盘里的文件。网友也可以访问和下载,你所共享的文件、图片、视频等等。第二节网络信息资源简介一、概念二、特点三、类型四、信息传播方式一、网络信息资源概念
网络信息资源是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和。二、网络信息资源的特点内容广泛:信息资源覆盖面广,涵盖了各学科领域,不管是专业学术研究还是生活娱乐都可以在网络上寻找结果。内容生动:网络资源有多种多样信息类型和众多的表现形式,既有文字、符号、声音、表格、还有图形、动画和图象。内容新颖:内容新颖、深入,信息更新周期短,高速度传递,能及时获取。共享性强,获取信息便捷:打破了地域和时空的限制,不管身在何地都可以与他人进行面对面的交流,并很方便、快捷地获取到世界各地的信息。网络信息资源的特点(二)质量不一:网络信息质量良莠不齐,由于资源来源分散,内容庞杂,不可避免有大量灰暗的、毫无价值的虚假冗余信息。稳定性差:各种信息资源处在不断更新、淘汰的状态,可以随时发布,也可以及时变更修改。信息资源的更新、消亡无法预测和控制,缺乏稳定性。信息传递无序:许多新的信息不能及时传递,大量信息被埋没。精确度低:由于没有统一的经营管理机构,统一的发布标准,信息编排混乱,针对某一主题的查找其结果往往不够精确、不够全面,不能令用户满意。三、网络信息资源的类型按信息资源的来源分:1、政府信息资源:各级政府在网上发布的关于国家和政府的信息,包括新闻、统计信息、政策法规、政府档案、部门职能介绍等。2、公众信息资源:为社会公众服务的机构所拥有的信息,包括公共图书、电视广播、新闻出版、科技信息等。3、商用信息资源:商业性公司或商情咨询公司为生产经营者或消费者提供的有偿或无偿的信息,如:产品、商情、咨询等信息。网络信息资源的类型
按信息的表现形式和内容划分1、全文型信息:它指直接在网上发行的电子期刊、网上报纸、印刷型期刊的电子版、政府出版物、标准全文等。电子版期刊:各专业期刊的网站,电子期刊的数据库网站:龙源期刊网、博看网
2、事实型信息各种新闻信息、天气预报,城市或景点介绍,工程实况、机构名录、字词典、指南等。3、数值型信息各种统计数据、产品或商品的规格与价格统计数据:国家统计局统计数据库、中经网统计数据库、中国统计年鉴数据库产品数据:行业信息网站(中国机电网)、价格数据:4、数据库类信息:数据库公司的网上站点。如:万方数据、中国知网等行业联合建立的网上信息查询数据库如:湖南省高等学校图书馆数字资源共享平台
商业信息公司的数据库:如:中国资讯行()中文商业数据库平台,专门从事中国商业经济资讯的收集、整理和传播。专业数据库:如:法律图书馆(中国法律法规数据库)、中国专利信息中心(中国专利数据库)5、其他信息微信息:如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等。实时活动性信息:投资行情和分析、天气预报、节目预告等。其它类型:图形图象,音乐影视、广告等。四、网络信息资源的传播方式利用web传播图、文、音并茂的信息利用电子邮件传播信息利用远程登录利用远程计算机的有关信息资源利用网络论坛(bbs)传播信息利用Ftp传播信息利用网络硬盘传播共享信息第三节网络信息获取的一般方法1、网络地址法(直接访问法)2、与网友交流3、利用在线文档分享平台4、利用虚拟图书馆5、通过相关数据库的网站6、搜索引擎法(网络信息检索工具)1、网络地址法(直接访问法)利用各种媒介信息,了解有关网站的内容,掌握这些网站(包括新的网站)的地址。
自动化专业常用网站(综合网站)
中国自动化网 / 中南民大论坛-自动化版http:///thread.php?fid=49智捷自动化公司
http:/// 东莞自动化网 http:/// 中国自动化 http:/// 中国自动化联盟/ 自动化系统工程 http:/// 控制网http:///中国工控网http:///中华工控网http:///自动化网http:///自动化专业常用网站(单片机网站)
21IC中国电子网
/EC66中国电子技术信息网
/电子工程专辑
http:///电子人博客
http:///电子先锋(电子网站导航)
/website/index.htm搜电子
http:///凌阳单片机
http:///PIC单片机学习网
/嵌入式资讯网
http:///硬道理电子技术交流网
http:///中国单片机世界
http:///21ICSEARCH(芯片搜索)
/模拟电子技术实验室
48/labonline/index.asp电子工程世界
http:///中国电子工程师博客网
http:///blog/index.html2、与网友交流通过BBS与网友交流、征求信息。学术论坛:
小木虫学术论坛:/bbs/
专业论坛:
自动化论坛:
/3、利用在线文档分享平台文档分享平台是供网友在线分享文档的开放平台,在这里,用户可以在线阅读和下载涉及课件、习题、考试题库、论文报告、专业资料、各类公文模板、法律文件、文学小说等多个领域的资料。平台上所累积的文档,均来自热心用户的积极上传。
中文在线文档分享平台:
1、百度文库:2、豆丁网:3、道客巴巴:4、新浪爱问共享资料:
4、利用虚拟图书馆
是针对某一个学科或领域的研究者的需要,将互联网上与这个学科或领域有关的各种资源线索,包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URLs(即统一资源地址,包括Http、Gopher、Ftp、Usenet等)系统地组织起来,存放在某一个网站内,供大家浏览或者检索。虚拟图书馆也叫“学科导航”。CALIS重点学科导航重点学科导航库是“211工程”立项高校图书馆共建项目。其目的是建立在INTERNET网上的导航库,收集整理有关重点学科的网络资源,为高校重点学科服务,让在重点学科领域的师生,以较快的速度了解本领域科技前沿研究动向和国际发展趋势。资源类型:大学研究院所、学会协会、组织机构、免费资源等。68中国知网学术资源导航中国知网学术资源导航,搜集上千种学术相关网络资源,范围覆盖自然科学、技术工程、人文科学、社会科学,提供学科导航、科研机构导航和行业导航。http:///中国科技图书文献中心国家科技图书文献中心(NSTL)是一个虚拟的科技文献信息服务机构,主要服务为免费检索及浏览文摘,网上订购全文,Email24小时之内原文传递。还订购了许多电子资源,向全国用户免费开放网址:NSTL的组成图书馆NSTL中国标准化研究院标准馆中国计量科学研究院5、通过相关数据库网站中国知网万方数据系统法律数据库标准数据库专利数据库第四节
网络信息检索工具——搜索引擎搜索引擎是一种用于帮助网络用户查询信息的搜索工具,是网络上的信息检索系统,它以一定的策略在Internet中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。用户系统用户接口搜索器索引器检索器WWW信息资源FTP信息资源Telent信息资源Ghopher信息资源WAIS信息资源用户服务组信息资源搜索引擎网络网络一、搜索引擎的构成及工作原理搜索引擎:搜索器、索引器、检索器、用户接口搜索引擎的工作原理(一)
主要由四部分构成:1、搜索器:在互联网中漫游,发现和搜集信息。2、索引器:分析搜索器所搜索到的信息,从中抽取出索引项生成文档库的索引表。3、检索器:根据用户的查询,在索引库快速检出文档,进行文档与查询相关度的评价,对输出的结果排序。4、用户接口:输入用户查询、显示查询结果、提供用户相关性、反馈机制。搜索引擎的工作原理(二)基本程序:从互联网上抓取网页建立索引数据库在索引数据库中搜索排序将搜索结果的链接地址和页面内容组织起来返回给用户。搜索引擎的工作原理(三)搜索引擎并不是真正搜索互联网,它实际上搜索的是预先整理好的网页索引数据库。搜索引擎并不能真正理解网页上的内容,只能机械的匹配网页上的文字。各搜索引擎的排序和算法不同,抓取的网页也不尽相同,所以检索的结果会不同。最大的搜索引擎收集到的网页,只占互联网上普通网页的30%左右,还有大量网页,没有抓取到。因此,用搜索引擎是无法获得网上所有的信息的。二、搜索引擎的种类(一)根据搜索内容分:综合性搜索引擎专业性搜索引擎:又称垂直搜索引擎。是针对某一个行业的专业搜索引擎,对网页库中的某类专门的信息进行整合,定向分字段抽取出需要的数据进行处理后返回给用户。垂直搜索引擎索引
生活搜索:常用搜索查询
酷讯搜索
可口网-食谱搜索
房老大-房产搜索
去哪儿-旅游搜索
新浪汽车搜索
顶九购物搜索
实景城市地图搜索口碑网生活搜索行业搜索:亨者电子商务搜索
商业搜索
农业搜索
人力资源搜索
化工搜索
建材搜索
快递查询学术搜索:数据搜索
小说搜索
电子图书搜索
汉典汉语搜索
代码搜索中英文例句搜索
医学信息搜索
全球高校网址查询
专业英语翻译搜索网络资源搜索:奇虎论坛搜索
北大天网FTP搜索
FTP搜索
电影字幕搜索
BT影视搜索
字体搜索(英)
图片搜索其他特殊搜索:中央政府网站搜索
品牌搜索
中文姓氏查询
招聘信息搜索
驾校搜索
优库搜人引擎
爱马者搜索(英)
公司信息搜索(英)搜索引擎的种类(二)根据搜索范围分类:独立搜索引擎集成搜索引擎:又称元搜索引擎。连接多个独立搜索引擎,对一个检索词在若干个搜索引擎中同时进行查询,然后显示出结果。其特点是:自身不采集信息,没有信息库。中文集成搜索引擎
觅搜
/
搜乐搜索
/
搜魅网
/
百狗搜
/
搜网全能搜索
/
搜索引擎的种类(三)按搜索信息的语种分类:单语种搜索引擎:多语种搜索引擎:可以同时检索多个语种的网页信息。
AltaVista
三、搜索引擎的基本检索方式1、自然语言检索2、相关检索3、精确检索4、分类检索5、限制检索6、布尔逻辑检索7、截词检索1、自然语言检索直接输入一个字、词、句,提交搜索引擎查询,这是最基本的查询方式。2、相关检索当输入一个检索词时,搜索引擎会把与该检索词相关的词一并反馈列出,供用户选择。如:百度输入“智能电梯”列出相关检索词:智能电梯控制系统、电梯智能系统、智能电梯管理系统、电梯智能化、智能建筑电梯安装3、精确检索
在查询的关键词两边加上双引号“”,表示检索到的信息必须与检索词完全相同,使得到的结果更加准确。“自动控制理论”——自动控制理论在查询的关键词两边加上书名号《》,表示检索的信息为专有的名词。如:查歌曲“双截棍”用《双截棍》查4、分类检索搜索引擎提供了不同信息类型的分类检索。如:百度:MP3、视频、图片、贴吧、新闻
Google:地图、购物、音乐必应:地图、词典搜搜:博客、问问、搜吧5、字段限制检索
限定检索词在检索结果中出现的位置,用来控制检索结果的相关性。关键字的范围限定大体可分为:分类限定、地域限定、时间限定、文档类型限定、域名限定等。如:URL限制(inurl:)查询的关键字出现在找到后的网页url即链接地址中网站域名限制(site:)表示只在指定的网站中查找该资源标题限制(intitle:)搜索网页标题含有该关键词的页面文件类型限制(filetype:)查询需要的特定类型的文件,文档(doc、pdf、ppt),图片(bmp、jpg),视频等。
6、布尔逻辑检索默认的连接符是“与(and)”,输入两个检索词,中间用空格,搜索引擎就会同时搜索两个检索词。逻辑“或”:大写的“OR”逻辑非的表示:减号前要空格。如:查有关“申花”企业申花–足球7、截词检索用“*”表示不考虑截取的部分。如:“基于*控制”四、搜索引擎的检索策略(一)
选择合适的检索词学会用两个关键词检索对常见的关键词要用其他词加以说明对多义词要注意用其他的词语加以区分注意同义词、相关词的检索
根据检索结果,调整检索词四、搜索引擎的检索策略(二)
学会选择和利用搜索引擎选择合适的搜索引擎和网站搜索引擎的信息滞后周期从一周到一月不等,所以找最新内容可以考虑去新闻网站。要查找较全面的信息,可考虑使用集成搜索引擎。查找专门的信息可以选择搜索引擎的专项搜索或使用垂直搜索引擎。使用限制检索,缩小检索范围对时间、网站、文件类型等限制五、常用中文搜索引擎1、google(谷歌)2、百度(baidu)3、搜狗(sogou)4、中国搜索(zhongsou)5、SOSO搜搜百度
1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,与徐勇一同回国,于2000年1月1日在中关村创建了百度公司。Google
Google是由斯坦福大学学生LarryPage和SergeyBrin共同开发的全新的在线搜索引擎。是在第一代搜索引擎的基础上发展起来的第二代搜索引擎的代表。目前被公认为全球最大的搜索引擎。谷歌学术搜索谷歌网页目录搜索/谷歌VS百度:/enews/special/b&g/
调查显示,用户对百度不满意主要包括将广告与自然搜索结果混排、不完全提供来自海外的中文搜索结果、不够客观公正、相关性不好。而对谷歌不满意主要包括:搜索不稳定、网页快照不能用、不提供MP3搜索和贴吧等服务。谷歌VS百度谷歌的搜索语法在百度中一般都适用谷歌是按照网页级别来收录的,只有达到一定的网页级别,才会被Google收录。百度则中文网页尽可能都收录。搜索结果的输出:百度将广告混合,谷歌明确将广告放一边;此外,谷歌搜索结果的输出相关度更强。谷歌中、外文;百度中文为主。谷歌VS百度基本的搜索语法:filetype:搜索指定文件类型title(intitle):搜索标题内容site:搜索指定的网站inurl:搜索指定的网址intext:在文本正文里搜索相关的检索词
谷歌和百度的网页搜索谷百度歌:/雅虎全能搜索1994年4月,斯坦
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 代理运营与管理协议(04版)
- 二零二四年度专利申请权转让合同
- 购销合同印花税的税率
- 电工合同范本(2篇)
- 村医抽调卫生院值班合同(2篇)
- 南京空白就业协议书(2篇)
- 合伙人合同协议书范文(2篇)
- 二零二四年度设备租赁及运营管理合同
- 二零二四年度商务咨询合同终止协议
- 桥梁桩基工程劳务外包合同
- 小红书推广协议合同模板
- 地表水自动监测运维理论考核试题
- 超长期特别国债项目
- 第17课+挽救民族危亡的斗争+教学设计 高中历史统编版(2019)必修中外历史纲要上册
- 中班美术活动课件《秋天的树林》
- 《美丽的小兴安岭》课件
- 10.2 滋养心灵 课件-2024-2025学年统编版道德与法治七年级上册
- 空气动力学仿真技术:大涡模拟(LES):LES结果后处理与分析
- 2024-2030年中国备份软件行业市场发展趋势与前景展望战略分析报告
- 2024年碳排放管理员(高级工)职业鉴定考试题库及答案
- 2024年艾滋病防治知识竞赛考试题库200题(含答案)
评论
0/150
提交评论