




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
互联网信息利用原理10/17/20221第7章互联网信息的检索原理互联网信息资源上海大学内上海大学外图书馆资源:商业数据库(EBSCO、Ei、中国期刊网等)、印刷型馆藏目录等公共网资源:计算机中的无数信息、信息利用工具、网络通信渠道
10/17/20222第7章互联网信息的检索原理互联网信息利用原理本章要点:1基本概念2互联网信息资源3网络信息检索工具和检索方法4百度实习示例10/17/20223第7章互联网信息的检索原理1基本概念IP地址
InternetProtocol(简称IP)—互联网协议
表示:四段数字,中间用圆点隔开如:上海大学图书馆主页的IP网址
93
上网计算机—有一个惟一的IP地址对应
p.11810/17/20224第7章互联网信息的检索原理1基本概念域名
DomainName,简称DN
表示:通信协议、主机名、机构性质域名和国家地区域名如:上海大学的WWW服务器的域名为
http://
通信协议主机名shu—shanghaiuniversity简称机构性质国家域名服务器—域名域名和IP地址可互换p.11810/17/20225第7章互联网信息的检索原理1基本概念表5-4常见机构性质域名一览表域名含义edueductional
如:大学、中学等学校的服务器网站govgovernmental如:政府机构(财政部、交通、文化部、公安部)的服务器网站orgnon-profitmakingorganizations非盈利性的机构如:上海市总工会,上海市软件行业协会comcommercial如:商业盈利性网站(银行、搜索引擎、网上书店等)的服务器网站10/17/20226第7章互联网信息的检索原理1基本概念网址统一资源定位器(UniformResourceLocator,简称URL)表示:域名加文件地址如:AcademicSystemsCorporation的InteractiveMathematics教学文件的网址是http:///Interactive_Mathematics/Overvi
ew.asp一级(服务器域名)二级三级
主机名机构性质目录(路径)文件名互联网上一切资源(计算机、各种文件)—网址10/17/20227第7章互联网信息的检索原理1基本概念三种对应关系:IP地址上网计算机域名、IP地址服务器URL地址互联网一切资源(如:某台上网计算机上的某个路径下的某个文件)10/17/20228第7章互联网信息的检索原理1基本概念网页、网站区别
网站:一般包含与主题密切相关内容的导航链接,内容体系相对独立、完整,所含网页层次较多如:钱学森网站
网页:HTML文件,是某网站的分支内容如:钱学森网页/introduction/qxs.aspp.11710/17/20229第7章互联网信息的检索原理2互联网信息资源网络信息资源的定义网络信息资源的特点网络学术信息资源的类型学术网站的类型10/17/202210第7章互联网信息的检索原理2互联网信息资源
-网络信息资源的定义广义:是在互联网上以各种方式存在并传播的信息集合。包括网上计算机中的无数信息、网上的各种信息工具以及网络通信渠道。p.115
10/17/202211第7章互联网信息的检索原理2互联网信息资源网络公共信息资源计算机中的无数信息(检索对象)信息利用工具网络通信渠道免费数据库、软件、文件、出版物原文等浏览器、FTP文件传输工具、e-mail、搜索引擎等HUB、路由器等硬件设备10/17/202212第7章互联网信息的检索原理2互联网信息资源
-网络信息资源的定义狭义:通常只指公网上访问权不受任何限制的信息资源。它不包含使用权受
IP控制的、受用户名及其密码限制的资源。10/17/202213第7章互联网信息的检索原理2互联网信息资源
-网络信息资源的特点数量庞大,增长迅速整体无序,局部有序更新频繁,变化无常多维显示,交互方便良莠混杂,参差不一p.11710/17/202214第7章互联网信息的检索原理2互联网信息资源
-网络学术信息资源的类型网络学术资源:指与学术研究有关的网络资源。可按以下五个角度区分:
内容、出版类型、是否具有原创性、是否经过审核、是否属于搜索引擎检索范围p.11610/17/202215第7章互联网信息的检索原理2互联网信息资源
-网络学术信息资源的类型内容出版类型原创性专家审核是否属于搜索引擎检索范围学术机构信息、学术人物信息、科研信息、科研成果信息网络图书、期刊、专利等一次资源二次资源正式出版物非正式出版物可见信息、不可见信息10/17/202216第7章互联网信息的检索原理2互联网信息资源
-网络学术信息资源的类型按内容区分:学术机构:学术团体、专业协会、高等院校、研究院所等;如:中国法学会
http://
学术人物:各学科著名科学家、学者、专家等的个人网站。如:钱学森网站
科研信息:上海市科学技术委员会
http://科研成果:国家科技成果网
http://10/17/202217第7章互联网信息的检索原理2互联网信息资源
-网络学术信息资源的类型按出版类型区分:网络专利
/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&r=1&p=1&f=G&l=50&d=PTXT&S1=((alumina+OR+AL2o3)+AND+NANO$).TI.&OS=ttl/((alumina+or+AL2o3)+and+NANO$)&RS=TTL/((alumina+OR+AL2o3)+AND+NANO$)10/17/202218第7章互联网信息的检索原理2互联网信息资源
-网络学术信息资源的类型按原创性区分:一次资源:首次发表的原创性信息
中华人民共和国国家统计局
http://
二次资源:转载已有的信息或从原创中提取的部分信息新浪网:发布的新闻是从各个网站上转载过来的;中国标准咨询网:提取的是标准的题录信息http:///index.asp10/17/202219第7章互联网信息的检索原理2互联网信息资源
-网络学术信息资源的类型按是否经专家审核:正式出版物
pdf全文/21/lwml/%D0%C5%CF%A2%CB%D8%D6%CA%BD%CC%D3%FD%B5%C4%BD%CC%D1%A7%C4%DA%C8%DD%CB%BC%BF%BC.pdf
百度知道非正式出版物
/question/619334.html10/17/202220第7章互联网信息的检索原理2互联网信息资源
-网络学术信息资源的类型是否属于搜索引擎检索范围:不可见信息搜索引擎不可直接搜索到的信息:IP地址限制,用户名密码限制,不含超链接,
动态数据库内容可见信息搜索引擎可直接搜索到的静态网页10/17/202221第7章互联网信息的检索原理2互联网信息资源
-网络学术信息资源的类型可见信息不可见信息搜索引擎1:40010/17/202222第7章互联网信息的检索原理图6-1网上学术信息资源的构成
不可见信息:IP、用户名密码限制可见信息仅限于静态网页iPAC等动态数据库产生的网页不属于可见信息10/17/202223第7章互联网信息的检索原理2互联网信息资源
-学术网站的类型学术网站的定义:以学科领域的专业研究人员为主要对象,以学术研究内容为主要内容,以满足学术信息交流为主要目的的网站。学术网站的类型:学科门户网站、学科资源网站、学术机构网站、行业协会机构网站、学科专家网站以及学科论坛网站等。
p.13310/17/202224第7章互联网信息的检索原理2互联网信息资源
-学术网站的类型学科门户网站。集研究机构、研究课题、专著论文、会议消息等内容之大成,主要宗旨为提供信息交流平台。如:中国经济学教育科研网:
http:///cn/10/17/202225第7章互联网信息的检索原理2互联网信息资源
-学术网站的类型学科资源网站。集中学科领域内的历史知识、术语、学会组织、出版刊物、会议消息、数据库等相关内容,以方便专业人员日常学习和工作为主要目的,以资料汇总为主要特征。
如:中国数学资源网:
http://10/17/202226第7章互联网信息的检索原理2互联网信息资源
-学术网站的类型学科性论坛博客网站。论坛是当前网络信息交流的一个主要工具,它可以起到组织热点话题、筛选学科新闻、评点学术动态和推荐优秀论著等重要作用。
如:ABBS建筑论坛:
http://10/17/202227第7章互联网信息的检索原理3网络信息检索工具和检索方法网上信息检索工具搜索引擎百度引擎的检索方法虚拟图书馆
10/17/202228第7章互联网信息的检索原理3.1搜索引擎的工作原理定义:网上信息搜索工具。类型按工作方式区分:主题、目录和多元。p.11910/17/202229第7章互联网信息的检索原理3.1搜索引擎的工作原理工作过程:
信息的收集
信息处理
信息查询10/17/202230第7章互联网信息的检索原理3.1搜索引擎的工作原理—主题引擎主题引擎工作原理收集①处理②查询③根据结果由用户访问④10/17/202231第7章互联网信息的检索原理3.1搜索引擎的工作原理—主题引擎主题引擎:搜索软件索引软件检索软件程序自动完成,处理信息的层次是网页。优点:信息量大、更新及时缺点:返回信息中常有很多无关信息,甚至有一定比例的死链接,用户必须从结果中进行筛选。
p.119-12010/17/202232第7章互联网信息的检索原理3.1搜索引擎的工作原理—主题引擎主题引擎国内代表:百度:
等
国外代表:
Google:http://等。
它们的首页都只有一个检索文本框
10/17/202233第7章互联网信息的检索原理3.1搜索引擎的工作原理—目录引擎目录引擎:编辑人员Web站点对每个站点描述和网址归入预先分好的类别p.12110/17/202234第7章互联网信息的检索原理3.1搜索引擎的工作原理—目录引擎目录引擎国内代表:搜狐:等国外代表:YahooDirectory(网站数量约200万个)等。
http://
p.12110/17/202235第7章互联网信息的检索原理3.1搜索引擎的工作原理搜索引擎主题引擎目录引擎是否人工参与无程序自动完成是提供的结果网页网站适合专指、具体某一专题p.12110/17/202236第7章互联网信息的检索原理3.1搜索引擎的工作原理—多元引擎
多元引擎(元搜索引擎)
搜索软件索引软件检索软件没有存放网页信息的数据库。提供各个主题引擎的统一检索平台p.121××10/17/202237第7章互联网信息的检索原理3.1搜索引擎的工作原理—多元引擎多元搜索引擎国内代表:
万维搜索:http://等。国外代表:metacrawler(),
Profusion(http://)等
p.12110/17/202238第7章互联网信息的检索原理3.1搜索引擎的工作原理—多元引擎可以选择其中的一个或多个搜索引擎同时检索10/17/202239第7章互联网信息的检索原理3.2百度搜索引擎的检索方法百度中国互联网软件技术提供商和平台运营商。1999年底,成立于美国硅谷。2000年百度公司回国发展。百度的起名,来自于"众里寻她千百度"的灵感。百度主要服务于门户网站,客户包括Sina,Sohu,T,263在线,21CN,上海热线,广州视窗等,中国提供搜索引擎的主要网站中,超过80%由百度提供。
p.12210/17/202240第7章互联网信息的检索原理3.2百度搜索引擎的检索方法1)检索词网页、新闻、图片等任何内容,形式可以是中文、英文、数字或中文英文数字的混合体。
p.12210/17/202241第7章互联网信息的检索原理3.2百度搜索引擎的检索方法2)使用两个以上检索词的检索逻辑
逻辑与。表示为:AB
空格
含义:空格前后的两个检索词在同一个网页中出现。如:搜索“中国专利”检索策略:中国专利
p.12310/17/202242第7章互联网信息的检索原理3.2百度搜索引擎的检索方法逻辑或。表示为:A|B
含义:“|”前后的两个检索词中至少有一个在网页中出现。如:要查询“图片”或“写真”相关网页检索策略:图片
|
写真逻辑非。表示为:A-B。但减号之前必须留一空格含义:网页中出现检索词A而不出现检索词B。如:要搜寻[光学处理方法],但不含[紫外光光学处理方法]的相关网页检索策略:光学处理
-紫外p.12310/17/202243第7章互联网信息的检索原理3.2百度搜索引擎的检索方法3)字段检索在标题及其链接的说明语中搜索。表示为:intitle:检索词
如:intitle:(互联网协议)
或intitle:互联网intitle:协议表示搜索标题及其说明语中同时含有检索词“互联网”、“协议”的网页。p.12310/17/202244第7章互联网信息的检索原理3.2百度搜索引擎的检索方法①②③①网页标题②网页说明语③网页地址10/17/202245第7章互联网信息的检索原理3.2百度搜索引擎的检索方法在url中搜索。表示为:inurl:文字。可限制只搜索url中可能含有的文字的网页。如:inurl:org
查找可能是组织机构的网站
inurl:edu
查找可能是教育机构的网站只有当org、edu等处在服务器域名位置时,才是组织机构、教育机构网站。
p.12310/17/202246第7章互联网信息的检索原理3.2百度搜索引擎的检索方法URL地址中含有edu10/17/202247第7章互联网信息的检索原理3.2百度搜索引擎的检索方法查找文件类型
filetype:pdf
限制查找pdf文件
filetype:doc
限制查找doc文件
filetype:ppt
限制查找ppt文件10/17/202248第7章互联网信息的检索原理3.2百度搜索引擎的检索方法10/17/202249第7章互联网信息的检索原理课堂提问??检索策略:检索词inurl:edu
得到的检索结果一定是教育机构的网站吗?答:当edu处在URL地址第一级服务器域名中时,才是教育机构
10/17/202250第7章互联网信息的检索原理3.3虚拟图书馆又称,学科导航,网络导航10/17/202251第7章互联网信息的检索原理3.3虚拟图书馆搜索引擎能搜索商业信息资源和学术信息资源。虚拟图书馆实质上是一种网络信息利用工具。它针对某一学科或领域的研究者的需要,将互联网上与之有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等包括URLs在内的各种资源线索,进行系统地收集、核实并加以组织,以网站、网页或数据库形式提供给用户浏览或者检索。p.12910/17/202252第7章互联网信息的检索原理3.3虚拟图书馆清华大学虚拟图书馆/chinese/virtual10/17/202253第7章互联网信息的检索原理3.3虚拟图书馆虚拟图书馆使用场合:当时间短促,不允许浏览由搜索引擎查得的巨量的信息时;当希望看到比较可靠的网络信息;当希望对某个领域有个整体的、较全面的了解时;
用户在访问某一学科的虚拟图书馆网页时,通过浏览选择所需要的分类,点击相关的网络线索即超级链接,就可以浏览到大量相关资料。
10/17/202254第7章互联网信息的检索原理4百度实习示例实习目的练习搜索引擎的使用方法,收集学术网站。实习内容和要求以百度作为主要的练习搜索引擎,要求运用并掌握百度的逻辑算符和字段算符方法,检索获得与专业相关的一个学术网站10/17/202255第7章互联网信息的检索原理4百度实习示例例:运用百度引擎查找“光学”学科有关的一个学术网站。
(1)取“光学”学科(见网络课件第5.7)(2)检索策略:
光学
(学会|
协会|
研
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 豪华别墅装修委托合同模板
- 石子加工生产合同范本
- 小区车位权益合同范本
- 农村电力安装合同范本
- 话剧剧本合同范本
- 农场乐园采购合同范本
- 心愿任务群之许下远足心愿-一年级语文下册二单元《我多想去看看》教学设计(第一课时)
- 内部承包砖合同范本
- 安装门窗合同范本
- 2025年新版正式员工劳动合同范本
- 古代汉语-形考任务1-3-国开-参考资料
- 工业废水处理技术作业指导书
- 2025年中国航天日知识竞赛考试题库300题(含答案)
- 体检中心质量控制指南
- 2024年四年级英语下册 Unit 6 What's Anne doing第2课时教学实录 湘少版
- 严守八项规定发言稿
- 2025-2030中国三相UPS系统行业市场发展趋势与前景展望战略分析研究报告
- 2025年湖南省低空经济发展集团有限公司招聘11人笔试参考题库附带答案详解
- 医疗商务谈判艺术
- 2025年广东中考试题数学及答案
- 四川2024年12月四川省内江市事业单位公开选调2名工作人员笔试历年典型考题(历年真题考点)解题思路附带答案详解
评论
0/150
提交评论