powerpoint演示文稿网上信息资源及其查询方法解析课件_第1页
powerpoint演示文稿网上信息资源及其查询方法解析课件_第2页
powerpoint演示文稿网上信息资源及其查询方法解析课件_第3页
powerpoint演示文稿网上信息资源及其查询方法解析课件_第4页
powerpoint演示文稿网上信息资源及其查询方法解析课件_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章网上信息资源及其查询方法INTERNET三大基本概念和功能组网上信息检索的工具、搜索方式和搜索技巧影响检索结果的因素使用搜索引擎时应注意事项第五章网上信息资源及其查询方法INTERNET三大基本概念11INTERNET三大基本概念和功能组

1.1INTERNET三大基本概念1)TCP/IP协议:传输控制与网际协议2)DN(域名)和IP地址3)URL:全球资源定位器1INTERNET三大基本概念和功能组

1.1INTER21)TCP/IP协议TCP是TransmissionControlProtocol(传输控制协议)的缩写,IP是InternetProtocol(网际协议)的缩写支持WWW功能的HTTP(HypertextTransportProtocol,超文本传输协议),该协议容许文字、图画、声音等同时传输支持E-mail功能的SMTP(SimpleMailTransferProtocol,简单邮件传输协议)和POP(PostOfficeProtocol,邮局协议)支持FTP功能的FTP(FileTransferProtocol,文件传输协议)1)TCP/IP协议TCP是TransmissionCon32)DN(域名):DomainName结构:由2到5段字符构成,中间用.隔开,形如host.inst.fild.statstat——国别代码,au(澳大利亚),ca(加拿大),cn(中国),fr(法国),it(意大利),uk(英国),美国因创建Internet优先而无此码2)DN(域名):DomainName结构:由2到5段字4fild——网络分类代码,ac(学术网)、com(商用网)、edu(教育网)、gov(政府网)、mil(军事网)、net(公共网)、org(社团网)七类,1997年秋季起Internet管理机构决定未来将增设arts(文艺机构)、firm(公司企业)、info(信息服务机构)、nom(个人专用)、rec(娱乐专用)、store(商店专用)、web(万维网专用)七类代码;fild——网络分类代码,ac(学术网)、com(商用网5inst——单位或子网代码,一般是其英文缩写;sdau(山东农业大学)host是主机或服务器代码。如我校的WWW服务器的DN为FTP服务器的DN则为ftp.inst——单位或子网代码,一般是其英文缩写;sdau(62)IP地址

结构:一般为四段数字,中间用.隔开2)IP地址

结构:一般为四段数字,中间用.隔开73)URL(UniformResourceLocator)定义文件在Internet上的位置,无论其位于哪台主机、哪个子目录,只要给出文件的URL地址,就能在nternet信息海洋中准确无误地定位该文件,就象是一个全球定位器。URL的一般语法格式为:protocol://hostdn(hostip)[:port/path/file]

3)URL(UniformResourceLocato81.2Internet功能组

功能群基础协议URL形式主要搜索工具(1)WWWHTTPhttp://...WebSearchEngineBrowser

(2)FTPFTPftp://...FTPSearchEngine(Archie)Browser;Ws_ftp(3)EmailSMTP/POPmailto:...WhitepageSearchEngineBrowser;Eudora(4)UsenetNNTPnews:...UsenetSearchEngineBrowser;WinVN(5)TelnetTELNETtelnet://...Gopher(Veronica&Jughead)etcBrowser;Netterm1.2Internet功能组

功能群基础协议92网上信息检索的工具、搜索方式

和搜索技巧6.2.1工具:搜索引擎(SearchEngine):Internet上具有查询功能的网页的统称,如:WebSearchEngine(万维网搜索引擎)FTPSearchEngine(文件搜索引擎)Email/WhitePageSearchEngine(电子函件/白页搜索引擎)YellowPageSearchEngine(黄页搜索引擎)UsenetSearchEngine(新闻论坛搜索引擎)Meta-SearchEngine(元搜索引擎)等类型2网上信息检索的工具、搜索方式

10中文搜索引擎百度http://www.baidu.com搜狐http://www.sohu.com搜索客http://www.cseek.com悠游http://www.goyoyo.com.cn新浪http://www.sina.com.cn网易http://www.yeah.net中文搜索引擎百度http://www.baidu.11中文搜索引擎常青藤http://www.tonghua.com.cn若比邻http://www.robot.com.cn北极星http://www.beijixin.com.cn网典http://www.cnnavigate.com.天网http://e.pku.edw.cn/雅虎中文http://cn.yahoo.com中文搜索引擎常青藤http://www.tonghu12西文搜索引擎http://www.google.comhttp://www.infoseek.comhttp://www.excite.comhttp://www.yahoo.comhttp://www.1ycos.comhttp://www.altavista.comhttp://www.metacrawler.comhttp://www.profusion.com西文搜索引擎http://www.google.com136.2搜索引擎的搜索方式简单搜索(SimpleSearch,简记作SS):指输入一个单词(关键词)或两个单词以上的词组(短语),提交搜索引擎查询,这是最基本的搜索方式。大多数搜索引擎都约定把词组或短语放在引号“”内。高级搜索(AdvancedSearch,简记作AS):指用布尔逻辑组配方式查询,也叫定制搜索。也包括多词语句提问的任意查询。不同搜索引擎对语句中词与词之间的关系的处理方式不同。目录搜索(CatalogSearch,简记作CS):指按搜索引擎提供的分类目录逐级查询,用户一般不需要输入查询词,而是按照查询系统所给的几种分类项目,选择类别进行搜索,因而也叫分类搜索(ClassifiedSearch)。6.2搜索引擎的搜索方式简单搜索(SimpleSearc14powerpoint演示文稿网上信息资源及其查询方法解析课件15powerpoint演示文稿网上信息资源及其查询方法解析课件16powerpoint演示文稿网上信息资源及其查询方法解析课件176.3搜索引擎的检索技巧

5种常见的数据库检索功能:布尔逻辑检索、字符串检索、截词检索、字段检索,限制检索和位置检索特有的检索功能:自然语言检索、概念检索、加/减(+/一)号检索、区分大小写的检索、检索结果的相关性排序6.3搜索引擎的检索技巧5种常见的数据库检索功能:布尔逻181)布尔逻辑检索

(1)逻辑运算符:逻辑与:空格、+、and计算机病毒、计算机+病毒、计算机and病毒逻辑或:|、or计算机or电脑、计算机|电脑逻辑非:not、-彩票not山东、彩票-山东

1)布尔逻辑检索(1)逻辑运算符:19(2)注意事项:A受支持的程度不同:完全支持,如Excite、Infoseek等均支持AND、OR、NOT全部三种运算;部分支持,如Yahoo只支持AND、OR两种运算;只在其“高级检索”模式中“完全支持”,而在“简单检索”模式中是“部分支持”,如HotBot、Lycos。(2)注意事项:A受支持的程度不同:20(2)注意事项:B提供运算的方式不同:大部分仍采用常规的命令驱动方式,也有一部分是采用菜单驱动方式,即用菜单选项代替布尔运算符进行逻辑运算,如HotBot、Lycos中均提供了两个菜单选项“Allthewords”和“Anyofthewords”代表AND和OR运算。(2)注意事项:B提供运算的方式不同:大部分仍采用常规212)字符串检索(短语检索)定义:将一个字符串(通常用双引号括起)当作一个独立的运算单元,进行严格匹配,以提高检索的精度和准确度。逻辑运算符:“”几乎所有的搜索引擎都支持字符串检索

2)字符串检索(短语检索)定义:将一个字符串(通常用双引号223)截词检索

逻辑运算符:*在搜索引擎中,目前只提供右截法

3)截词检索逻辑运算符:*234)字段检索和限制检索

在搜索引擎中字段检索一律表现为前缀限制的形式,如属于主题字段限制的有:“Title:”、“Subject:”,“Keyword:”、“Summary:”等;属于非主题字段限制的有:“Image:”、“text:”等。作为一种网络检索工具,搜索引擎还提供了许多新的、带有典型网络检索特征的字段限制类型,如主机名限制(host:)、超链限制(anchor:)、域名限制(domain:)、URL限制(url:)、网址限制(site:)、E-mail限制(from:)等。4)字段检索和限制检索

在搜索引擎中字段检索一律表现为前缀限245)位置检索

目前只有AltaVista提供临近位置运算(near运算)5)位置检索目前只有AltaVista提供临近位置运算(n256)自然语言检索定义:直接采用自然语言中的字、词甚至整个句子作提问式进行检索,如可用“WhatistheweatherinBoston”

6)自然语言检索定义:直接采用自然语言中的字、词甚至整个句子267)概念检索在用某一检索词进行检索时,能同时对该词的同义、近义、广义和狭义词进行检索,以达扩大检索范围、避免漏检的目的。这类似于一般数据库检索中的“扩展检索”功能。目前,只有Excite能提供此功能。7)概念检索在用某一检索词进行检索时,能同时对该词的同义、近278)加/减(+/一)号检索

作用相当于AND/NOT运算几乎所有的搜索引擎都支持该功能8)加/减(+/一)号检索

作用相当于AND/NOT运算289)区分大小写的检索

又称大小写敏感检索,这主要是针对检索词中含有人名、地名等专有名词而言的。如在区分大小写的情况下,RockHudson能被当作人名看待,而rockhudson则被当作两个普通词看待,从而影响了检索结果的准确性。目前,AltaVista和Infoseek提供有此项功能。9)区分大小写的检索又称大小写敏感检索,这主要是针对检索词2910)检索结果的相关性排序

检索结果通常是根据相关程度按从大到小的顺序降序排列几乎所有的搜索引擎都提供了“对检索结果按其相关性大小排序”的功能

10)检索结果的相关性排序检索结果通常是根据相关程度按从大303影响检索结果相关性的因素

(1)检索词的个数:检索出的记录中含有的检索词个数越多,相关性越大。(2)检索词在数据库记录中出现的位置:检索出的记录中含有的检索词出现在题名字段的,比出现在其他(如正文或URL)字段的相关性更大。3影响检索结果相关性的因素

(1)检索词的个数:检索出的记31(3)检索词所属的类目级别:检索出的记录中含有的检索词所属的类目级别越高,相关性越大。(4)检索词的权值:检索出的记录中含有的检索词权值比重越大,相关性越大(词的专指度越高,权值越大)。

(3)检索词所属的类目级别:检索出的记录中含有的检索词所属324使用搜索引擎应注意的事项

最重要的技巧是关键词的选择

(1)查询要求应具体明确,能使用下位词时,就不要使用上位词。(2)不要使用常用词,即不要使用太泛的词。(3)调整查询。如果查询返回太多的结果,就要使检索词更具体。如果查询没有产生足够多的结果,就要使它更一般。不要认为第一次选择的关键字是最好的。(4)使用单词的词尾变化。例如,如果要查找有关running的Web页,则可使用“run”、“runs”和“running”等。4使用搜索引擎应注意的事项最重要的技巧是关键词的选择33(5)使用同义词。如果用户正在使用的搜索引擎是支持关键词组配的搜索工具,一定要使用“OR”将各个同义词配合起来。(6)尽可能多使用字符串检索。如果用户想准确地匹配一个短语或标题,一定要用引号将它括起来,即进行字符串检索。例如,如果想在Internet上查找“informationretrieval”,在搜索表单中应键人“informationretrieval”。(7)熟悉正在使用的搜索工具。掌握一些搜索工具有很特殊的功能,使得查找相关内容更加容易。(5)使用同义词。如果用户正在使用的搜索引擎是支持关键词组34(8)任何信息搜索工具都有其局限性。当用户使用某种工具的搜索效果不理想时,换一种工具再试。一些工具在查询某类信息时的搜索领域宽于查询另一类信息的搜索领域,也可以考虑使用元搜索引擎或专业搜索引擎进行检索。(9)当获得的搜索结果十分有价值时,将它作为一个HTML文本存储在本地计算机中,以便再次使用。(10)查找专业性较强的信息时,应优先考虑使用专业搜索引擎。国内目前就有多种专业搜索引擎,如公路交通信息搜索引擎、医学搜索引擎、水产搜索引擎、暖通空调搜索引擎等。(8)任何信息搜索工具都有其局限性。当用户使用某种工具的搜35第五章网上信息资源及其查询方法INTERNET三大基本概念和功能组网上信息检索的工具、搜索方式和搜索技巧影响检索结果的因素使用搜索引擎时应注意事项第五章网上信息资源及其查询方法INTERNET三大基本概念361INTERNET三大基本概念和功能组

1.1INTERNET三大基本概念1)TCP/IP协议:传输控制与网际协议2)DN(域名)和IP地址3)URL:全球资源定位器1INTERNET三大基本概念和功能组

1.1INTER371)TCP/IP协议TCP是TransmissionControlProtocol(传输控制协议)的缩写,IP是InternetProtocol(网际协议)的缩写支持WWW功能的HTTP(HypertextTransportProtocol,超文本传输协议),该协议容许文字、图画、声音等同时传输支持E-mail功能的SMTP(SimpleMailTransferProtocol,简单邮件传输协议)和POP(PostOfficeProtocol,邮局协议)支持FTP功能的FTP(FileTransferProtocol,文件传输协议)1)TCP/IP协议TCP是TransmissionCon382)DN(域名):DomainName结构:由2到5段字符构成,中间用.隔开,形如host.inst.fild.statstat——国别代码,au(澳大利亚),ca(加拿大),cn(中国),fr(法国),it(意大利),uk(英国),美国因创建Internet优先而无此码2)DN(域名):DomainName结构:由2到5段字39fild——网络分类代码,ac(学术网)、com(商用网)、edu(教育网)、gov(政府网)、mil(军事网)、net(公共网)、org(社团网)七类,1997年秋季起Internet管理机构决定未来将增设arts(文艺机构)、firm(公司企业)、info(信息服务机构)、nom(个人专用)、rec(娱乐专用)、store(商店专用)、web(万维网专用)七类代码;fild——网络分类代码,ac(学术网)、com(商用网40inst——单位或子网代码,一般是其英文缩写;sdau(山东农业大学)host是主机或服务器代码。如我校的WWW服务器的DN为FTP服务器的DN则为ftp.inst——单位或子网代码,一般是其英文缩写;sdau(412)IP地址

结构:一般为四段数字,中间用.隔开2)IP地址

结构:一般为四段数字,中间用.隔开423)URL(UniformResourceLocator)定义文件在Internet上的位置,无论其位于哪台主机、哪个子目录,只要给出文件的URL地址,就能在nternet信息海洋中准确无误地定位该文件,就象是一个全球定位器。URL的一般语法格式为:protocol://hostdn(hostip)[:port/path/file]

3)URL(UniformResourceLocato431.2Internet功能组

功能群基础协议URL形式主要搜索工具(1)WWWHTTPhttp://...WebSearchEngineBrowser

(2)FTPFTPftp://...FTPSearchEngine(Archie)Browser;Ws_ftp(3)EmailSMTP/POPmailto:...WhitepageSearchEngineBrowser;Eudora(4)UsenetNNTPnews:...UsenetSearchEngineBrowser;WinVN(5)TelnetTELNETtelnet://...Gopher(Veronica&Jughead)etcBrowser;Netterm1.2Internet功能组

功能群基础协议442网上信息检索的工具、搜索方式

和搜索技巧6.2.1工具:搜索引擎(SearchEngine):Internet上具有查询功能的网页的统称,如:WebSearchEngine(万维网搜索引擎)FTPSearchEngine(文件搜索引擎)Email/WhitePageSearchEngine(电子函件/白页搜索引擎)YellowPageSearchEngine(黄页搜索引擎)UsenetSearchEngine(新闻论坛搜索引擎)Meta-SearchEngine(元搜索引擎)等类型2网上信息检索的工具、搜索方式

45中文搜索引擎百度http://www.baidu.com搜狐http://www.sohu.com搜索客http://www.cseek.com悠游http://www.goyoyo.com.cn新浪http://www.sina.com.cn网易http://www.yeah.net中文搜索引擎百度http://www.baidu.46中文搜索引擎常青藤http://www.tonghua.com.cn若比邻http://www.robot.com.cn北极星http://www.beijixin.com.cn网典http://www.cnnavigate.com.天网http://e.pku.edw.cn/雅虎中文http://cn.yahoo.com中文搜索引擎常青藤http://www.tonghu47西文搜索引擎http://www.google.comhttp://www.infoseek.comhttp://www.excite.comhttp://www.yahoo.comhttp://www.1ycos.comhttp://www.altavista.comhttp://www.metacrawler.comhttp://www.profusion.com西文搜索引擎http://www.google.com486.2搜索引擎的搜索方式简单搜索(SimpleSearch,简记作SS):指输入一个单词(关键词)或两个单词以上的词组(短语),提交搜索引擎查询,这是最基本的搜索方式。大多数搜索引擎都约定把词组或短语放在引号“”内。高级搜索(AdvancedSearch,简记作AS):指用布尔逻辑组配方式查询,也叫定制搜索。也包括多词语句提问的任意查询。不同搜索引擎对语句中词与词之间的关系的处理方式不同。目录搜索(CatalogSearch,简记作CS):指按搜索引擎提供的分类目录逐级查询,用户一般不需要输入查询词,而是按照查询系统所给的几种分类项目,选择类别进行搜索,因而也叫分类搜索(ClassifiedSearch)。6.2搜索引擎的搜索方式简单搜索(SimpleSearc49powerpoint演示文稿网上信息资源及其查询方法解析课件50powerpoint演示文稿网上信息资源及其查询方法解析课件51powerpoint演示文稿网上信息资源及其查询方法解析课件526.3搜索引擎的检索技巧

5种常见的数据库检索功能:布尔逻辑检索、字符串检索、截词检索、字段检索,限制检索和位置检索特有的检索功能:自然语言检索、概念检索、加/减(+/一)号检索、区分大小写的检索、检索结果的相关性排序6.3搜索引擎的检索技巧5种常见的数据库检索功能:布尔逻531)布尔逻辑检索

(1)逻辑运算符:逻辑与:空格、+、and计算机病毒、计算机+病毒、计算机and病毒逻辑或:|、or计算机or电脑、计算机|电脑逻辑非:not、-彩票not山东、彩票-山东

1)布尔逻辑检索(1)逻辑运算符:54(2)注意事项:A受支持的程度不同:完全支持,如Excite、Infoseek等均支持AND、OR、NOT全部三种运算;部分支持,如Yahoo只支持AND、OR两种运算;只在其“高级检索”模式中“完全支持”,而在“简单检索”模式中是“部分支持”,如HotBot、Lycos。(2)注意事项:A受支持的程度不同:55(2)注意事项:B提供运算的方式不同:大部分仍采用常规的命令驱动方式,也有一部分是采用菜单驱动方式,即用菜单选项代替布尔运算符进行逻辑运算,如HotBot、Lycos中均提供了两个菜单选项“Allthewords”和“Anyofthewords”代表AND和OR运算。(2)注意事项:B提供运算的方式不同:大部分仍采用常规562)字符串检索(短语检索)定义:将一个字符串(通常用双引号括起)当作一个独立的运算单元,进行严格匹配,以提高检索的精度和准确度。逻辑运算符:“”几乎所有的搜索引擎都支持字符串检索

2)字符串检索(短语检索)定义:将一个字符串(通常用双引号573)截词检索

逻辑运算符:*在搜索引擎中,目前只提供右截法

3)截词检索逻辑运算符:*584)字段检索和限制检索

在搜索引擎中字段检索一律表现为前缀限制的形式,如属于主题字段限制的有:“Title:”、“Subject:”,“Keyword:”、“Summary:”等;属于非主题字段限制的有:“Image:”、“text:”等。作为一种网络检索工具,搜索引擎还提供了许多新的、带有典型网络检索特征的字段限制类型,如主机名限制(host:)、超链限制(anchor:)、域名限制(domain:)、URL限制(url:)、网址限制(site:)、E-mail限制(from:)等。4)字段检索和限制检索

在搜索引擎中字段检索一律表现为前缀限595)位置检索

目前只有AltaVista提供临近位置运算(near运算)5)位置检索目前只有AltaVista提供临近位置运算(n606)自然语言检索定义:直接采用自然语言中的字、词甚至整个句子作提问式进行检索,如可用“WhatistheweatherinBoston”

6)自然语言检索定义:直接采用自然语言中的字、词甚至整个句子617)概念检索在用某一检索词进行检索时,能同时对该词的同义、近义、广义和狭义词进行检索,以达扩大检索范围、避免漏检的目的。这类似于一般数据库检索中的“扩展检索”功能。目前,只有Excite能提供此功能。7)概念检索在用某一检索词进行检索时,能同时对该词的同义、近628)加/减(+/一)号检索

作用相当于AND/NOT运算几乎所有的搜索引擎都支持该功能8)加/减(+/一)号检索

作用相当于AND/NOT运算639)区分大小写的检索

又称大小写敏感检索,这主要是针对检索词中含有人名、地名等专有名词而言的。如在区分大小写的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论