《信息技术》课件-模块二 信息检索技术_第1页
《信息技术》课件-模块二 信息检索技术_第2页
《信息技术》课件-模块二 信息检索技术_第3页
《信息技术》课件-模块二 信息检索技术_第4页
《信息技术》课件-模块二 信息检索技术_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

搜索引擎的使用Theuseofsearchengines信息技术信息技术informationtechnologyInformationTechnology陈老师提出问题TeacherChenraisedaquestion哪位同学知道计算机领域的最高奖项叫什么名字?Whichstudentknowsthenameofthehighestawardinthefieldofcomputerscience?这个奖项的来历是什么?Whatistheoriginofthisaward?如何获取这个问题的答案?Howtoobtaintheanswertothisquestion?使用新一代信息检索技术Usingnext-generationinformationretrievaltechnology从狭义上,信息资源指的是信息本身或者信息内容,即经过加工处理,对决策有用的数据。而开发利用信息资源的目的就是充分发挥信息的效用,实现信息的价值。从广义上,信息资源是指信息活动中各种要素的总称,贯穿于人类社会信息活动中从事生产、分配、交换、流通、消费的全过程。信息资源由信息生产者、信息、信息技术三大要素组成。狭义Narrowsense广义Generalized信息资源:信息本身或者信息内容,即经过加工处理,对决策有用的数据Informationresources:Informationitselforinformationcontent,thatis,datathathasbeenprocessedandusefulfordecision-making目的:充分发挥信息效用,实现信息价值Purpose:Tofullyleveragetheutilityofinformationandrealizeitsvalue信息资源:信息活动中各种要素的总称,贯穿于人类社会信息活动中从事生产、分配、交换、流通、消费的全过程Informationresources:Thegeneraltermforvariouselementsininformationactivities,whichrunthroughtheentireprocessofproduction,distribution,exchange,circulation,andconsumptioninhumansociety'sinformationactivities信息资源:由信息生产者、信息、信息技术组成Informationresources:composedofinformationproducers,information,andinformationtechnology数字信息资源Digitalinformationresources01数据库Database02网络信息资源Networkinformationresources数字信息资源Digitalinformationresources01数据库Database02网络信息资源Networkinformationresources数字信息资源产生的最早形式Theearliestformofdigitalinformationresources数字信息资源Digitalinformationresources01数据库Database02网络信息资源Networkinformationresources网络信息资源Networkinformationresources以数字化形式记录Recordindigitalform以多媒体形式表达Expressinginmultimediaform分布式存储在互联网不同主机上DistributedstorageondifferenthostsontheInternet通过计算机网络通信方式进行传递信息资源的集合Acollectionofinformationresourcestransmittedthroughcomputernetworkcommunication网络信息资源Networkinformationresources计算机技术Computertechnology通信技术Communicationstechnology多媒体技术Multimediatechnology互联网上可查找、可利用的信息资源InformationresourcesavailableontheInternet信息资源检索InformationResourceRetrieval将信息资源按一定方式组织和存储Organizeandstoreinformationresourcesinacertainway针对信息用户的特定需求查找出所需信息内容Findtherequiredinformationcontentbasedonthespecificneedsofinformationusers信息资源检索过程InformationResourceRetrievalProcess01信息指引和存储过程Informationguidanceandstoredprocedures02信息的需求分析和检索过程AnalysisofInformationNeedsandRetrievalProcess信息资源检索方式Informationresourceretrievalmethods01分类检索Categoricalsearch02主题检索Topicsearch03作者检索AuthorSearch04名称检索NameSearch05号码检索NumberSearch搜索引擎Searchengine网络信息检索工具Networkinformationretrievaltool网络爬虫技术Webcrawlertechnology大数据处理技术Bigdataprocessingtechnology自然语言处理技术Naturallanguageprocessingtechnology网页处理技术Webprocessingtechnology检索排序技术Retrievalandsortingtechniques为信息检索用户提供快速、高相关性的信息服务Providefastandhighlyrelevantinformationservicesforinformationretrievalusers全球最大的中文搜索引擎Theworld'slargestChinesesearchengine全球最大的中文网站Theworld'slargestChinesewebsite百度Baidu布尔逻辑检索Booleansearch布尔逻辑搜索Booleansearch布尔检索法BooleanSearchConcepts利用布尔逻辑运算符连接各个检索词UsingBooleanlogicaloperatorstoconnectvarioussearchterms由计算机进行相应逻辑运算Performcorrespondinglogicaloperationsbycomputers使用面最广Widelyused使用频率最高Thehighestfrequencyofuse“关键词1”+“|”+“关键词2”Keyword1+"|”+Keyword2或搜索Orsearch搜索包含“数字”或包含“中国”的内容Searchforcontentcontaining'numbers'or'China'“关键词1”+“|”+“关键词2”Keyword1+"|”+Keyword2或搜索Orsearch搜索包含“数字”或包含“中国”的内容Searchforcontentcontaining'numbers'or'China'“关键词1”+“空格”+“关键词2”Keyword1+"Space"+Keyword2和搜索Andsearch搜索包含“数字”、“中国”的内容Searchforcontentcontaining"numbers"and"China"“关键词1”+“空格”+“关键词2”Keyword1+"Space"+Keyword2

和搜索Andsearch搜索包含“数字”、“中国”的内容Searchforcontentcontaining"numbers"and"China"“关键词1”+“空格”+“-不想包含的关键词2”Keyword1+"Space"+"-unwantedkeyword2不含某个词搜索Searchwithoutaspecificword搜索包含“数字中国”而不包含“百科”的结果Searchresultsthatinclude'DigitalChina'butnot'Encyclopedia'“关键词1”+“空格”+“-不想包含的关键词2”Keyword1+"Space"+"-unwantedkeyword2不含某个词搜索Searchwithoutaspecificword搜索包含“数字中国”而不包含“百科”的结果Searchresultsthatinclude'DigitalChina'butnot'Encyclopedia'在关键词外加双引号“”Adddoublequotationmarkstokeywords“”不拆分搜索Donotsplitsearch搜索包含“数字中国”完整关键词的结果Searchresultscontainingthecompletekeyword'DigitalChina'在关键词外加双引号“”Adddoublequotationmarkstokeywords“”不拆分搜索Donotsplitsearch搜索包含“数字中国”完整关键词的结果Searchresultscontainingthecompletekeyword'DigitalChina'“关键词”+“空格”+“filetype:”(英文半角:)+文件格式pdf/doc/xls/pptKeywords+spaces+filetype:+fileformatpdf/doc/xls/ppt指定搜索某种格式的文件Specifytosearchforfilesinacertainformat搜索包含数字中国的ppt文档SearchforPPTdocumentscontainingDigitalChina“关键词”+“空格”+“filetype:”(英文半角:)+文件格式pdf/doc/xls/pptKeywords+spaces+filetype:+fileformatpdf/doc/xls/ppt指定搜索某种格式的文件Specifytosearchforfilesinacertainformat搜索包含数字中国的ppt文档SearchforPPTdocumentscontainingDigitalChina“intitle:”+“关键词”Intitle:+"Keywords在标题中设置关键字搜索Setkeywordsearchinthetitle搜索结果中所有标题中都包含“数字中国”这个关键词Alltitlesinthesearchresultscontainthekeyword'DigitalChina'“intitle:”+“关键词”Intitle:+"Keywords在标题中设置关键字搜索Setkeywordsearchinthetitle搜索结果中所有标题中都包含“数字中国”这个关键词Alltitlesinthesearchresultscontainthekeyword'DigitalChina'“关键词”+“空格”+“site:”(英文半角:)+“网址”Keywords+spaces+"site:"(Englishhalfwidth:)+"URL"在指定网站搜索Searchonthedesignatedwebsite在政府官方网站里面搜索包含“数字中国”的结果Searchforresultscontaining'DigitalChina'ontheofficialgovernmentwebsite“关键词”+“空格”+“site:”(英文半角:)+“网址”Keywords+spaces+"site:"(Englishhalfwidth:)+"URL"在指定网站搜索Searchonthedesignatedwebsite在政府官方网站里面搜索包含“数字中国”的结果Searchforresultscontaining'DigitalChina'ontheofficialgovernmentwebsite搜索到大量关于“数字中国”的信息内容Foundalargeamountofinformationabout'DigitalChina'迎接数字时代,激活数据要素潜能,推进网络强国建设,加快建设数字经济、数字社会、数字政府,以数字化转型整体驱动生产方式、生活方式和治理方式变革。“数字中国”建设是时代的必然选择。Embracingthedigitalage,activatingthepotentialofdataelements,promotingtheconstructionofastrongcybernation,acceleratingtheconstructionofadigitaleconomy,digitalsociety,anddigitalgovernment,anddrivingtheoveralltransformationofproduction,lifestyle,andgovernancethroughdigitaltransformation.Theconstructionof'DigitalChina'isaninevitablechoiceofthetimes.截词检索TruncationRetrieval利用计算机特有的指定位对比判断功能,使不完整词能与标准词进行比较、匹配的一种检索Aretrievalmethodthatutilizestheuniquedirectionalcomparisonandjudgmentfunctionofcomputerstocompareandmatchincompletewordswithstandardwords按截断位置分类Classifybytruncationposition01后截断Posttruncation02前截断Fronttruncation03中截断Intermediatetruncation位置检索Locationsearch邻近检索Nearbysearch常用位置算符Commonpositionoperators01(W)与(nW)(W)with(nW)02(N)与(nN)(N)wit(nN)03(X)与(nX)(X)with(nX)元搜索引擎Metasearchengine多搜索引擎Multiplesearchengines元搜索引擎Metasearchengine多搜索引擎Multiplesearchengines通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作Assistusersinselectingandutilizingsuitablesearchenginesfrommultiplesearchenginesthroughaunifieduserinterfacetoachieveretrievaloperations对分布于网络的多种检索工具的全局控制机制Globalcontrolmechanismformultipleretrievaltoolsdistributedacrossthenetwork元搜索引擎Metasearchengine01检索请求提交机制Searchrequestsubmissionmechanism02检索接口代理机制Searchinterfaceproxymechanism03检索结果显示机制Searchresultdisplaymechanism01030204元搜索将最大化用户数据的价值Metasearchwillmaximizethevalueofuserdata元搜索将与硬件设备、语音、图像等结合更紧密,为用户在元宇宙中的生活提供便捷服务Metasearchwillbemorecloselyintegratedwithhardwaredevices,voice,images,etc.,providingconvenientservicesforusers'livesinthemetaverse

元搜索将会融合搜索与推荐技术,全方位融入用户的生活和工作场景中Metasearchwillintegratesearchandrecommendationtechnologies,fullyintegratingintousers'dailylivesandworkscenarios元搜索对数据流的整合、加工和利用,为各行各业的企业用户带来极大价值Metasearchintegrates,processes,andutilizesdatastreams,bringinggreatvaluetoenterpriseusersinvariousindustries元搜索的特点CharacteristicsofMetaSearch网络搜索Networksearch获取信息的便利手段Convenientmeansofobtaininginformation注意信息安全问题Payattentiontoinformationsecurityissues不侵犯别人知识产权Notinfringingonothers'intellectualpropertyrights保护好自身信息安全Protectyourowninformationsecurity问题讨论Problemdiscussion信息检索技术的基本原理、基本方法有哪些?Whatarethebasicprinciplesandmethodsofinformationretrievaltechnology?专业平台信息检索Professionalplatforminformationretrieval信息技术信息技术informationtechnologyInformationTechnology小杨时间紧、任务重,资料需网上查阅Timeistight,tasksareheavy,andmaterialsneedtobesearchedonline参差不齐Uneven错误信息Errormessage参差不齐Uneven错误信息Errormessage对主题内容进行检索Retrievethetopiccontent借鉴文献的实践和理论PracticeandTheoryofReferenceLiterature探索方向是对的,具体如何操作?Theexplorationdirectioniscorrect,howtooperateitspecifically?什么是垂直搜索引擎?Whatisaverticalsearchengine?垂直搜索引擎Verticalsearchengine分析挖掘Analysisandmining过滤筛选Filterandfilter定位精准Accuratepositioning垂直搜索引擎Verticalsearchengine垂直搜索引擎数据Verticalsearchenginedata所处行业相关站点Industryrelatedwebsites自身平台的搜索被认为是“站内搜索”Thesearchonone'sownplatformisconsideredas"internalsearch"垂直搜索引擎数据Verticalsearchenginedata所处行业相关站点Industryrelatedwebsites自身平台的搜索被认为是“站内搜索”Thesearchonone'sownplatformisconsideredas"internalsearch"结构化Structured格式化Format提取结构化信息Extractstructuredinformation人工Artificial半人工Semiartificial人工半人工智能化Intelligentization非结构化信息提取技术取得重大进展,得到有效应用Significantprogresshasbeenmadeinunstructuredinformationextractiontechnology,whichhasbeeneffectivelyapplied提取结构化信息个性化、社会化Personalizationandsocialization实时性Realtimeperformance数据挖掘分析、BI、报表Datamininganalysis,BI,reporting010203信息来自某一特定领域,比起通用搜索引擎漫无边际的信息抓取,有个非常大的优势,就是信息实时性;Theinformationcomesfromaspecificfield,andcomparedtotheendlessinformationcrawlingofgeneralsearchengines,thereisagreatadvantage,whichisthereal-timeinformation;行业历史发展、最新动向、趋势是行业从业人员非常关注的话题;Thehistoricaldevelopment,latesttrends,andtendenciesoftheindustryaretopicsofgreatconcerntoindustrypractitioners;查询服务只是垂直搜索引擎一部分,垂直搜索引擎在用户的个性化方向的发展很重要;Queryservicesareonlyapartofverticalsearchengines,andthedevelopmentofverticalsearchenginesinthepersonalizeddirectionofusersisveryimportant;多元化查询Diversifiedquery智能化语义网IntelligentSemanticWeb0405语义网(semanticweb)有可能成为下一代互联网,此类网络上的数据和信息将被计算机程序所理解;ThesemanticwebislikelytobecomethenextgenerationInternet,andthedataandinformationonthiskindofnetworkwillbeunderstoodbycomputerprograms;目前的搜索引擎,局限于关键字搜索,主要原因:对用户的查询需求无法建模,无法模式化。Thecurrentsearchenginesarelimitedtokeywordsearches,mainlyduetotheinabilitytomodelandpatternuserqueryneeds.01求职搜索Jobsearch02音乐搜索Musicsearch03视频搜索Videosearch04新闻搜索Newssearch垂直搜索引擎应用方向Verticalsearchengineapplicationdirection05图书搜索Booksearch06地图搜索Mapsearch07财经搜索Financialsearch08图片搜索Imagesearch常见文献垂直搜索引擎Common

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论