信息可视化检索课件_第1页
信息可视化检索课件_第2页
信息可视化检索课件_第3页
信息可视化检索课件_第4页
信息可视化检索课件_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息可视化检索1信息可视化检索1什么是信息可视化?信息可视化就是利用计算机支撑的、交互的、对抽象数据的可视表示,来增强人们对些抽象信息的认知。可视化是这样一个过程,它将信息转化为一种视觉形式,充分利用人们对可视模式快速识别的自然能力去进行观测、浏览、识别和理解信息。在这个过程中,人们利用计算机系统从屏幕上观察交互图形、图像并通过可视模型处理信息。信息可视化的任务在于搜索、发现信息之间的关系和信息中隐藏的模式。2什么是信息可视化?信息可视化就是利用计算机支撑的、交互的、对信息可视化参考模型3信息可视化参考模型3信息可视化检索的概念信息可视化检索是指把文献信息、用户提问、各类情报检索模型以及利用检索模型进行信息检索的过程中不可见的内部语义关系转换成图形,在一个二维或三维的可视化空间中显示出来。4信息可视化检索的概念信息可视化检索是指把文献信息、用户提问、信息可视化检索的特点检索过程透明化。检索结果输出高效性。更为有效的结果集排序机制。有效的用户反馈机制。检索过程的连续性、可逆性。5信息可视化检索的特点5整个可视化检索的过程世界计算计算法匹配数据转换地图图片用户解释数据和模型的有效性检测数据预处理产生图像的系统化方法图像处理技术6整个可视化检索的过程世界计算计算法匹配数据转换地图图片用户解为什么要研究可视化信息检索

20世纪90年代,因特网的迅速发展与普及为信息检索开创了新局面。用户可以在浏览器上直接获取信息而无需知道繁琐的检索命令和复杂的命令格式。然而,普通浏览器是一种获取信息的有效途径,但不是信息检索的最佳方法。常规浏览器在因特网上检索信息使人们处于两难的境地:一方面看到因特网是最大的信息资源网络,到处都是信息;另一方面,用户所需的信息又很难找到。7为什么要研究可视化信息检索20世纪90年代,因特网目前的网络检索系统在与用户交互上存在许多不足:

检索界面单一缺乏对相关文档间关系的揭示机制没有从用户的信息获取行为角度出发提供多种结果操作功能目前的检索工具并不提供具备满足探索型检索需求的结果文档没有考虑到用户的检索需求将随着检索结果的浏览而发生改变忽略了人在浏览选取检索出的结果文档时的交互作用8目前的网络检索系统在与用户交互上存在许多不足:

检索界面单一于是人们开始研究可视化技术、设计智能代理、进行网络信息资源的数据挖掘。在实践中人们深切的认识到:利用可视化、智能化的检索技术势在必行。同时可以看到信息检索的可视化、智能化必将信息检索技术推向一个崭新的阶段。9于是人们开始研究可视化技术、设计智能代理、进行网络www信息检索的可视化基于链接关系的检索

基于链接关系的浏览可视化的实现是由用户提供一个入口网址,把与该网址有链接关系的web网页可视化地显示出来,这种方法充分利用了web本身的以节点代表网页、以连线代表链接的图状结构可视化显示。目前在基于链接关系的浏览界面可视化中,根据显示的图状结构可分为层次状和网状两大类型。层次状的代表有双曲线浏览技术(HyperbolicTree)和圆锥树(ConeTree)。网状结构的代表是由Touchgraph提供的java小程序GoogleBrowser。10www信息检索的可视化基于链接关系的检索10双曲线浏览(HyperbolicTree)技术

双曲线浏览技术在基于双曲线的圆形平面区域内显层次结构信息,在相同的空间里,采用双曲线浏览技术显示的信息是普通二维技术的10倍。根在树的中间向外呈扇形扩展,当用户选择下游节点时,该节点被推到中心,同时放大其视图及细节信息。这种技术能帮助用户从整体上理解数据资源,并通过提供感兴趣部分的细节信息,使用户可以对指定的信息进行深入的分析。双曲线树技术被用于开发浏览器、网站地图以及其他针对大型层次结构信息的可视化工具。特别适合浏览图库、文件系统、数据仓库、Web信息资源及其空间链接结构所包含的数据。11双曲线浏览(HyperbolicTree)技术圆锥树(ConeTrees)技术

ConeTrees使用三维空间来描述等级信息,根节点或者放置在空间(锥形树)的顶端,或者放置在空间(凸轮树)的最左端,子节点均匀地分布在根节点的下面或者右面的锥形延展部分。节点的标识有一部分是透视的,这是为了表明节点间的空间分布,且不易于造成视觉上的混乱。ConeTrees不是静态的显示,当用户用鼠标点击了某个节点,这个选中的节点会高亮度显示,同时这个树结构发生旋转,将该节点旋转到图形的前方。一个完整的ConeTrees图形能够持续旋转,使得用户可以观察大型等级结构,理解其中的关系。12圆锥树(ConeTrees)技术Cone谷歌浏览器GoogleBrowser

它可以通过浏览Google的数据库,绘出以某一站点为中心的所有相关联的站点的关联图。由用户输入起始URL来指定浏览起点,然后由Google将与该URL有链接关系的网页搜索后返回,根据链接关系以互相连接的网状图显示,组成了一个事实上的Web地形图。以不同的颜色及连线宽度的变化来代表网站的相似度,点击某一站点的提示小图标,可以看到其基本信息和在Google中的目录分类。这个关联图是动态的,可以实现互动,在双击某一站点后,过几秒,它就像一个巨大的蜘蛛开始缓慢地运动,绘制出以此站点为中心派生出来的新的关联图,实现动态浏览。13谷歌浏览器GoogleBrowser它可基于SOM的检索

基于SOM(selforganizingmap)的浏览界面是一种地图概念式的图形接口。SOM以直观的、图形化的方式来显示文本信息中的重要主题概念,被认为是组织大信息空间的最有效算法。SOM的目标在于把输入数据或信号的各种特征加以抽象和组织,把它们归并到不同的类目中,并用简单的几何关系表示出来。14基于SOM的检索14www信息检索的可视化SOM原理图

InputPatternInputLayerOutputLayer15www信息检索的可视化SOM原理图InputPattern基于分类的主题浏览为了能让用户在浏览过程中快速找到所需要的信息,可将信息按其包含的语义内容分类,指明信息资源方位与联系,缩小用户浏览的范围。如AntarcticSystem公司开发的VisualNet,它以可浏览的主题地图来显示各种信息(Office文档、Web页、Email等),并可将如文档类型、日期、文件大小等可以快速帮助用户定。位所需要信息的元数据信息显示出来,用户通过点击地图上的相关类目来发现信息。它已广泛运用于图书馆、政府部门、网络信息提供者及搜索引擎。16基于分类的主题浏览为了能让用户在浏览过程中快速-感谢您的关注!17-感谢您的关注!17信息可视化检索18信息可视化检索1什么是信息可视化?信息可视化就是利用计算机支撑的、交互的、对抽象数据的可视表示,来增强人们对些抽象信息的认知。可视化是这样一个过程,它将信息转化为一种视觉形式,充分利用人们对可视模式快速识别的自然能力去进行观测、浏览、识别和理解信息。在这个过程中,人们利用计算机系统从屏幕上观察交互图形、图像并通过可视模型处理信息。信息可视化的任务在于搜索、发现信息之间的关系和信息中隐藏的模式。19什么是信息可视化?信息可视化就是利用计算机支撑的、交互的、对信息可视化参考模型20信息可视化参考模型3信息可视化检索的概念信息可视化检索是指把文献信息、用户提问、各类情报检索模型以及利用检索模型进行信息检索的过程中不可见的内部语义关系转换成图形,在一个二维或三维的可视化空间中显示出来。21信息可视化检索的概念信息可视化检索是指把文献信息、用户提问、信息可视化检索的特点检索过程透明化。检索结果输出高效性。更为有效的结果集排序机制。有效的用户反馈机制。检索过程的连续性、可逆性。22信息可视化检索的特点5整个可视化检索的过程世界计算计算法匹配数据转换地图图片用户解释数据和模型的有效性检测数据预处理产生图像的系统化方法图像处理技术23整个可视化检索的过程世界计算计算法匹配数据转换地图图片用户解为什么要研究可视化信息检索

20世纪90年代,因特网的迅速发展与普及为信息检索开创了新局面。用户可以在浏览器上直接获取信息而无需知道繁琐的检索命令和复杂的命令格式。然而,普通浏览器是一种获取信息的有效途径,但不是信息检索的最佳方法。常规浏览器在因特网上检索信息使人们处于两难的境地:一方面看到因特网是最大的信息资源网络,到处都是信息;另一方面,用户所需的信息又很难找到。24为什么要研究可视化信息检索20世纪90年代,因特网目前的网络检索系统在与用户交互上存在许多不足:

检索界面单一缺乏对相关文档间关系的揭示机制没有从用户的信息获取行为角度出发提供多种结果操作功能目前的检索工具并不提供具备满足探索型检索需求的结果文档没有考虑到用户的检索需求将随着检索结果的浏览而发生改变忽略了人在浏览选取检索出的结果文档时的交互作用25目前的网络检索系统在与用户交互上存在许多不足:

检索界面单一于是人们开始研究可视化技术、设计智能代理、进行网络信息资源的数据挖掘。在实践中人们深切的认识到:利用可视化、智能化的检索技术势在必行。同时可以看到信息检索的可视化、智能化必将信息检索技术推向一个崭新的阶段。26于是人们开始研究可视化技术、设计智能代理、进行网络www信息检索的可视化基于链接关系的检索

基于链接关系的浏览可视化的实现是由用户提供一个入口网址,把与该网址有链接关系的web网页可视化地显示出来,这种方法充分利用了web本身的以节点代表网页、以连线代表链接的图状结构可视化显示。目前在基于链接关系的浏览界面可视化中,根据显示的图状结构可分为层次状和网状两大类型。层次状的代表有双曲线浏览技术(HyperbolicTree)和圆锥树(ConeTree)。网状结构的代表是由Touchgraph提供的java小程序GoogleBrowser。27www信息检索的可视化基于链接关系的检索10双曲线浏览(HyperbolicTree)技术

双曲线浏览技术在基于双曲线的圆形平面区域内显层次结构信息,在相同的空间里,采用双曲线浏览技术显示的信息是普通二维技术的10倍。根在树的中间向外呈扇形扩展,当用户选择下游节点时,该节点被推到中心,同时放大其视图及细节信息。这种技术能帮助用户从整体上理解数据资源,并通过提供感兴趣部分的细节信息,使用户可以对指定的信息进行深入的分析。双曲线树技术被用于开发浏览器、网站地图以及其他针对大型层次结构信息的可视化工具。特别适合浏览图库、文件系统、数据仓库、Web信息资源及其空间链接结构所包含的数据。28双曲线浏览(HyperbolicTree)技术圆锥树(ConeTrees)技术

ConeTrees使用三维空间来描述等级信息,根节点或者放置在空间(锥形树)的顶端,或者放置在空间(凸轮树)的最左端,子节点均匀地分布在根节点的下面或者右面的锥形延展部分。节点的标识有一部分是透视的,这是为了表明节点间的空间分布,且不易于造成视觉上的混乱。ConeTrees不是静态的显示,当用户用鼠标点击了某个节点,这个选中的节点会高亮度显示,同时这个树结构发生旋转,将该节点旋转到图形的前方。一个完整的ConeTrees图形能够持续旋转,使得用户可以观察大型等级结构,理解其中的关系。29圆锥树(ConeTrees)技术Cone谷歌浏览器GoogleBrowser

它可以通过浏览Google的数据库,绘出以某一站点为中心的所有相关联的站点的关联图。由用户输入起始URL来指定浏览起点,然后由Google将与该URL有链接关系的网页搜索后返回,根据链接关系以互相连接的网状图显示,组成了一个事实上的Web地形图。以不同的颜色及连线宽度的变化来代表网站的相似度,点击某一站点的提示小图标,可以看到其基本信息和在Google中的目录分类。这个关联图是动态的,可以实现互动,在双击某一站点后,过几秒,它就像一个巨大的蜘蛛开始缓慢地运动,绘制出以此站点为中心派生出来的新的关联图,实现动态浏览。30谷歌浏览器GoogleBrowser它可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论