网络数据挖掘(二)_第1页
网络数据挖掘(二)_第2页
网络数据挖掘(二)_第3页
网络数据挖掘(二)_第4页
网络数据挖掘(二)_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、网络数据挖掘(二)o 网络数据挖掘的分类o 网络信息内容挖掘o 网络内容挖掘即从网络的内容、数据、文档中发现有用信息的过程,这是搜索引擎在网络搜索时的访问对象,WEB内容挖掘是指对WEB页面内容进行挖掘,针对的对象分别是WEB文本信息和WEB多媒体信息 o WEB内容挖掘的重点是页面分类和聚类o 1、WEB文本挖掘文本挖掘是从非结构化的文本中发现潜在的知识。文本挖掘处理的对象主要是大量的、无结构的文本信息。文本挖掘的目的是从不同格式的文本中发现有用的知识。网络上文本数据挖掘的对象是HTML或XML的文档集。文本挖掘于数据挖掘具有一定的区别o 文本挖掘相关技术:o 文本分类:就是将自由文本文献自

2、动归入一个或多个事先定义好的类目中。o 文本聚类 它事先没有定义好的类,完全依据文献间的相似度,把文献分入到一个或多个类中。o 自动摘要 它是一门多学科高度交叉的应用,涉及自然语言处理、信息检索、统计学、认知心理学和人工智能等领域。o 文本可视化 就是用二维或三维的图形显示文献集的语义模式,使用户可以迅速的发掘出大型文献中语义关系。o 多媒体数据的挖掘o 多媒体数据挖掘的特点1、挖掘对象的复杂性2、多媒体信息 内容丰富3、时空相关性4、知识的表示和解释机制比较困难5、数据的查询和特征提取通常采用基于内容检索法o 多媒体数据特征的提取1、元数据2、文字注释特征3、内容特征4、纹理特征5、颜色特征6、形状和空间特征o 多媒体数据知识挖掘过程1、数据准备2、媒体数据知识挖掘3、知识表示与解释4、挖掘结果表示方法 挖掘的知识必须以可理解的方式呈现给用户,不同的知识用不同的表示方式,如:柱状图形、网格为底的立柱群、分类树、表格或坐标图o 网络信息结构的数据挖掘 有向连接图,典型的web结构挖掘算法o 网络数据挖掘案例分析 案例1: 我国电子商务网站访问量与链接量相关系的实证研究 o 分析与结论1、从数据分析来看。我国电子商务网站规模与访问量正相关2、我国电子商务网站网页和链接更新量与访问量正相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论