电子商务平台中的Web数据挖掘应用探讨_第1页
电子商务平台中的Web数据挖掘应用探讨_第2页
电子商务平台中的Web数据挖掘应用探讨_第3页
电子商务平台中的Web数据挖掘应用探讨_第4页
电子商务平台中的Web数据挖掘应用探讨_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、电子商务平台中的 Web数据挖掘应用探讨摘 要:随着In ternet的高速发展和快速普及,各种信息知识可以在网 络上获得,由于In ternet是全球性的信息服务中心,可以从中取得的 数据量难以计算,特别是电子商务平台上的客户信息量的巨大,难以从中获取有价值的信息,数据挖掘技术应运而生。介绍了Web数据挖掘定义,阐述了其在电子商务平台上的应用。关键词:Web数据挖掘;电子商务平台Web数据挖掘概述Web数据挖掘定义Web数据挖掘是指使用数据挖掘技术从 Web文档及Web服务中 自动发现并提取人们感兴趣的信息。 Web挖掘是一项综合技术,覆盖 了多个研究领域,包括 Web技术、数据库、数据挖掘

2、、计算机语言 学、信息获取、统计学以及人工智能等。Web数据挖掘不同于传统的 数据挖掘。Web数据挖掘的研究对象是以半结构化或非结构化文档为 中心的Web,这些数据没有统一的模式,不像传统数据库中的结构化 表格,数据的内容和表示互相交织,数据内容基本上没有语义信息进 行描述,仅仅依靠HTML语法对数据进行结构上的描述。Web数据挖掘分类根据不同的作用与应用对象的不同,可以把Web数据挖掘分为3 种类型:HTML标记的Web文档数据、Web文档内的连接的结构数 据和用户访问数据如服务器的log日志信息。Web内容挖掘(Web Content Mining):是指对 Web上大量文档集合的“内容”

3、进行总结、分类、聚类、关联分析以及利用Web文档进行趋势预测等,是从 Web文档内容或其描述中抽取知识的过 程。Web上的数据既有文本数据,也有声音、图像、图形、视频等多 媒体数据;既有无结构的自由文本,也有用 HTML标记的半结构数 据和来自数据库的结构化数据。Web内容挖掘可分为Web文本挖掘 和Web多媒体挖掘,针对的对象分别是 Web文本信息和Web多媒体 信息。Web结构挖掘(Web Structure Mining):由于超文本文档间的关联关系,使得 WWW不仅可以揭示文档中所包含的信息,同时 也可以揭示文档间的关联关系所代表的信息。利用这些信息可以对页面进行排序,来发现重要的页面

4、。挖掘 Web结构的目的是发现页面 的结构和Web结构,在此基础上对页面进行分类和聚类从而找到权 威页面。Web使用挖掘(Web Usage Mining):主要通过分析用户访问Web的记录了解用户的兴趣和习惯,对用户行为进行预测,以便 提供个性化的产品信息和服务。挖掘的数据是用户与Web交互过程中留下的用户访问过程的数据。Web使用记录数据除了服务器的日志 记录外还包括代理服务器日志、游览器端日志、注册信息、用户会话 信息、交易信息、Cookie中的信息、用户查询、鼠标点击流等一切用 户与站点之间可能的交互记录。Web数据挖掘的过程2.1 Web资源搜集利用抓取网页的工具爬虫(crawler

5、)和蜘蛛(spider)从Web或电 子商务网站上收集页面信息。游览页面是用户请求的页面,一个页面 中包括几个框架、图片和脚本。2.2预处理所谓数据预处理就是从原始数据集中除去那些与挖掘无关,甚至有可能影响挖掘效果的数据,同时也要对数据的属性进行必要的删 除,只留下与挖掘相关的数据属性。2.3特征抽取特征抽取对 Web文本内容的过滤和分类、聚类、自动摘要以 及用户兴趣模式发现、知识发现等具有重要作用。2.4模式发现自动地发现模式,Web挖掘所产生的知识模式,既可以是对哥 哥文档含义的概括,也可以是有关整个文档集合的结构或趋势描述。2.5模式评价最后对挖掘出的模式进行质量评价,若评价的结果满足一

6、定的 要求,则存储这一知识模式,否则返回到前面的某一步骤,分析改进 后,进行新一轮的挖掘。Web数据挖掘技术应用于电子商务平台3.1路径分析技术路经分析是一种找寻频繁访问路径的方法,它通过对Web服务器的日志文件中客户访问站点访问次数的分析,挖掘出频繁访问路 径。简而言之,就是简化路径,消除一些不必要的页面,使用户快速 需找到相应的商品。在很多情况下,中间页面会降低消费者的兴趣, 同时增加了网站的维护成本,路经分析就是对网站页面之间的关系及 超链接之间联系的分析,判断网站中最频繁访问的路径,删除其他没 有价值的页面。3.2关联规则关联分析(Association Analysis)就是从大量的

7、数据中发现项集之间有趣的联系、相关关系或因果结构,以及项集的频繁模式。关联 分析用于了解顾客的购买习惯和偏好,决定市场商品的摆放和产品的 捆绑销售策略;如淘宝网上运动服装页面上会有大量的关于运动鞋和 袜子以及相关产品的图片链接;女性杂志书籍页面中,会有不同的相 关图书,顾客可能会一起购买等等。利用关联分析还可以发现什么商 品组合,客户多半会一起购买,从而可以向客户提出推荐或把相关的 商品的链接放在一起,进而提高销售量。优化网站结构关联分析的目 的就是为了挖掘出隐藏在数据间的相互关系, 找到客户对网站上各种 文件之间访问的相互联系。可以更好地组织站点,减少用户过滤信息 的负担,并可以根据客户当前

8、的购买行为给客户提供推荐,挖掘群体用户访问页面之间的关联,进而改进电子商务网站的设计。3.3序列模式序列模式是用某时间点发现的产品购买或其他行为模式来预测将来顾客购买产品或服务类别的概率;例如,根据前一段时间里, 电子商务网站的销售情况来预测下一个阶段的销售情况。当客户在网上购买了羽毛球拍时,那么顾客会在后续的时间里会不断的购买羽 毛球,以及相应的运动用品。序列模式分析的侧重点在于分析数据间 的前后或因果关系。在电子商务数据挖掘中,应用序列模式分析技术 便于电子商务企业预测客户的行为对客户提供个性化服务。当访问者链接到电子商务网站,网站管理员可以找出这个访问者的访问序列模 式,将他可能要访问但

9、还未访问的页面放在显眼的位置。3.4分类分类用于预测哪些人会对邮寄广告和产品目录、 赠券促销手段 有反应,还可用于顾客类别划分、破产预测等。对于商业网站,根据 访问网站的客户信息和用户的访问模式得出访问网站的用户特征。对用户分类后,知道各类客户的特点爱好,就可以发现未来的潜在客户 并开展有针对性的商务活动,提供人性化的信息服务。同时,也可以 对新的客户进行分析,分类,发现新的客户属于哪一个类别,进而有 针对性的开展商务活动。3.5聚类分析聚类用于市场细分,将顾客按其行为或特征模式的相似性划分 为若干细分市场,以采取有针对性的营销策略;可以从服务器访问信 息数据中找出具有相似特性的客户组,即把有

10、相似特性的用户信息数 据合并到一起。在电子商务平台上为用户提供个性化服务, 将需求和 爱好类似的用户归为一类,从而动态地为客户定制商品的内容或提供浏览建议,同时有利于提高广告的效果,促进网上销售和提高用户忠 诚度等。4电子商务中的Web挖掘的作用4.1发现潜在客户和提高客户满意度通过挖掘相关的 Web日志,发现用户访问 Web页面的模式;通 过分析日志的规律,可以识别用户的忠诚度、喜好和满意度,可以挖 掘潜在用户,增强站点的服务竞争力。4.2优化网站结构Web挖掘有利于合理建造网站及合理设计服务器, 如辅助改进分布式网络系统的设计性能,在有高度相关的网站间提供快速有效的访 问通道;帮助更好地组

11、织设计 Web主页;帮助改善市场营销决策, 如把广告放在适当的 Web页上或更好地理解客户的兴趣,这样的知 识将有助于商家制定促销策略。4.3个性化服务,智能商务针对单个用户的使用记录对该用户进行建模, 结合该用户基本信 息分析其使用习惯、个人喜好,目的是在电子商务环境下为该用户提 供与众不同的个性化服务。根据客户所访问的商品页面内容,提供大 量同类商品的链接页面进行对比选择,满足客户的不同需求。5结束语电子商务平台就像一个可以收集海量客户信息的数据库,应用Web数据挖掘技术,分析其规律,探讨其模式,为商业决策提供有力 的支持和保证。作为实用工具,还需要进一步地分析完善。Web数据 挖掘在电子商务平台上有着不可估量的发展前景,能够指导网商进行合理的、科学地建设网站,提供个性化的服务和增强市场竞争力。参考文献::1夏火松.数据仓库与数据挖掘技术(第 2版)M 北京: 科学出版社,2009.:2洪涛.电子商务盈利

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论