计算机Web数据挖掘技术在现代商业中的应用_第1页
计算机Web数据挖掘技术在现代商业中的应用_第2页
计算机Web数据挖掘技术在现代商业中的应用_第3页
免费预览已结束,剩余5页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机Web数据挖掘技术在现代商业中的应用[内容摘要]数据发掘是近年来随着数据库技术和人工智能技术的发展而出现的一种全新的。随着internet的普及,使web成为获取市场信息的最主要的载体。本文介绍了web数据发掘经过,以及特点,最后重点研究了web数据发掘技术现代商业中的应用。[本文关键词语]数据发掘人工智能载体一、web数据发掘概述web发掘是从web资源上抽取信息或知识的经过,它是将传统的数据发掘的思想和方法应用于web,从web文档和web活动中抽取感兴趣的、潜在的、有用的形式和隐藏信息。web发掘可在多方面发挥作用,如搜索引擎构造的发掘,搜索引擎的开发,改良和提升搜索引擎的质量和效率,确定权威页面。web发掘研究覆盖了多个研究领域,包含数据库技术、信息获取技术、统计学、人工智能中的机器学习和神经网络等。十分是电子商务领域,通过对用户特征的理解和分析,如对用户访问行为、频度、内容等的分析,提取出用户的特征,进而为用户定制个性化的界面,有助于开展有针对性的电子商务活动。二、web发掘流程以及特点发掘的流程web数据发掘就是利用数据发掘技术从网络文档和效劳中发现和提取信息。与传统数据和数据仓库相比,web上的信息是非构造化或半构造化的、动态的、而且是容易造成混同的,所以很难直接以web网页上的数据进行数据发掘,而必需经过需要的数据处理。web发掘的有下面几个经过:(1)资源发现。任务是从目的web文档中得到数据,值得留意的是有时信息资源不仅限于在线web文档,还包含电子邮件、电子文档、新闻组,或者网站的日志数据以至是通过web构成的交易数据库中的数据。〔2)信息选择和预处理。任务是从获得的web资源中剔除无用信息和将信息进行需要的例如从web文档中自动去除广告连接、去除多余格式标记、自动辨别段落或者字段并将数据组织陈规整的逻辑形式以至是关系表。〔3)形式发现。自动进行形式发现。能够在同一个站点内部或在多个站点之间进行。〔4)形式分析。验证、解释上一步骤产生的形式。能够是机器自动完成,可以以是与分析人员进行交互来完成。发掘的特点web发掘技术具有很多优点,如不需要用户提供主观的评价信息;能够处理大规模的数据量;用户访问形式动态获取,不会过时;使用方便等。但是与传统数据库和数据仓库相比,web是一个宏大、分布广泛、全球性的信息效劳中心,牵涉经济、文化、教育、新闻、广告、消费、娱乐、金融、保险、销售、电子商务等信息,内容极其丰富,数据最大特点就是半构造化;而传统的数据库中的数据构造性很强,即其中的数据为完全构造化的数据。显然,面向web的数据发掘比面向单个数据仓库的数据发掘要复杂得多,会面临许多详细问题,重要有:(1)半构造化数据。web页面以某种格式呈现的半构造化数据,其数据构造不规则或不完好,复杂水平远远高于普通的文本文档,其数据构造隐含、形式信息量大、形式变化快。大量的文档无任何排列顺序,无分类索引。(2)web是一个异质、分布、动态的信息源。web及其数据的更新、增加速度极快,也无固定的形式。web上的信息几乎都是隐藏的、潜在的、未知的,从web上发现这些未知的信息和有用的形式,仅用传统的基于关键字的检索方式很难实现,如今的搜索引擎尚不具备这些功能。(3)面对一个非常广泛的形形色色的用户群体。不同的用户访问web的兴趣、喜好和使用目的千差万别,面对一个非常广泛的形形色色的用户群体,能否使用户根据自己的喜好兴趣定制网页,以至能否根据发现的用户。自动为用户定制网页,进而提供个性化的信息检索和查询效劳。发掘在电子商务中的应用当前对于,web发掘的对象和使用的方法层出不穷,但随着电子商务网站的兴起,电子商务将是将来web发掘的重要发展方向之一,因而它在各种商业领域都存在广泛的使用价值。在当电子商务在企业中得到应用时,企业信息系统将产生大量数据,这些海量数据使数据发掘有了丰富的数据基础,同时高性能计算机和高传输速率网络的使用也给数据发掘技术提供了坚实的保障。介绍下面几个方面的应用:(1)分析查找获得潜在客户。随着以客户为中心的经营理念不断深切进入人心,分析客户、了解客户并引导客户的需求已成为企业经营的主要课题。通过对电子商务系统采集的交易数据进行分析,能够按各种客户指标(如天然属性、收入奉献交易额、价值度等)对客户分类,然后确定不同类型客户的行为形式,以便采用相应的营销办法,促使企业利润的最大化。比方通过数据发掘能够发现购买某种商品的消费者是男性还是女性,学历、收入怎样,有什么喜好,是什么职业等等。以至能够发现不同的人在购买该种商品的相关商品后多长时间有可能购买该种商品,以及什么样的人会购买什么型号的该种商品等等。也许许多因素外表上看起来和购买该种商品不存在任何联络,但数据发掘的结果却证明他们之间有联络。在采取了数据发掘后,针对目的客户发送的广告的有效性和回应率将得到大幅度的提升,推销的成本将大大降低。在对web的客户访问信息的发掘中,利用分类技术能够在internet上找到将来的潜在客户,获得这些潜在的客户市场。通常的策略是先对己经存在的访问者进行分类,一般分为三种:“nocustomer〞、“visitoronce〞“visitorregular〞。对于一个新的访问者,通过在web上的分类发现,辨别出这个客户与己经分类的老客户的一些公共的描绘叙述,进而对这个新客户进行正确的分类。然后从它的分类判定这个新客户是属于有利可图的客户群,还是属于无利可图的客户群,决定能否要把这个新客户作为潜在的客户来对待。客户的类型确定后,就能够对客户动态地展现web页面,页面的内容取决于客户与销售商提供的产品和效劳之间的关联。(2)保留客户。数据发掘能够把你大量的客户分成不同的类,在每个类里的客户拥有类似的属性,而不同类里的客户的属性也不同。你完全能够做到给不同类的客户提供完全不同的效劳来提升客户的满意度。数据发掘还能够发现具有哪些特征的客户有可能流失,这样挽留客户的办法将具有针对性,挽留客户的费用将下降。对客户来说,传统客户与销售商之间的空间间隔在电子商务中己经不存在了。在网上,每一个销售商对于客户来说都是一样的,那么怎样使客户在自己的销售站点上驻留更长的时间,对销售商来说将是一个挑战。为了到达这一目的,就应该了解客户的浏览行为,知道客户的兴趣及需求所在,动态地调整web页面,以知足客户的需要。通过对客户访问信息的发掘,就能知道客户的浏览行为,进而了解客户的兴趣及需求。在网上的电子商务中的一个典型的序列,恰好就代表了一个购物者以页面形式在站点上导航的行为,所以可运用web数据发掘中的序列形式发现技术。(3)聚类客户。在电子商务中客户聚类是一个主要的方面。通过分组具有类似浏览行为的客户,并分析组中客户的共同特征,能够帮助电子商务的组织者更好地了解自己的客户,向客户提供更合适、更面向客户的效劳。例如,有一些客户都花了一段时间浏览“babytoys〞“babyfurniture〞页面,经过分析这些客户被聚类成为一组。销售商根据分析出来的聚类信息,就知道这是一组“expectingparents〞客户,对他们所进行的业务活动当然也就不可能同于其他被聚类了的客“collegestudents〞、“officeladies〞。及时调整页面及页面内容,使商务活动能够在一定水平上知足客户的要求,对客户和销售商来说更有意义。(4)穿插销售与个性效劳。穿插销售的好处在于,对于原有客户,企业能够比较容易地得到关于这个客户的比较丰富的信息,大量的数据对于数据发掘的精确性来说是有很大帮助的。在企业所把握的客户信息,尤其是以前购买行为的信息中,可能正包括着这个客户决定他下一个购买行为的关键,以至是决定因素。这个时候数据发掘的作用就会具体表现出出来,它能够帮助企业寻找到这些影响他购买行为的因素。当客户在电子商务网站注册时,客户将会看到带有客户姓名的欢迎词〞根据客户的订单纪录,系统能够向客户显示那些可能引起客户特殊兴趣的新商品。当客户留意到一件特殊的商品时,系统会建议一些在购买中能够增长的其他商品。普通的产品目录手册经常简单的按类型对商品进行分组,以简化客户挑选商品的步骤。然而对于在线商店,商品分组可能是完全不同的,它经常以针对客户的商品补充条目为基础,不仅考虑客户看到的条目,而且还考虑客户购物篮中的商品,结果就会使推荐愈加个性化。三、结束语随着计算机技术的迅猛发展和internet资源的快速增加,十分是电子商务的兴起,web发掘成为21的热门研究领域之一,其研究具有广阔的应用前景和宏大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论