基于关联规则的客户满意度提升分析_第1页
基于关联规则的客户满意度提升分析_第2页
基于关联规则的客户满意度提升分析_第3页
基于关联规则的客户满意度提升分析_第4页
基于关联规则的客户满意度提升分析_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本科毕业论文(设计) 论文(设计)题目:基于关联规则的客户满意度提升分析 学 院: 职业技术学院专 业: 市场营销 班 级: 市场职08(1) 学 号: 082002110356 学生姓名: 付瑾 指导教师: 杨 琼 2012年5 月 30日贵州大学本科毕业论文(设计)诚信责任书本人郑重声明:本人所呈交的毕业论文(设计),是在导师的指导下独立进行研究所完成。毕业论文(设计)中凡引用他人已经发表或未发表的成果、数据、观点等,均已明确注明出处。特此声明。论文(设计)作者签名: 日 期: 目 录摘 要IIIAbstractIV1 绪论11.1客户满意度含义11.2客户满意度的影响因素11.3客户满意

2、度分析时的评价指标22 关联规则的概述32.1关联规则基本概念32.1.1关联知识挖掘32.1.2关联规则的基本概念32.2关联规则Apriori算法概述52.2.1 Apriori算法理论基础52.2.2 Apriori算法介绍53 基于Apriori算法的客户满意度分析83.1通讯业务介绍(数据来源)83.2数据挖掘在通讯业务中的应用背景83.3Apriori算法在通讯行业的应用103.3.1实例描述103.3.2 Apriori算法的应用113.3.3强关联规则结果分析154 提高客户满意度的策略174.1 基于关联规则提高客户满意度的策略174.1.1 产品策略174.1.2 价格策略

3、174.1.3 促销策略184.2关联规则在零售业中提高客户满意度的运用18结语21参考文献22致 谢23摘 要随着数据库技术的迅速发展以及数据库管理系统的广泛运用,人们对于挖掘数据背后隐藏的知识越来越重视,目前数据挖掘使数据库技术进入了一个更高级的阶段,它不仅能对过去的数据进行查询和遍历,并且能够找出过去数据之间的潜在关系,从而促进信息的传递。关联规则是数据库技术中的其中一个分支,对于零售业的发展有着至关重要的作用。关联规则挖掘在最近几年被广泛研究,它发现大量数据中项集之间的关联关系,在数据挖掘中,对于关联规则的研究是现在数据挖掘领域重要的研究方向之一。 对于企业来说,客户满意度至关重要,本

4、课题研究主要研究的是运用关联规则的挖掘算法,在实际中采集数据进行分析计算,清晰的反应出关联规则对于客户满意度提升的影响和重要性,从而为企业决策提供依据。针对当前普遍存在的问题进行改进,增加企业销售量,提高市场竞争力。关键词:数据库技术,关联规则,客户满意度AbstractWith the rapid development of database technology and the use of database management system ,the hidden knowledge of the data mining become more and more important.

5、 The current database data mining technology goes into a more advanced stage,It can not only query and traverse the past database,but also find out the potential relationship between the past data,so as to promote the transfer of information. Association rules is one branch of the database technolog

6、y,which has crucial effect for the retail industry development .Association Rules Mining is being widely used in recent years,we can use it to found out lots of association between data items. In data mining,the research on association rules in data mining area is now one of the most important resea

7、rch direction.Customer satisfaction is essential to the enterprise,The research is mainly about the application of association rules mining algorithm, and use it to analysis and calculate by collecting data,clear response the effect and importance of association rules to enhance customer satisfactio

8、n, so as to provide a basis for decision-making. Also , the research is to analysis the current common problems and improve them, so that enterprise can increase salse volume and market power. Key words: Database Technology Association Rules Customer Satisfaction Data Mining1 绪论1.1客户满意度含义客户满意是客户的一种心

9、理活动,是客户通过对一个产品或者服务的可感知效果与其期望值相比较之后形成的感觉状态。而客户满意度就可以看作是可感知效果与期望值之间的变异函数,也就是说客户满意度的高低取决于客户对于客户对产品或者服务的期望值与其所真正感知的效果,如果客户对企业的产品或者服务实际感知效果低于他们的期望值,客户就不会感到满意,甚至会产生抵触情绪;相反,如果客户的实际感知效果等于或高于他们的期望值,他们就会感到满意或者非常满意。客户对于企业的产品或者服务有了高度的满意度之后,就会忠实于此产品或服务,企业在销售和竞争过程中就处于优势地位。 对于企业来说,客户满意度至关重要,首先,客户满意有助于提高企业的利润率;其次,客

10、户满意是抵御竞争对手的有效手段;再次,客户满意有助于降低企业成本。有数据表明:平均每个不满意的客户会将其不满意的经历告诉20个人以上,而且这些人都表示不愿意接受这种恶劣的服务态度;而平均每个满意的客户会将其满意的经历告诉12个人以上,这12个人中间在没有其他因素干扰的情况下,有超过10个人表示愿意购买。由此可见,客户满意度对于企业的生存与发展来说起着至关重要的作用1。1.2客户满意度的影响因素 大量企业兴衰存亡的事实表明,客户满意度对于企业的影响深远,如何提高企业的产品质量和优质服务来提高客户满意度已经成为了企业在激励竞争中制胜的关键因素之一。通过对客户满意度基本概念的理解,客户满意度可以用以

11、下公式来表示: C=b/a2上面公式中:C客户满意度 b客户对产品或服务所感知的实际体验 a客户对产品或服务的期望值 在此公式中,如果a<b,客户对产品或服务的期望值小于他们所感知的实际体验,客户满意度的值就越大,客户对产品或服务就会感到非常满意。如果a=b,客户的期望值恰好等于他们的实际体验,这时候客户就会感到满意。如果a>b,客户的期望值大于实际体验,客户满意度值就越小,客户对产品或服务就会感到非常不满意。由此可见,客户满意度的影响因素是由客户对产品或服务所感知的实际体验和期望值共同决定的。它取决于客户所期望的产品或服务利益的实现程度以及反应预期与实际结果的一致性程度,当预期的

12、服务与感知的服务不一样的时候,会产生不同的客户满意度。1.3客户满意度分析时的评价指标客户对企业产品或服务的期望包括很多方面,根据马斯洛需求层次理论将企业给客户提供的东西分为四个层次3,分别是:1、核心产品或服务2、延伸服务3、所承诺服务的实现4、情感因素在上面的几个评价指标中,延伸服务和所承诺服务的实现对于提高客户满意度有着重要的作用,随着科技物流的越来越发达,竞争越来越激烈,在核心产品或服务这一层次各同类企业都具有同质性,客户对于核心产品或服务的满意度都是较为满意的,所以在这一层上都是不分彼此的;而延伸服务这一层每个企业所采取的战略措施不同,所产生的外围和支持性的服务也就 不同,这样就同别

13、的企业所区别开来,从而提高客户满意度;所承诺服务的实现,是指企业能否将自己所提供核心产品和服务做好,这一层就需要企业加强内部管理,做的让客户满意的程度;情感因素这一层是服务的感性方面,在这一层中考虑企业传递给客户的某些微妙信息,这些信息将使客户对企业产生正面或者负面的情绪。2 关联规则的概述2.1关联规则基本概念关联规则挖掘在最近几年被广泛研究,它发现大量数据中项集之间的关联关系,在数据挖掘中,对于关联规则的研究是现在数据挖掘领域重要的研究方向之一。2.1.1关联知识挖掘关联知识挖掘是数据挖掘常用的知识表示模式与方法之一。数据挖掘常用的知识表示模式与方法包括:广义知识挖掘、关联知识挖掘、类知识

14、挖掘、预测型知识挖掘与特异型知识挖掘4。这里我们主要介绍关联知识挖掘,关联知识反映一个事件与其他事件之间的依赖和关联。数据库的组织形式是一种机构化的,利用其依附的数据模型可能刻画了数据间的关联,但是,除了数据间的这种关联之外,数据间的关联是十分复杂的,且大部分都是蕴藏的,关联知识挖掘就是找出数据间蕴藏的关联知识部分。通过数据关联分析所获得的关联关系,对于企业来说是十分具有商业价值的。关联规则挖掘时关联知识发现的最常用的方法,最著名的是1994年,Agrawal等人在之前的工作基础上,提出一个称为Apriori的关联规则挖掘算法。为了发现有意义的关联规则,需要给定两个阈值,也就是最小支持度和最小

15、置信度。挖掘出的关联规则必须满足用户给定的最小支持度,它表示一组关联在一起需要满足的最低联系程度,也就是说,数据挖掘系统的目的就是从源数据库中挖掘出满足最小支持度和最小置信度的关联规则。Apriori算法一直作为经典的关联规则挖掘算法被引用。但它只是关联规则挖掘算法之中的一种算法,其他的算法还包括了AprioriTid算法、FP-Tree算法等等5。 2.1.2关联规则的基本概念 关联规则表示数据库中一组对象之间某种关联关系的规则。假设I=i1,i2,、in为n个不同项目组成的集合,另设一个给定事务数据库D,其中每个事务T是一些项目的集合,即TI,T有一个标示符TID。若项集AI且AT,则事务

16、集T包含项集A6。关联规则就形如AB的蕴涵式,其中AI,BI,并且AB=。当然,并不是所有的关联规则都是有用的,它有着一定的成立条件,如下所示:1.它具有支持度S,其中是指设有S%的事务在D中支持项目集A和B,即D中至少有S%的事务包含AB。 2.它具有置信度C,C表示在D中有C%的事务支持A的同时也支持B,即D中包含A的事务知识有C%同时也包含B。 关联规则的评价标准主要是支持度和置信度,支持度对关联规则的重要性(适用范围)的衡量,表示这条规则的频度。支持度说明这条规则在所有事务中有多大的代表性和适用性,支持度越大,则关联规则越重要,说明这条规则应用越广泛。置信度是对关联规则准确度的衡量,表

17、示关联规则的强度。支持度和置信度两个阈值是描述关联规则的两个重要概念,关联规则的挖掘问题就是在事务数据库D中找出具有用户给定的最小支持度min-sup和最小置信度min-conf的关联规则。其中:最小支持度min-sup表示项目集在统计意义上的最低重要性。最小置信度min-conf表示规则的最低可靠性。那些超过最低支持度阈值和最低置信度阈值的规则,称为强关联规则。如果用P(A)事务中出现物品集A的概率 P(B/A)物品集A的事务中,出现物品集B的概率,它们的表达式分别为 支持度:support(AB)=P(AB) 置信度:confidence(A)=P(B/A)7 一个项目集的出现频度是指该项

18、目集的支持度,也就是整个交易数据集D中包含该项目集的交易记录数。如果项目集的出现频度大于或等于最小支持度与D中事务总数的乘积,则该项目集满足最小支持度。如果项目集A大于或者等于最小支持度(满足最小支持度),则称为频繁项目集频繁k-项目集的集合记为Lk。相反地,如果A小于最小支持度,则称为非频繁项目集。 候选项目集市潜在的频繁项目集的集合,是频繁(k-1)-项目集的超集。含有k项的候选项目集记为Ck,由它构成频繁k-项目集Lk。2.2关联规则Apriori算法概述2.2.1 Apriori算法理论基础 Apriori算法是通过项目集元素数目不断增长来逐步完成项目集发现的。Apriori算法一般可

19、分为两个阶段: 第一步是迭代识别所有的频繁项目集,要求频繁项目集的支持度不低于用户设定的最小支持度。识别或发现所有项目集是关联规则最核心的部分,同时也是计算量最大的部分。 第二步是从频繁项目集中构造置信度不低于用户设定的最小置信度的规则。即首先产生1-频繁项目及L1,然后产生2-频繁项目集L2,知道不能再扩展频繁项目集的元素数目而算法停止。在第k次循环中,先产生k-候选项目集的集合Ck,然后通过扫描数据库生成支持度并测试产生k-频繁项目集Lk,为了使算法效率得到提高,一般采用更为简洁的推论对候选项集进行修剪8。推论:若x是一个k一项目集,如果x是频繁项目集,则x中所有包含项目数为K一1的子集都

20、是频繁项目集。 根据推论,Apriori算法由频繁(k一1)一项目集的集合Lk1产生候选k项集的集合Ck,Ck中任何一个候选k一项集中包含项目数为k一1的子集必须包含在Lk-1中。这样产生的候选k-项目集的集合Ck与所有k-频繁项目集的集合LK满足CkLK,即不可能有频繁k-项目集被漏掉9。2.2.2 Apriori算法介绍1.生成频繁项目集 第一,事务数据库的事务都以<标识号,项>的形式存储,并且每一个事务中包括的项都按词典顺序进行排列,即按A、B、C的字母顺序排列。 第二,通过第一遍扫描数据库,生成频繁1一项集。生成的步骤是:(l)扫描每一条事务,确定每一个项的支持度:(2)把

21、事务数据库中每一个项的计数与事先指定的最小支持度(min-sup)进行比较,保留计数大于最小支持度的项。 第三,通过频繁(k一1)-项集生成频繁k-项集。生成的步骤是:(l)连接步。假定生成了频繁(k一l)-项集,则通过频繁(k一1)-项集的自连接生成侯选的频繁k-项集。(2)剪枝步。对候选集进行修剪,候选k-项集的子集必须包含在频繁(k一1)-项集中;(3)确定候选k-项集的支持度。将所有支持度大于用户给定的最小支持度的k-项集加入频繁k-项集的集合中。2.生成关联规则 如果给定了一个频繁集Y=i1,i2,.,ik,k2,iJi只需产生包含集合i1,i2,.,ik中的项的所有规则:XY。X和

22、Y都是I中项的一个子集。通过上面的步骤,可能生成大量的关联规则,所以当规则生成后,需对生成的规则进行筛选。 (l)校验关联规则的置信度,confidence=support(XY)/sup(X)只有那些大于用户给定的最小置信度(min-conf)的规则才被保留下来。即:confidence>min-conf (2)输出关联规则XY(支持度,置信度)10。3.Apriori算法的表述算法3-1:利用根据候选项目集生成的逐层迭代来找出频繁项目集。算法:Apriori输入:事务数据库D和最小支持度阈值min-sup。输出:D中频繁项目集L。方法:(1)L1=find_frequent_1-it

23、emsets(D); (2)For(k=2;LK-1;k+); (3)Ck=Apriori_gen(Lk-1,min_sup); (4)For all transaction tD; (5)Ck=subset(Ck;t); (6)For each candidate cCk; (7)c.count+; (8)Lk=cCk|c.count>=min_sup; (9)Return L=UkLk;11 一旦从数据库D中的事务中找出频繁项目集,就可以由它们产生关联规则。算法如下所示:算法3-1:产生关联规则。输入:频繁项目集L和最小置信度阈值(min_conf)。输出:关联规则1) 对于L中的每

24、一个频繁项目集l,产生l的所有非空子集。2) 对于l的每一个非空子集s,如果, min_conf12则输出“S=>(l-S)”。 由于规则由频繁集产生,每个规则都自动满足最小支持度。因此,经过以上算法所产生的关联规则,就是所希望得到的关联规则。所有满足最小置信度的频繁集称为强关联规则。我们所要研究的部分就是强关联规则部分。3 基于Apriori算法的客户满意度分析3.1通讯业务介绍(数据来源)随着科技的不断发展,通讯领域技术越来越成熟,加上全球化进程的加快,人们对于未来经济的发展前景普遍看好。基于世界经济发展的良好势头,全球电信运营的市场规模在2010年已经超过1.65万亿美元,在200

25、6-2010年均增长率约6%13。从全球通讯业务来看,移动通信作为全球通讯市场发展的主要推动力之一,业务收入占全球电信收入比例继续上升;固定通讯虽然在市场上仍有发展潜力,但就目前的发展状况来看已经将处于停滞状态;互联网业务将继续飞速发展,到2010年已经到达20亿以上的用户。就目前中国的情况而言,从20世纪90年代以来,特别是进入21世纪开始,通讯市场迅猛发展。随着中国加入WTO,通过国际市场的开拓,引入了经济一体化和竞争机制,中国通讯运营日益成熟,产业间的优化重整升级扩张也为中国通讯业的飞速发展注入了活力,其业务发展情况主要表现在以下几个方面:(1) 需求增长、规模扩大。随着通讯用户的增多,

26、整个通讯业务的需求量持续增长。据调查显示,到2011年7月底,全国通讯业务收入为5103.9亿元,比2010年同期增长10.1%。其中以移动通讯业务发展最为明显,占据通信业务的半壁江山。通信需求的持续旺盛推动了我国电信网络规模的不断扩大。(2) 业务趋向个性化、多元化。随着通讯科技的快速发展,我国通讯业务市场结构发生了巨大的变化,新的业务增长点逐渐形成,并取得了突破性的进展,主要表现有:新业务的增长如3G业务的发展逐渐普及,3G网络建设成为通讯投资市场发展的主要推动力。互联网及宽带业务,如移动互联网的接入、互联网内容和应用服务、有线/无线宽带互联网接入等发展迅速,将成为驱动互联网市场发展的主要

27、推动力。移动通讯成为通讯业务发展的亮点,传统业务如固定通信等市场份额将呈下滑趋势。(3) 全方位竞争格局正在形成。自从加入WTO之后,我国市场对外开放,外资企业不断涌入我国,按照加入世贸组织是的承诺,从2003年1月11日起,北京、上海、广州三地首先对外资进入基础电信业务打开闸门;截止2007年年底,外资股比可达49%,并将取消地域限制,这对本土企业是一个严峻的挑战。(4) 运营商将先后实施战略转型。随着科技的发展和技术的更新,竞争越来越激烈全球一流通讯运营商已纷纷推出转型战略。例如德国提出要成为欧洲成长最快的综合电信运营商及领先的服务公司;应该提出要成为最优秀的综合信息通信服务商;中国也于2

28、005年提出了由传统网络运营商向综合信息服务提供商转变。运营商的转型将是未来通讯运营市场的重要特征,战略转型也是为了适应市场变化的需要也是运营商自身发展的需要,更重要的是,通过转型尝试,运营商业体会到了转型带来的好处,促进了业务的增长14。3.2数据挖掘在通讯业务中的应用背景通讯业务的主要特点是数据信息量大,业务系统众多,数据繁杂,传统的信息处理方式已经不能满足通讯发展的需要,必须要引入新的技术来支持企业业务的需要,因此,数据挖掘在通讯行业的成功应用已成为必然15。通讯行业积累了大量的数据资源可供挖掘。经过多年的发展,通讯行业的信息进程取得了巨大的成功。各大运营商通过已建立或者正在建立的多种数

29、据平台累积了大量的数据信息资源,这些数据都是以电子化的方式存储,通过数据仓库,我们可以从这些数据中得到很多有价值的信息。然而,这些数据信息在运营商手里只是被简单的运用在各种业务系统中,并没有得到有效的开发利用,如何利用这些信息来建立决策支持服务,更进一步了解客户的需求,针对客户的需要提供有效业务,从而扩宽通讯业务,促进通讯业务的进一步发展,成为当前信息数据挖掘的当务之急。数据挖掘有利于提高各通讯行业的市场竞争力。随着全球化进程的加速,通讯行业的竞争格局发生了重大的变化,从以前的只有少数几个企业之间的竞争,变为现在众多的通讯企业对全球市场的争夺,竞争的越发激烈。为了在激烈的竞争中保持优势,必修对

30、通讯市场的业务运转情况保持高度的警惕,并且随时准备调整竞争策略。通过数据挖掘技术的帮助,运营商可以充分利用拥有的宝贵的数据资源,建立专门面向客户、分析全面业务指标、实施垂直一体化管理的数据挖掘体系,并通过先进的网络技术,向面向经营管理、市场部、大客户发展等部门提供业务咨询、业务分析、营销策略的制定等全业务、个体化综合咨询服务。数据挖掘是争夺客户资源的重要手段。通讯行业间的竞争越来越激烈,客户的选择余地就越来越大,对于客户资源的管理也越来越重要。调查表明:每年有1/3的左右的客户流失到竞争对手那里,而争取、吸引一个新的客户的费用是保住现有客户的515倍。除此之外,在技术不断的更新发展的影响之下,

31、通讯业务的市场不断扩大,业务的需求量也不断增长,大大的吸引了新的运营商的加入,激发了竞争的积极性。面对这么激烈的竞争,企业必须借助数据挖掘的手段,随时了解掌握客户的动态,提高客户满意度,在发展新客户的同时也能留住老客户,实现企业经济效益的不断增长。3.3Apriori算法在通讯行业的应用 3.3.1实例描述 前面提到,满足最小支持度的同时也满足最小置信度的关联规则称为强关联规则,强关联规则是我们所希望发现的关联规则。 表1-1是某通讯公司随机抽取的500条中低端用户(年龄:20-45岁;收入:800-2000元;申请套餐前了解渠道:互联网)数据作为此次模拟实验数据源。数据源来自通信中的话费计费

32、数据库,以月话费大于50元,小于等于100元的中低端为例进行挖掘。提取内容如下:类型代码月租30元A市话50元B长途50元C漫游15元D短信10元E流量10元F彩铃5元G 表1-1 用户呼叫模式表 数据工作准备完成后,就形成了关联分析中的交易集T,T=t1,t2,t3,.,tn,其中每个t代表了一个用户呼叫模式。 表1-2是模拟实验样本数据集的一个片段,数据集有两列,第一列是主叫号码,第二列是用户的呼叫模式。 表1-2 模拟实验样本数据用户主叫号码呼叫模式1559023C D E1551433A B C E F1559253A G E 1553422A D F B D F G B D E A

33、B C A B F G D G C D G A B E G B F B C D A B F A B D F B C D E G1551913A B C D1552788B C E1552969A B C E1554623A C F表1-2中的第二列“呼叫模式”字段内容,形成交易集T,其中的每个“呼叫模式”记录组成了交易集T中的一个记录。然后将交易集T作为数据源,运用到Apriori算法中生成频繁项集。3.3.2 Apriori算法的应用根据上面的销售数据,我们要运用Apriori算法挖掘出其中的关联规则。我们假定最小支持度为:min_sup=20%,最小置信度min_conf=65%。具体步骤

34、如下:(1) 使用候选项集生成频繁集 利用Apriori算法挖掘关联规则的过程如下: 在算法的第一次迭代,每个项都是候选1-项集的集合C1的选项。简单扫描整个数据库,对每个项的出现次数计数。 在假定min_sup=20%的前提下,扫描整个数据库,可以确定频繁1-项集的集合L1。它是由最小支持度的候选1-项集组成。 为发现频繁2-项集的集合L2,算法使用L1L1产生候选2-项集合C2。 扫描T中事务数据库,计算C2中每个候选项集的支持计数。 确定频繁2-项集的集合L2,它具有最小支持度C2中的选项2-项集组成。 候选项集C3的产生详细过程如下: A、连接:C3=L2L2= A,B,A,C,A,E

35、,A,F,B,C,B,D,B,E,B,F, B,G,C,D,C,E A,B,A,C,A,E,A,F,B,C,B,D,B,E,B,F, B,G,C,D,C,E = A,B,C,A,B,E,A,B,F,A,B,D,A,B,G,A,C,E,A,C,F,A,C,D,A,E,F,B,C,D,B,C,E,B,C,F,B,C,G,B,D,E,B,D,F,B,D,G,B,F,G,C,D,E B、使用Apriori性质剪枝:频繁项集的所有子集必须是频繁的。A,B,C所有的2-项集子集A,B,A,C,B,C都是L2的元素。因此保留在C3中。A,B,E所有的2-项集子集A,B,A,E,B,E都是L2的元素。因此保留

36、在C3中。A,B,F所有的2-项集子集A,B,A,F,B,F都是L2的元素。因此保留在C3中。A,B,D所有的2-项集子集A,B,A,D,B,D不是L2的元素。因此在C3中删除。A,B,G所有的2-项集子集A,B,A,G,B,G不是L2的元素。因此在C3中删除。A,C,E所有的2-项集子集A,C,A,E,C, E都是L2的元素。因此保留在C3中。A,C,F所有的2-项集子集A,C,A,F,C,F 不是L2的元素。因此在C3中删除。A,C,D所有的2-项集子集A,C,A,D,C,D不是L2的元素。因此在C3中删除。A,E,F所有的2-项集子集A,E,A,F,E,F不是L2的元素。因此在C3中删除

37、。B,C,D所有的2-项集子集B,C,B,D,C,D都是L2的元素。因此保留在C3中。B,C,E所有的2-项集子集B,C,B,E,C,E都是L2的元素。因此保留在C3中。B,C,F所有的2-项集子集B,C,B,F,C,F不是L2的元素。因此在C3中删除。B,C,G所有的2-项集子集B,C,B,G,C,G不是L2的元素。因此在C3中删除。B,D,E所有的2-项集子集B,E,B,D,D,E不是L2的元素。因此在C3中删除。B,D,F所有的2-项集子集B,D,D,F,B,F不是L2的元素。因此在C3中删除。B,D,G所有的2-项集子集B,D,D,G,B,G不是L2的元素。因此在C3中删除。B,F,G

38、所有的2-项集子集B,F,B,G,F,G不是L2的元素。因此在C3中删除。C,D,E所有的2-项集子集C,D,C,E,D,E不是L2的元素。因此在C3中删除。 C、剪枝后C3= A,B,C,A,B,E,A,B,F,A,C,E,B,C,D,B,C,E 扫描T中事务,确定L3,它具有最小支持度C3中的候选3-项集组成。 继续使用算法L3L3产生候选4-项集的集合C4。在C4中,共有A,B,C,E,A,B,C,F,A,B,E,F,B,C,D,E 几个项集,其中A,B,C,F,A,B,E,F ,B,C,D,E这几个集合的子集不是频繁的,故被剪去,这样C4=A,B,C,E,因只剩唯一一个集,但是A,B,

39、C,E的支持度小于最小支持度,也被剪去,但所以算法终止,找出了所有频繁项集。类型支持度(%) A 55 B 70 C 50 D 50 E 40 F 40 G 30 搜索频繁项集的过程如图1-3所示类型支持度(%) A 55 B 70 C 50 D 50 E 40 F 40 G 30 扫描T,对每个 用min_sup=20%候选计数作为C1 扫描C1 得到L1 类型支持度(%)A B 40A C 25A D 15A E 20A F 30A G 15B C 35B D 30B E 30B F 30B G 20C D 25C E 25C F 10C G 10D E 15D F 15D G 15E F

40、 10E G 15F G 5类型支持度%AB40AC25AE20AF30BC35BD30BE30BF30BG20CD25CE25由L1产生候选 用min_sup=20% 计数为 C2 扫描 C2得到L2 类型支持度(%)A B C 20A B F 20B C E 20类型支持度%A B C 20A B E 15A B F 20A C E 10B C D 15B C E 20由L2产生候选 用min_sup=20%计数为 C3 扫描 C3得到L3 图1-3最终产生的最大频繁集为A,B,C,A,B,F和B,C,E。(2) 由频繁集产生强规则 由事务库T中的事务找出频繁集,可以找出强关联规则(由mi

41、n_sup= 20%形成以上频繁项集之后,同时满足min_conf=65%产生的规则集) 根据公式confidence(AB)=计算关联规则置信度如下: confidence(ABC)=36% confidence(BCA)=57%同理,以此类推,可得到所有频繁项集所产生的关联规则如下表1-4所示: 表1-4 关联规则序号关联规则置信度序号关联规则置信度1AB73%21CE50%2BA57%22EC63%3AC45%23ABC36%4CA50%24BCA57%5AE36%25BAC29%6EA50%26ACB80%7AF55%27CAB40%8FA75%28ABC50%9BC50%29ABF3

42、6%10CB70%30BFA67%11BD43%31BAF29%12DB60%32AFB67%13BE43%33FAB50%14EB75%34ABF50%15BF43%35BCE29%16FB75%36CEB80%17BG29%37CBE40%18GB57%38BEC67%19CD50%39EBC50%20DC50%40BCE57%在此基础上,由于最小置信度的阈值为60%,则最终输出的强关联规则为表1-5所示: 表1-5 强关联规则序号关联规则置信度序号关联规则置信度1AB73%6ACB80%2FA75%7BFA67%3CB70%8AFB67%4EB75%9CEB80%5FB75%10BEC6

43、7%3.3.3强关联规则结果分析从上述关联规则可以初步得出以下结论:(1) 首先从规则1、3、4、5可以看出:使用月租30元套餐或者长途50元套餐或者短信10元套餐或者流量10元套餐的用户,大部分斗会使用市话50的套餐。说明了月租和市话、长途和市话、短信和市话、流量和市话这几种套餐具有强相关性。(2) 从规则2可以看出使用流量10元套餐的用户相当一部分都会使用月租30元的套餐。(3) 从规则6可以看出同时在使用月租30元套餐和长途50元套餐的用户,绝大多数都会使用市话50元的套餐。(4) 从规则7、8可以看出在月租30元、市话50元、流量10元这几种套餐之间有较强的相关性。同时使用市话50元和

44、流量10元套餐的客户,使用月租30元套餐的可能性是67%,也就是说可能性比较大。而同时使用月租30元和流量10元套餐的客户,使用市话50元套餐的可能性也比较大。(5) 从规则9、10可以看出市话50元、长途50元、短信10元这几种套餐之间具有较强的相关联性。同时使用长途50元和短信10元套餐的客户,绝大多数都会使用市话50元,而同时使用市话50元和短信10元套餐的客户,也有相当一部分会使用长途10元的套餐。 4 提高客户满意度的策略4.1 基于关联规则提高客户满意度的策略 关联规则的挖掘发现产品之间的关联性,利用这种关联性我们可以进一步开拓市场,发展更多的服务,让顾客对我们的产品或服务更加满意

45、。在关联规则发掘的基础上,我们可以运用4P营销理论16在各方面提出提高客户满意度的策略。4.1.1 产品策略通过关联规则研究,我们发现产品之间具有关联性,比如上一章规则6所提出的像同时在使用月租30元套餐和长途50元套餐的用户,绝大多数都会使用市话50元的套餐;通过这样一个规则,我们可以制定一系列的产品策略。1、 捆绑销售策略。捆绑销售策略是指将相关联的产品或者服务进行组合销售的一种产品销售策略,通过捆绑一些相关联的产品进行销售,满足顾客对不同产品的需要,比如我们可以在销售月租30元的和长途50元套餐的时候,同时将市话50元套餐业务捆绑在一起销售,这种销售针对那些既要使用月租和长途也要使用市话

46、的顾客群体。这种策略有利于顾客配套购买,方便使用,也有利于企业扩大销售,增加销售利润。2、 附赠品包装销售策略。这一种策略是指在两个相关联的产品中,选择其中之一作为另外一个产品的附送赠品进行组合包装销售。比如我们可以将为定制市话50元套餐的客户赠送月租的这种销售模式,这样销售满足了顾客获取额外利益的心理,使用产品也觉得方便实惠,进而吸引他们进行购买或重复购买,扩大企业销量,增加利润。 4.1.2 价格策略 关联规则的运用在价格策略这一块主要涉及的是产品或服务的组合定价策略。如在上章规则7、8计算中得出在月租30元、市话50元、流量10元这几种套餐之间有较强的相关性:同时使用市话50元和流量10

47、元套餐的客户,使用月租30元套餐的可能性是67%,也就是说可能性比较大。而同时使用月租30元和流量10元套餐的客户,使用市话50元套餐的可能性也比较大。有了这一规则,对于产品的组合定价就有了更准确的方向。 产品或服务的组合定价策略在关联规则运用中主要是将相关联的产品组合销售,在价格上实现一定的优惠的形式。在对多项产品定价时,需重视产品组合整体的利润最大化,而不是孤立的考虑单个产品利润的高低,只要从总体上获利,有些产品价格甚至可以低于其成本。如上述关联规则中,可以将流量超过10元套餐作为组合定价策略时候优惠套餐,可以制定出同时购买月租30元和市话50元的客户,免费赠送流量10元套餐等等。4.1.

48、3 促销策略促销策略主要包括了人员推销策略,广告促销策略,在关联规则基础上的促销策略主要是在人员推销策略和广告促销策略中的应用较多。在人员推销策略中,公司可以根据事先得出的关联规则结论确定产品关联性,在推销过程中,向顾客推荐相关联的产品,这样不仅使顾客的购买计划完整进行,而且扩大销量,增加利润,对于顾客和企业来说,都是一种双赢的选择。比如在规则2中向使用流量10元套餐的用户推荐月租30元的套餐。在广告促销策略中,运用产品之间的关联性,设计广告标语,推出关联产品之间的优惠信息,借此吸引目标客户的购买。4.2关联规则在零售业中提高客户满意度的运用关联规则在整个零售业中的运用也是相当广泛的。通过关联规提高客户满意度的策略的提出,在零售业特别是超市销售过程中,我们可以根据产品策略、价格策略以及促销策略来促进产品销售,提高销售量,增加利润。在超市的销售过程中,我们可以将有关联的产品进行捆绑销售、交叉销售、附赠品销售等;在制定销售价格的时候,对相关联的产品或服务进行组合定价策略等;在促销活动中,向顾客推荐相关联的产品;对现有的商品,在设计货物摆放的时候,将相关联的产品摆放在一起,这样顾客挑选的时候就会十分方便,更容易的找到所需要的商品;在进货

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论