基于因子分析与聚类分析的客户偏好探究_第1页
基于因子分析与聚类分析的客户偏好探究_第2页
基于因子分析与聚类分析的客户偏好探究_第3页
基于因子分析与聚类分析的客户偏好探究_第4页
基于因子分析与聚类分析的客户偏好探究_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于因子分析和聚类分析的客户偏好探究一 文献综述 二十世纪五十年代中期,美国学者温德尔史密斯提出了顾客细分理论。该理论指出,顾客由于其文化观念、收入、消费习俗等方面的不同可以分为不同的消费群体。企业在经营中应该针对不同的顾客提供针对性的服务,这样才能够利用有限资源进行有效的市场竞争。对顾客的细分从方法上讲有根据人口特征和购买历史的细分和根据顾客对企业的价值即基于顾客的消费金额、消费频率的细分。本文的细分是基于购买历史和人口特征的聚类分析。饭店作为一个古老的服务行业,在现阶段的高度竞争市场下的发展趋势最重要的方面便是服务趋于个性化,所以针对饭店的消费群体特征的聚类可以对饭店进行定位,在此基础上通

2、过分析目标客户群体对消费质量评价的最主要影响因素可以达到其服务个性化的目标。波特把顾客的价值定义为买方感知性与购买成本的一种权衡。对顾客的个性化服务增加了买方的感知度从而加大了他们愿意为此付出的成本,于是饭店便可以增加营业额。聚类分析是把研究对象视作多维空间中的许多点, 并合理地分成若干类,即一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系。 李蓉, 李宇. 基与主成分分析与聚类分析方法的我国西部区域划分问题的研究. 科技广场, 故聚类算法是对顾客进行分析的一个有效方式。在聚类分析的众多算法中因子分析是研究如何以最少的信息丢失, 将众多原始变量浓缩

3、成少数几个因子变量, 以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。 李新蕊.主成分分析、因子分析、聚类分析的比较与应用. 山东教育学院学报.而典型的k-means算法以平方误差准则较好地实现了空间聚类,对于大数据集的处理效率较高。 杨善林.kmeans 算法中的k 值优化问题研究 系统工程理论与实践在对顾客细分相关文献的研究过程中,主要运用的方法有神经网络,分层聚类,因子分析等方法。比如,在关于网络青少年用户的分类中,作者用层次聚类的方法,通过对青少年年龄,性别,民族,网络可得性,父母的观点等变量等变量定义不同的上网动机,在此基础上对其进行了分类。而在研究人寿保险持有者未来购买

4、基金支持寿险可能性的文章中,通过灰度聚类和神经网络利用消费者的基本信息,财产地位信息,风险承受程度将消费者分为了忠实客户和非忠实客户。在对客户忠诚度的聚类中,作者用RFM的商业模型用DBI确定了Kmeans的最优K值,并最终用kmeans对客户忠诚度进行了聚类。经过综合分析,我们选择了这两种方法处理顾客数据和饭店的基本资料。即,通过k-means对客户进行聚类后通过因子分析分析不同类别客户的评价影响因素。为分析每类客户倾向的饭店特征,本文根据客户聚类结果对饭店数据进行筛选。由于饭店部分属性之间具有相关性,本文采用因子分析法挖掘其“根本属性”,之后对饭店数据进行聚类,分析得到每类客户评价得分最高

5、的饭店特征。二 方法论本文选取UCI上的数据(包括饭店、客户、评价得分等信息),旨在通过划分客户群体并分析每一类客户对不同饭店的评价得分,得出每一类顾客选择饭店的倾向,即特定类别客户的喜好和评价饭店时最看重的因素。将结论应用于指导饭店发展路线与目标客户群间的战略匹配。具体方法步骤如下: 1 根据详细的客户信息对客户进行K-means聚类,总结出每一类客户的显著特点2 客户偏好的研究饭店的多个属性之间存在相互影响的关系,因此本文在研究饭店特点采用因子分析法,将相同本质的属性归入一个因子,既可减少变量的数目,又能得出能够表征饭店属性的影响因子。在因子分析的基础上,对同类顾客所评价的饭店进行聚类分析

6、,得到每类顾客所选饭店的种类。然后分析比较各类饭店的特点,选出影响最大的因子(依据系数绝对值大小来判断),参照因子旋转矩阵后即可得到对顾客评分影响最大的饭店属性,从而分析出特定类别顾客在选择、评价一家饭店时的偏好。Figure 1 研究框架三 研究过程(一) 顾客聚类分析:在顾客信息的属性中删去User ID,其余属性作为输入字段进行K均值聚类。模型中的K值默认为5,但是分类结果中不同类型间的差异较小,随即降低K值进行尝试。考虑到顾客评分分为0,1,2三个等级,而且K=3时分类结果间的差异较显著,因此将顾客分为三类。Cluster 1:此类顾客人数最多,出生日期在1986年之后,绝大多数人学生

7、,其次是工作者,主要同家人一起就餐;基本不饮酒;兴趣点主要为technology;绝大多数未婚,性格为thrifty protector Catholic为主 ;基本不吸烟;公交Cluster 2:此类顾客人数最少,年龄最大,不愿多透漏个人信息(数据中有大量缺失值)。Cluster 3:此类顾客人数居中,出生年份在1981左右,主要为学生、工作者 多与朋友一起就餐,大多属于social drinker。多数人是单身,但是单身比率高于类型1,性格为hard-worker,car-owner为主。聚类分析结果如下图所示:Figure 2 顾客的聚类结果(二) 顾客偏好分析本文通过分析每类顾客关注饭

8、店的特征提取分析顾客的偏好,从而便于饭店把握顾客需求,指定差异化战略。1. 因子分析i. 评价指标的选择及数据预处理影响顾客在饭店消费体验的影响性变量,本文主要筛选如下:alcohol,smoking_ area,dress_ code,accessibili1y,price,Rambience ,Franchise, area, parking, acceptance, other service。由于因子分析需要数值型数据,本文对饭店数据中定性的变量量化处理。统计学依据数据的计量尺度将数据划分为三类:定距型数据(Scale)、定序型数据(Ordinal)、定类型数据(Nominal)。定距

9、型数据通常是指诸如身高、体重、血压等的连续型数据,也包括诸如人数、商品件数等离散型数据;定序型数据具有内在固有大小或高低顺序,职称变量可以有低级、中级、高级三个取值,可以分别用1、2、3等表示,数据间却是不等距的。测量数值不能直接比较大小,只能比较优先次序。定类型数据是指没有内在固有大小或高低顺序,一般以数值或字符表示的分类数据。如性别变量中的男、女取值。本文采用的数据中,饭店的属性包含多个定序型变量,如other-variance包含none,Internet 和variety三类;Accessibility包括no_accessibility,completely和partially三类。

10、本文采用0、1、2代表上述属性中的值,0、1、2代表依次递增,即0表示no_accessibility,1表示partially,2表示completely。此外,数据集中还有定类型的数据,如franchise有True和false两种取值。本文中将却是指用该属性取值的平均值替代。012alcoholnowine/beerfull barsmoking_areanot permittedsection/only at barpermitteddress_codeinformalcasualaccessibilitynone partiallycompletelypricehighmediuml

11、owRambiencequietfamiliarfranchiseFALSETRUEareaclosedopenother_servicesnone InternetvarietyFigure 3 因素量化ii. 因子分析由于饭店的属性之间部分具有相关性,本文采用spss进行因子分析来消除这种相关性。对饭店数据库中的影响性变量相关数据进行因子分析,所得结果见Figure 4。从Figure 4中可以看出,前八个因子的累计方差贡献率已经达到86.028%。根据累计方差贡献率>85%的标准,本文选择前八个作为因子进行分析。Figure 4 初始特征矩阵为了更好地赋予所得因子以合理的解释意义,

12、本文进行了因子旋转,因子载荷矩阵见Figure 5,从表中的因子载荷可以看出,第一个因子(F1)可以用来解释price,第二个因子(F2)可以用来解释alcohol,第三个因子(F3)可以用来解释smoking-area,第四个因子(F4)可以用来解释Franchise,第五个因子(F5)可以用来解释Rambience,第六个因子(F6)可以用来解释dress_code,第七个因子(F7)可以用来解释Cuisine,第八个因子(F8)可以用来解释Parking,八大因子的累计方差贡献率可以反映顾客对饭店的满意程度。Figure 6 因子载荷矩阵根据表,可由因子方差贡献率计算得出因子解释贡献率(

13、因子解释贡献率=因子方差贡献率/总方差贡献率),从而得到各饭店的因子得分数据,具体数据如附录所示。Figure 7 提取平方和载入矩阵iii. 饭店聚类分析为分析每类顾客偏好的饭店类型,本文针对每类顾客评价过的饭店进行聚类分析,希望找出具有不同评分的各类饭店的显著性特征。本文采用K-means方法对各类顾客评价过的饭店数据进行聚类分析。以cluster 1客户为例,筛选出cluster 1 客户评分过的饭店因子得分数据,对该部分数据进行聚类分析。由于顾客对饭店的评分分为三类(0,1,2),此处对饭店聚类K值选取为3.计算每类饭店的客户评分平均值,可得出cluster 1客户最偏好的饭店类别。通

14、过分析该类饭店的显著性特征,可得出cluster 1客户最偏好的饭店特征。判断cluster 1 偏好的饭店特征具体步骤如下:1) 筛选出cluster 1 评价过的饭店因子得分数据。2) 对该数据应用k-means进行聚类分析,k取值为3.3) 分析每类饭店的显著性特征4) 计算每类饭店的平均客户评分并对三类饭店进行排名。5) 分析排名第一的饭店(cluster 1 客户最偏好的饭店)的显著性特征。在解释聚类分析的结果时,本文采取每类累计方差解释度较高的因子解释每类饭店的特征。综合考虑各类顾客各类饭店的数据分析结果我们可以看到,无论是哪类饭店F4、F5、F6均具有较高的方差解释度,因此可以看

15、出无论是哪类顾客都是比较看重F4、F5、F6这三类因子的,结合Figure 6(因子载荷矩阵),可以分析得出Franchise、Rambience、dress_code是所有饭店都考虑的普遍性因素。考虑每类饭店除F4、F5、F6之外的因子影响程度,可分析得出不同顾客对饭店的差异化要求,便于饭店针对顾客指定差异化战略。对cluster 1 参与评价的饭店评价因子得分数据进行聚类分析,其结果如Figure 8所示。可以看出除F4、F5、F6之外聚类一饭店的特征还可用F2解释,结合Figure 6,可以分析得出除了cluster 1的顾客对alcohol是较为关注的。同理聚类二的饭店特征除F4、F5

16、、F6之外还可用F1进行解释,因此cluster 1 的顾客对Price是较为关注的。聚类三的饭店特征还可用F7进行解释,因此cluster 1 的顾客对Cuisine是较为关注的。计算三类饭店的客户评分平均值,得到cluster 1的客户对于聚类1的饭店评分是最高的,可以看出可分析得出该类客户是最看重的差异化服务是alcohol。Figure 8 cluster 1 客户聚类分析结果为分析cluster 2客户的差异化要求,对cluster 2 参与评价的饭店评价因子得分数据进行聚类分析,其结果如Figure 9所示。可以看出除F4、F5、F6之外聚类一饭店的特征还可用F7解释,结合Figu

17、re 6,可以分析得出除了cluster 2的顾客对cuisine是较为关注的。同理聚类二的饭店特征除F4、F5、F6之外还可用F2进行解释,因此cluster 2 的顾客对alcohol是较为关注的。聚类三的饭店特征还可用F1进行解释,因此cluster 2 的顾客对price是较为关注的。计算三类饭店的客户评分平均值,得到cluster2的客户对于聚类1的饭店评分是最高的,可以看出可分析得出该类客户是最看重的差异化服务是cuisine。Figure 9 cluster 2 客户聚类分析结果为分析cluster 3客户的差异化要求,对cluster 3参与评价的饭店评价因子得分数据进行聚类分

18、析,其结果如Figure 10所示。可以看出除F4、F5、F6之外聚类一饭店的特征还可用F1解释,结合Figure 6,可以分析得出除了cluster 3的顾客对price是较为关注的。同理聚类二的饭店特征除F4、F5、F6之外还可用F2进行解释,因此cluster 3 的顾客对alcohol是较为关注的。聚类三的饭店特征还可用F8进行解释,因此cluster 3的顾客对parking是较为关注的。计算三类饭店的客户评分平均值,得到cluster3的客户对于聚类3的饭店评分是最高的,可以看出可分析得出该类客户是最看重的差异化服务是parking 。Figure 10 cluster 3 客户聚

19、类分析结果对应三类顾客的自身特征与其偏好,本文对顾客偏好的分析基本符合顾客自身特征。Figure 11 顾客偏好四 结论本文综合使用了聚类分析和因子分析,分析出了不同类型顾客的特点,以及每类顾客的选择、评价饭店的偏好。所得结论对饭店的经营和战略制定有极其重要的指导意义。以第三类顾客为例,顾客主要为1981年左右出生的年轻人,多与朋友一起就餐,绝大多数拥有私家车。该类顾客评价过的饭店进行聚类分析后,发现顾客非常关注泊车这一饭店属性。因此,当某饭店制定差异化战略时,如若想吸引上述第三类客户,除了关注dress_code, ambience 和franchise这三个具有普遍性的属性外,还应针对该种

20、顾客的特点尽量提供停车位,以吸引更多的顾客。五 参考文献1. A segmentation of adolescent online users and shoppers William W. Hill, Ph.D. Sharon E. Beatty, Ph.D. Gianfranco Walsh, Ph.D.2. Cluster analysis using data mining approach to develop CRM methodology to assess the customer loyalty Seye

21、d Mohammad Seyed Hosseini *, Anahita Maleki, Mohammad Reza Gholamian3. An anticipation model of potential customers purchasing behavior based on clustering analysis and association rules analysis Horng-Jinh Chang a, Lun-Ping Hung b,*, Chia-Ling Ho 4. A two-stage clustering method to analyze customer

22、 characteristics to build discriminative customer management: A case of textile manufacturing business Der-Chiang Li a, Wen-Li Dai b, Wan-Ting Tseng a5. Distributing weights under hierarchical clustering: A way in reducing performance breakdown Jin Zhang a, Dietmar Maringer b6. 李蓉, 李宇. 基与主成分分析与聚类分析方

23、法的我国西部区域划分问题的研究. 科技广场, 7. 李新蕊.主成分分析、因子分析、聚类分析的比较与应用. 山东教育学院学报.8. 杨善林.kmeans 算法中的k 值优化问题研究 系统工程理论与实践9. 奚胜田 詹原瑞 韩著钊 因子分析与聚类分析在企业信用评级中的应用 附录一:饭店因子得分数据placeIDf1f2f3f4f5f6f7f8132560-0.0540.0793012.1635210.5382471.4250721.1247251.2409751.735357132561-1.31120.470879-0.083530.2207341.4573410.90689-0.019480.

24、030694132564-1.31120.470879-0.083530.2207341.4573410.90689-0.019480.030694132572-1.173410.6461880.0669760.7115481.7446350.7888670.9259410.668394132583-0.916990.1493240.2057990.8316771.1973951.0260521.0540081.090584132584-0.575420.502048-0.023861.5053091.585160.865962-0.180580.732066132594-1.109980.5

25、354060.5764520.6512821.6542560.777135-0.132231.795288132608-0.87570.4194381.8947081.6161010.9477091.1800720.1794741.544903132609-1.010560.5362890.0796251.5451410.7459010.8542680.9143590.62026132613-0.503980.495981.281751.6365351.8773461.2034980.1427090.529814132626-0.410250.6449850.0894712.0538191.8

26、073460.6761610.7675480.427091132630-1.31120.470879-0.083530.2207341.4573410.90689-0.019480.030694132654-1.31120.470879-0.083530.2207341.4573410.90689-0.019480.030694132660-1.31120.470879-0.083530.2207341.4573410.90689-0.019480.030694132663-1.31120.470879-0.083530.2207341.4573410.90689-0.019480.03069

27、4132665-1.31120.470879-0.083530.2207341.4573410.90689-0.019480.030694132667-1.156050.4627770.0987361.541731.584890.7774610.976409-0.22226132668-1.31120.470879-0.083530.2207341.4573410.90689-0.019480.0306941327060.7895660.1388050.2381871.6787241.2300120.830051-0.199151.5359751327150.2235080.0175070.6

28、423080.5469510.0380350.684693-0.14319-0.03596132717-0.161170.482570.1275970.571281.5144880.8643810.7973881.687904132723-0.253041.8714480.4973690.7242882.0628450.944143-0.087811.457525132732-1.022760.4529370.4454140.7656631.552702-0.32442-0.09096-0.174861327330.1627420.8423420.1462013.0777022.1306460

29、.3686170.649895-00.983790.4645921.8077030.8979011.8162250.9711150.196476-0.292311327540.0149110.373568-0.031720.6501041.3237350.756855-0.20414-04491881.8060890.058382.0474241.7544960.528483-0.282480.8395161327660.4279060.7482230.1245770.2243641.1635240.8415350.8417920.93684

30、51327670.1509022.1417791.8198931.5297621.81927-0.139671.1168440.1776341327680.2025350.3477420.0938611.9700891.479947-0.330580.827592-0.523251327730.2960130.6584082.0534390.9013831.4616030.8532881.207779-0.32854132825-1.055230.4706610.5020960.7666741.5240390.63358-0.12681-0.09006132830-1.31120.470879

31、-0.083530.2207341.4573410.90689-0.019480.0306941328340.0588730.1222840.1590090.3354431.195964-0.01525-0.004911.6924791328450.5678440.1264210.0665290.5096891.0327810.779897-0.18266-0.108371328460.033226-0.003172.0324830.6526281.3235180.0231671.282246-0.234791328470.050642-0.023630.6985970.4858440.942

32、1320.679663-0.083850.064202132851-1.173410.6461880.0669760.7115481.7446350.7888670.9259410.668394132854-0.104971.439874-0.015191.5290782.0687310.4879070.6811730.196517132856-1.137271.158988-0.034290.5050471.6846250.7429790.948861-0.1598132858-1.146030.6138160.0297980.7692441.6795260.7170890.928651-0

33、.274281328610.4492370.9410210.1745663.5896442.2922960.2148450.591069-0.4521328620.9597971.703037-0.052782.5520972.4815-0.725170.4493360.468032132866-0.686730.697345-0.007830.7693911.7403320.7695620.7786150.6680961328690.4191430.2030510.1886690.4885611.1584260.8156450.8215820.822361132870-0.040170.11

34、95220.2262990.4884141.097620.7631730.971617-0.120021328720.1253260.5812490.1559611.0832221.6761380.7106090.7385621.3948731328751.8431521.5093691.4447353.1328181.7352320.4332140.6691230.839652132877-1.31120.470879-0.083530.2207341.4573410.90689-0.019480.030694132884-1.31120.470879-0.083530.2207341.45

35、73410.90689-0.019480.030694132885-1.200790.678560.1041540.6538521.8097430.8606450.9232311.611069132921-0.926731.0804721.0627990.6647540.860332-0.160771.038505-0.27361132922-0.620380.6766281.317280.9593241.9387471.9933231.068763-0.39203132925-0.529261.165887-0.194060.5263221.6197870.759702-0.20542-0.

361.290372.8140060.4287810.3444560.7473141.0320551.174934-0.22784132951-1.140940.6284640.0102930.7105381.773298-0.169140.9617920.5835941329540.4291810.4965170.2160862.4253451.6780420.5454310.7302050.211192132955-0.371762.4744050.0787553.3021862.0521830.2776510.864874-1.261141329580.1627950

37、.8986310.1559073.6506041.3273930.1674020.681764-1.494541349750.4909413.1269590.3355871.8982922.067220.563127-0.24381-0.995421349760.7919420.447930.3485711.9665441.6476790.3736350.792428-0.056441349831.5320641.5388760.6952111.1075061.6337140.7093430.7586680.3638421349860.6230040.6860540.04091-0.17103

38、0.90381.8622270.7201520.3717021349870.549230.7039650.0396150.1877961.1029890.877564-0.165160.9487891349921.6770950.9317210.6176581.3341241.596742-0.23852-0.232640.1765021349960.1389280.984051.351120.5680091.0466851.4739370.3164911.1009751349990.1600260.0720.1231260.0343150.9316670.897640.8831180.172

39、7171350000.5678440.1264210.0665290.5096891.0327810.779897-0.18266-0.108371350010.2928291.343257-0.002852.7769372.0752080.430535-0.33685-0.032541350110.557827-0.024620.1354661.2821740.9381450.840268-0.1349-0.056341350130.0811580.0752640.1413360.4518461.0370840.799202-0.03534-0.108071350160.5678440.12

40、64210.0665290.5096891.0327810.779897-0.18266-0.10837135018-0.017923.0062431.6576361.8823652.1877730.7034390.0139410.018698135019-1.432530.5151370.0014330.2573021.5178760.8708610.9874770.01875135021-0.104940.0332280.3695921.1455081.13320.96711.0139551.817361350251.427330.4224570.1516232.0455141.51773

41、20.31858-0.35914-0.987461350260.6642381.213502-0.07986-0.436240.9375620.9301130.7762120.4013861350271.4360930.9676290.0875321.7813171.522830.34447-0.33893-0.872981350281.4360930.9676290.0875321.7813171.522830.34447-0.33893-0.872981350300.4341610.7476890.0605280.5958070.0970170.7935920.81673-0.211091

42、350321.0092370.9749190.8712881.2561651.6980260.7745360.8830741.1923311350331.4630480.4194220.8044272.1111271.6638250.487348-0.1975-1.088591350341.3060060.4667150.2365862.0820821.5782670.2825520.647813-0.999411350351.8010320.547210.8517592.1478421.7851670.5037920.659422-0.158161350380.6035630.1233860

43、.7193320.5753021.1788750.948664-0.02102-0.2095135039-0.031820.148860.9162790.4963311.3088221.0037191.1305510.7215331350401.6089060.952480.0215371.2695221.4219860.550714-0.430140.3624281350410.4552840.7158510.08740.282061.0984160.7697570.844501-0.005831350420.4465210.1706790.1514910.5462571.0933170.7

44、438680.824292-0.120311350430.4465210.1706790.1514910.5462571.0933170.7438680.824292-0.120311350440.4465210.1706790.1514910.5462571.0933170.7438680.824292-0.120311350451.3548820.836077-0.063510.7565691.288999-0.25352-0.335460.570661350460.9921330.4004080.2453991.5124451.4817260.5081010.7039290.236298

45、1350471.6446240.9494450.674341.3351351.5680790.719482-0.268490.2613021350481.7740771.0954160.1348651.8180321.6441720.3609130.5179880.0574531350490.4465210.1706790.1514910.5462571.0933170.7438680.824292-0.120311350501.8954011.0511580.0499021.7814641.5836360.396942-0.488970.0693971350510.1168770.07222

46、90.7941390.5174591.1831770.967970.126308-0.20921350521.5237231.5095380.005231.0995891.4225120.4687970.599734-0.477711350531.8010320.547210.8517592.1478421.7851670.5037920.659422-0.158161350541.4788190.4515650.1705911.5702871.4774230.4887960.5566040.2361350551.9223560.5029520.7667972.1112741.7246310.53982-0.34753-0.146211350571.323111.0412250.8624751.8258031.7945680.5489860.826958-0.043381350580.9547370.2817420.3515142.2272341.4521980.64

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论