




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
]。总结与展望首先在客户潜在潜在价值方面,国内外学者对客户潜在价值分类认识角度各不相同,但是这些分类仍然存在着对潜在价值定义不明确,与其他客户群体交集过大等问题。本文认为针对航空公司客户潜在价值的研究应将潜在价值看作在未来一段时间选择本航空公司作为出行选择的可能性。而不应该将其与间接价值,附加价值,隐性价值有较大的交集。所以本文将集中研究一种预测模型,在传统的影响因素中引入客户活跃度,并将其具有预测功能的一个重要参数。实现预测客户未来一段时间的价值等级,并针对性的为其提供不同类别的服务。其次模型建立环节,适用于航空领域的客户潜在价值分析的模型有RFM模型和LRFMC模型。两者在潜在价值预测中预测性属性较少。所以本文将在LRFMC模型基础上进行改进,认为活跃度与客户三方面信息挂钩。第一为购买能力,从乘机的平均价格看出客户每次坐飞机带来的盈利,在经济方面衡量客户价值。但是仅凭平均飞行票价不能看出客户是否为高价值,有可能出现在观测期内仅有少次长途旅行而提高了平均票价的极端现象。所以加入平均乘机时间间隔作为第二个因素,用来调整极端情况的出现。从而凸显出乘机次数多,且盈利较大的顾客群体。第三个因素是积分兑换次数,这个数值可以反应出客户对航空出行的关注度和活跃度。因为绝大部分人大没有突发情况下,购买和关注行为是具有连续性的。所以这三个因素可以作为一个很好的预测性指标。最后在建立模型后使用动态k-means算法通过计算模型轮廓系数将模型功能调试到最佳。本文结构本文结构将分为4个大章节来介绍客户潜在价值评估系统的建立过程,第一章将主要介绍课题背景和本文在一些基础上进行的改进与创新工作。第二章将介绍python模块,在python工具的基础上如何进行数据预处理和模型建立以及评估的过程。第三章将介绍前台系统的主要实现细节。第四章将主要展示python模块所得的模型和前台系统功能展示,最后在所得模型的基础上对不同类型客户的任务画像建立和给出的服务建议。
预测模型的建立与评估在第二章将主要介绍客户潜在价值预测模型的建立过程,包括数据预处理,模型建立和模型评估过程。其中将使用jupyter-notebook和pycharm作为主要开发工具。数据预处理在使用改进后的LRMFC模型和k-menas算法之前,对已知数据集处理显得格外重要。数据预处理可以去除无效数据、无法使用的数据,补齐缺失值,对已知数据的大小、格式、类型归一化处理,便于进行后续的计算。数据集介绍本论文所研究的数据集来源来自于网络公开航空公司客户数据,其数据抽取了观测窗口为2012年4月1日到2014年3月31日内有乘机记录的所有客户的详细乘机数据,总共有62988条记录。其中包含了如会员卡号、入会时、性别、年龄、观测窗口内的飞行次数、平均折扣率、末次飞行时间、平均乘机时间间隔、总基本积分等44个属性,如图2-1到2-3所示。图2-1属性中英文对照图2-2属性中英文对照图2-3属性中英文对照原始数据部分截图如图2-4所示图2-4部分原始数据展示原始数据各属性统计量如表2-1所示表2-1原始数据各属性统计量countuniquetopmeanstdMEMBER_NO62988NaNNaN31494.518183.2FFP_DATE6298830682011/1/13NaNNaNFIRST_FLIGHT_DATE6298834062013/2/16NaNNaNGENDER629852男NaNNaNWORK_CITY62988NaNNaN4.102160.37385WORK_PROVINCE607193309广州NaNNaN表2-1(续表)原始数据各属性统计量WORK_COUNTRY597401183广东NaNNaNAGE62962118CNNaNNaNLOAD_TIME62568NaNNaN42.47639.88591FLIGHT_COUNT6298812014/3/31NaNNaNBP_SUM62988NaNNaN11.839414.0494EP_SUM_YR_162988NaNNaN10925.116339.4EP_SUM_YR_262988NaNNaN0.00.0SUM_YR_162437NaNNaN5355.371645.70SUM_YR_262850NaNNaN5604.028703.36SEG_KM_SUM62988NaNNaN17123.820960.8WEIGHTED_SEG_KM62988NaNNaN12777.217578.5LAST_FLIGHT_DATE629887312014/3/31NaNNaNAVG_FLIGHT_COUNT62988NaNNaN1.542151.78699AVG_BP_SUM62988NaNNaN1421.442083.12BEGIN_TO_FIRST62988NaNNaN120.145159.572LAST_TO_END62988NaNNaN176.120183.822AVG_INTERVAL62988NaNNaN67.749877.5178MAX_INTERVAL62988NaNNaN166.033123.397ADD_POINTS_SUM_YR_162988NaNNaN540.3163956.08ADD_POINTS_SUM_YR_262988NaNNaN814.6895121.79EXCHANGE_COUNT62988NaNNaN0.379771.13601avg_discount62988NaNNaN0.721580.18542P1Y_Flight_Count62988NaNNaN5.766257.21092L1Y_Flight_Count62988NaNNaN6.073158.17512P1Y_BP_SUM62988NaNNaN5366.728537.77L1Y_BP_SUM62988NaNNaN5558.369351.95表2-1(续表)原始数据各属性统计量ADD_Point_SUM62988NaNNaN1355.017868.47Eli_Add_Point_Sum62988NaNNaN1620.698294.39L1Y_ELi_Add_Points62988NaNNaN1080.375639.85Points_Sum62988NaNNaN12545.720507.8L1Y_Points_Sum62988NaNNaN6638.7312601.8Ration_L1Y_Flight_Count62988NaNNaN0.486410.31391Ration_P1Y_Flight_Count62988NaNNaN0.513580.31911Ration_P1Y_BPS62988NaNNaN0.522290.33963Ration_L1Y_BPS62988NaNNaN0.468420.33895EP_SUM62988NaNNaN265.6891645.70Point_NotFlight62988NaNNaN2.728157.3641数据清洗在数据处理的过程中,发现数据集属性值不合理的数据。统计后得出不合理数据有944个,所占数据集的比例不足1.5%,因此不会对分析结果产生较大的影响,在本论文中直接做删除处理。处理后对数据集进行索引重排列,以免造成在后续计算中出现索引缺失错误。模型提取在本论文使用的LRFMCA模型中,所涉及到的关键属性如下:观测窗口的结束时间、入会时间、最后一次乘机时间至观测窗口结束时长、观测窗口内的飞行次数、观测窗口的总飞行里程、平均折扣率、观测窗口的票价收入、积分兑换次数、非乘机变动次数、平均乘机时间间隔。在LRFMCA模型中,计算后所得出的属性为L、R、F、M、C、客户活跃度6个最终属性。具体计算公式如下L(入会时长)=LOAD_TIME−FPP_DATERFMC客户活跃度=其中在新属性客户活跃度的计算当中,本文认为客户活跃度与客户的三方面信息挂钩。第一为客户的购买能力即体现在客户活跃度计算公式中的第一项,从每次乘机的平均价格可以看出客户每次乘坐飞机为航空公司带来的盈利大小,乘以0.03代表在客户活跃度中所占权重为30%,但是所得具体数据值较大,为了避免覆盖其他参数的影响,对其量级进行乘以0.1处理,从而所得参数可以在经济方面衡量客户潜在价值。但是在现实生活中,仅仅凭借平均飞机票价并不能看出客户价值的高低。有一部分客户在观测期内出现了仅有少次长途旅行而提高了平均票价的极端现象。所以加入平均乘机时间间隔作为第二个影响因素来修正极端现象所带来的分类不准确问题。第三个因素为积分变动次数,这个数值可以反应出客户群体对航空出行的关注度和活跃度,在绝大多数人没有突发情况下,个人的购买行为和关注领域具有连续性,不会发生较大的变化,所以将次因素作为重点预测因素加入的最终属性的计算之中,从而得出客户活跃度作为一个优秀的预测性指标。值得一提的是,在处理属性L的过程中,所得属性类型为data类型,需要对L进行类型转化为int属性,否则难以参加后续样本距离的计算。接下来在所得数据集中加入一名为asix的列,用于存放针对此样本的分类结果。所得数据集如表2-3所示。表3处理后部分数据展示MLRFC客户活跃度asix05807.17270.6121002625823.23-112936.78259.7714001750857.83-122837.12261.51113501687826.83-132813.36204.7972302873282.15-1表3(续表)处理后部分数据展示43099.28181.6515201900626.17-1……620403.68324.91212025354.00-16204110.62196.1392025142.50-1620429.04136.246420251306.6-1620437.6046.6282202561.50-162044row*7columns最后通过计算个属性的平均值发现,各个属性量级不相同,在后续的距离计算中会对每个属性所占的权值产生重要影响,所以本文根据每个属性的平均值量级对属性的数据进行量级统一化,统一到100-999之间以便参与后续的数据计算。所得最终数据集个属性平均值为图2-5所示。图2-5各属性平均值结果具体数据处理代码如图2-6到2-9所示。图2-6属性提取图2-7非法数据处理图2-8LRFMC属性计算图2-9属性量级统一改进后k-means算法的实现在python的sklearn库中提供了k-means函数,调用时各个参数含义和使用方法如图2-10所示。图2-10k-means函数参数含义可见传统的k-means算法中可以指定迭代次数,在查阅资料后得出在调用函数的过程中最大迭代次数为300次,且在计算样本点到簇心的距离时只能选取三种距离。当p等于2时,为欧式距离,当p等于1时,为绝对值的和,当p等于正无穷时,这个距离就成为了维度差最大的那个值。显然,传统的k-menas算法并不能突出重点属性在分类中的作用且迭代次数有上限,在数据集过大时不能对数据集进行精准的分类。所以在本论文中将重新对k-means算法进行编写。样本间距离计算在本文涉及到的模型建立过程中,需要对具有不同功能的属性赋予不同的权值。本文将L,R,F,M,C这五个属性作为分类的主要属性,将客户活跃度属性当作预测的主要属性。并对分类五个属性都赋予0.15的权值,对客户活跃度赋予0.25的权值。随后根据各个属性不同的权值来将各个属性加权求和作为样本间距离。具体实现的部分代码如图2-11所示。图2-11样本属性距离计算代码首次k-menas算法的实现相较于后续的k-menas迭代过程,首次k-menas实现需要手动选择初试的迭代点。在本论文中采取随机的方法,在初试数据集中随机找出k个数据,并分别作为k个簇的样本中心的点参与第一次分类的计算。具体迭代过程将在下一小节进行详述。随后在数据末尾添加首次分类过后各个簇的样本中心点,供后续计算使用。首次k-means算法具体代码和更新样本中心点的具体代码分别如图2-12和图2-13所示。图2-12首次k-means算法具体代码图2-13首次更新中心点代码迭代实现过程在后续的k-means迭代过程中,计算样本距离的方法同首次k-menas算法相同。在对每个点到k个中心点距离计算完成后,将此点分入与其距离最小的第k簇中,并将此样本的asix属性更改为k来表示此样本所属的簇。在对所有点完成计算后,将重新更新样本中心点,此时不再是将新样本中心添加在数据末尾,而是将数据中后k个数据依次进行覆盖操作,以保证数据规模不变且更新后的样本中心点不影响后续的模型评估操作。在更新完样本中心点后,将对在开始本次迭代前保存的数据样本和迭代完成后的数据样本进行比较。值得一提的是在对dataframe样本进行赋值的过程中需要使用copy()函数进行赋值,否则只是创建新指针,新副本将随着原数据的变化而变化,从而导致迭代的终止条件始终满足,无法进行后续迭代计算。在比较前后两个数据集过程当中,不能使用dataframe的比较函数,因为其返回值为布尔类型的列表,并不能实现我们所需的函数功能。所以在比较时只比较两个dataframe的asix属性,并在两个datafrmae的asix完全相同时返回2,不同时返回1。来实现对迭代前后数据集的比较。在传统k-means算法中,迭代的终止条件常常为在迭代前后的两个数据集距离之和小于某个的阈值。本文则采取前后数据集完全相等条件作为迭代的终止条件,以追求聚类结果的准确性。具体实现代码如图2-14所示。图2-14首次k-means算法后的迭代过程聚类模型评估与可视化下文将介绍在模型建立后模型评估方法和模型评估与可视化的过程。聚类评估方法介绍在k-menas算法中,k值的选取对于得出的模型具有十分关键的影响。而传统k-menas算法将直接按照k=4或5参与运算。但在论文中为了追求所得模型的精准度,将k等于3到10所得出模型进行模型评估,在对比后采取最优k对应的模型进行后续的聚类实现。具体方法如下所示。手肘法手肘法在评估一个聚类模型的好坏程度时,使用的评测指标为模型中所有簇的簇内距离平方和。计算公式如下。SSE=在计算过程中,随着k值的不同,所得出的总距离也不一样。而随着k值的不断增长,所划分出的簇的数量也越多,每个簇内的样本距离越小,自然总会总体距离就会呈现出一个下降的趋势。而在下降的过程中会出现明显的拐点,此时这个拐点所对应的k值就是最佳k值。手肘法的优点为实现简单,计算量小,且k值在图中容易找出。但是对于各个簇之间的分类指标不明确,评估重点偏向于簇内。所以在本论文中将不采取手肘法作为模型评估方法。轮廓系数法轮廓系数法在衡量一个聚类模型的好坏时,综合考虑了聚类模型中簇内和簇间两个因素对模型的影响程度。轮廓系数的计算公式如下所示。s在计算中主要设计两个变量分别为a(i)和b(i)。其中a(i)为样本i到所属簇中所有样本的平均距离,体现了簇的内聚程度,而b(i)是样本i到其他各个簇所有样本的平均距离的最小值。体现了簇间的分离程度。而最后所得出的模型轮廓系数,是模型中所有样本轮廓系数的平均值,取值范围在-1到1之间,轮廓系数越大,则说明该聚类模型效果越好。针对于具体样本来看值大于0时,表示该样本应该被划分在当前簇中;小于1时,说明该样本应该划分在其他簇中;接近0时,表示该样本处在两个或多个簇的交接位置。轮廓系数法的优点是考虑因素全面,所得出的模型合理有效;缺点是计算复杂度过高,为o(n^2)。所以在本文的模型评估环节使用轮廓系数法作为评估方法。聚类模型评估与可视化过程在取k值为3、4、5、6、7、8、9、10时分别得到8个聚类模型后,使用轮廓系数法对所得模型进行评估,评估过程具体代码如图2-15所示,所得结果如表2-4所示。图2-15轮廓系数法实现代码表2-4不同k值对应的轮廓系数值K值轮廓系数30.423826777917289240.274402020099294450.32775759081706860.317685787503782170.2885216221974573680.2704208608411237790.2723987225651615100.24065263093781844比较后发现,在k值等于3时,模型的轮廓系数最大,具体值近似为0.4。所以本论文将选取k等于3作为k-means算法的k值,在经过模型建立后将所得模型保存为excel文件,通过excel中画图的方法绘制出雷达图。如图2-16所示。图2-16k=3时所对应的雷达图其中雷达图中六个顶点为所对应的LRFMCA指标每个涔层次之间的差值为200。三种颜色的线代表聚类后所得出的三个客户群体,具体客户群体分析将在第四章进行详述。系统设计与实现第三章将对前台系统的实现过程与代码功能做出具体介绍。功能描述本本通过javaweb技术实现了用户信息管理和预测系统,具有简单的用户信息管理功能和客户潜价值预测功能。登录用户具体分为普通用户和管理员,且两者对系统的主要实现的功能模块如图3-1所示。图3-1系统功能结构图预测系统代码结构介绍本系统将所用到的java文件主要分为4个包,分别为dao,model,service和util。其中dao包中的两个文件负责将数据库链接对象实例化,通过获取AdminDao中方法传入的数据来重新组建sql语句实现与数据库的交互功能,从而将前后台连接起来。其中还写入了聚类功能的代码,通过获取前台传入的客户具体数据来计算与三个样本中心点距离,找到最小值作为分类结果返回。model包中设计了用户和客户的实例化对象,并根据客户和用户的具体属性编写了对于每个属性获取具体值和设置具体值的方法,作为前后台数据交互的接口,实现前台页面显示具体客户信息的功能。Service包主要负责相应前台页面请求和JavaScript触发函数的实现,其中LoginServlet实现了用户信息比对的功能;RegisterServlet实现了前台信息写入数据库用户表的功能;UserExitServlet实现了用户注销后页面跳转到login.html的功能;AdminDao存放处理前台页面在JavaScript中触发相应操作后触发的函数。Utils包主要负责通过数据库连接包设置具体数据库配置来重写url语句来建立起与数据库的实时连接对象,并将此对象提供给dao包中的函数调用。Java文件目录如图3-2所示。图3-2Java文件目录在本系统的页面设计中将前台分为了jsp页面,JavaScript文件夹,image文件夹,lib文件夹和css文件夹。其中jsp页面为系统运行时主要显示页面,lib文件夹下存放系统运行时必要的jar包,js文件夹下存放相应的JavaScript文件,用于相应jsp页面触发的具体操作,image文件夹下存放前台页面背景图片,css文件下存放对于jsp页面使用到的css文件用于设置前台页面的页面布局设置。前台页面目录结构如图3-3所示。图3-3web目录结构系统处理流程图系统处理的流程主要分为用户登录模块和数据处理模块。图3-4系统登录模块流程图图3-5子模块操作流程图前台页面设计在前台页面设计的过程中,本论文采取JSP页面设计的方法进行前台页面设计,JSP全称为JavaServerPages,中文名为java服务器页面。JSP主要实现的是视图层的功能。JSP的动态网页技术标准是在传统的HTML文件中加入Java程序段。在JSP文件中,共同存在着两种代码即HTML代码和JAVA代码,其中,HTML代码具体用来实现静态页面的显示内容,而JAVA、代码用来实现页面中的动态模块。JSP页面具有跨平台,组件重复使用和预编译的特点。本文中涉及到admin,user,message,register,login5个JSP页面来实现前台的页面设计。其中login页面用于实现管理员和用户登录操作,通过文本框将用户名和密码通过请求的方法将数据传给LoginServlet文件,从而对用户名和密码实现验证操作。如果用户名密码校验成功,且所属权限属于管理员,则显示admin页面。若所属权限属于普通用户,则显示user页面上。若用户名密码不存在于数据库,则提示报错页面,通过JavaScript语句输出提示信息。Message页面用于显示错误提示信息,若用户没有登陆而直接访问admin,user页面,则会跳转到messag页面提示用户未登录警告,并跳转到login页面。前台页面运行截图如图3-6到3-10所示。图3-6login页面图3-7注册界面图3-8管理员界面图3-9普通用户界面图3-10错误提示界面针对所有登录后的界面,实现的功能与动作检测都是通过JavaScript脚本实现,admin页面与user页面操作都对应一个JavaScript脚本。以admin页面为例,对应按钮的触发操作onclick对应一个JavaScript函数,当触发成功后,将所获取的信息传到JavaScript页面来执行对应函数操作,在函数内通过show函数将右边对应的html页面和页面内所包含的对应信息进行输出。JavaScript功能实现在本论文所设计的系统之中,所有具体页面的操作,如目录栏伸缩效果,具体点击显示的页面效果与触发操作时的页面及时反映都是通过JavaScript脚本实现。针对用户和管理员的具体操作权限不同,本文同样将JavaScript分为两个部分,为admin.js和user.js分别实现了管理员和用户界面的具体操作响应功能。两者功能大同小异,下文中将以admin.jsp内容为基础进行介绍。在前台页面中,登陆成功后系统页面左方为目录列表,其中伸缩式目录的实现过程为通过js页面中的$(funcation())方法实现,每个可点击目录都对应一个js页面中的方法。在查询功能中,通过admin.jsp页面中点击按钮所触发的函数query_all()在js页面寻找所对应的函数。在函数中通过xmlhttp方法在页面执行函数语句并将所执行的动作返回到AdminDao类中,通过query_all()所传入的具体参数来拼接xmlhttp.open()所需要的参数来选择在AdminDao中所触发的方法。在AdminDao中具体函数主要分为两个模块。首先通过参数传递获取前台页面传入的信息,并新建一个dao中的具体对象并通过dao中的方法获取与数据库交互后返回的信息,在查询中所返回的为一个列表,其中包含了对应数据表中的所有信息。其次将列表中的参数通过get方法获取,并使用输出语句与html语句相结合。部分代码如图3-11所示。 图3-11query函数代码展示对于插入,删除,修改功能,其代码结构相同,下文中将以插入用户功能为例进行介绍。在admin.jsp页面下点击用户新增目录按钮将触发对应与admin.js页面中的show_insert_user函数,在函数中通过show变量的赋值,将html代码赋值给show变量从而可以显示在页面右方主要部分。部分html代码代码如图3-12所示。图3-12show_insert_user函数随后在所出现页面中点击插入按钮,将触发insert(user)函数,将user作为参数传入给js页面中的insert函数。在insert函数中匹配传入参数后,将触发对应的函数,将页面所输入的信息保存通过字符串拼接的方式组合url,最后通过xmlhttp.open方法发送给AdminDao中的对应函数,主要代码如图3-13所示。图3-13insert函数展示在触发AdminDao中的insert_user函数后,将新建一个userDao对象,并将前台页面传入的数据赋值给对应变量。随后将所获取的变量作为参数传递给UserDao对象中的方法从而实现对后台数据库的操作。在UserDao的insert_user方法中,将通过set函数将所传入参数赋值给对应的sql语句,并设置flag变量的值为1和0表示插入操作是否完成,并将flag作为返回值表示是否执行语句成功。最后在AdminDao的insert_user方法最后,通过返回的flag语句对info变量进行不同的赋值,使用输出方法将info与html标签结合,实现插入成功与失败的及时相应功能。具体代码如图3-14,3-15所示。图3-14AdminDao中inert_user函数图3-15Userdao中insert_user函数对于本系统的预测功能模块,功能入口设计在admin.jsp页面中的潜在价值预测目录按钮上,在触发按钮操作后将进入admin.js中的show_pridict()函数中,通过对show变量赋予相应的html代码来实现对预测用户信息输入的页面代码如图3-16所示。图3-16show的html代码在输入客户信息后,点击预测按钮将触发admin.js页面的pridict()函数,在函数中通过向页面获取用户具体信息,并将获取信息赋值给customer变量,最后通过重组url的方法将参数传递给AdminDao中的pridict_customer函数。在AdminDao中的pridict_customer()函数主要分为两个模块。首先获取传入的信息并赋值给相应的变量,随后将变量放入CustomerDao的pridict_customer()中,而在CustomerDao的pridict_customer()函数将通过传入的L,R,F,M,C,A的具体值来与python模块中获得的模型做距离计算,本文在k=3时得到的模型聚类效果较好,所以将函数返回值设为3类,在客户数据与3个样本中心点距离都计算完毕后,找到距离最小值赋值给flag变量,最后通过flag变量的具体值来判断当前用户所属类别,并通过输出语句将预测信息和针对性建议通过与html语句相结合的方式输出到页面,从而实现客户潜在价值预测功能。其主要代码与页面展示如图3-17,3-18所示。图3-17AdminDao的pridict函数图3-18customerDao中的pridict函数数据库模块本论文中将使用mysql数据库作为后台数据的存储操作载体,通过数据库连接类实现与前台数据库的链接。具体过程论述如下。数据库结构设计在本系统中,需要两张数据表来配合系统功能,分别为user和customer表。其中user表用于实现用户登录注册功能,通过数据库连接类的方法将前台获取的用户名与密码和user表中的对应username,和password相对比,从而实现登录功能。注册功能则是将前台页面传回的请求通过数据库连接类中的参数传递方法,将参数与insert插入语句相结合后传回数据库,来实现对user表的插入操作。同样,在对客户进行其他操作时也是通过数据库连接模块将具体请求参数与数据库语句相结合后,传回数据库执行,实现对应的具体功能。在具体数据表结构编写时,本论文使用MYSQL8.0CommandLineClient和MYSQLWorkben实现数据库和数据表的建立。具体表详细介绍如下。user表属性E-R图如图3-19所示,具体表内容与结构如图3-20与图3-21所示。图3-19user表E-R图图3-20user表内容图3-21user表结构Customer表属性E-R图如图3-21所示。Customer表的具体内容与结构如图3-22与图3-23所示。图3-20customer属性E-R图图3-21customer表内容图3-22customer表结构数据库连接方式在本论文中,通过mysql-connector-java-8.0.11.jar包的类方法实现有关数据库的函数功能。首先通过getConnection()方法获取与数据库的连接对象Connection,在方法中根据本地数据库的具体配置,如数据库的用户名,密码,数据表所在的数据库名称,mysql数据库在系统中的端口号等,重组连接语句。随后将连接语句通过数据库连接类com.mysql.jdbc.Driver组合来获取数据库连接对象conn。对于对数据库的具体操作语句,通过dao包中的UserDao和CustomerDao来实现,具体实现过程主要分为两个部分。首先通过connection对象获取数据库连接对象conn。其次为通过具体函数的参数在PreparedStatement类方法下将参数与具体的功能sql语句相结合,并发送到后台数据库进行执行,从而实现了前台与数据库的交互功能。
聚类模型和系统测试结果第四章将介绍k-means得出的聚类模型和系统的测试结果。模型展示在本通过k从3到10计算所得的轮廓系数对比得,k=3时模型的轮廓系数值为0.4238,在所有模型中为较好。所以选取k=3的模型来实现客户潜在价值预测功能。模型的三个样本中心点如表4-1所示。表4-1模型展示LRFMCA0136.6779165.157637.8005117.320350.04101150.9811180.808532.9704390.1913540.6889499.8385344.54522144.0956199.839679.8421111.5336105.4436425.033随后通过雷达图的形式将上表三个数据进行绘图分析,雷达图效果如图4-1所示。图4-1k=3时的雷达图根据图4-1所示我们可以将三类具体客户分为高价值,中价值,和低价值客户群体。首先看客户群体0类,其客户活跃度最高且远远超出其他两类客户群体,但是仅仅凭借客户活跃度并不能说明客户在未来一段时间的潜在价值,综合其他5个属性来看,其L,R,F,M,和C都为三类中最低。由此可看出此类客户的客户行为为不经常选择飞机作为出行方式,飞行公里总数较少,但是从客户活跃度较高可推断出其平均每次飞行票价较高,且积分兑换次数也高于其他两类客户。并由此可以推断此类客户虽然不经常选择飞机出行,但是一旦选择飞机出行就是中长途旅行,且平均票价远高于其他两类客户可看出此类客户舱室选择大多为商务舱或头等舱。在航空行业当中,空中旅途越长,本次班机所盈利率就越大,且此类用户通过客户活跃度可看出在近期出行的几率较大。所以将此类用户归为高价值客户。其次通过观察客户群1类,发现其客户活跃度与2类客户相差无几,但是在其L,F,M和C当中都为3类最高且R最短,可以看出此类客户为经常选择本航空公司客户,他们经常乘坐飞机,且最近仍然再继续选择本航空公司作为出行方式。虽然其飞行公里总数较长,但是其客户活跃度相对较低,由此可见这类客户平均乘机票价较低,出行时大多为短途旅行,且舱室选择大多在经济舱。对于飞机短途旅行,盈利效果远没有长途旅行大,所以将此类用户归为中等价值客户。最后观察2类用户,此类用户L,R,F,M,C和客户活跃度都相对较低。可见此类用户为刚刚选用本航空公司作为出行方式的客户群体,总飞行公里数相对较少,但客户活跃度在0,1类之间。说明虽然刚刚选用本航空公司作为出行方式,但是仍然具有一定的潜在价值,且对于航空服务业的关注度也保持在中等水平,所以将此类用户归为低价值客户。系统测试在下文叙述的系统测试中主要测试环境为eclipse-jee-2021-12-R-win32-x86_64。对应的web服务器版本为apache-tomcat-8.0.52-64。实例测试下文将给出具体的系统测试步骤,具体流程如图4-2和图4-3所示。图4-2测试流程图4-3测试流程针对上文给出的实例测试步骤,图4-4到图4-11将展示部分功能的运行截图。图4-4用户列举图4-5新增用户图4-6删除指定用户图4-7修改指定用户图4-8客户列举图4-9添加新客户图4-10删除指定客户图4-11客户潜在价值预测功能图4-10预测结果展示针对不同客户群体的服务意见本文将根据实验结果将客户群体主要分为三种类型,分别为高价值,中等价值和低价值客户群体,对于每种客户群体的描述将在下文具体介绍。高价值客户的服务意见针对高价值客户群体,平均飞行距离长,且在近期出行的可能性较大。可以在近期通过精准投放广告的方式向用户推送本航空公司的优惠内容。并在数据库中根据客户历史航班记录统计出客户最常出行的地点以及航班信息来具体投放关于旅行地点以及具体航班优惠政策来引导客户选择本航空公司进行出行。在客户候机时,可使用积分来换取更加优质的服务,如登记提醒,接机,引导服务和VIP候机室体验服务避免在候机乘机时出现意外情况。在客户进行乘机时,可以适当增加客户的免费升舱机会,以此来提高客户对本航空公司的服务印象,避免在候机乘机时出现意外情况。在客户体验更高等级的服务过后,在随后的出行中选择本航空公司高价值服务的可能性也会随之提升。在乘机后可以线上或者线下发放问卷或者空乘人员进行专人调查来询问客户对于此次旅途是否满意,有哪些需要改进的地方并在节假日送上祝福以及小礼品,通过针对性的服务来保留客户。中等价值客户的服务意见对于此类客户来讲,其出行频繁,距离相对较短,且为经济舱客户。可以推断此类客户为经常短距离出差的人士。可以通过此类客户的历史航班信息,来推断出此类客户经常出差,旅行的起始地和目的地。通过数据来为此类客户打造航班时刻表,将经常乘坐的航班信息推送给客户,并相应的提高优惠政策和商务仓的体验活动,以此来提升客户对本航空公司的服务印象和在之后出行中选择商务舱的几率。也可以根据用户分布,选择性的来开设专车接送服务。比如在某城市中的某航班中价值客户群体较多,可针对此航班开设机场大巴来接送此类客户,避免误机等意外的发生。低价值客户的服务意见对于低价值客户来讲,从当前数据并不能完全否认其未来创造价值的能力,应该对此类客户保持长期的观察,看是否有转变为中,高价值客户群体的趋势,在服务方面保持和普通用户相同的待遇,在节假日送上祝福,推送一些办卡,升舱,淡季优惠活动。并在航班完成后可发放线上意向调查,看是否在未来一段时间有出行的需要,可将此类客户往中高价值客户方向培养,但不建议投入太多的人力物力。
总结与展望在本系统的开发过程中从我国航空公司行业的实际需求出发,并对航空旅客进行了深入的调查,力求最大限度的实现航空公司对客户潜在价值预测的需求。在分类时使用加权的k-menas算法和根据轮廓系数调节k值是本预测系统的一个亮点。在预测系统登录时对管理普通用户和管理员进行区分,有着简洁易上手的操作页面也是在系统设计中的一个优势。通过不断地完善,后台聚类模型建立完成,系统可以正常运行,实现了所设计的功能。通过本预测系统功能的实现,使用本系统后航空公司的服务质量将得到有效的改善。(1)可以将所有客户群体分类,以便于有针对性的服务。(2)在分类后,可根据分类时所涉及到的属性和系统所给出建议更好的提升服务品质,达到挽留甚至提升客户价值的效果。本系统的设计过程中和预测模型建立过程中,还有很多不完善的功能。如:考虑数据安全问题,带有重复功能的模块不能很好的整合到一起。显示界面也需要进一步的完善。由于能力有限,在模型建立和系统设计中仍然存在一些缺陷,模型可以加入更多属性来建立更加有效的预测性指标,在模型评估时可以考虑更加全面的评估方法。系统功能可以进一步整合,并添加一些可视化因素达到更有说服力的结果。期望在今后的进一步学习中可以对本系统进行改善。
参考文献AarikkaStenroosLeena,WelathanthriMartinaDon,RantaValtteri.WhatIstheCustomerValueoftheCircularEconomy?Cross-IndustryExplorationofDiverseValuesPerceivedbyConsumersandBusinessCustomers[J].Sustainability,2021,13(24):0-1.Wen-YuChiang.Identifyinghigh-valueairlinescustomersforstrategiesofonlinemarketingsystems[J].Kybernetes,2018,47(3):0-14.JohnLindström.WhenMovingfromProductsandServicestowardsFunctionalProducts:WhichSustainability-orientedCustomerValuesareofInterest?[J].Procedia,2016,48:0-6.YounJae,SoYeonPARK,HyeYoon.AStudyontheCustomerValueofAirline:FocusedonImprovingCustomerSatisfactionbyCustomerValueType[J].EastAsianJournalofBusinessEconomics,2021,9(3):0-11.Ching-FuChen,Jing-PingW
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国书架子数据监测研究报告
- 创新菜品考试题及答案
- 2019-2025年消防设施操作员之消防设备基础知识考前冲刺模拟试卷A卷含答案
- 2019-2025年消防设施操作员之消防设备基础知识考前冲刺模拟试卷A卷含答案
- 2019-2025年军队文职人员招聘之军队文职教育学通关题库(附答案)
- 2020年辽宁省沈阳市中考道德与法治试卷(含答案)
- 采购与质量分包合同(2篇)
- 高等教育自学考试《00102世界市场行情》模拟试卷三
- 2025年全国硕士研究生考试《管理类联考综合能力》模拟试卷一
- 2025年法制宣传日普法知识竞赛题库及答案(二)
- 2025年共青科技职业学院单招职业技能测试题库附答案
- 2025年湖南生物机电职业技术学院单招职业倾向性测试题库1套
- 2025年部编教材对道德与法治的启示心得体会
- 《预算编制要点讲解》课件
- 2025年交管12123学法减分试题库附参考答案
- 2025年360亿方智能航空AI白皮书-爱分析
- 2025(人教版)音乐三年级下册全册教案及教学设计
- 福建省厦门市第一中学2023-2024学年高二上学期开学考试英语试题(解析版)
- 2025年山东新华书店集团限公司临沂市县分公司招聘录取人员高频重点提升(共500题)附带答案详解
- 2025年极兔速递有限公司招聘笔试参考题库含答案解析
- 酒店资产管理制度
评论
0/150
提交评论