基于建行数据挖掘的中高端客户理财消费及营销策略(投稿).doc_第1页
基于建行数据挖掘的中高端客户理财消费及营销策略(投稿).doc_第2页
基于建行数据挖掘的中高端客户理财消费及营销策略(投稿).doc_第3页
基于建行数据挖掘的中高端客户理财消费及营销策略(投稿).doc_第4页
基于建行数据挖掘的中高端客户理财消费及营销策略(投稿).doc_第5页
免费预览已结束,剩余21页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于建行数据挖掘的中高端客户金融消费消费分析及营销策略我国是世界上富裕人群增长最快的国家之一。美林全球财富与凯捷顾问公司发布的2009年亚太区财富报告,声称中国的富裕人士(指净资产100万美元以上人士)为36.4万人,排名全球第四,整体财富达1.7万亿美元,预计未来十年富裕人士财富成长率增速每年会超过12。也就是说,预计到2019年,中国富裕人士的财富将达到10.5万亿以上。由于2009年经济的快速回升以及充沛的流动性释放,通货膨胀迅速到来,2009年底cpi及ppi纷纷转正,2010年一季度cpi、ppi仍逐渐上行,同时,ppi同比增速超过cpi同比增速。过多的流动性加上狂热的投资,在最终需求特别是消费需求增速不断加大的情况下,将进一步推高物价,增加通胀压力。由于对通货膨胀的预期,富裕人士对财富的保值增值有了很大的兴趣,他们中的许多人转而向金融业寻找解决的办法,希望通过理财投资、合理配置资源的方式对抗cpi上涨。这些人于是就成为银行的中高端客户,并给银行带来丰厚的利润。对于银行来说,抓住市场机会,营销基金、黄金、理财产品等银行厚利型产品,帮助客户稳健对抗cpi,是实施与客户共赢进而密切与客户的关系的重要手段。为争夺这些中高端客户,各家银行的竞争手段各异,包括推行个人理财顾问业务、理财套餐服务、贷款创新产品、投资理财类产品以及银行理财类产品,以及设立理财中心、财富中心营造舒适的环境,采用客户关系管理系统,配备一对一的个人客户经理等等。随着电子银行产品的普及,中高端客户到银行上门办理业务的次数越来越少,抓住这寥寥的面对面的机会销售合适的金融产品,是每家银行都想做好的功课。由于现在各家银行普遍存在过度营销,使客户感觉不胜其烦。同时,银行的员工在毫无购买意向的客户身上浪费了大量的时间。在这里,利用现有的数据库,分析已购买金融产品的客户的消费行为,识别分析客户的金融消费行为,进而根据新来的中高端客户情况,实施金融产品的精准营销,挖掘客户的潜在需求,是提高银行工作效率和提升客户满意度的有效途径。识别分析客户的金融消费行为,是最具有技术难度的一环。以往,识别分析客户的金融消费行为,基本上都是采用问卷调查的形式,以银行客户的数据库为基础的数据挖掘较少。同样地,以电信、移动客户的数据库为基础的数据挖掘和分析文章时有见闻,而对银行客户的数据挖掘分析则几乎没有。本文则利用数据库的数据挖掘,对中高端客户的金融消费行为作分析。一、本文数据来源和客户的基本情况在建设银行浙江富阳支行的2009年底的6913位中高端客户的数据库中,随机抽取出728位客户资料,主要包含客户的年龄、性别、学历、职业、资产(日均存款)、负债 (贷款)、持有的基金、银行理财产品、国债、信用卡消费、网上银行交易额等信息。对728个观测数据的结构分析如下:性别:728个客户中,女性客户为384 人,占总人数的52.75%; 男性客户为344,占 47.25%,男女比例相对比较均匀。年龄:被访客户的平均年龄为42岁,最大的客户为77岁,最小的客户为18岁。并且,年龄可以近似的服从一个正态分布,说明选取的样本比较合理。 学历:728个客户中,总共有5 类学历水平。其中,学历为研究生及以上的为2人,占0.28%; 学历为大学本科的有151人, 占总的比例为20.74%; 学历为大学专科的有243 人,占33.38%; 学历为高中的有238人,占 32.69%;学历为初中及以下的有94人,占 12.91%。 职业: 728个客户中, 总共有 5类 职业。 其中, 职业为高脑力劳动者(如企业主、负责人、专业技术人员)的有431人, 占总人数的59.19%;职业为脑力劳动者(如公务员、教师、it职员、会计审计、企业中层管理者)的有51人, 占总的比例为7.01%; 职业为半脑力半体力者(如办事人员、商业工作人员、服务型工作人员)的有121人, 占 16.62%; 职业为轻体力劳动者(如工业劳动者、军人、其他劳动者)的有 123 人, 占16.90%;职业为重体力劳动者(如农林牧渔劳动者)的有 2 人, 占0.28%。资产:728 个客户中, 日均存款的平均值为 186661 元, 标准变差为444679, 极差为6163058。 贷款: 728个客户中, 共有 229 个客户在银行有贷款。 基金:728个客户中, 共有241个客户购买了基金, 占总的购买客户的比例为33.1%。 其中, 在购买基金的客户中, 购买基金的平均数为117123 元, 标准偏差为157709 元, 极差(购买基金最高额与购买基金最低额的差)为1188489 元。 国债: 728个客户中, 共有22个客户购买了国债, 占总的购买客户的比例为3.02%。 其中, 在购买国债的客户中, 购买国债的平均数为 153318 元, 标准偏差为 213304 元, 极差为 980000。理财产品: 728个客户中, 共有33个客户购买了理财产品, 占总的购买客户的比例为4.53%。 其中, 在购买理财产品的客户中, 购买理财产品的平均数为239242元, 标准偏差为 333799 元, 极差为 1550000。二、建立logistic模型,对基金、国债、理财产品分别作logistic 回归。这批数据中, 响应变量取值分别为基金、理财产品、国债, 自变量取值分别为性别、学历、职业、年龄、资产(日均存款)和负债 (贷款), 同时我们还自定义了风险因子(具体定义见下)。同时, 我们规定资产、负债、风险因子和年龄为连续型变量, 性别、职业、学历为分类变量。 自变量风险因子的定义: 风险因子=(国债*1+理财产品*4+基金* 5)/(国债+理财产品+基金+存款+贷款)*2.注:最后乘以系数2目的是使得风险因子取值在0与10之间。 (一)基金1.模型的建立首先对基金作logistic回归。假设对某个客户而言,他购买基金的概率为 。 由sas 运行结果可以知道,影响的变量分别有年龄、学历水平、职业、资产、负债以及风险因子,但是,性别对是否购买基金的概率没有影响。在得到具体模型之前,我们先解释 odds的概念。 odds= 表示购买基金的概率与不购买基金的概率的商。变换公式可得,所以,odds与存在正相关关系。如果odds取值大,说明购买基金的概率比较高;特别当 odds 1时,就说明购买基金的概率要大于 0.5。如果odds取值小,说明购买基金的概率比较小。特别当odds1时,就说明购买基金的比例要小于0.5。在下文中,学历水平为1的是研究生及以上,学历水平为2的是大学本科,学历水平为3的是大学专科,学历水平为4的是高中,学历水平为5的是初中及以下。职业代码为1代表高脑力劳动者,如企业主、负责人、专业技术人员;职业代码为2代表脑力劳动者,如公务员、教师、it职员、会计审计、企业中层管理者;职业代码为3代表半脑力半体力劳动者,如办事人员、商业工作人员、服务型工作人员;职业代码为4代表轻体力,如工业劳动者、军人、其他劳动者;职业代码为5代表重体力,如农林牧渔劳动者。下面通过logistic 回归得到关于基金的logistic模型如下:当学历水平为 5 或者1, 职业类型为 4 或 1 或 5时,当学历水平为5或者1, 职业水平为 2 时, 当学历水平为 5 或者 1, 职业水平为 3时, 当学历水平为 2, 职业类型为 4 或 1 或 5时,当学历水平为 2, 职业类型为 2时,当学历水平为 2, 职业类型为 3时,当学历水平为 3, 职业类型为 4 或 1 或 5时,当学历水平为 3, 职业类型为 2时,当学历水平为 3, 职业类型为 3时,当学历水平为 4, 职业类型为 4 或 1 或 5时,当学历水平为 4, 职业类型为2时,当学历水平为 4, 职业类型为3时,2.模型的解释下面分析各个变量对 影响程度的大小。1.1年龄购买基金的影响程度年龄与odds存在正相关关系,所以年龄与购买基金的概率也存在正相关关系。当顾客年龄增加一岁时,odds的取值就增加到 1.06 倍。 1.2资产对购买基金概率的影响。资产与 odds存在正相关关系,所以资产与购买基金的概率也存在正相关关系。当资产额增加 10 万元时,相应的,odds的取值就增加到 1.083 倍。 1.3负债(贷款)对购买基金概率的影响负债与odds存在正相关关系,所以负债与购买基金的概率也存在正相关关系。当负债额增加10万元时,相应的,odds的取值就增加到 1.052 倍。1.4风险因子对购买基金概率的影响。风险因子与odds存在正相关关系,故亦与购买基金的概率存在正相关关系。当风险因子增加1个单位时,odds的取值增加到1000倍以上。所以,风险因子对购买基金的概率起到了一个决定性的作用。 1.5学历水平对购买基金概率的影响。这里学历水平为分类变量,故这里假定以学历水平5作为一个基础水平。这里由于学历水平1只有两个数据,所以经过统计分析得到,学历水平1与学历水平5对购买基金的概率的影响程度相同。 当学历水平由5变成2时,则odds的取值增加到原来的13.061 倍,所以相应的值也会有一个很大的提高。 当学历水平由5变成3时,odds值增加到4.965 倍,相应也会有所增加。 当学历水平由5变成4时,odds值 增加到 2.749 倍,相应也会有所增加。 1.6职业对购买基金概率的影响。 这里职业仍然为分类变量,并取职业类型 5为基准,首先,职业1或4与5的影响相同。 当职业由5变成职业2时,odds值增加到46.873倍,相应也会有所增加。 当职业由5变成职业3时,odds值增加到6.402 倍,相应 也会有所增加。 3.模型的检验由似然比检验得到,chi-square=17336.8618, pr0.000010.05, 所以得到的logistic 模型拟合优度比较好。且 aic, bc的值都比较小,说明模型拟合度较好。 同时,该模型中, max-scaled r-square = 1.0000, 该数据可以很好的由该模型来解释。 最后, 由二维分类表检验得到如下结果。 预测数据原始数据频数010487016235注:该表中, 0表示没有购买基金,1表示购买基金。对于,预测数据,如果预测概率大于或者等于0.5,我们则判断购买基金; 若预测概率小于0.5,则不购买基金。 由上表可以知道,购买基金的241位顾客中,有235位被准确预测到。 4.模型参数的检验模型参数在 0.05的显著水平下都显著。 如下表: analysis of maximum likelihood estimates standard waldparameter df estimate error chi-square pr chisqintercept 1 -9.6844 0.7352 173.5100 .0001age 1 0.0585 0.0100 34.1252 .0001edu2 1 2.5696 0.4650 30.5364 .0001edu3 1 1.6024 0.4658 11.8353 0.0006edu4 1 1.0112 0.4683 4.6630 0.0308career2 1 3.8474 0.4932 60.8515 .0001career3 1 1.8566 0.2042 82.6937 .0001deposit 1 0.0800 0.00707 128.0116 .0001loan 1 0.0503 0.00787 40.9131 .0001risk 1 105.5 6.5176 262.0247 .0001(二). 国债1. 模型的建立下面对国债作logistic 回归。假设对某个客户而言,他购买国债率为。由sas运行结果可以知道,影响的变量分别有性别、年龄、学历水平、职业、资产,以及风险因子,但是,负债对是否购买国债的概率没有影响。下面通过logistic 回归得到关于国债的logistic 模型如下:当客户性别为男,学历水平为1或2或3或5,职业类型为4或5时,当客户性别为男, 学历水平为1或2或3或5,职业类型为1时,当客户性别为男, 学历水平为1或2或3或5,职业类型为2时,当客户性别为男,学历水平为1或2或3或5,职业类型为3时,当客户性别为男,学历水平为4,职业类型为4或5时,当客户性别为男,学历水平为4,职业类型为1时,当客户性别为男,学历水平为4,职业类型为2时,当客户性别为男,学历水平为4,职业类型为3时,当客户性别为女,学历水平为1或2或3或5,职业类型为4或5时,当客户性别为女,学历水平为1或2或3或5,职业类型为1时,当客户性别为女,学历水平为1或2或3或5,职业类型为2时,当客户性别为女,学历水平为1或2或3或5,职业类型为3时,当客户性别为女,学历水平为4,职业类型为4或5时,当客户性别为女,学历水平为4,职业类型为1时,当客户性别为女,学历水平为4,职业类型为2时,当客户性别为女,学历水平为4,职业类型为3时,2.模型的解释下面分析各个变量对 影响程度的大小。2.1 年龄对购买国债的影响程度年龄与odds存在正相关关系,所以年龄与购买国债的概率也存在正相关关系。当顾客年龄增加一岁时,odds的取值就增加到 1.082倍。 2.2资产(存款)对购买国债概率的影响。资产与odds存在负相关关系,所以资产与购买国债的概率也存在负相关关系。当资产额增加10万元时,相应的,odds的取值就变为原来的0.879。 2.3风险因子对购买国债概率的影响。风险因子与odds存在正相关关系,故亦与购买国债的概率存在正相关关系。当风险因子增加1个单位时,odds的取值增加到1.151倍。 2.4学历水平对购买国债概率的影响。这里学历水平为分类变量。故这里假定以学历水平 5 作为一个基础水平。首先,学历水平1或2或3与学历水平5的作用相同。当学历水平由5变成4时,odds值增加到3.164倍。 2.6职业对购买国债概率的影响。 这里职业仍然为分类变量,并取职业类型5时为基准。首先,职业4与5的影响水平相同。 当职业由5变成职业1时,odds值减少到原来0.226。当职业由5变成职业2时,odds值增加到17.701倍。当职业由5变成职业3时,odds值增加到5.805倍。 2.7 性别对购买国债的影响。 性别作为分类变量,以男性作为基准。当顾客由男性变为女性时,odds值增加到原来的3.166倍。 3.模型的检验由似然比检验得到,chi-square=600.7264, pr0.000010.05,所以得到的logistic模型拟合优度比较好。且 aic、bc的值都比较小,说明模型拟合的也比较好。 同时,该模型中,max-scaled r-square = 0.6750。最后, 由二维分类表检验得到如下结果。 预测数据原始数据频数01070421157注:该表中,0表示没有购买国债,1表示购买国债。对于预测数据,如果预测概率大于或者等于0.5,我们则判断购买国债;若预测概率小于0.5,则不购买国债。 该表是否需要修改。4.模型参数的检验模型参数在 0.05的显著水平下的显著。 如下表: analysis of maximum likelihood estimates standard waldparameter df estimate error chi-square pr chisqintercept 1 -9.7575 0.7276 179.8213 .0001age 1 0.0791 0.0106 55.5001 .0001edu4 1 1.1519 0.2304 24.9929 .0001career1 1 -1.4860 0.5646 6.9263 0.0085career2 1 2.8736 0.4348 43.6734 .0001career3 1 1.7587 0.4396 16.0080 .0001deposit 1 -0.1292 0.0551 5.4932 0.0191risk 1 0.1404 0.0330 18.1128 .0001sex 1 1.1525 0.2391 23.2296 .0001(三)理财产品1. 模型的建立下面对理财产品作logistic 回归。 假设对某个客户而言,他购买理财产品的概率为 。由sas运行结果可以知道,影响的变量分别有性别、学历水平、职业、资产、负债以及风险因子,但是,年龄对是否购买理财产品的概率没有影响。下面通过logistic 回归得到关于理财产品的logistic 模型如下:当客户性别为男,学历水平为1或2或3或5,职业类型为1或4或5时,(下面等式的右边第三项忘记打 负债)当客户性别为男,学历水平为1或2或3或5,职业类型为2时,当客户性别为男,学历水平为1或2或3或5,职业类型为3时,当客户性别为男,学历水平为4,职业类型为1或4或5时,当客户性别为男,学历水平为4,职业类型为2时,当客户性别为男,学历水平为4,职业类型为3时,当客户性别为女,学历水平为1或2或3或5,职业类型为1或4或5时,当客户性别为女,学历水平为1或2或3或5,职业类型为2时,当客户性别为女,学历水平为1或2或3或5,职业类型为3时,当客户性别为女,学历水平为4,职业类型为1或4或5时,当客户性别为女,学历水平为4,职业类型为2时,当客户性别为女,学历水平为4,职业类型为3时,2.模型的解释下面分析各个变量对 影响程度的大小。2.1资产(存款)对购买理财产品概率的影响。资产与odds存在正相关关系,所以资产与购买理财产品的概率也存在正相关关系。当资产额增加10万元时,相应的,odds的取值就变为原来的1.077倍。 2.2 负债对购买理财产品的影响 负债与理财产品存在负相关系。当负债增加10万元时,odds就变为原来的0.7132.3 风险因子对购买理财产品概率的影响。风险因子与odds存在正相关关系,故亦与购买理财产品的概率存在正相关关系。当风险因子增加1个单位时,odds的取值增加到1.398倍。 2.4 学历水平对购买理财产品概率的影响。这里学历水平为分类变量。故这里假定以学历水平5作为一个基础水平。首先, 学历水平1或2或3与学历水平5的作用相同。当学历水平由5变成4时,odds值变为原来的0.4622.5 职业对购买理财产品概率的影响。 这里职业仍然为分类变量,并取职业类型 5时为基准。首先,职业1或4与 5 的影响水平相同。当职业由5变成职业2时,odds值增加到7.773倍。当职业由5变成职业3时,odds值增加到1.943倍。 2.6 性别对购买理财产品的影响。 性别作为分类变量,以男性作为基准。当顾客由男性变为女性时,odds值增加到原来的2.607倍。 3.模型的检验由似然比检验得到,chi-square=339.9194,pr0.000010.05, 所以得到的logistic 模型拟合优度比较好。且 aic、 bc的值都比较小,说明模型拟合的也比较好。 同时,该模型中,max-scaled r-square = 0.4878。最后, 由二维分类表检验得到如下结果。 预测数据原始数据频数01069321285注: 该表中, 0表示没有购买理财产品, 1 表示购买理财产品。对于预测数据,如果预测概率大于或者等于0.5,我们则判断购买理财产品;若预测概率小于 0.5,则不购买理财产品。 该表是否需要修改。4.模型参数的检验模型参数在 0.05的显著水平下的显著。 如下表: analysis of maximum likelihood estimates standard waldparameter df estimate error chi-square pr chisqintercept 1 -5.1400 0.3075 279.4168 .0001edu4 1 -0.7720 0.2367 10.6351 0.0011career2 1 2.0506 0.2507 66.8840 .0001career3 1 0.6640 0.2536 6.8553 0.0088deposit 1 0.0739 0.0133 30.9718 .0001loan 1 -0.3382 0.1663 4.1369 0.0420sex 1 0.9582 0.2337 16.8139 .0001risk 1 0.3349 0.0309 117.3945 fmodel 25 359.4602077 14.3784083 18.33 .0001error 215 168.6305054 0.7843279corrected total 240 528.0907131由上表可知,pr0.0001 fmodel 3 1.76777862 0.58925954 0.52 0.6731error 18 20.34946982 1.13052610corrected total 21 22.11724843同理, 学历水平对购买国债的数额也没有显著影响, 方差分析表如下: sum ofsource df squares mean square f value pr fmodel 3 1.72853369 0.57617790 0.51 0.6813error 18 20.38871474 1.13270637corrected total 21 22.11724843但是, 性别对购买国债的数额还是有显著影响的, 方差分析表如下: sum ofsource df squares mean square f value pr fmodel 1 4.26423934 4.26423934 4.78 0.0409error 20 17.85300909 0.89265045corrected total 21 22.11724843但是,通过对数据采用协方差分析,可以发现,模型中没有变量在5%的显著水平下被选入,说明该模型中,购买国债的数量都不能被这些变量很好的解释。 (三)理财产品 这里值得注意的是买理财产品的客户中,只有一个客户有贷款, 所以这里基本不用考虑贷款的影响。同样,对买国债的数额做一个对数变换,通过proc univariate,可以通过正态性检验。首先,通过方差分析可以得到性别、职业、学历水平都对购买理财产品的数额没有显著性的影响。方差分析表如下:性别: sum ofsource df squares mean square f value pr fmodel 1 1.16432820 1.16432820 1.19 0.2832error 31 30.26781894 0.97638126corrected total 32 31.43214713学历水平: sum ofsource df squares mean square f value pr fmodel 3 1.45119854 0.48373285 0.47 0.7069error 29 29.98094860 1.03382581corrected total 32 31.43214713职业: sum ofsource df squares mean square f value pr fmodel 4 0.76119369 0.19029842 0.17 0.9500error 28 30.67095345 1.09539119corrected total 32 31.43214713下面,通过协方差模型,可以发现,在5%的显著水平下,分类变量职业、性别、与学历水平都没有被选入自变量。 所以在变量选择的时候,可以完全剔除分类变量,只需对连续型变量做回归分析。利用sas 的proc reg 过程可以得到如下模型:首先,影响购买理财产品数额多少的变量分别为风险因子和资产, 其中年龄这个变量没有对结果产生影响。 其次,得到回归模型如下:下面对该模型进行检验:首先得到方差分析表如下: analysis of variance sum of meansource df squares square f value pr fmodel 2 4414.18818 2207.09409 305.41 .0001error 31 224.02530 7.22662uncorrected total 33 4638.21348由上表知, pr0.001 |t|risk 1 1.50827 0.07896 19.10 .0001ddp 1 0.89248 0.11459 7.79 .0001四、在实际中的运用利用以上研究成果,建立服务于中高端客户的“金融产品营销服务系统”,创建和固化依托营销系统的“精准营销模式”,并将系统作为“渠道精准营销门户”,利用系统精准分析定位目标客户,统一调度多营销渠道捕捉商机,跨前台销售系统发布一致性的营销信息,在向前台一线传输营销意图的同时,为销售人员提供了有力的营销支持,有效解决 “挖掘客户、捕捉商机、把握营销机会”等系列问题,促进产品销售显著增长。具体的步骤是;(一)创建客户金融消费行为分析系统。根据以上研究成果,把中高端客户的资料录入系统,先分别分析客户购买基、国债、银行理财产品的概率,对概率大于0.5的客户,再根据回归公式测算购买金融产品的金额。 (二)将上述系统嵌入目前银行的业务系统,当客户前往银行网点来办理业务时,系统自动提示银行工作人员对客户营销什么产品,大致可以推荐多少额度。(三)每次依托营销系统策划和发布营销任务前,都召集资深个人客户经理进行座谈,采用“头脑风暴”的方式,利用资深业务人员的经验,结合历史任务的执行和反馈情况,对目标产

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论