营销数据分析-案例 第8章基于决策树的消费者响应预测案例_第1页
营销数据分析-案例 第8章基于决策树的消费者响应预测案例_第2页
营销数据分析-案例 第8章基于决策树的消费者响应预测案例_第3页
营销数据分析-案例 第8章基于决策树的消费者响应预测案例_第4页
营销数据分析-案例 第8章基于决策树的消费者响应预测案例_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于决策树的消费者响应预测案例基于决策树的广告投入销售额预测项目背景随着人们生活节奏的加快,广告在商品销售中起到的作用越来越大,各个公司都已经十分重视自身产品的广告投入方式,从而将广告的作用发挥到最大,来实现收益的最大化。精准投放广告的作用有以下几个方面。1、广告是最大、最快、最广泛的信息传递媒介。通过广告,企业或公司能把产品与劳务的特性、功能、用途及供应厂家等信息传递给消费者,沟通产需双方的联系,引起消费者的注意与兴趣,促进购买。如果出现某些产品在某地积压滞销,而彼地却缺少货源,也可通过广告沟通联系。为了沟通产需之间的联系,现在不仅生产单位和销售单位刊登广告,寻找顾客,而且一些急需某种设备或原材料的单位,也刊登广告,寻找货源。因此,广告的信息传递能迅速沟通供求关系,加速商品流通和销售。2、广告能激发和诱导消费。消费者对某一产品的需求,往往是一种潜在的需求,这种潜在的需要与现实的购买行动,有时是矛盾的。广告造成的视觉、感觉映象以及诱导往往会勾起消费者的现实购买欲望。有些物美价廉、适销对路的新产品,由于不为消费者所知晓,所以很难打开市场,而一旦进行了广告宣传,消费者就纷纷购买。另外,广告的反复渲染、反复刺激,也会扩大产品的知名度,甚至会引起一定的信任感。也会导致购买量的增加。3、广告能较好地介绍产品知识、指导消费。通过广告可以全面介绍产品的性能、质量、用途、维修安装等,并且消除他们的疑虑,消除他们由于维修、保养、安装等问题而产生的后顾之忧,从而产生购买欲望。4、广告能促进新产品、新技术的发展。一新产品、新技术的出现,靠行政手段推广,既麻烦又缓慢,局限性很大,而通过广告,直接与广大的消费者见面,能使新产品、新技术迅速在市场上站稳脚跟,获得成功。如果我们能分析出广告媒体投入与销售额之间的关系,我们就可以更好地分配广告开支并且使销售额最大化。二、项目简介1.项目内容本项目将分析广告的不同投入方式对销售额的影响,并建立相关模型对不同广告投入方式的销售额进行预测。主要研究以下内容:(1)不同广告投入方式与销售额之间的关系。(2)对不同广告投入方式所带来的销售额进行预测。(3)尝试给出合理化的广告投入建议2.数据说明实验使用从kaggle获取的不同广告投入方式和销售额的数据。该数据共有4个字段,共202条内容。每条内容包含了不同广告方式的投入额和相应的销售额。三、分析步骤1.理解数据在Pycharm中输入下面程序,导入数据和工具包,并查看数据集的信息、大小,并初步观察头部信息。2.数据预处理在真实世界中,数据通常是不完整的(缺少某些感兴趣的指标值)、不一致的(包含代码或者名称的差异)、极易受到噪声(错误或异常值)的侵扰的。因为数据库太大,而且数据集经常来自多个异种数据源,低质量的数据将导致低质量的挖掘结果。就像一个大厨现在要做美味的蒸鱼,如果不将鱼进行去鳞等处理,一定做不成我们口中美味的鱼。数据预处理就是解决上述所提到的数据问题的可靠方法,因此,在进行数据分析之前我们需要进行数据预处理。数据预处理一般要遵循以下规则:①完整性:单条数据是否存在空值,统计的字段是否完善。②全面性:观察某一列的全部数值,通过常识来判断该列是否有问题,比如:数据定义、单位标识、数据本身。③合法性:数据的类型、内容、大小的合法性。比如数据中是否存在非ASCII字符,性别存在了未知,年龄超过了150等。④唯一性:数据是否存在重复记录,因为数据通常来自不同渠道的汇总,重复的情况是常见的。行数据、列数据都需要是唯一的。本项目对数据进行数据类型转换和缺失值处理两种预处理方法,以确保其完整性、全面性与合法性。(1)数据类型转换首先,通过Dataframe中的info()函数查看各数据字段数据类型和缺失值情况。经过观察,发现所有数据类型都为浮点型数据,所以不需要进行数据类型的转换。(2)缺失值处理在上述数据类型转换过程中,发现radio和newspaper列存在数值缺失,需要对该缺失数据进行处理。缺失值指的是现有数据集中某个或某些指标的值是不完全的。其一般处理主要有以下方法:①删除指标或者删除样本:如果大部分样本该指标都缺失,这个指标能提供的信息有限,可以选择放弃使用该维指标。②统计填充:对于缺失值的指标,尤其是数值类型的指标,根据所有样本关于这维指标的统计值对其进行填充,如使用平均数、中位数、众数、最大值、最小值等,具体选择哪种统计值需要具体问具体分析。③统一填充:常用的统一填充值有“空”、“0”、“正无穷”、“负无穷”等;④预测/模型填充:可以通过预测模型利用不存在缺失值的指标来预测缺失值,如统计、学习等。这种虽然方法复杂,但是最后得到的结果比较好。本项目通过dropna方法删除该样本的缺失值来进行缺失值处理。结果显示,缺失值处理已经完成,下面可以进行数据可视化分析。(3)探索性数据分析探索性数据分析(ExploratoryDataAnalysis,EDA)是对数据进行分析并得出规律的一种数据分析方法,是一种利用各种工具和图形技术(如柱状图、直方图等)分析数据的方法。它是一个开放式的过程,在这个过程中,我们可以绘制图表并计算统计数据以便探索我们的数据。EDA的目标是确定我们的数据可以告诉我们什么。与目标相关的变量对模型很有用,因为他们是用于预测目标。简单说就是画图来理解数据,EDA探索性数据分析本质上就是用图画图的方式来理解数据。首先,通过散点图分析每一种广告投放方式的销售额分布情况:通过绘制每一个维度特征与销售额的散点图,可以大概看出,各种广告投入与销售额成正比。然后我们在画出各个投放方式金额的平均数和销售额的条形图来更加直观的证明这个结论。从下图我们也可以清晰的看出电视这种广告投放方式的平均值最高,这和我们上面得到的散点图基本一致,电视广告投放散点图分布有明显的集中趋势。但是我们要清楚散点图分布只能看出一个模糊的大概,具体量化的关联性,可以通过关联矩阵和热力图进行展示,首先就是corr()方法输出关系矩阵。然后可以将输出的数据进行图形可视化,较为常用的就是热力图,直接利用上面的结果进行输出。绘制热力图的代码如下查看关联矩阵和热力图都只需要查看主对角线(左上角到右下角对角线)的一侧即可,由于这里探究的是利润与其它三个影响因素之间的关系,因此只需要看最后一行的数据即可。数值在(0.45,1)或者(-1,-0.45)之间,都可以认为两者具有相关性。比如上面的输出结果,利润和电视投放以及广播投放都是有关联,而与新闻报纸的投放没有关联。(4)销售额预测使用决策树模型分析:结果显示,决策树模型的R2(拟合优度)较高,均大于百分之九十。接下来画出模型的学习曲线,观察模型的拟合情况。五、实验总结1.结果分析根据以上分析,可以得到结论:要想增加商品的销售额,我们应该首先考虑增加电视广告和电台广告的投入量,因为商品的销售额与这两种广告投放方式的关系最大。我们要严格控制在报纸上的广告投入量,因为经过我们分析,报纸广告投入这种方式与销售额并没有什么明显关系,换句话说,加大报纸广告投入量并不能提高销售额,所以我们也就没有必要增加报纸的广告投入。2.改善建议(1)现代化企业的广告宣传并不能只着眼于传统宣传方式,随着互联网平台的崛起,在新媒体营销时代背景下,企业产品的销售模式也随之发生改变。当前企业转变生产产品营销可以借助新媒体中的互联网平台来开展,可以此有效的降低企业的销售成本和运输费用,以此实现企业的经济效益增长,为生产企业的健康发展提供保障。(2)企业不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论