版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据与金融
实训操作手册
1
目录
-、“案例六综合实训-大数据与金融”3
(一)理论导入3
1、量化交易(投资方法)3
2、算法交易(自动交易、黑盒交易或机器交易)3
3.量化策略3
4、量化选股3
5、股票回测4
(二)实验设计4
1、股票时间序列数据采集4
2、绘制股票成交量的时间序列图5
3、绘制股票收盘价和成交量的时间序列图5
4、绘制K线图(蜡烛图)6
5、股票指标相关性分析8
6、移动平均线10
(三)实训操作12
1、选择案例与任务12
2、添加项目12
3、参数填写13
4、代码执行14
5、查看结果14
二、”案例七综合实训-大数据与电商”16
(一)理论导入16
1、数据化运营的重要意义16
2、数据化运营的两种方式16
3、数据化运营的工作流程17
(-)实验设计19
1、白酒商品数据采集19
2、白酒商品评价数采集19
3、数据清洗19
4、五粮液用户评论分析20
2
5、数据可视化20
(三)实训操作27
1、选择案例与任务27
2、添加项目27
3、参数填写27
4、代码执行27
5、查看结果28
三、财务大数据28
【任务实施】28
一、“案例六综合实训I-大数据与金融”
(一)理论导入
1、量化交易(投资方法)
以先进的数学模型替代人为的主观判断,利用计算机技术从庞大的历史数据
中海选能带来超额收益的多种“大概率”事件以制定策略,极大地减少了投资者
情绪波动的影响,避免在市场极度狂热或悲观的皆况下作出非理性的投资决策。
量化交易一般会经过海量数据仿真测试和模拟操作等手段进行检验,并依据
一定的风险管理算法进行仓位和资金配置,实现风险最小化和收益最大化,但往
往也会存在一^定的潜在风险。
2、算法交易(自动交易、黑盒交易或机器交易)
通过设计算法,利用计算机程序发出交易指令的方法。在交易中,程序可以
决定的范围包括交易时间的选择、交易的价格,甚至包括最后需要成交的资产数
量。
3、量化策略
使用计算机作为工具,通过一套固定的逻辑来分析、判断和决策。量化策略
既可以自动执行,也可以人工执行。
一个完整的策略需要包含输入、策略处理逻辑、输出;策略处理逻辑需要考
虑选股、择时、仓位管理和止盈止损等因素。
4、量化选股
3
用量化的方法选择确定的投资组合,期望这样的投资组合可以获得超越大盘
的投资收益。
常用的量化选股模型:多因子选股模型、行业轮动选股、风格轮动模型、资
金流模型、动量反转模型、一致预期模型、趋势跟踪选股等。
5、股票回测
将交易策略在历史数据中进行合理验证的过程。
股票回测的意义:策略筛选、策略优化、策略验证。
(二)实验设计
1、股票时间序列数据采集
在东方财富网中,采集“比亚迪”2020年的股票历史数据,包含了开盘价、
最高价、最低价、收盘价、成交量、成交额、振幅、涨跌额、涨跌幅和换手率这
9种指标。
股票指标名称指标含义
开盘价每个交易日开市后的第一笔每股买卖成交价格
最高价
最高价是好的卖出价格,最低价是好的买进价格,可根据价格极
差判断股价的波动程度和是否超出常态范围
最低价
最后一笔交易前一分钟所有交易的成交量加权平均价,无论当天
收盘价
股价如何振荡,最终将定格在收盘价上
指一个时间单位内对某项交易成交的数量,可根据成交量的增加
成交量
幅度或减少幅度来判断股票趋势,预测市场供求关系和活跃程度
指当天(已)成交股票的金额总数,成交量的多少,不仅取决于
成交额市场的投资热情,还取决与相应产品的吸引力大小,以及投资者
对该产品的熟悉程度。
指股票开盘后的当日最高价和最低价之间的差的绝对值与昨日收
振幅
盘价的百分比,在一定程度上表现股票的活跃程度。
是指当日股票价格与前一日收盘价格(或前一日收盘指数)相比
涨跣额
的涨跌数值。
涨跌幅是对涨跌值的描述,用%标识,涨跌幅=涨跌值/昨收盘*100机当
4
前交易日最新成交价(或收盘)与前一交易日收盘价相比较所产
生的数值。在中国股市对涨跌停做出了限制,因此有“涨跌停板”
的说法。
,,换手率”也称“周转率”,指在一定时间内市场中股票转手买
换手率
卖的频率,是反映股票流通性强弱的指标之一
2、绘制股票成交量的时间序列图
绘制股票2020年的日成交量的时间序列图。
以时间为横坐标,每日的成交量为纵坐标,做折线图,可以观察股票成交量
随时间的变化情况。使用Matplotlib的作图工具进行画图。
注意:文档编写时,采集的数据为比亚迪股票2020年216天的数据,实训时采集的数
据为实时数据(数据量比文档展示的数据量多),所以操作手册中的图与分析结论与实训是
可能有出入,属于正常现象。
图1-1股票成交量的时间序列图
从图中可知,比亚迪股票价在1-2月交易活跃,3-6月进入低迷状态,7月
成交量有回升趋势,但后续8月未能保持,9月开始成交量呈现稳步上升的状态。
3、绘制股票收盘价和成交量的时间序列图
绘制股票在2020年1-6月的日收盘价和日成交量的时间序列图,因为它们
5
的数值差异很大,所以采用两套纵坐标系来做图。
图1-2股票收盘价和成交量的时间序列图
结合收盘价进行分析,可知股票收盘价格曲线与成交量曲线走势并不完全一
致,1月至5月的收盘价围绕这50这一水平线上线波动,6月以来,收盘价整体
趋于稳定增长,结合政策与企业经营资讯来看,受到国家“十四五”规划中对新
能源产业的利好影响,加上企业从7月以来销量持续上升,企业股票也一路斜升,
直驱200元。
4、绘制K线图(蜡烛图)
(1)K线图理论
绘制方法:首先找到该日或某一周期的最高和最低价,垂直地连成一条直线;
然后再找出当日或某一周期的开市和收市价,把这二个价位连接成一条狭长的长
方柱体。假如当日或某一周期的收市价较开市价为高(即低升高收),我们便以
红色来表示,或是在柱体上留白,这种柱体就称之为“阳线”。如果当日或某一周
期的收市价较开市价为低(即高开低收),我们则以绿色表示,又或是在住柱上
涂黑色,这柱体就是"阴线”了。
表示意义:能够全面透彻地观察到市场的真正变化。我们从K线图中,既可
看到股价(或大市)的趋势,也同时可以了解到每日市况的波动情形。
6
最高价
上影线
收食价
阳线实体
开意价
T影线一
最低价
阳线
图1-3K线图
(2)K线图绘制
使用mplfinance模块中的candlestickohlc()函数绘制K线图。
绘制股票在2020年16月份每日的开盘价,最高价,最低价,收盘价的K
线图。
该图红色代表上涨,绿色代表下跌。
2020年开盘价、最高价、最低价和收盘价的K线图
200-
180-
160-
140-
120-
100-
80-
60-
40-
图1-4比亚迪股票K线图
7
5、股票指标相关性分析
(1)相关关系分析
选取部分代表性的指标,并使用pandas.scatter_matrix()函数,将各项指
标数据两两关联做散点图,对角线是每个指标数据的直方图。指标包括成交量,
振幅,涨跌幅,涨跌额,换手率。从图中可以明显发现成交量和换手率有非常明
显的线性关系;涨跌幅和涨跌额有明显的线性关系。所以我们可以将换手率、涨
跌额这两个指标去除,这里使用了相关性关系来实现数据降维。
750000■
500000-
250000■
10■
饕
里5.
10-
爨
粉0-
麦
-10-
10■
麦
协5°-
&2.5-
,
-,
。00
00O
0OO
吊M
0Z
S振幅涨跌幅
交
成
澧
图1-5散点图矩阵
注意:相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无
法确切地表明两个变量之间相关的程度。
(2)相关系数(Correlationcoefficient)分析
8
相关系数是用以反映变量之间相关关系密切程度的统计指标。
简单相关系数:又叫相关系数或线性相关系数,一般用字母「表示,用来度量两个变蚩间的线性关系。
定义式111
X,Y)
y/Var\X]Var\Y]
其中,Cov(X.Y)为X与Y的协方差,Var[X协X的方差,Vag为Y的方差
我们可以使用numpy.corrcof()来直接计算各指标数据间的相关系数。
成交量、振幅、涨跌幅、涨跌额、换手率。
[[1.0.739451340.299638210.273641860.99999368]
[0.739451341.0.325267860.299952350.73963618]
[0.299638210.325267861.0.917639280.30000447]
[0,273641860.299952350.917639281.0.27370261]
[0.999993680.739636180.300004470.273702611.]]
看数字还是不够方便,所以继续将上述相关系数矩阵转换成图形,使生
matplotlib.pyplot.matshow()将矩阵可视化。如下图所示,其中用颜色来代表
相关系数。
图1-6矩阵展示
9
从图中可以看出,。和4的相关系数非常大,即成交量和转手率强烈正相关,
查看相关系数矩阵,数值为1;2和3相关系数也比较大,即涨跌幅和涨跌额强
烈正相关,查看相关系数矩阵,其数值为0.92。
相关性分析总结:用矩阵图表的方式分析多个指标或观察指标间的相关系数
矩阵可以迅速找到了强相关的指标。
6、移动平均线
移动平均线(MovingAverage,MA)是用统计分析的方法,将一定时期内的
证券价格(指数)加以平均,并把不同时间的平均值连接起来,形成一根MA,
用以观察证券价格变动趋势的一种技术指标。使用股票数据中每日的收盘价,算
出5日均价和20日均价,并将均价的折线图(也称移动平均线)与K线图画在
一起。
诜取该股票2020年1月至6月的数据进行模拟。
图1-7移动平均线
移动平均线具有抹平短期波动的作用,更能反映长期的走势。观察上图,比
较5日均线和20日均线,特别是关注它们的交叉点,这些是交易的时机。移动
平均线策略,最简单的方式就是:当5日均线从下方超越20日均线时,买入股
票,当5日均线从上方越到20日均线之下时,卖出股票°
10
为了找出交易的时机,我们计算5日均价和20日均价的差值,并取其正负
号,当图中水平线出现跳跃的时候就是交易时机。为了更方便观察,上述计算得
到的均价差值,再取其相邻日期的差值,得到信号指标。当信号为1时,表示买
入股票;当信号为T时,表示卖出股票;当信号为0时,不进行任何操作c
图1-8信号指标
从上图中看出,一共有两轮买进和卖出的时机。
看一下下这两轮交易详情:
datepriceoperation
422020-03-1060.11SeiI
582020-04-0157.06Buy
852020-05-1457.63SeiI
982020-06-0260.94Buy
上述表格列出了交易日期、操作和当天的价格。分析发现第一轮的交易中卖
出价格高于买入价格,可进行交易;第二轮中交易的卖出价都小于买入价,不可
进行交易。
如果考虑更长的时间跨度,比如2年、5年,并考虑更长的均线,比如将20
日均线和50日均线比较;虽然过程中也有亏损的时候,但赢的概率更大。
11
(三)实训操作
1、选择案例与任务
在【案例选择】下拉列表中,选择“案例六综合实训-大数据与金融”,点
击任务一按钮,进入“比亚迪股票数据采集”任务,如图1-9。
图1-9比亚迪股票数据采集
2、添加项目
①点击【新建】按钮,新增项目,系统加载一个“未命名”项目。②单击选
中项目,鼠标右键,对项目进行【重命名】设置,③完成后点击保存按钮,保存
项目,如图l-10o
12
草Jl'lthni就」的大政也推浦拟仿门系哈V国念0O(!)
8HA*令・一文・・・・・
ti«W
眼《«*■
r-1
全MHHB弓施疗
UJ
@«0岭析g
C2ttMnJWt
图ITO添加项目
3、参数填写
①点击【任务描述】预计根据下发的教案,完成任务。②点击【数据向导】,
弹出关键词替换弹窗,如图卜3。③对每一关键词填入正确的参数,④然后点击
确认,将参数传入系统代码模板中,如图1-40⑤点击【保存】按钮,保存代码
数据。
图1-11数据向导
13
网“分析数跳采一
开发语言:Python■«rtt保存或行注91凄名数事向39由政塞
re
frep^yjllRMComection
xa9orxev»jtf
w>njec<\
bead-I
'Uwr-JUent's'lotlllVB.O(Vlt^ovrXT10.0IxnM.xM>也l«VeXM/6JT・36iXHHL,Hk«do)Quom/8^a42«.75Safari^J7.
def*OK_h*dlc«(event.ct«*ac«)t
w;-'http:〃pwK>u,.e6Mcr”.Ripi/WitBVMM«S,mfr7ll240%*^8a)1573186l8619a»»f,eld8l»fl*Xf2*2aK
dra二(«QMe^a.c«t(url«
<H•r«.«9irchCadtfa":(.»^))\\>data*mS>.craJp《l>.re],B()',**>
-Moulg^(dd)
lxw«-4^«,jsonCkhmr)
Ute=11nM[2059。
<te*a_lirt•U
forheinhehe1
h-Z・卬】K(/)
datLlm.append<h>
cxnnCcmcfion((YTdX))
cursor=ccra^cursor0
-'D»PTML£IFEXISTSyo003.l224/
cursor,execute(del.gD
图1-12数据向导/输入参数后
4、代码执行
完成参数填写且保存后,即可提交代码至服务器进行执行,点击【执行】按
钮,系统提示“已执行,请稍后查看执行结果”。
网站分忻
开发法言:卜
ython■新■保存胞行注am名故家向33出畋方
lapoxtre
fr<»(rmysqlx^sctComecticn
iWrtrequests
iBportjron
h»M-(
A«tl*1UWC»9/V•!?”,XEW.1tl»»<1
已嶙行.丽衽・羯行络军
d>f*a^_hvull«c(«%vrrttccr*«x
url=*Mtp«//puA2af.eas...cyll240M«»45W«30lS?3.!tte!»19CnR24fieldil=fWXf2B2CfMl
4r»reqwitK.(ur)fh»ad»rrh*«d)-t«Kt
&re.dearchf'dm':•.•?!)\X>',dit,te.S).gco<p(l).i«placer)r">
dracjwn-jroi.lo»dF(dcO
lifttt-dat*_jMn('klir0»]
Me-linw(2(69:1
-0
fo:heinhehex
h-he.splitC»')
5Uut・append(h>
cc<r»-Ccriwction<(Yr9X))
cu:fc*=«rrkcurior0
&LR1-‘图犷TA06IFMISTSyoOW.l2K/
cu:gcc・.JMCUS(dal.2)
图1-13代码执行
5、查看结果
执行代码后,①鼠标单击选中项目然后鼠标右键,②点击【查看结果】,弹
出结果查看弹窗,如图1T4。
14
开发Bl含:■•・tt/F・行疾■・日P931B8
比ovmm电■金名I«|m・•
(1)改名彝:yimot3.12240敛―216
图1-14查看结果
注意:其余任务的操作方法与“任务一”的操作一致,在此不再赘述。注
意:操作时,需跳转到当前任务中操作,如需进行任务二,点击任务二按钮进
入任务区域,不然会导致实训内容不正确。
15
二、“案例七综合实训I-大数据与电商”
(-)理论导入
数据化运营是指通过数据化的工具、技术和方法,对运营过程中的各个环节
进行科学分析、引导和应用,从而达到优化运营效果和效率、降低成本、提高效
益的目的。
运营是一个范围“弹性”非常大的概念,最大可以延伸到所有公司的事务管
理,最小可能只包括网站运营管理工作。
1、数据化运营的重要意义
数据化运营的核心是运营,所有数据工作都是围绕运营工作链条展开的,逐
步强化数据对于运营工作的驱动作用。数据化运营的价值体现在对运营的辅助、
提升和优化上,甚至某些运营工作已经逐步数字化、自动化、智能化。
具体来说,数据化运营的意义如下:
1)提高运营决策效率。在信息瞬息万变的时代,抓住转瞬即逝的机会对企业
而言至关重要。决策效率越高意味着可以在更短的时间内做出决策,从而跟上甚
至领先竞争对手。数据化运营可使辅助决策更便捷,使数据智能引发主动决策思
考,从而提前预判决策时机,并提高决策效率。
2)提高运营决策正确性。智能化的数据工作方式,可以基于数据科学方法进
行数据演练,并得出可量化的预期结果,再配合决策层的丰富经验,会提高运营决
策的正确性。
3)优化运营执行过程。数据化运营可以通过标准口径的数据信息和结论,为
运营部门提供标准统一、目标明确的KPI管理,结合数据化的工作方法和思路,
优化运营过程中的执行环节,从而降低沟通成本、提高工作效率、提升执行效果。
4)提升投资回报。数据化运营过程中,通过对持续的正确工作目标的树立、
最大化工作效率的提升、最优化工作方法的执行,能有效降低企业冗余支出,提升
单位成本的投资回报。
2、数据化运营的两种方式
从数据发挥作用的角度来看,数据化运营分为辅助决策式数据化运营和数据
驱动式数据化运营。
(1)辅助决策式数据化运营
16
辅助决策式数据化运营是运营的决策支持,它是以决策主题为中心的,借助
计算机相关技术辅助决策者通过数据、模型、知识等进行业务决策,起到帮助、
协助和辅助决策者的目的。例如,通过为决策者提供商品促销销量信息,对企业的
促销活动提供有关订货、销售等方面的支持。
(2)数据驱动式数据化运营
数据驱动式数据化运营是指整个运营运作流程以最大化结果为目标,以关键
数据为触发和优化方式,将运营业务的工作流程、逻辑、技巧封装为特定应用,
借助计算机技术并结合企业内部流程和机制,形成一体化的数据化工作流程。例
如,个性化推荐就是一种数据驱动数据化运营方式。
辅助决策式数据化运营和数据驱动式数据化运营是两个层次的数据应用,数
据驱动相对于辅助决策的实现难度更高、数据价,直体现更大。
•辅助决策式数据化运营为抄务决策方服务,整个过移都由运营人员掌控,
数据是辅助角色。
•数据驱动式数据化运营的过程由数据掌控,数据是主体,实现该过程需要
IT、自动化系统、算法等支持,数据驱动具有自主导向性、自我驱动性和效果导
向性。
由于数据和流程本身会存在缺陷,同时运营业务通常都有强制性规则的需
求,因此即使在数据驱动式数据化运营过程中也会加入人工干预因素。但即使如
此,数据作为数据驱动的核心是不变的,也就是说,数据是决策主体本身。
3、数据化运营的工作流程
数据驱动式数据化运营工作包含数据和运营两个主体,在实际工作过程中需
要二者协同。在某些大型工作项目上,还有可能涉及与IT部门、信息中心等部
门的联动。其工作流程分为3个阶段:
(1)笫1阶段:数据需求沟通
该阶段主要包括需求产生和需求沟通两个步骤。
1)需求产生:由运营部门产生的某些数据化运营需求,例如预测商品销量、
找到异常订单、确定营销目标人群名单等。
2)需求沟通:针对运营部门提出的需求进行面对面沟通和交流,沟通主要
包含3方面:一是业务需求沟通,包括需求产生的背景、要解决的问题、预期达
17
到的效果等;二是数据现状沟通,包括数据存储环境、主要字段、数据字典、数
据量、更新频率、数据周期等,如果没有数据则需要制定数据采集规则并开始采
集数据,该过程中可能需要IT部门的协助;三是数据与分析的关联性沟通,根
据与运营人员的沟通,了解业务背景下哪些是常见的、带有业务背景的数据、不
同场景会导致数据如何变化、分析中会涉及哪些关键字段或场景数据等,业务人
员丰富的经验会帮助数据工作者少走很多弯路。
(2)第2阶段:数据分析建模
从这一阶段开始进入正式的数据工作流程,包括获取数据、数据预处理、数
据分析建模和数据结论输出4个步骤。
1)获取数据:数据化运营分析所需的数据需要经过特定授权从数据库或文
件中得到。
2)数据预处理:在该过程中对数据进行质量检骆、样本均衡、分类汇总、
合并数据集、删除重复项、分区、排序、离散化、标准化、过滤变量、转置、查
找转换、脱敏、转换、抽样、异常值和缺失值处理等。
3)数据分析建模:运用多种数据分析和挖掘方法,对数据进行分析建模。
方法包括统计分析、OLAP分析、回归、聚类、分类、关联、异常检测、时间序
列、协同过滤、主题模型、路径分析、漏斗分析等。
4)数据结论输出:数据结论的揄出有多种方式,常见的方式是数据分析或
挖掘建模报告,另外还包括Excel统计结果、数据API输出、数据结果返回数据
库、数据结果直接集成到应用程序中进行自动化运营(例如短信营销)。
(3)第3阶段:数据落地应用该阶段是数据化运营落地的关键阶段,前期所
有的准备和处理工作都通过该阶段产生价值。该阶段包括数据结论沟通、数据部
署应用及后续效果监测和反馈3个步骤。
1)数据结论沟通:对手输出为报告、Excel统计结果等形式的内容,通常
都需要与运营对象进行深入沟通,主要沟通的内容是将通过数据得到的结论和结
果与业务进行沟通,通过沟通来初步验证结论的正确性、可靠性和可行性,并对
结果进行修正。如果没有可行性,那么需要返回第2阶段重新开始数据分析建模
流程。
2)数据部署应用:经过沟通具有可行性的数据结论,可直接应用到运营执
18
行环节。例如,将预测结果作为下一个月的KPI目标,将选择出来的用户作为重
点客户进行二次营销。
3)后续效果监测和反馈:大多数的数据化运营分析都不是“一次性”的,
尤其当已经进行部署应用之后,需要对之前的数据结论在实践中的效果做二次验
证,若有必要则需要进行结论的再次修正和意见反馈。
(二)实验设计
1、白酒商品数据采集
(1)数据采集
在京东商城中,采集白酒类目下的商品数据,数据指标包括产品重量(kg)
‘价格',‘储存方法‘包装','包装清单’品牌‘,'商品产地’商品名
称‘,'商品毛重‘,‘商品编号‘,'存储方法‘容量',’店铺‘,’度数‘标题
'省份','等级','规格‘,’货号','适用人群','酒精度'酿造工艺‘,'
链接'香型,将数据储存在MongoDB中。
(2)数据处理
将商品信息数据从MongoDB中导入到mysql数据库,以便进行后续的数据处
理、统计与分析。
2、白酒商品评价数采集
(1)数据采集
由于京东商城不展示商品的销售数量,采用商品的评论数代替销量,爬取商
品中的评论数,包括全部评价、好评、中评、差评数。
(2)数据处理
将商品评价数据从MongoDB中导入到mysql数据库,以便进行后续的数据处
理、统计与分析。
3、数据清洗
查看采集的白酒商品数据,对数据进行清洗
从商品名称中提取“度数”数据,统一规范化“香型”、“品牌”等数据,
删除非白酒产品等垃圾数据。
19
4、五粮液用户评论分析
(1)用户评论内容采集
商品评价是最能反映产品好坏的标杆,通过采集五粮液商品的要陪你过户评
论,研究用户对产品的关注程度以及品牌。
(2)评论分词
使用snownlp模块对评论进行分词,并通过Counter()函数统计分词词频。
(3)词云图绘制
对用户评价进行可视化,使用词云图呈现,用wordcloud包的Wordcloud()
函数实现。
5、数据可视化
使用poworhi对商品数据进行可视化分析,powpr比操作方法详见“案例
一单项实训|-数据采集”中任务一的操作手册,在此不再赘述。
(1)销量与销售额分析
①销量
京东平台上共有68种白酒品牌,销量前十的品牌占据了整个市场销售总量
的84.7%。可见,消费者受品牌知名度和品牌信任度的影响,对于知名大众化品
牌的选择远远超过小众品牌。平台中销量最高的品牌为牛栏山,因其价格较低,
打破传统高端白酒对市场的封锁,销量高于泸州老窖等五个知名高端品牌,累计
销量达800万件,位居第一;近年来,白酒市场消费正向大众化、平民化发展,
因此,汾酒、红星等主打低价白酒的品牌销售量也相对较大。
20
②销售额
从销售额来看,排名前五的均为知名高端白酒品牌,其中五粮液的销售额远
高于其他品牌,占全平台白酒销售总额的16.15%,其原因可以归结于其品牌产
品数量较多、价格范围覆盖面大、知名度高,从而获得了从高端到低端不同层次
消费者的喜爱。
结合销量发现,销量大并不意味着销售额也大。如销量排名第一的牛栏山销
售额排名在第四位,低廉的价格是其销售额相对不高的主要原因;
(2)消赛倾向分析
21
①香型
随着科学技术的进步、酿酒工业的发展,白酒的香型也更加丰富,从人们熟
知的浓香型、酱香型、清香型的三种发展到数十种。数据显示,京东上售卖的白
酒仍主要集中为浓香、酱香和清香三种传统香型,合计占比92.25%。其中又以
浓香型最多,远高于其他香型。
占商品编号的计数的%GT(按香型)
[―3.51%(3.51%)
匿
・凤百型
•龈郁香型
•兼百型
•浓香型
・清看型
消费者在购买时同样更青睐浓香型、清香型和酱香型三种香型,其中清香型
销量最高,说明清香型白酒在市场上是最普遍也是消费者更倾向购买的白酒香
型
22
占全部评价的%GT(按香型)VR•••
「0.78%(0.78%)
香型
・凤香型
■则凝
46.76%(46.76%)
・浓香型
•清曾型
②度数
从度数来看,呈现度数越低、销量越少的趋势。消费者更倾向于购买5D度
以上的白酒,其销量占平台总销量的72.12%。俗话说“酒是陈的香”,而酒精
度40度以下的低度白酒在存放一段时间后会因酯类物质水解导致口味寡淡,且
日常生活中消费者存在购买白酒以备日后饮用的暗况,因此消费者更多倾向于购
买高度白酒。
23
占翎B评价的%GT(按度数分组)
6.40%(6.4%)厂0Q0%9%)
度数分组
・35-39度
・35度以下
・40-49度
・50度以上
•其他
销量排名前的白酒度数均在40度及以上,其中52-53度的白酒最受欢迎。
由于水分子和酒精分子缔合最好的度数是在52-53度,且这个度数的白酒口感
比较协调,能够品尝出白酒丰富的层次感,所以销量最高的白酒都是在52-53度
左右O
24
全部评价(按du_value和du_value)
du.value«0・42・43・45*48・50«52・53・56・62
70
60:
50
a.40
।
w30
20
10
0
0百万2百万4百万6百万8百万10百万12百万
全部评价
(3)价格分析
①价格与销量
平台中白酒的销量呈现随价格的增加而减少的趋势。售价低于200元的白
酒销量占37.72%,远超其余价格区间,而价格在千元以上的高端白酒销量仅占
比15.18队说明部分消费者虽有购买高端白酒的需求,但大部分消费者在购买
白酒时更注重仍为价格因素。
25
占全部评价的%GT(按价格分组)
价格分组
•1000-12007E
•1200UUZ
•2004)0元
■200元以下
•400-600元
■600-800元
•800-100(沅
(4)评论分析
商品评价是最能反映产品好坏的标杆。五粮液有白酒种类多、价格分布广的
特点,是一个比较典型且值得研究的品牌。报告采集了京东网中消费者对于五粮
液的产品的评论数据汇成词云图。词云图数据显示,“设计”、“包装”、“口
感”、“速度”等标签表明消费者对比较重视这几个方面。同时“好”、“不错”
这几个标签表明了消费者对于五粮液白酒的认可。
26
便宜京
艮复家鼻到东
开爆住
®屣
氐土彝髯
a
课lp
雪l
赛老他
□□
致^
r
—
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学院校外实践基地协议书
- 暨南大学《美学》2023-2024学年第一学期期末试卷
- 暨南大学《国家金融学》2021-2022学年第一学期期末试卷
- 房屋拆迁补偿协议(2024年版)
- 软件工程师工作总结
- 科学计算语言Julia及MWORKS实践 课件8 - 基本数据类型
- 糖尿病伤口的护理评估
- 衣柜导购培训
- 翻译三级笔译实务模拟真题五
- 新生儿观察与护理
- 三级入场教育培训
- 电子商务运营流程详解作业指导书
- 心肺复苏培训课件
- 小学劳动教育一年级下册第二单元第3课《削果皮》课件
- 担任学生干部证明
- 绿化恢复合同范本
- 2024年秋一年级语文上册第三单元 作业设计(含答案)
- 经济法学-计分作业一(第1-4章权重25%)-国开-参考资料
- DB23-T 3788-2024 河湖健康评价技术规范
- 2024年自考《14269数字影像设计与制作》考试复习题库(含答案)
- 2024年新版全员消防安全知识培训
评论
0/150
提交评论