版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章概论西华大学数据分析基础与实践超市销售数据分析
目录Contents案例介绍案例实现流程详细过程及结果总结案例介绍一1.1案例任务及背景4超市的经营管理产生了大量数据,对这些数据进行分析,可以提升超市的竞争力,为超市的运营及经营策略调整提供重要依据。利用python对销售数据进行统计分析,并作可视化展示,分析顾客的消费行为,研究促销对销售的影响。设计具体要求:1.生鲜类商品和一般商品每天销售金额的折线图。2.一月各大类商品销售金额的占比饼图。3.分析顾客的消费行为,并对用户进行画像。案例实现流程二2.1总体流程62.2数据获取本案例的目标是通过超市数据分析超市的销售情况,得出对超市日常经营管理的方向和定位,达到提高经济效益的目的。数据源来自2019年某竞赛提供的数据,数据集提供了某超市2015年1月1日至2015年4月30日的经营产生的销售数据,数据集包括顾客编码、大类编码和名称、中类编码和名称、小类编码和名称、商品编码、销售日期、商品的类型、商品的销售数量和金额、以及商品是否促销等信息。2.3数据预处理8首先将需要用到的库进行导入,把要分析的数据读取进来,并对数据进行预处理。因为现实世界中数据大体上都是具有很多问题的脏据,无法直接进行数据挖掘,否则无法得到令人满意的挖掘结果。数据预处理流程图如图所示:
2.4生鲜和一般商品每天销售金额表9该案例主要利用groupby函数的分组对数据进行分组,再对分组后的数据进行销售金额计算,创建新的DataFrame,删除日期中没有销售金额的空行,最后生成折线图,对比分析生鲜类商品和一般商品的销售情况。
2.5一月各大类商品销售额占比图10首先导入预处理后的数据,使用groupby分组,对各种大类商品进行分组,具体的分组包括休闲、冲调、家居、家电、文体、日配、水产、洗化、烘焙、熟食、粮油、肉禽、蔬果、酒饮、针织。将这些分类好的商品按月进行统计,然后创建一个新的df储存之前的统计的月销售金额,最后生成一个饼图。
2.6顾客画像11本案例根据消费情况,提取消费前10的消费者,并为第一名消费者绘制顾客画像,首先要安装wordcloud库,因为表格内容是中文所以还要安装jieba库。详细过程及结果三3.1
数据预处理13数据是数据分析的基础,没有良好的数据,分析所得的结果就不能真实反映事件的本质,而用于处理的数据来源是多方面的,数据质量也参差不齐,因此在将数据应用到具体的数据分析任务之前需要对数据进行预处理,数据预处理的好坏,有时候能够对结果产生重大影响。3.1数据预处理14导入数据3.1数据预处理15数据清洗3.1数据预处理16数据展示3.2生鲜类商品和一般商品每天销售金额表17首先对日期进行处理。利用函数将销售日期改成合适的形式3.2生鲜类商品和一般商品每天销售金额表18首先对日期进行处理。利用函数将销售日期改成合适的形式3.2生鲜类商品和一般商品每天销售金额表19然后对数据进行分组并计算生鲜类商品和一般商品每天的销售数据3.2生鲜类商品和一般商品每天销售金额表20然后对数据进行分组并计算生鲜类商品和一般商品每天的销售数据3.2生鲜类商品和一般商品每天销售金额表21最后进行可视化处理3.2生鲜类商品和一般商品每天销售金额表22对比分析
折线图可以明显看出:生鲜商品4个月的销售金额变化不大,一直较小。一般产品的销售金额在春节前后(第30天到50天)变化巨大,可以得知一般商品受春节影响较大.酒饮、蔬果等此类受众较大的商品,而生鲜的受众相对来说较小所以销售额也一直较小。3.3各大类商品月销售金额的占比图23首先利用函数将数据按照大类进行分组并求出月销售额3.3各大类商品月销售金额的占比图24首先利用函数将数据按照大类进行分组并求出月销售额3.3各大类商品月销售金额的占比图25然后进行可视化分析3.3各大类商品月销售金额的占比图26然后进行可视化分析在一月份的时候销售最多的是蔬果、粮油、日配和休闲,然后再是洗化、肉禽、酒饮、冲调、熟食、针织、家居、文体、家电、水产和烘焙。占比第一的是蔬菜,高达17%。占比并列第二的是粮油和日配,占比为17%。占比第四的是休闲,达到16%,只比第二名少1%。第五名使洗化类商品,只占10%3.3各大类商品月销售金额的占比图27然后进行可视化分析
因为蔬果、粮油、日配和休闲此类商品是生活必须商品,所以每月的销售额都较大,且15年的春节在2月份,根据国人的习惯可知,大家会提前制备蔬菜水果,粮油,肉禽,日常用品和休闲物品,这也是为何在一月份中这些类别物品占比较大的原因,此时的酒水有一定占比但还没有很大。3.4顾客画像28安装库
根据前文的介绍,需要安装中文分词库jieba和词云显示库wordcloud。具体操作方法是,打开Anaconda中的AnacondaPrompt然后右键选择管理员身份运行,然后输入pipinstallwordcloud和pipinstalljieba即可成功安装所需要的第三方库。3.4顾客画像29导入数据和库3.4顾客画像30按顾客汇总消费金额,并抽取出总消费最高的一位顾客3.4顾客画像31为该顾客绘制词云3.4顾客画像32为该顾客绘制词云
经过代码运行,可以得到消费第一名的顾客的词云图。可以得出以下结论:可以很明显的看出中间最大的两个字是蔬菜,所以顾客经常买菜回家做饭。其余散落的文字比如叶菜,玉米油,酱菜,蛋品,猪肉,笋类,花果等可以看出该顾客是一个居家型顾客。买的生活用品种类也很丰富,有内衣裤,羽绒服,牙膏,纸副品,冲调,点心,膨化等,基本上生活所用的一些必需品,顾客都在该超市购买。根据购买的频率和种类推测顾感觉顾客家应该离超市较近,大概率是一位女性。总结四4总结34本章以超市销售数据分析为案例,对数据分析过程进行了具体的展示。本案例主要从三个方面分析超市销售数据:1. 根据数据处理的结果进行绘制生鲜类商品和一般商品每天销售金额表和一月各大类商品销售金额的占比饼图,分析图表中蕴含的信息,提供给超市更好的运行管理策略,帮助超市管理者更好的进行决策;2. 根据数据处理的结果进行绘制一月各大类商品销售金额
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年专业影棚租赁合同
- 2024年创新房产展示:合作与推广协议
- 2024年企业增资扩股合同
- 2024年业务接盘协议
- 2024年升级:人力资源外包协议
- 2024年劳动法下社会保障细化合同
- 2024年古建筑施工及修复劳务分包合同
- 2024年专业育儿保姆雇佣合同
- 2024年婚姻解除协议样本
- 2024年专项技术顾问聘用协议
- 年产08万吨发泡聚苯乙烯聚合工段工艺设计设计
- sup25改性改性目标配合比(玄武岩)
- (完整)学生课堂自我评价表
- 图书馆本科教学水平合格评估汇报
- 现场施工组织机构框图
- 有机物的可生化性参照表
- 安全饮水初步设计编制大纲
- 整式知识点总结
- 《制作洋葱表皮细胞临时装片》教学设计
- 土地租金发放表
- 医院水电安装施工方案
评论
0/150
提交评论