版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第8章咖啡销售情况分析第8章咖啡销售情况分析8.1准备数据import
numpy
as
npimport
pandas
as
pdimport
matplotlib.pyplot
as
plt
data=pd.read_excel("data\某咖啡公司销售数据.xlsx")#读取数据集data
#打印数据集第8章咖啡销售情况分析8.2数据清洗8.2.1缺失值处理data.isnull().info()#查询缺失值第8章咖啡销售情况分析8.2数据清洗8.2.2重复值处理很多数据都是有重复值的,这在数据分析前必须删除掉,不然会影响结果的准确度,清洗方法为drop_duplicates()。输出结果显示清洗后的数据集中包含4264行数据(共14列),因此数据集中原先存在两条重复数据。print('输出前:',data.shape)
#清洗前的数据集大小data=data.drop_duplicates()#清洗重复值print('输出前:',data.shape)
#清洗后的数据集大小第8章咖啡销售情况分析8.3数据分析8.3.1数据集概要8.3.2描述性分析data.shape
#用shape方法查看维度输出结果:(4246,14)data.describe()第8章咖啡销售情况分析8.3数据分析8.3.3排序分析想看不同产品类别的销售利润额从高到低的情形。sort_values(by='利润额')表示按利润额排序,ascending=False表示降序排序data.sort_values(by='利润额',ascending=False).head()#前5条数据第8章咖啡销售情况分析8.3数据分析8.3.4数据分组data1=data.groupby(['产品类别'])[['利润额','销售额']].sum()#根据产品类别分组,查看利润额、销售额data1
#计算结果保存在新的变量中data1.sort_values(by='利润额',ascending=False)第8章咖啡销售情况分析8.3数据分析8.3.5数据查询data1=data.loc[(data['利润额']<0)]#找出存在负利润的行data1.sort_values(by='利润额').head()#对利润额进行升序排序,显示前5条数据data1=data.loc[(data['利润额']<0)&(data['产品类别']=='清凉茶')]data1.sort_values(by='利润额').head()第8章咖啡销售情况分析8.3数据分析8.3.6复杂条件查询data1=data.loc[(data['产品类别']=='清凉茶')]data1.pivot_table(values=['利润额','销售额'],index=['区域','产品类别'],aggfunc=['sum','mean','max','min'])第8章咖啡销售情况分析8.3数据分析8.3.7新增数据列data1=data['利润额']/data['销售额']data['利润率']=data1.apply(lambda
x:format(x,'.2%'))#小数点后保留两位,换算成百分比格式data.head()第8章咖啡销售情况分析8.4数据可视化8.4.1产品类别利润额可视化import
matplotlib.pyplot
as
pltplt.rcParams['font.sans-serif']=['simsun']#设置加载的字体名称plt.rcParams['axes.unicode_minus']=False
#解决保存图像是负号'-'显示为方块的问题
data1=data.pivot_table(values=['利润额'],index=['产品类别'],aggfunc=('sum'))data1.plot.bar(figsize=(10,6))第8章咖啡销售情况分析8.4数据可视化8.4.1产品类别利润额可视化第8章咖啡销售情况分析8.4数据可视化8.4.2产品利润额分布区间可视化图中显示有一种产品的利润额接近140(属于异常情况,因为数据点显示在箱线图外),另一种产品的利润额接近0。data1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 磁共振上岗证课件
- 短文两篇记承天寺夜游课件
- 盗梦空间影视赏析
- 地理广东佛山市2025-2026学年普通高中高三年级教学质量检测(一)(佛山一模)(1.26-1.28)
- 2026年环境保护法律法规知识考试题目参考
- 2026年公共关系管理高级考试练习题
- 2026年金融行业实操题目外汇市场操作技巧与实践案例分析
- 2026年产品市场分析与定位模拟测试
- 2026年美容师职业资格美妆技术及皮肤护理题库
- 2026年生物学实验室技术与安全规范测试题
- GB/T 31831-2025LED室内照明应用技术要求
- 云南省昆明市2026届高三三诊一模摸底诊断测试数学试卷(含答案)
- 23G409先张法预应力混凝土管桩
- 家具年度总结和规划
- 星光精细化工(张家港)有限公司造纸
- 护坡分包合同书范本
- 街道(乡镇)区域养老服务中心建设验收指标总分表及验收标准
- 国家卫生部《综合医院分级管理标准》
- 撇洪沟改造工程监理规划河道整治样本
- (完整版)保证药品信息来源合法、真实、安全的管理措施、情况说明及相关证明
- 2023年设计部电气工程师年度总结及下一年计划
评论
0/150
提交评论