版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第8章咖啡销售情况分析第8章咖啡销售情况分析8.1准备数据import
numpy
as
npimport
pandas
as
pdimport
matplotlib.pyplot
as
plt
data=pd.read_excel("data\某咖啡公司销售数据.xlsx")#读取数据集data
#打印数据集第8章咖啡销售情况分析8.2数据清洗8.2.1缺失值处理data.isnull().info()#查询缺失值第8章咖啡销售情况分析8.2数据清洗8.2.2重复值处理很多数据都是有重复值的,这在数据分析前必须删除掉,不然会影响结果的准确度,清洗方法为drop_duplicates()。输出结果显示清洗后的数据集中包含4264行数据(共14列),因此数据集中原先存在两条重复数据。print('输出前:',data.shape)
#清洗前的数据集大小data=data.drop_duplicates()#清洗重复值print('输出前:',data.shape)
#清洗后的数据集大小第8章咖啡销售情况分析8.3数据分析8.3.1数据集概要8.3.2描述性分析data.shape
#用shape方法查看维度输出结果:(4246,14)data.describe()第8章咖啡销售情况分析8.3数据分析8.3.3排序分析想看不同产品类别的销售利润额从高到低的情形。sort_values(by='利润额')表示按利润额排序,ascending=False表示降序排序data.sort_values(by='利润额',ascending=False).head()#前5条数据第8章咖啡销售情况分析8.3数据分析8.3.4数据分组data1=data.groupby(['产品类别'])[['利润额','销售额']].sum()#根据产品类别分组,查看利润额、销售额data1
#计算结果保存在新的变量中data1.sort_values(by='利润额',ascending=False)第8章咖啡销售情况分析8.3数据分析8.3.5数据查询data1=data.loc[(data['利润额']<0)]#找出存在负利润的行data1.sort_values(by='利润额').head()#对利润额进行升序排序,显示前5条数据data1=data.loc[(data['利润额']<0)&(data['产品类别']=='清凉茶')]data1.sort_values(by='利润额').head()第8章咖啡销售情况分析8.3数据分析8.3.6复杂条件查询data1=data.loc[(data['产品类别']=='清凉茶')]data1.pivot_table(values=['利润额','销售额'],index=['区域','产品类别'],aggfunc=['sum','mean','max','min'])第8章咖啡销售情况分析8.3数据分析8.3.7新增数据列data1=data['利润额']/data['销售额']data['利润率']=data1.apply(lambda
x:format(x,'.2%'))#小数点后保留两位,换算成百分比格式data.head()第8章咖啡销售情况分析8.4数据可视化8.4.1产品类别利润额可视化import
matplotlib.pyplot
as
pltplt.rcParams['font.sans-serif']=['simsun']#设置加载的字体名称plt.rcParams['axes.unicode_minus']=False
#解决保存图像是负号'-'显示为方块的问题
data1=data.pivot_table(values=['利润额'],index=['产品类别'],aggfunc=('sum'))data1.plot.bar(figsize=(10,6))第8章咖啡销售情况分析8.4数据可视化8.4.1产品类别利润额可视化第8章咖啡销售情况分析8.4数据可视化8.4.2产品利润额分布区间可视化图中显示有一种产品的利润额接近140(属于异常情况,因为数据点显示在箱线图外),另一种产品的利润额接近0。data1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年普通高考四月适应性检测语文
- 2026年辽阳市白塔区社区工作者招聘考试参考题库及答案解析
- 运城师范高等专科学校《计量经济学题库》2025-2026学年期末试卷
- 安徽矿业职业技术学院《护理教育学》2025-2026学年期末试卷
- 马鞍山职业技术学院《民法总则》2025-2026学年期末试卷
- 运城学院《中国文学与文化》2025-2026学年期末试卷
- 福州墨尔本理工职业学院《电子商务》2025-2026学年期末试卷
- 萍乡学院《旅游目的地管理》2025-2026学年期末试卷
- 厦门软件职业技术学院《金融科技》2025-2026学年期末试卷
- 泉州工艺美术职业学院《口腔组织病理学》2025-2026学年期末试卷
- 急性外阴炎的护理
- 2025年云南省高考政治试卷(含答案解析)
- 2025年甘肃省高考物理试卷(含答案解析)
- 《渗透型液体硬化剂应用技术规程》
- 库房人员安全试题及答案
- 公司作风纪律管理制度
- 新中国控制传染病的光辉历程
- 皮肤新药生产基地及研发试验中心环评资料环境影响
- 甘肃省庆阳市华池县第一中学2024-2025学年高二下学期期中考试数学试题
- 汽车制造工艺技术课件:汽车总装生产工艺流程及检测工艺
- 空调维保服务投标方案(技术标)
评论
0/150
提交评论