第11章-实战案例-电商消费者数据分析_第1页
第11章-实战案例-电商消费者数据分析_第2页
第11章-实战案例-电商消费者数据分析_第3页
第11章-实战案例-电商消费者数据分析_第4页
第11章-实战案例-电商消费者数据分析_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主讲人:***第11章电商消费者数据分析首都师范大学13-10月-23Python数据分析与数据挖掘目录contents案例背景0102数据加载和预处理03探索性数据分析案例背景0111.1数据来源

本案例旨在分析来自英国零售商的电子商务真实交易数据集,该数据集为英国公司的在线零售的交易数据,包含了4000名客户在一年内的购物数据,该公司主要销售特定的礼品,公司的许多客户都是批发商。数据来源: UCI机器学习数据库(通过关键字“OnlineRetail”查找)下载。

或从kaggle的官网下载E-CommerceData(ActualtransactionsfromUKretailer)数据集/carrie1/ecommerce-data#data.csv11.1案例背景数据集中的一共有541909条数据,每条数据包含以下8个特征:InvoiceNo:发票号。字符型,一个6位整数,唯一分配给每个事务。如果此代码以字母“c”开头,则表示取消。StockCode库存代码:产品(项目)代码。一个5位数的整数,唯一地分配给每个不同的产品。Description:说明产品(项目)名称。字符型。Quantity数量:每笔交易中每个产品(项目)的数量。数值型。InvoiceDate发票日期:发票日期和时间。数值型,生成每个事务的日期和时间。UnitPrice单价:商品单价。数值型,单位产品价格(英镑)。CustomerID:客户编号。一个5位整数,唯一分配给每个客户。Country国家:国家名称。字符型,每个客户居住的国家的名称。数据加载和预处理021、加载需要的库及读入数据11.1案例背景11.2数据加载和预处理2、数据信息初步分析11.2数据加载和预处理3、数据预处理空值检查:多条数据的customerID和Description列有缺失值查看是否存在购买数量Quantity小于0的异常数据:10624条数据的购买数量为异常值11.2数据加载和预处理3、数据预处理对原始数据df进行处理,将去掉空值异常值的数据放到新变量df_ec中,同时增加一列AmountSpent,用来放购物总价,并对CustomerID列转为整型。11.2数据加载和预处理11.2数据加载和预处理经过预处理后,df_ec的中各个特征的数据类型如表11-1所示:探索性数据分析0311.3.1各国订单情况分析数据来源1、订单来源国家分析目的:检查订单都来源于哪些国家,并对各个国家的订单数量进行排序。结论:大部分订单来自英国,其次是德国和法国还可以使用pivot_table透视表,查看各国订单数量情况。11.3.1各国订单情况分析数据来源2、各国订单数据分析11.3.1各国订单情况分析数据来源3、各国订单金额分析11.3.2客户情况分析1、客户情况分析11.3.2客户情况分析2、查看最有价值客户的来源国家11.3.3产品情况分析1、最畅销的产品分析11.3.3产品情况分析2、销售额最高的产品分析首先,获取销售额最高的前50个产品,保存到变量most_profitable_product中,然后输出其中的前3条数据。由输出可知,销售额最高的产品依然是编号为23843的papercraft,littlebirdie,销售额为168469.60。下面将销售额最高的前5个产品作图输出。11.3.4按时间的销售数据分析1、查看销售数据时间区间

首先,我们按InvoiceDate对销售数据进行分析,可以获知数据集中销售数据的时间区间,即数据集中销售数据的开始时间和结束时间。11.3.4按时间的销售数据分析为了进行后续分析,可以对InvoiceDate字段进行抽取,在数据集中增加表示时间的年、月、周等字段。11.3.4按时间的销售数据分析2、分析各个年份的销售情况销售数据分布在2010年和2011年,以2011年为主。其中2011年的销售数据371764,2010年的为26160。11.3.4按时间的销售数据分析3、每月销售订单数分析11.3.4按时间的销售数据分析4、一周中每天的销售订单数分析由结果可知,一周中周四的累计订单数最多,周六的订单数为0。在此基础上,还可以进行一天中各个时间段的累计订单数等分析,请读者自行开展相关分析。11.4小结通过对数据的分析,我们可以得出以下信息:(1)通过对各国订单的分析可知:订单最多的客户来自英国(UK),购买金额最高的客户来自荷兰,除英国外,订单数量最多的前5个国家名单如下:德国、法国、爱尔兰、西班牙、荷兰。由于这家电商公司是一家总部位于英国的公司,因此该公司从英国客户那里收到的订单数量最多。(2)通过对客户情况的分析可知:本数据集中,超过90%的客户来自英国。花费最高的是ID为14646的客户,该客户的购买金额超过了250000英镑。在Top20的最有价值顾客中,16家来自英国,2家来自爱尔兰,各有1家来自澳大利亚和荷兰。(3)最畅销的产品和销售额最高的产品均是编号为23843的产品,所售产品为:papercraft和littlebirdie。(4)通过对销售数据按时间分析可知:订单最多的月份为2011年11月,2010年12月1日至2011年12月9日之间没有交易。从周一到周四,公司接到的订单数量往往会增加,之后会减少。该公司在下午12:00收到的订单最多,大多数顾客可能会在中午12:00到2:00

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论