电商订单数据分析
时间:2023-03-15 22:34:01 | 来源:电子商务
时间:2023-03-15 22:34:01 来源:电子商务
电商订单数据分析- 背景
随着互联网进入到家家户户,电商平台的不断发展,电商的竞争日益激烈,为了提高店铺的销量,稳定客流,找准运营方向。
- 任务目标
我们期望能运用数据分析技术,对电商订单进行初步分析,希望能够解决一下问题:
- 2017年和2018年销售情况怎样?如果下降,原因是什么?
- 用户的消费行为是怎样的?
- 怎样指定接下来的运营策略?
分析思路如下
- 数据处理
- 数据基本信息
数据集:电商用户订单数据.csv
时间跨度:2017年-2018年
字段:由于数据集包含字段太多,现只选取部分字段:订单ID,客户ID,下单日期,销售额,数量,细分。
由于部分图表是在Python里进行分析,所以字段名改为:order_id , user_id order_dt, trade_amount, order_quantity,user_category
- Python数据预处理
(1)导入数据
(2)字段提取
由于字段太多,只使用以下六个字段,且部分图表是在Python里进行分析,所以对于字段进行重新命名:
订单ID:order_id ,
客户ID:user_id
下单日期:order_dt,
销售额:trade_amount,
数量:order_quantity,
细分user_category
- 数据表基本信息
- 修改字段类型
需要把order_id类型改为object,
order_dt数据类型改为datetime
新增加月份month这一列
通过以上基本信息可以得出,该表格没有缺失值,且经过excel简单查验,发现也没有重复值,所以可以开始对数据进行分析了
- 订单数据的描述统计
根据描述统计,
每次下单购买数量:平均数是3.76个商品,标准差在2.23,故可以发现购买数量波动很大。中位数是3,75个百分位为5,最大值为14,故下单购买数量受到极值影响/
每次下单销售额:平均数是1619,标准差是2646,中位数是638,75百分位数是1790,极值是35621,说明销售金额数据波动大,且受极值影响。
- 购买数量以及销售金额的数据分布
可以看出订单购买数量和销售额都是呈右偏分布,即中位数<平均数
- 数据分析
- 数据集的整体状况(此处用的excel分析)
通过饼图可以发现,2018年总体销售额比2017年略有下降。
- 用户消费趋势分析(按月分析)
(1)下图是2017年和2018年用户每月销售额汇总情况对比
根据2017年和2018年的销售额汇总折线图可以发现,每年的销售额在1-4月,7月处于淡季,5-6月,8-12月处于旺季。
(2)下图是2017年和2018年用户每月购买次数汇总情况对比
(3)下图是2017年和2018年用户每月下单人数汇总情况对比
通过以上三个图形情况,发现销售额,下单数量和下单人数趋势一致。
(4)下面三个图分别是2017年和2018年每月的销售额,下单人数,购买数量增长情况
通过对比2017年和2018年的购买数量,下单人数以及销售金额情况都是在淡季的时候销售情况下跌,在旺季的时候销售情况上涨
结论:通过以上图表,发现在淡季用户下单人数大幅减少,从而导致购买数量和销售额的减少,由于缺乏数据,可以进一步分析。
①用户体验流程分析,查看流失客户行为数据,进一步回访客户找出客户流失原因,进行优化改进。
②产品分析:针对客户的评价,网站评论,用户反馈意见等维度,对产品体验进行分析优化。
③用户来源,通过分析用户来源渠道方面加强运营推广
- 用户个体消费能力分析(按用户分析)
- 展示购买数量和销售额的分布情况
通过以上两图可以发现
购买数量主要集中在10个以内,购买数量波动比较大,属于右偏分布
销售金额主要集中在5000以内,销售额波动大,极值对其影响也很大,也属于右偏分布
- 用户购买数量和销售额的散点图
用户购买数量和销售金额不成相关性,但是由于销售金额分布较广
- 用户购买退货率
- 用户累计消费金额占比
通过下图可以发现销售金额不满足二八原则,即不满足20%的人数的销售额占比80%,也就是说销售额肯定存在问题
通过以上对用户个体消费能力分析,可以发现,用户的购买数量和销售金额数据波动很大,极值差距也很大,且购买金额不满足二八原则,说明核心用户定位不够精准
结论:需要根据店铺定位,对于核心客户加大推广力度,并且针对性的对这些客户的加强购物体验
- 用户消费行为分析
- 用户第一次消费
可以看出,用户基本是集中在2017年进行第一次消费,也就是说新客是在逐渐减少,到2018年基本上没有新客进行消费行为
- 用户最后一次消费
通过上图可以发现,客户最后一次消费时间基本上就是集中在订单数据的最后几个月
- 新老客户占比
①多少用户仅消费了一次
仅7个用户仅消费了一次,说明用户黏度较高
- 用户分层
①RFM
RFM是一个经典用户分类模型,模型利用通过交易环节中最核心的三个维度:最近消费(Recency),消费频率(frequency),消费金额(Monetary)细分用户群体,从而分析不同群体的用户价值,最终达到精准营销。
- 基于规则(均值)划分的RFM
RFM熊3个维度,分两个等级得到8类用户分层
通过RFM模型,把用户分为八类,分别给用户打上标签,八个分类为:
重要保持客户',重要价值客户,重要发展客户,重要挽留客户,一般保 持客户,一般价值客户,一般发展客户,一般挽留客户
从RFM分层可以知道,店铺中有很大一部分客户为一般发展客户和一般挽留客户,可以针对提升这些用户的活跃度,转换为优质客户。重要保持客户需要提供更优质服务,采用会员制运营。
针对上述8类用户分层情况,可初步制定三大运营策略:
提高活跃度:注重提升一般客户、低价值客户的活跃度,将其转化为优质客户。
提高留存率:与重要价值、重要挽留客户互动,提高这部分用户的留存率。
提高付费率:维系重要保持客户、重要发展客户的忠诚度,保持网站的良好收入。
具体手段包括搭建会员体系、会员分类管理与升级、积分兑换、发放折扣券等。
具体的运营策略参照如下:
【'111':'重要价值客户'】该类用户与企业交易频繁、交易金额大,但长时间没有二次消费,存在流失风险。——企业利润的潜在来源,采用用户唤回运营。
【'011':'重要保持客户'】该类用户与企业交易频繁、交易金额大,且最近一次消费时间间隔短,实际贡献价值很高。——企业优质的客户群,采用会员制运营。
【'101':'重要挽留客户'】该类用户交易金额大,但交易并不频繁、且长时间没有二次消费,也存在流失风险。——有很高潜在价值的客户,可针对性研究用户特征,通过特定营销手段吸引用户提高购买频率。
【'001':'重要发展客户'】该类用户最近消费间隔短、购买金额大,但交易不频繁。——有很高潜在价值的客户。对该类用户展开专题研究,重点分析用户群特征,以便在下次促销时向合适的用户传递合适的CD产品,转化为留存客户。
【'110':'一般价值客户'】该类用户购买频率高,但长时间没有交易,而且购买金额较低,企业已很难获取更多利润。
【'010':'一般保持客户'】该类用户最近交易时间间隔短、购买频率高,属于活跃用户,但由于累计购买金额较少,消费能力有限,属于企业的一般维持用户。
【'100':'一般挽留客户'】低价值客户。
【'000':'一般发展客户'】 无法立即给企业带来较大利润的用户。
针对上述8类用户分层情况,可初步制定三大运营策略:
提高活跃度:注重提升一般客户、低价值客户的活跃度,将其转化为优质客户。
提高留存率:与重要价值、重要挽留客户互动,提高这部分用户的留存率。
提高付费率:维系重要保持客户、重要发展客户的忠诚度,保持网站的良好收入。
具体手段包括搭建会员体系、会员分类管理与升级、积分兑换、发放折扣券等。
通过上图可以发现,重要价值客户的F和M较大,即消费次数多且消费时间间隔远,可以采取重点换回方式运营。
②新老客户活跃流失
参考漏斗模型,针对每个用户,按两年内的每个月对用户情况进行分类,即新用户、活跃用户、回流用户、流失用户。
通过下面的数据透视表即可得到每个用户每个月的购买情况,从而进行转化分析。
若本月无消费(即为0)
之前有记录
1.上条记录为无消费(即为0)
1.1若为未注册,则为未注册
1.2若为不活跃,则为不活跃
2.上条记录为有消费(即为1),则为不活跃
之前无记录,则为未注册
若本月有消费(即为1)
之前无记录,则为新客户
之前有记录
3.上条记录为无消费(即为0)
3.1若为未注册,则为新客户
3.2若为不活跃,则为回流客户
4.上条记录为有消费(即为1),则为活跃客户
由上表可知,每月的用户消费状态变化
活跃用户(持续消费用户),对应的是消费运营的质量
回流用户(之前不消费本月才消费),对应的是唤回运营
不活跃用户,对应的是流失
新客户,对应渠道与市场
Active:活跃用户除了2017年上半年处于增加情况,下半年处于先降低,然后缓步增加,到了2018年,整体处于先大幅度下降,然后缓步上升到2017年的水平。整体来说活跃用户偏少,说明运营质量不高,可能是竞争激烈导致,具体情况需要再进行详细分析。
New:新用户,只有在2017年以减少的趋势增加了,之后2018年则一直没有新用户增加。说明市场,渠道,需要加大运营力度以增加新用户。
Return:回流客户,除了2017年上半年处于上涨趋势,后一直到2018年底,都处于在150的幅值上下波动,说明老客户维护的还不错,需要进一步的挖掘客户需求。
Unactive:不活跃用户,2017年的不活跃用户一致增加,直到2018年二月达到顶峰,随后一直小幅下降。说明用户一直处于较大流失状态,需要采取提高用户体验等措施以达到加强用户黏度的效果。
- 用户购买周期(按订单)
产品的平均购买周期是48天
- 用户生命周期(第一次与最后一次购买时间差)
用户生命周期的均值是539天,75%以上的用户周期超过486天,说明用户黏度不错。
- 复购率和回购率
- 复购率
复购率的波动很大除了2018年7月份,基本上在0.45的上下波动。需要详细分析7月份产品分类,查找原因,这里不做赘述。
- 回购率
从上图可以看出回购率的波动很大。说明客户的忠诚度不够,需要采取例如举办活动,发放优惠券等方式提高用户的忠诚度。
- 总结
本次分析采用了多种分析方法,如趋势分析,用户行为分析,RFM模型分析,生命周期分析,漏斗转化分析,较全面刻画了店铺的运营现状。
主要结论有
- 总体来看,每月的消费总金额、消费次数、产品购买量、消费人数趋势相似:均在1-4月,7月处于下降趋势,处于淡季,5-6月,8-12月处于大幅增加趋势,处于旺季。
- 通过以上对用户个体消费能力分析,可以发现,用户的购买数量和销售金额数据波动很大,极值差距也很大,且购买金额不满足二八原则,说明核心用户定位不够精准
- 用户基本是集中在2017年进行第一次消费,也就是说新客是在逐渐减少,到2018年基本上没有新客进行消费行为,但是老客户的黏性较高。
- 从RFM分层可以知道,店铺中有很大一部分客户为一般发展客户和一般挽留客户,可以针对提升这些用户的活跃度,转换为优质客户。重要保持客户需要提供更优质服务
- 整体来说活跃用户偏少。
新用户,只有在2017年以减少的趋势增加了,之后2018年则一直没有新用户增加。
回流客户,除了2017年上半年处于上涨趋势,后一直到2018年底,都处于在150的幅值上下波动,说明老客户维护的还不错。
不活跃用户,2017年的不活跃用户一致增加,直到2018年二月达到顶峰,随后一直小幅下降。说明用户一直处于较大流失状态。
- 产品的平均购买周期是48天,用户生命周期的均值是539天,75%以上的用户周期超过486天,说明用户黏度不错。复购率的波动很大除了2018年7月份,基本上在0.45的上下波动。
- 回购率的波动很大。
可以采取的措施:
- 用户体验流程分析,查看流失客户行为数据,进一步回访客户找出客户流失原因,进行优化改进。
- 产品分析:针对客户的评价,网站评论,用户反馈意见等维度,对产品体验进行分析优化。
- 用户来源,通过分析用户来源渠道方面加强运营推广
- 需要根据店铺定位,对于核心客户加大推广力度,并且针对性的对这些客户的加强购物体验
- 提高活跃度:注重提升一般客户、低价值客户的活跃度,将其转化为优质客户。
提高留存率:与重要价值、重要挽留客户互动,提高这部分用户的留存率。
提高付费率:维系重要保持客户、重要发展客户的忠诚度,保持网站的良好收入。
具体手段包括搭建会员体系、会员分类管理与升级、积分兑换、发放折扣券等。