电商数据全流程分析
时间:2023-03-15 21:34:02 | 来源:电子商务
时间:2023-03-15 21:34:02 来源:电子商务
一、理解数据- 选择数据集:淘宝和天猫购买婴儿用品的信息,表1为购买商品字段,表2为婴儿信息
- 数据集来源:阿里巴巴天池https://tianchi.aliyun.com/data
- 表格字段:
二、数据清洗经过选择子集-列名重命名-删除重复值-缺失值处理-一致化处理-数据排序-异常值处理7个步骤,清洗后表1数据集有29972条信息记录,表2数据集有811条信息记录。
三、分析思路,提出问题综合运用逻辑树分析法将表1表2数据拆解成用户、产品、市场3个维度,每个维度运用对比分析法找出存在的问题,用假设检验分析法对问题进行假设并验证:
四、分析问题(一)、市场维度——销售情况由图显示,
- 2012年和2015年的销量偏低,将每年数据具体列出后发现是2012和2015年的数据不全导致;
- 2012-2015年的销量和订单逐年递增,说明该电商运营效果逐年提升;
- 在每年的5月和11月有销量和订单小高峰出现,且11月订单最多;
- 每年的1-2月和6月份销量和订单有下降趋势,特别是1-2月份为全年最低;
由此进行假设分析:
假设1:每年的5月和11月订单高峰由于节假日活动促销所致销量=订单数*购买数量由5月销量和订单图可知:
5月2-3日、5月7日、5月10-12日、5月19-22日、5月25-27日在订单出现了小高峰,经查询,5月份的节日比较多:
5月1日劳动节,2013年5月11日/2014年5月13日 母亲节,5月20日,520节,在这些节日的前后均出现购买小高峰,与假设的商家利用节日进行促销相吻合。
由11月销量和订单图可知:
11月11-13日在销量和订单上都出现了小高峰,每年的双十一为电商的购物节,2012-2015年的订单高峰均出现在11月11日这一天,与假设的商家利用节日进行促销相吻合。
由此,假设1成立。
假设2: 1-2月份订单下降趋势是由于春节期间快递停运导致由1-2月订单和销量图可知:
2013年订单和销量都在2月1日-15日趋于0,经查2013年春节假期为2月9日-15日;
2014年订单和销量在1月21-2月4日趋于0,经查2014年春节假期为1月31日-2月6日;
2015的春节假期为2月18日-24日,而数据只显示到2月4日,数据不全,不做分析;
2013-2014年订单和销量低谷时间与春节假期吻合,故假设2成立。
(二)产品维度——产品运营情况分析1、各品类商品年度销量/订单情况由图显示,2012-2015年间,
- 28类累计销量最多,50008168类累计下单次数最多;
- 在销量上,28类、50014815类和50008168类为各年畅销商品,38类、50022520类、122650008类偏低;
- 在订单次数上,50008168类、28类和50014815类和为各年畅销商品,50022520类、122650008类和38类偏低;
2、各品类月度销量/订单情况由图显示,在1-12月份期间:
- 在销量上,28类在12月份销量最多、50008168类在9月份购买最多、50014815在11月份购买最多;
- 在订单次数上,50008168在11月下单次数最多,其次为9月和5月;28类在12月份下单次数最多,其次为11月和7月;50014815在11月下单次数最多。
- 50014815类商品在11月销量最多,但当月订单次数并不多;
假设3: 50014815类商品为少次大批量采购对50014815类商品用户销量top10进行统计,此top10个用户的订单次数均为1次,用户ID2288344467单次采购数量为10000,因此假设3成立。
3、热销商品TOP10 由图显示,
- 在购买数量上,商品50018831最多,为12657个,购买次数为718次;应该有多个用户一次购买多个,属于大批量采购,可重点关注;
- 在购买次数上,商品50013636最多,为2066次,购买数量为2279,属于购买次数频繁,但购买数量不多的商品,说明商品小量单次采购居多。
(三)用户维度1、不同年龄用户购买情况分析由图显示
- 0-3岁用户是购买主力;
- 在购买数量上,0-1岁用户购买50014815类、50008168类、50022520类和38类较多,2-3岁用户购买50008168类和28类较多;
- 在购买次数上,0-3岁用户购买50008168类、50014815类和28类较多。
2、不同性别用户购买情况分析由图显示,
- 女性用户购买数量更多;
- 在购买数量上,女性用户购买50014815类、50008168类、28类和38类更多,男性用户购买50008168类、28类和50014815类更多。
- 在购买次数上,男性用户和女性用户都是购买50008168类、28类和50014815类更多;
3、0-3岁不同性别用户购买情况分析由图显示,
在购买数量上:
- 0岁女性用户购买数量更多,更喜欢购买50014815类;
- 1岁女性用户喜欢购买38类和50014815类;
- 2岁用户都喜欢购买50008168类;
在购买次数上:
- 0岁男性用户购买次数更多,
- 0-1岁用户都喜欢购买50008168类、50014815类和28类;
- 2-3岁用户都喜欢购买50008168类和28类;
4、用户复购率由图显示,只有25名用户购买次数大于1次。通过删除用户ID重复项,得出用户总数为29944,用户复购率为25/29944=0.835%,复购率极低。
通过数据透视表列出25名用户的对不同商品的购买次数,发现:
- 仅有的25名用户复购品类集中在28类和50008168类,其他4个类别复购情况特别少
五、解决问题—结论和建议1、该电商2012-2015年的销量和订单逐年递增,运营效果逐年提升;
2、在销量和订单高峰通常出现在节假日,说明该电商促销效果显著,后续可继续利用节假日进行促销;
3、5月、9月、11月和12月为销售旺季,基本集中在下半年。28类、50014815类和50008168类为各年特别是各年下半年的畅销商品,商家需要投入精力重点运营,库存需要储备充足。针对50022520类、122650008类和38类择需要缩减库存,并找出滞销原因,进行改进。
4、针对商品单次大批量采购用户需要重点关注,挖掘其后续购买潜力。
5、0-3岁用户是购买主力,女性用户较男性用户购买数量更多,其中
- 女性用户和男性用户都喜欢购买50014815类、50008168类、28类;
- 0岁女性用户购买数量更多,0岁男性用户购买次数更多;
- 0-1岁用户更喜欢购买50008168类、50014815类和28类;
- 2-3岁用户更喜欢购买50008168类和28类;
6、用户复购率极低,商家后续需要增加用户粘性,提升用户复购率。