数据分析母婴用品的电商销量问题
时间:2023-03-26 06:12:01 | 来源:电子商务
时间:2023-03-26 06:12:01 来源:电子商务
随着互联网的日渐普及,人们的消费行为也有所改变。以前需要在实体店里买日用品,现在可以在各个电商平台进行购买,大大方便了生活。电商平台之间的竞争也日趋激烈,怎么样更好地更快地满足用户需求,为他们提供需要的产品,成为了电商平台关注的问题之一。对用户在电商平台的消费行为进行分析,便于今后电商平台及商家开展有针对性的营销活动。
一、数据集介绍
数据来自淘宝和天猫上购买婴儿用户,本数据集包括2个excel文件
表1购买商品
表2婴儿信息
二、数据来源
阿里巴巴天池
https://tianchi.aliyun.com/dataset/dataDetail?dataId=45三、解释表里数据字段的含义
表名 | 字段中文名 | 字段含义 |
---|
购买商品 | 用户ID | 用户的唯一标识和编码。 |
| 商品编号 | 商品的唯一标识和编码 |
| 商品二级分类 | 商品类别上的二级分类,属于一级分类的下一层级 |
| 商品一级分类 | 商品类别的大类别 |
| 商品属性 | 针对商品的大小、尺码等特征进行描述 |
| 购买数量 | 用户购买量或下单量 |
| 购买时间 | 用户下单的时间 |
婴儿信息 | 用户ID | 用户的唯一标识和编码。 |
| 出生日期 | 用户的出生年龄 |
| 性别 | 用户的男女性别si |
四、提出问题
根据已有数据,提出以下问题
1、婴儿产品的复购率如何?
2、不同种类的产品的销量情况怎么样?
3、婴儿的性别对商品销量有何影响?
4、婴儿的年龄对商品销量有何影响?
5、热销产品和差销产品有哪些?
以下是分析思路:
四、清洗整理数据
1、前期已经对表1表2的数据格式进行处理,并补充表2 婴儿信息的商品一级分类、二级分类信息。方法:按照用户ID对表1进行VLOOKUP匹配出商品分类信息。
2、对异常值的处理:
(1)年龄上的异常值。通过婴儿出生日期和用户购买日期,计算用户年龄,发现一位28岁的用户,不符合婴儿用户年龄,剔除数据值。
(2)性别上的异常值。婴儿表上的用户总量有953个,性别为未知的用户有27个,占比约为2.8%。可以忽略这部分数据的影响,将性别为未知的数据剔除。
五、对已拥有数据分析问题:
商品销量受时节季度、用户性别和用户年龄等的影响。
(一)用户角度
1、婴儿不同的性别对商品销量的影响
女婴儿对商品销量比男婴儿贡献大。男婴儿商品购买量是559个,女婴儿购买量是931个。从商品的不同类别继续分析男女婴儿消费情况。
女婴儿对一级商品品种28、38、50008168、50014815、122650008需求量比男婴儿更大。
婴儿产品的复购率:消费两次以上的付费人数/付费人数=60/927*100%=6.47%。婴儿用户购买商品量上,老用户对商品的重复购买占比小,新用户占比贡献更大,说明商品对用户的粘性不够,需要从竞品、商品上等角度上研究。
2、婴儿的不同年龄对商品销量的影响。
横轴代表用户年龄,可以看出,0-1岁之间的用户的商品销量最大。
出生前-11岁的婴儿对一级商品50008168和50014815两类商品需求量最大。
(二)产品角度
对表1中的购买时间数据进行格式化处理,忽略商品属性和商品编号这两列,注重分析商品一级、二级分类。
一级类目商品月份销售情况。选取字段商品一级分类、购买时间和购买数量,商品编号28在1月、5月、7月和12月份销售量突出。商品编号38、50022520和122650008的销量和其他一级商品相比,销量不突出。商品编号50008168销量高峰在9月份,商品编号50014815在11月份的销量相比其他一级商品异常突出。
编号5004815在第四季度11月份的销量表现抢眼,超越了其他类目,成为销量最佳的类目。结合图3和图4判断,是因为出现了某位用户购买大量该类商品。
总体而言,一级品目商品28、50008168的各个月份销量更稳定,在一年中某些月份会有突出表现。
六、总结建议
1、女婴儿用品的销量远大于男婴儿用品销量。重视女婴儿用品的推广宣传和运营。
2、一级商品类别28和50008168销量较高。保持对这两类商品的供应稳定,加大这类商品的宣传和推广。
3、出生前到1岁之间的婴幼儿用品销量高。增加对这个年龄段的商品品类的投入和关注。
4、婴幼儿的复购率低,用户粘性低。需要在产品运营和用户运营、竞品上下功夫,分析研究老用户的消费行为,提升产品品牌的忠诚度。