电商母婴童商品案例数据分析
时间:2023-03-26 04:38:02 | 来源:电子商务
时间:2023-03-26 04:38:02 来源:电子商务
数据来源:阿里巴巴天池Baby Goods Info Data-数据集-阿里云天池
表1 购买商品表2 婴儿信息一、理解数据集及提出问题
- 表1有7个字段,每个字段29971条数据
- 表2有3个字段,每个字段有953条数据
提出问题- 产品各类别的销量
- 不同时间段的销量
- 不同性别的购买情况
- 不同年龄的购买情况
使用思维导图来梳理问题
二、清理数据
1、将两张表通过用户ID连接合并,并将字段英文名改为自己习惯的名字。
2、将auctionid(物品编号)、property(商品属性)选择隐藏,不研究。
3、删除重复值:在Excel中使用
删除重复值功能,两张表均没有发现重复值。
4、缺失值处理:数据区域内通过
ctrl+G定位空值,未找到单元格。
5、一致化处理:购买日期与出生日期字段格都不是日期格式,需要
改为日期格式。其中出生日期需要计算年龄归类方便分析。
6、异常值处理1)购买时间的区间为2012/7/2-2015/2/5。2015年2月只有5天的数据,不能研究,删除。
2)对年龄排序发现,年龄最大值为28,应该是认为输入错误,将其改为未知U。年龄为-1的可以理解为即将出生的宝宝提前购买商品,那么-2表示提前2年,明显不合理。将年龄小于-1的值改为U。
3)性别字段中,将1改为男,0改为女。
4)产品销量中超过100的全用众数1代替,这次分析主要针对个人用户,考虑到存在一次购买几十件商品的土豪,所以将分界线设为100。
5)出生日期、性别、年龄字段存在错误值(#N/A),这是这些用户没有填写婴儿信息无法匹配到导致的,为了美观可以将其修改为未知U。
清洗后将不需要的出生日期和年龄隐藏
处理后的数据清洗后有7个字段,每个字段29712条数据。三、分析
(一)产品角度——销量1、各类别的销量热销类别top3:28,50008168,50014815。这三大类占了80%左右的市场
1)对2013和2014的数据进行同比分析所有的产品都有
高增长率。按照
波士顿矩阵可划分:明星业务与问题业务- 明星业务:28,50008168,50014815
这类产品可能成为企业的现金牛产品,需要加大投资以支持其迅速发展。可以采用的发展战略是:
增长战略,积极扩大经济规模和市场机会,以长远利益为目标,
提高市场占有率,加强竞争地位。
- 问题业务:38,20022520,233650008
问题业务,是一些相对市场份额还不高,但市场增长率提高很快的业务。之所以叫“问题业务”,是因为它们最终会
成为明星业务,甚至现金牛业务,还是会死掉,是不确定的问题。为发展问题业务,企业必须增加设备和人员,以便跟上迅速发展的市场,并超过竞争对手,这些意味着大量的资金投入,这些需要多方面考虑,难以给出建议。
2、不同时间的销量可以看出店铺销量整体上处于上升状态,有良好的增长趋势。11月有着明显的波峰,但在1月,2月迎来波谷。
对这些现象提出问题:- 为什么1月、2月时销量普遍偏低?
- 为什么11月份会出现一个销售波峰?
1)假设1月、2月受春节影响销量下降
可以看出2013年在2/2-2/15期间销量下降,2014年在1/25-2/4期间销量下降。2013的春节时间为2/9-2/15,2014年的春节时间为1/30-2/6。
春节时间与销量下降的时间高度吻合,证明了假设正确。
2)假设11月份受到购物节的影响销量上升
观察可发现在这三年的11月份中11日的销量都居最高位,由此可证明是双11活动为店铺带来明显的流量和销量,提高了11月的销量。
3、总销量=订单量*人均购买量在接近30000个用户购买数据中,只有25名用户发生重复购买行为,老用户对于销量的影响极小,主要对销量造成影响的是新用户数。产品的复购率极低,用户粘性差。
(二)用户1、年龄阶段在幼儿阶段(1-3岁)的购买产品的最多。
可以看出不同年龄段对不同类别产品的喜爱程度:
- 未出生:50014815,50022520
- 新生儿:50014815,28,50008168
- 婴幼儿:50014815
- 幼儿:最喜爱50008168,但50014815,28,38也有不错的销量,不可忽视
- 学前:50008168
- 小学:50008168
综合来看,1岁前最受欢迎的是50014815,1岁后是50008168。
2、性别从图中可以发现:为男宝宝购买的人数略少于女宝宝,但在购买量上二者明显有相差。男宝宝的人均购买量为1.28,女宝宝的人均购买量为1.57。
说明店铺的产品更吸引女宝宝。值得注意的是我国近些年出生婴儿,男性总是多于女性,平均比例为1.15,与客户的性别比例正好相反。对此现象提出假设:
在热销的商品中,存在为专门为女宝宝设计的商品为验证假设,选出男女宝宝销量top10的商品进行研究分析
对比看出女宝宝销量top10中,有大部分的商品是男宝宝少量购买甚至不购买,说明这些商品存在性别差异。而男宝宝销量top10的商品中就不存在这种性别差异。假设成立。因此有这些专门为女宝宝设计的商品,店铺的女宝宝购买次数和购买量上总是多于男宝宝。
为提高男宝宝的购买率,建议也设计几款对男宝宝的商品。
四、总结与建议
1、店铺热销top3:28,50008168,50014815。
2、商品销量逐年增长,前景非常广阔
- 店铺的所有大类别产品都有高增长率。其中有明星业务:28,50008168,50014815,建议加大投资,提高市场占有率;问题业务:38,20022520,233650008,这些为题业务最终会成为明星业务,甚至现金牛业务,也可能会死掉,是不确定的问题,需要店铺好好斟酌。
3、在1月,2月份受春节影响销量大幅度减少;在11月份受双11购物节影响,销量会爆发式增长。
- 大型促销活动往往能带动商品的销售,双11购物节往往能出现全年商品销量的峰值,所以卖家应该跟紧淘宝和天猫平台的大型促销活动的机会,在自己的店铺也做一些促销活动促进商品销售。
4、用户的复购极低,粘性差。
- 可以从产品本身质量、产品售后服务、甚至是业务流程中哪个环节等问题,进行深层次探讨。
- 还是说婴儿成长快,产品使用寿命短,复购率低是整个行业的现象?
5、购买产品的年龄段以幼儿为主(1-3岁);不同年龄段对产品喜爱不同:1岁前最受欢迎的是50014815,1岁后是50008168。
6、女宝宝的购买次数和购买量都比男宝宝多。是因为店铺存在不少针对女宝宝的商品,为了提高男宝宝的购买率,可以尝试设计对男宝宝的商品。