母婴电商产品案例,数据分析报告
时间:2023-03-26 05:16:01 | 来源:电子商务
时间:2023-03-26 05:16:01 来源:电子商务
一、分析背景
随着电商的快速发展,人们的消费方式开始打破地域限制,丰富的品牌,多元化的产品,让网上购物成为了人们生活中的一部分。对于商家来说,不仅通过电商的销售获得了盈利增长,更是可以通过平台系统的数据统计,让商家获取到用户、店铺、产品等数据的延伸价值,而通过数据分析,商家更是可以及时调整各方面的销售策略,让产品的销售稳步增长。
本文通过阿里巴巴的天池平台获取的数据源,以淘宝天猫上的母婴产品销售数据为案例,对产品和用户情况进行分析,并最后以分析结论为基础对店铺的运营销售提出相关建议。
本文的数据源分为两个数据集表格,表1为购买商品,表2为婴儿信息,其数据字段含义如下:
二、分析目的
此次的分析目的在于根据店铺的综合运营情况,为店铺提供方向性及销售提升策略的建议,帮助店铺提升品牌能力及销售业绩。
三、分析思路
经过数据理解,本次分析分别从产品和用户维度进行拆解分析。
1.产品维度(1)商品每年每月的变化情况
(2)每笔订单购买量的情况
2.用户维度(1)男女性别对产品的需求情况
(2)不同年龄对产品的需求情况
四、数据清洗
1.选择子集:隐藏商品属性(Property)、购买行为编号(Auction_id)字段数据。
2.列名重命名:将字段改为中文。
3.删除重复值:在购买信息表中,并未发现重复值。
在婴儿信息表中,并未发现重复值。
4.缺失值处理:通过COUNT函数查找,并未发现缺失值。
5.一致化处理:购买日期与生日日期统一转换为2020/04/14日期格式。
婴儿信息统一把“0”改为“女性”,把“1”改为“男性”,把“2”改为“未知”。
6.数据排序:将购买数据按照时间顺序进行排序。
7.异常值处理:由于此次的分析,我们需要根据数据的情况发现经营问题,因此在没有空值、重复值、错误信息数据的情况下,我们先暂时不对数据本身的异常进行处理。
而在婴儿信息方面,我们可以通过计算婴儿在购买日期时的岁数来查看婴儿信息是否有异常。
首先我通过VLOOKUP和DTAEDIF函数对婴儿年龄进行计算。
输出后发现,有的岁数显示“#NUM!”错误,对照出生日期和购买日期,发现是因为这类错误的商品都是因为婴儿还没出生就进行购买的。
由于这类错误数据可假设为是用户不想透露婴儿信息而填写的,但是并不影响性别的分析。因此我们可以把表格复制一份,备注为婴儿性别分析表,并把未知性别的异常数据进行删除。
而后我们在另一个表格备注为年龄分析表,将“#NUM!”错误的异常数据进行删除。
五、分析内容
1.产品维度(1)商品每年每月的变化情况通过每年的数据对比发现,每月的同比基本上都有所增加,说明店家的销售业绩每年都有所增长。而店铺商品的销量主要集中在下半年,每年5月、9月、11月会迎来销量的高峰期,而2013年的7月和12月也呈现出高峰期的状态,每年1-2月份是销量低谷的状态,2015年2月出现销量急剧下跌的状态。
a.每年5月、9月、11月迎来销售高峰原因分析假设1:消费用户增加导致销量增长
假设成立,通过每年的消费用户数的数据变化发现,每年的5月、9月、11月的消费用户数量都有一定幅度的增长,因此导致销量也随之增长。
假设2:数据异常导致销量增长
假设成立,每年5月的数据并无异常,而2014年的9月和11月存在数据异常的情况。
通过筛选2014年9月和11月的购买数量数据排序发现,2014年9月20日与11月30日的个别用户均存在千位数的极度异常购买数量。异常数据的出现导致出现销量增长的情况。
假设2:节假日活动导致销量增长
- 5月:国际家庭日、青年节、母亲节、520网络情人节
- 9月:教师节、示爱节
- 11月:双11,感恩节
假设成立,每年的5月、9月、11月均有家庭、大型消费节日等活动,因此会促进用户的消费。
结论:每年5月、9月、11月迎来销售高峰是由于促销活动的推广,促使用户在集中时间段对优惠商品进行购买消费,而9月和11月的数据异常也是导致销量增长的原因之一。
b.2013年7月、12月迎来销售增长。假设1:消费用户增加导致销量增长
假设不成立,通过2013年消费用户的变化情况发现,7月和12月的消费用户数并未呈现增长状态,因此销售量的增长并非由消费用户数变化导致的。
假设2:数据异常导致销量增加
假设成立,根据2013年每月的方差计算出数据变异性情况,发现7月、12月都出现数据异常的情况。
通过筛选2013年7月和12月的购买数量数据排序发现,2013年7月31日与12月20日的个别用户均存在千位数的极度异常购买数量。异常数据的出现导致出现销量增长的情况。
结论:2013年7月、12月迎来销售增长出现销售增长的情况是由数据异常导致的。
c.2014年11月销量爆发假设1:消费用户增加导致销量爆发
假设不成立,通过2014年消费用户数据情况发现,11月份的确有消费用户数增加的情况出现,因而导致销量增加,但并未达到爆发的趋势。
假设2:数据异常导致销量爆发
假设成立,根据2014年每月的方差计算出数据变异性情况,发现11月出现数据异常的情况。根据上述b子论点的分析中得出,11月31日存在用户的购买数量极度异常的情况。
结论:2014年11月的销售爆发增长,是由于数据异常导致的。
d.2015年2月销量急剧下跌假设1:消费用户变动导致销量急剧下跌
假设成立,根据2015年的消费用户数据变化发现,2月的销量急剧下跌是由于消费用户数下降导致的。
假设2:数据异常导致销量下跌
假设不成立,根据2015年每月的方差计算出数据变异性情况,发现2月无数据异常的情出现。
通过MAX和MIN函数找出2月订单统计的开始日期和截止日期。
发现,订单的日期仅统计2015年2月1日-5日的数据,数据不全导致销量数据下跌。
结论:2015年2月的销量下跌是由于数据统计不全导致的。
(2)每笔订单购买量的情况通过购买数量数据的描述性分析发现:
每个订单平均的购买商品数量为2.54个,中位数和众数都为1,代表大部分用户都是下单购买一件商品,但是发现购买数量的最大值是10000,且方差高达约4094,证明购买数量中存在异常高的值。假定购买数量的置信区间为平均值±3*标准差,即约为195,购买数量超过195的数据界定为异常数据。
通过统计分析得出,有29个异常值数据,删除异常数据后,重新分析数据得出以下数据:
结论:每个订单平均的购买商品数量为1.67个,中位数和众数都为1,代表大部分用户都是下单购买一件商品,通过统计分析得出,超过平均购买数量的订单数占比为12%,低于平均值即购买数量为1的订单数占88%。
2.用户维度(1)男女性别对产品的需求情况通过饼图对比分析发现,本商店的商品对于女性婴儿的购买需求会更强一些。
假设:由产品的男女需求解决力导致通过堆积柱状图发现,商品的总体需求量还是女性婴儿比较大。
结论:由于店铺总体产品对于女性婴儿的需求解决力更强导致,针对女性婴儿的购买力更强。
(2)不同年龄对产品的需求情况通过条形图可以看出0-3岁的婴儿购买需求是最大的。
假设:商品满足0-3岁的婴儿需求对于0-3岁的婴儿来说,“50008168”、“50014815”、“28”这三类商品的需求量最大,也是店铺销量最多的产品。
结论:店铺总体产品对于0-3岁婴儿的需求解决力更强。
六、总结
通过以上产品维度与用户维度的分析,可以得出以下总结:
1.产品维度(1)店铺的销售业绩每年都呈现上升的趋势。
(2)节假日活动的销售增长比较明显。
(3)数据异常对购买数量的影响较大,产生波动差异。
(4)88%的订单都购买1件商品。
2.用户维度(1)店铺商品对于女性婴儿的需求比男性婴儿大。
(2)店铺商品对于0-3岁婴儿的需求解决力更强。
(3)“50008168”、“50014815”、“28”这三类商品对于婴儿的需求量最大。
七、建议
1.销售数据中有购买异常值,需要跟店铺运营人员进一步核实情况,分析具体原因是由用户行为导致的,还是系统统计数据出错。
2.本店88%的订单购买数量都为1件,可通过相关捆绑销售策略增加客户购买商品的数量,提高客单价。
3.“50008168”、“50014815”、“28”这三类产品为店铺的爆款,应该加大宣传力度,而其余三类产品需根据实际经营成本与销售情况作进一步调整。
4.本店消费用户对节假日活动是比较敏感的,建议店家每逢活动期间加大营销力度,进一步提升销售效果。
5.本店女性婴儿的购买需求达到7成,店家可以在店铺定位方面更加偏向女性一点,并优化店铺产品的性别倾向,从而达到提高客单价的效果。
6.本店0-3岁的婴儿需求最大,店家可在店铺的定位和营销方向中专供迎合低龄儿童的需求。