母婴电商产品案例,分析思维梳理
时间:2023-03-26 03:54:01 | 来源:电子商务
时间:2023-03-26 03:54:01 来源:电子商务
一、数据背景
此数据分析案例是通过阿里巴巴的天池平台获取的数据源,两份关于淘宝天猫用户购买婴儿产品的数据表。下面我将对通过有限的字段数据,从明确问题,到数据分析,再到决策建议全流程进行梳理。
二、理解数据
数据表格分为两个,表1为购买商品,表2为婴儿信息,字段名含义如下:
三、提出问题
通过这两份表格中仅有的字段数据,我发现店铺商品销售的初步情况,并进一步了解到店铺商品的经营上出现了哪些现象,通过分析找出哪里出了问题,出问题的原因是什么,而以此为后续的经营提出建议。
通过逻辑树和多维度拆解分析方法,我将初步的问题分为产品维度、用户维度两个维度。
1.产品维度(1)商品每月成交量的情况
(2)商品每年每月的变化情况
(3)每笔订单购买量的情况
2.用户维度(1)男女性别对产品的需求情况
(2)不同年龄对产品的需求情况
四、数据清洗
1.选择子集:隐藏商品属性(Property)、商品编号(Aucion_id)字段数据。
2.列名重命名:将字段改为中文。
3.删除重复值:在购买信息表中,并未发现重复值。
在婴儿信息表中,并未发现重复值。
4.缺失值处理:通过COUNT函数查找,并未发现缺失值。
5.一致化处理:购买日期与生日日期统一转换为2020/04/04日期格式。
婴儿信息统一把“0”改为“女性”,把“1”改为“男性”,把“2”改为“未知”。
6.数据排序:将购买数据按照时间顺序进行排序。
7.异常值处理:由于此次的分析,我们需要根据数据的情况发现经营问题,因此在没有空值、重复值、错误信息数据的情况下,我们先暂时不对数据本身的异常进行处理。
而在婴儿信息方面,我们可以通过计算婴儿在购买日期时的岁数来查看婴儿信息是否有异常。
首先我通过VLOOKUP和DTAEDIF函数对婴儿年龄进行计算。
输出后发现,有的岁数显示“#NUM!”错误,对照出生日期和购买日期,发现是因为这类错误的商品都是因为婴儿还没出生就进行购买的。
由于这类错误数据可假设为是用户不想透露婴儿信息而填写的,但是并不影响性别的分析。因此我们可以把表格复制一份,备注为婴儿性别分析表,并把未知性别的异常数据进行删除。
而后我们在另一个表格备注为年龄分析表,将“#NUM!”错误的异常数据进行删除。
五、数据分析
1.产品维度(1)商品每月成交量情况从图中可以看出,每年的销售额都有上涨的趋势,而2014年11份的时候成交量有一个大爆发的情况出现,需要进一步分析。
(2)商品每年每月的变化情况通过每年的数据对比发现,每月的同比基本上都有所增加,说明店家的销售业绩每年都有所增长。而店铺商品的销量主要集中在下半年,每年5月、9月、11月会迎来销量的高峰期,而2013年的7月和12月也呈现出高峰期的状态,每年1-2月份是销量低谷的状态,2015年2月出现销量急剧下跌的状态。
(3)每笔订单购买量的情况通过购买数量数据的描述性分析发现:
订单平均购买商品的数量为2.5个,中位数和众数都为1,代表大部分用户都是下单购买一件商品,但是发现购买数量的最大值是10000,找到该笔订单出现在2014年11月13日,这个数据可能出了问题。
(4)明确问题①每年5月、9月、11月迎来销售高峰。
②2013年7月、12月迎来销售增长。
③2014年11月销量爆发。
④2015年2月销量急剧下跌。
⑤2014年11月单笔销量最大值为10000件。
(5)提出假设(假设检验分析法)以上发现的几个问题都是跟销量有关,我根据手头上已有的数据信息,进行三个方向的推断假设:
通过消费用户数量的变化发现规律,对应以上5个初步问题总结的假设,
结论如下:①假设成立,消费用户数有所增长。
②假设不成立,2013年的7月和12月消费用户数无增长变化。
③假设成立,消费用户数有所增长。
④假设成立,消费用户数有所下跌。
⑤假设不成立,单笔订单与消费用户数变化无关。
通过每年各月份销量的方差计算发现变异情况,对应5个初步问题总结的假设,
结论如下:①假设成立,2014年9月和11月销量变异。
②假设成立,2013年7月和12月销量变异。
③假设成立,2014年11月销量变异。
④假设不成立,2015年2月销量无变异。
⑤假设成立,2014年11月销量变异。
根据问题,我们通过调研看看2月、5月、7月、9月、11月、12月是否有相关节假日活动。
- 2月:2015年的春节在2月份,店家、物流停工。
- 5月:国际家庭日、青年节、母亲节、520网络情人节
- 7月:银色情人节
- 9月:教师节、示爱节
- 11月:双11,感恩节
- 12月:双12,圣诞节
因此,对应5个问题总结的假设结论皆成立,有相关营销活动对销售额影响的可能。
(7)分析总结①每年5月、9月、11月迎来销售高峰。消费用户有所增长,但是2014年9月和11月销售量数据有变异情况。
②2013年7月、12月迎来销售增长。消费用户无增长情况,且销售量数据有变异情况。
③2014年11月高峰异常。消费用户有所增长,但是销售量数据有变异情况。
④2015年2月销量急剧下跌。消费用户数有所下跌,销售量数据无变异情况。
⑤发现2014年11月单笔销量最大值为10000件。销售量数据有变异情况。
(8)继续深入分析①2014年9月和11月销售量数据有变异情况。③2014年11月销售量数据有变异情况。⑤发现2014年11月单笔销量有变异情况。我下面通过分别计算2014年9月和11月份的四分位数情况来找出异常值问题。
通过计算发现,2014年9月份每个订单的销售数量并无异常。
结合之前的分析可得出销量的增长是由于节假日营销活动的成功,带动了消费用户的增长。
通过计算发现,2014年11月份订单的销售数量出现异常,有一个最大值10000,通过销量发现还有一个2748的销量与7个百位的销量,通过四分位数的计算无法进行异常识别。
然后我通过输出2013年11月份的正常数据,用对比分析法进行分析。
通过2013年的正常数据发现,有几位头部的销量订单出现过百的情况,以此判别2014年11月份7个百位的销量属于正常情况,且超过1000的购买数量都属于数据异常。
通过分析得出结论,2014年11月的波动是由异常数据导致的。需要进一步与运营部门同事沟通,核查数据是由于统计异常出的问题,还是由于用户的特殊购买行为而导致的。
②2013年7月、12月销售量数据有变异情况。同样的,我通过QUARTILE函数分别对2013年7月和12月的销量情况进行四分位数的计算。
通过计算发现,2013年7月份订单的销售数量出现异常,有一个最大值1000。
通过计算发现,2013年12月份订单的销售数量出现异常,有一个最大值2800。
通过分析得出结论,2013年7月、12月的销售波动是由异常数据导致的。需要进一步与运营部门同事沟通,核查数据是由于统计异常出的问题,还是由于用户的特殊购买行为而导致的。
④2015年2月消费用户数急剧下跌。我通过MAX和MIN函数找出2月订单统计的开始日期和截止日期。
通过计算发现,订单的日期仅统计2015年2月1日-5日的数据。
2015年2月的消费用户数急剧下跌导致的销量下跌,是由于统计数据不全导致的,实际数据并无异常情况。
2.用户维度(1)男女性别对产品的需求情况通过饼图对比分析发现,本商店的商品对于女性婴儿的购买需求会更强一些。
通过堆积柱状图发现,商品的总体需求量还是女性婴儿比较大。
由于店铺总体产品对于女性婴儿的需求解决力更强导致,针对女性婴儿的购买力更强。
(2)不同年龄对产品的需求情况我使用针对年龄进行数据进行后的分析表进行分析。
通过条形图可以看出0-3岁的婴儿购买需求是最大的。
对于0-3岁的婴儿来说,“50008168”、“50014815”、“28”这三类商品的需求量最大,也是店铺销量最多的产品。
店铺总体产品对于0-3岁婴儿的需求解决力更强。
六、总结与建议
通过以上产品维度与用户维度的分析,可以得出以下总结与建议:
1.销售数据中有购买异常值,需要跟店铺运营人员进一步核实情况,分析具体原因是由用户行为导致的,还是系统统计数据出错。
2.“50008168”、“50014815”、“28”这三类产品为店铺的爆款,应该加大宣传力度,而其余三类产品需根据实际经营成本与销售情况作进一步调整。
3.本店消费用户对节假日活动是比较敏感的,建议店家每逢活动期间加大营销力度,进一步提升销售效果。
4.本店女性婴儿的购买需求达到7成,店家可以在店铺定位方面更加偏向女性一点,并优化店铺产品的性别倾向,从而达到提高客单价的效果。
5.本店0-3岁的婴儿需求最大,店家可在店铺的定位和营销方向中专供迎合低龄儿童的需求。