天猫淘宝母婴电商分析
时间:2023-03-26 02:34:01 | 来源:电子商务
时间:2023-03-26 02:34:01 来源:电子商务
一 分析背景
(一)发展背景
1.政策—二胎政策开放,新生儿数量增加,有利于促进在线母婴商品市场快速发展
2.经济—人们消费水平,生活质量越来越高,不断提高的人均可支配收入将提升家庭的消费意愿
3.社会—家长在孩子身上的投入越来越高,人口继续增长,人们网上购物已成习惯
4.技术—互联网技术越来越成熟,为电子商务迅速崛起注入强大的动力
(二)数据背景
1.数据来源—数据是通过google搜索获得,链接
https://tianchi.aliyun.com/dataset/dataDetail?dataId=452.数据构成
(1)表1 购买商品(sample)sam_tianchi_mum_baby_trade_history.csv)
(2)表2 婴儿信息((sample)sam_tianchi_mum_baby.csv)
二 分析目的
(一)对不同的时间节点和场景做出不同的销售和运营管理策略
(二)帮助商家提高销量和营业额、减少经营成本
三 构建业务问题
(一)分析母婴产品的市场概况及变动趋势
(二)各商品的销售情况
(三)用户群体特征及不同特征下商品的销售情况
四 分析问题
(一)产品维度
1.明确问题
(1)商品销量随时间的变化趋势
(2)热销/冷门商品有哪些
(3)不同用户下的销量情况
2.理解数据
(1)user_id-用户id
(2)auction_id-物品编号(item_id)
(3)cat_id:-商品种类ID(商品二级分类,表示商品属于哪个类别)
(4)cat1-商品种类ID(商品一级分类,表示商品属于哪个类别)
(5)property-商品属性
(6) buy_mount-购买数量
(7)day:购买时间
3.数据分析
(1)数据清洗
①列名重命名—把英文改成中文
②缺失值处理
③数据排序—将购买数量的列的数据进行排序
④日期数据处理—统一日期类型转换为YMD
(2)数据透视表
①商品销量随时间的变化趋势—购买时间与商品销量的透视表
②热销/冷门商品是什么—物品编号与商品销量的透视表
③不同用户下的销量情况—用户id与商品销量的透视表
(3)数据可视化
①商品销量随时间的变化趋势
上图可知,商品销量随时间的变化呈总体增长趋势。在每年的11月,销售情况都会有所增长(双十一的作用)。并且增长量逐年上升,在2014年更是有明显的爆发性增长。
而在每年的1,2月份,销售情况都会有所下降。2015年的产品销售情况也可能变得不好了(为了严谨分析,先假设存在此问题)。故接下来来分析这些问题。
A.问题1 每年的1,2月份销售额会变差
时间—2013,2014,2015年的1,2月份数据(2012年无1,2月份数据,故不考虑)
地点—数据本身无区域划分,则不考虑
明确指标—商品销售量
业务指标含义—用户购买商品的数量(此问题中分析2015年1,2月份的销售量,故与前几年1,2月份的销售量相比较)
分析原因(假设检验法)—为什么每年的1,2月份销售量会变差
假设1—付费人数减少
将不同用户在每年1,2月份的购买次数进行统计(已将购买次数降序排序)后,得出老用户只有2人,而新用户有4008人。
可知老用户对销售额的影响很小,故可排除老用户对销售额的影响,直接分析总体用户付费人数。
由上图可知,每年的1,2月份,用户人数都会减少,故假设成立。(可以推测是因为春节原因,发不了快递等原因)
假设2—平均单价降低
获取平均单价的数据,看平均单价是否有大幅变化 。但因无平均单价的数据,故本回不对此假设进行分析。
B.问题2 2015年的产品销售情况变不好了
时间—2015年
地点—数据本身无区域划分,则不考虑
明确指标—商品销售量
业务指标含义—用户购买商品的数量(此问题中分析2015年的销售量,故与前几年的销售量相比较)
分析原因(假设检验法)—为什么2015年的产品销售情况变差了
假设—2015年1,2月份的销售量出现了问题
由上图可知,2015年1,2月份的销售量并没有下降,反而有所增长(虽然2015年的二月份的销售量少,但那是因为数据到2月6日就没有了),
故假设不成立。且2015年的销量情况并没有变差,故此问题不存在,即无需解决。
②热销/冷门商品
上图可知,商品id为39769942518,20409520643,36505037679,3920805463,9716351898的商品销量在1000以上,为TOP5的热销商品。而在商品销量1000以下的商品的购买数量差异不大。可以参考以上不同商品的销售情况,向用户推荐热销产品。
③不同用户下的销量情
上图可知,用户id为2288344467,117730165,173701616,1945590674,32141414的用户购买的商品数量为1000以上,可当成为大客户。可继续挖掘这些大客户的消费行为,推荐合适的商品给他们。
(二)用户维度
1.明确问题
(1)出生日期对商品销量的影响程度
(2)性别对商品销量的影响程度
2.理解数据
(1)user_id-用户id
(2)birthday-出生日期
(3)gender-性别(0女性;1男性;2未知的性别)
3.数据分析
(1)数据清洗
①列名重命名—把英文改成中文
②日期数据处理—统一日期类型转换为YMD
(2)vlookup
①商品销量随时间的变化趋势—购买时间与商品销量的透视表
②热销/冷门商品是什么—物品编号与商品销量的透视表
③不同用户下的销量情况—用户id与商品销量的透视表
(3)数据可视化
①不同出生日期下的商品销量情况
上图可知,2011年出生的宝宝购买的商品数量最多,其次是2012,2013年,2014年。从2010开始,母婴用品的购买量有明显增长。
②不同性别下的商品销量情况
上图可知,性别对商品销量是有影响的。女婴的商品销量大于男婴。可得出与女婴相比,男婴用户购买力不足此问题。故分析此问题。
时间—2012年8月~2015年2月
地点—数据本身无区域划分,则不考虑
明确指标—商品销售量
业务指标含义—用户购买产品的数量(此问题中分析不同性别下的销售量,故将男婴和女婴的商品销售量进行比较)
分析原因(假设检验法)—为什么男婴用户购买力不足
假设—男婴购买的产品为热销产品较少
可以看出,与男婴购买的产品相比,女婴购买的产品销量高,而且购买的产品种类较多。故假设成立。
③不同性别下商品销量趋势图
上图可知,男婴女婴用品的总销售量都呈现上升趋势(虽然2014年到2015的趋势为下降,但是因为无2015年10,11,12月的数据,故不考虑2014到2015年的销量趋势),且女婴的购买数量始终比女婴多。
五 总结结论
(一)商品销量随时间的变化呈总体增长趋势。(近年来电商市场发展良好
(二)在每年的11月,销售情况都会有所增长,且增长效果越来越好。(双十一的作用越来越好)
(三)每年的1,2月份,销售情况都会有所下降(因为春节原因,发不了快递等原因)
(四)商品id为39769942518,20409520643,36505037679,3920805463,9716351898的商品销量在1000以上,为热销商品
(五)用户id为2288344467,117730165,173701616,1945590674,32141414的用户购买的商品数量为1000以上,为大客户
(六)从2010出生的婴儿开始,母婴用品的购买量有明显增长
(七)女婴的商品销量大于男婴。与女婴相比,男婴用户购买力不足。(男婴购买的产品为热销产品少)
(八)男婴女婴用品的总销售量都呈现上升趋势
六 给出建议
(一)在双十一活动上多下功夫,比如扩大双十一活动平台,加大宣传力度,加强促销活动等。
(二)可以考虑在1,2月份时进行商品促销活动刺激用户消费。如果业务允许,可尝试解决春节期间的物流问题。
(三)分析热销产品成为热销产品的原因。可从商家服务,商家产品,商家促销活动等方面进行深层次分析。
(四)分析大客户的消费行为(消费原因,消费习惯),群体特征(集体或个人,性别,职业,年龄等),对大客户进行精准推荐。
(五)近年来母婴用品市场发展良好,可加强公司对母婴用品的资金及人力投入。
(六)为了提高男婴的商品销量,可考虑进行促销活动来促进男婴产品的销量,并可以选择适当扩大男婴商品种类。