母婴电商平台数据分析--案例全流程
时间:2023-03-26 01:10:01 | 来源:电子商务
时间:2023-03-26 01:10:01 来源:电子商务
1,明确分析背景与目的本次数据分析案例关于母婴用品电商平台的销售数据。在电商平台在零售总额中占比越加重要的现实背景当中,为电商平台之前的销售数据采取多维度分析,假设验证分析法,相关性分析等多种分析法进行科学严谨的数据分析并得出可靠的结论与建议正是从事数据分析最为重要的意义。
因为本次数据分析对象为实体销售产品和婴儿所以会从产品数据与用户数据两大类数据指标分析。数据来源:
共两个数据表:表一购买商品,表二婴儿信息。
2,数据理解表1购买商品共七个字段:
user_id:用户id
auction_id:物品编号(item_id)
cat_id: 商品种类ID(商品二级分类,表示商品属于哪个类别)
cat1: 商品种类ID(商品一级分类,表示商品属于哪个类别)
property:商品属性
buy_mount:购买数量
day:购买时间
表二婴儿信息表共三个字段:
user_id:用户id
birthday:出生日期
gender:性别(0女性;1男性;2未知的性别)
3,提出问题提问与验证思路整理如下图:
4.数据清洗清洗数据主要分为以下几个内容:
1. 选择子集(把与分析问题无关的字段数据剔除)
2. 列重命名(便于理解分析)
3. 删除重复值
4. 缺失值处理
5. 一致化处理
6. 数据排列
7. 异常值处理
基于以上内容我们已经于之前将数据的属性(property)字段隐藏便于分析,而后重命名各个字段英文为中文名称为:
同时经过进一步检查可知本次数据集并未有重复值和缺失值,待以后采用其他原始数据集时可以重点练习该部分,大概会用到查找删选替换等功能。一致化处理, 数据排列,异常值处理等内容在原始数据集中也未发现,留待下一步数据处理过程中进一步探索,大概会用到vlookup(),len(),left()等等函数运算。
5、构建数据模型采用多种分析方法进行具体分析:5.1产品数据角度:5.1.1产品复购率分析:近三万条购买记录中88%购买数量为1,6%购买数量为2,各产品购买数据高度分散。仅12%的购买行为中购买产品数大于1.用多维度拆解分析方法,逻辑树分析法,对比分析法,相关性分析法,假设验证分析法等多种分析方法深入分析该现象的原因。
根据
"IDEAL"分析法(Identify识别,Define定义,Explain解释,Analysis分析,Look back回顾反思),第一步得出
问题本质为:该电商数据的复购率低吗?回答此问题需要用
同行业其他电商数据同时期的复购率进行对比实证该问题确实存在。。
第二步定义什么是复购率,什么因素影响着复购率。
复购率=重复购买者(购买次数大于等于2的人)/总购买人数*100%即复购率代表重复购买者在总顾客中的占比,复购率越高代表着老客户占比越高,产品品质越得到市场认可,提高复购率对于任何企业的发展壮大都是至关重要的核心任务之一。
第三步我们根据复购率的定义分析影响复购率的因素从而来解释为什么该母婴电商的复购率偏低。与第四步分析结合,采取多维度拆解分析法和假设验证分析法来分析复购率偏低的原因。
从定义的这一维度来分析:
复购率=重复购买者(购买次数大于等于2的人)/总购买人数*100%即复购率代表重复购买者在总顾客中的占比,即复购率收到重复购买人数与总购物人数两个因素影响,可使用假设验证分析:
根据假设分别统计在数据所示时间段内复购人数与总人数涨跌趋势如下图所示:
有数据可视化结果可得出结论:复购率于2013年第一季度曾达到过历史高点,在数据统计后期2014年最后一季度总客户数突然大量增加而复购人数却并没有同时增加导致了复购率整体降低。同时应注意横向对比行业内同等规模的电商平台同时期复购率数据才能得出最终关于该母婴电商的复购率研究结论。
同时我们可以从网购成交的全流程各个环节这一层面分析复购率低的背后逻辑与解决方案:
采用多维度拆解并且假设求证:
因为是研究复购率偏低问题,所以可以排除前期引流入站浏览等环节的影响,并且结合对比法流程图提出以下三个假设:
假设1:产品质量有问题影响回购意愿(对应售后评价反馈环节和4P营销理论中的product分析)
验证指标:热销产品数量与在总商品中的占比,同类型店铺热销产品数目与占比,店铺评论数,好评数与好评率
假设2:客服人员服务态度影响回购(针对咨询客服环节)
验证指标:店铺的付费转化率与行业内同等规模的网店付费转化率,评论中关于服务态度的打分等级,投诉数量与其他业内店铺的对比
假设3:推广促销力度不够影响回购积极性(针对下单购买的意愿与4P营销理论中的promotion和price分析)
验证指标:促销活动次数,每次促销前后回购率对比
以上三种假设符合MECE分类原则(相互独立,完全穷尽),将影响复购率的因素基本都包括在内。
显然以上对于复购率的研究太多涉及到产品质量调查,客服人员服务打分等本数据集中缺失的数据,导致暂时无法得出结论,以上思路可做参考,待数据齐备方可展开复购率相关具体分析。
5.1.2产品销量与销售时间的关系:首先,购买时间按
季度组合后与
销量之间的关系如下图
数据集中有两个完整年份:2013与2014,通过2013与2014年每个季度的对比可以看出2014年每个季度销量都同比正增长,其中第四季度同比增幅最大为120%,同时2014年第四季度也是该数据集中销量最大的季度。2012与2015两个年份的数据不全,但从现存2012年第三第四两个季度数据来对比2013年同季度均能得出每个季度同比销量增长的结论,唯独2015年第一季度的数据对比2014年第一季度产生了负增长,下面用假设验证具体分析原因:
假设:2015年第一季度数据缺失,一个季度中三个月份数据并不齐全。
验证:销量按月份显示出图如下:
根据数据集的具体数据记录显示,销量的起始统计时间为2012年7月2号,终止时间为2015年2月6号,所以2012年第三季度和2015年第一季度的数据都确实,无法同比其他年份数据进行分析。
根据数据齐全的2013,2014及2012年第四季度数据可初步得出销量在同比增加的结论。
同时第四季度的销量明显比其他季度要多,第三季度销量次之:
对比每个月份销量:
可知十一月份明显比其他月份销量高,猜测原因为双十一促销活动拉高了销量,可假设论证。
假设:双十一促销活动拉高了整个十一月份销量,从而使十一月份销量较其他月份偏高。
验证1.检查2012,2013,2014年整个十一月份销售数量根据双十一前后数日销量占整个月份的比重
验证2.比较2012,2013,2014三个年份11月每日消费人数的变动情况。
综合销售产品数量与销售人数可以得出结论:双十一前后的促销活动确实拉高了整个十一月份的销量,且销量随年份递增。5.2用户数据分析:5.2.1婴儿年龄与购买产品的关系:宝宝月龄与购买产品数量之间的关系如上图所示,大部分购买活动发生在宝宝出生前到宝宝学龄前(74个月)之间,且最集中的购买时间为宝宝0-2岁之间。
5.2.2婴儿的性别与购买产品之间的联系:由上图可得:商品销售于使用者(宝宝)性别关系不大,整体呈现平均分布,女性略多余男性
。6.结论与建议6.1产品复购率整体略低,应继续搜集更多相关数据结合产品本身品质,客服态度,推广营销等各个环节分析复购率低的具体原因,并与同行业其他商家复购率进行横向比较。尽快明确复购率的具体原因,并针对关键环节进行重点突破,尽快提高复购率,提高老客户留存。6.2产品的销量每年随季节月份波动变化比较大,整体呈现第四季度销量冠绝全年,而十一月份销量凭借双十一促销活动又领跑其他各个月份销量。建议在稳固传统旺季销量的同时,加大上半年淡季的营销宣传力度,力争实现全年总销量的新突破。6.3销售活动大部分集中在宝宝0-2岁这一时间段内,建议多增加对应宝宝年龄段的广告营销曝光度,为电商平台引流,同时产品方面以此年龄段的研发为重心。6.4产品销售情况与宝宝的性别关系不大,女宝人数略大于男宝,差距在5%左右。建议厂家尽量同时研发宣传男女宝宝各自的玩具类别,不宜主推单一性别的差异化产品。7.可视化报告PPT展示