电商数据简单的分析思路(续)
时间:2023-03-15 21:58:02 | 来源:电子商务
时间:2023-03-15 21:58:02 来源:电子商务
在上一篇文章里,笔者简要对用户购买信息存在的一些问题作了简要的分析,尤其是对于用户的复购率问题作出了用户,产品,竞品等维度的原因分析。数据中还存在着一些其他的潜在问题值得平台注意,其中最主要的一点在于产品销量的变化。
首先作出平台产品销量的年度折线图。2012年与2015年只统计了两个季度,因此直接比较年度总销售量是无意义的;下图展示了2012-2015年共12个季度的销量折线图。12个季度之间的差别还是相当明显的,除去最后的一个季度外销售量整体呈上升趋势,这和近几年互联网用户数量增加与平台的改善有着密切的联系。图中有两个值得注意的现象:1. 连续三年的第四季度销售量都有明显提高;2. 在2015年第一季度销售量异常低下。接下来笔者对这两个问题进行详细分析。
先从第二个问题开始分析。2015年第一季度无论是环比(与2014年第四季度)还是同比(2014年第一季度)都有明显下降,那么我们能想到的第一个问题就是数据集本身的问题。数据是否记录完全?运用假设检验的方法对数据进行求证。
假设1:2015年第一季度销量较少的原因是否与纪录日期(天数)有关?数据集最晚记录日期为2015-02-05,也就是说数据中显示的2015年第一季度销售量并不完全,仅有36天,缺失55天的数据。因此假设1成立,第一季度的销售量异常低下是因为记录数据的不完全。因此比较销售量时我们暂时可以忽略2015年的数据。(类似地,数据集最早纪录日期为2012-07-02,为第三季度的第二天,因此可以认为纪录天数对2012年第三季度几乎无影响)
回到第一个问题:第四季度为何销售量最多,尤其是2014年第一季度的增长简直丧心病狂。用户购买商品必然要受时间的影响。第四个季度包含十月,十一月,十二月,其中十一月和十二月可能是潜在的购买高峰。
销售量由三部分组成:购买产品的用户数量,可供购买的产品种类数量,与每位用户平均购买产品数量。每一部分的增长都会带动总体销量的增长。
从用户数量的角度:在双十一前后平台会对旗下商品进行大幅度的折扣活动,所以第一个假设就是:销售量是否在十一月获得暴涨?更进一步说,是否在双十一的几天内获得暴涨;除去双十一外还有哪些节日会影响购物呢?十二月份的圣诞节也是一个不错的购物节日,尤其是家长在这个节日会给孩子送礼,那么假设2就是:用户是否在圣诞节前后增加购买?同时,近些年二胎政策的实行也可能带来了更多的用户,假设3是关于政策影响:2014年的第四季度购买人数同比/环比是否有所增加?如果有所增加,那么2014年购买人数的增加是否与二胎政策的放宽有关?
从产品种类的角度:一款新的受欢迎的口碑爆品上市也可能会带动平台产品总销量。那么第4个假设就是:是否有新产品在第四季度上市?
最后从平均购买量的角度:假设5为第四季度用户的平均购买量是否有所提升?
对于这个问题的假设检验脑图绘制如下。
然后笔者对各个假设分别进行检验。假设1:双十一是否直接影响到了商品的销售量?结论如下图所示,深色线代表销售总量,浅色代表购买人数。通过下图可知,在2012,2013和2014年全部三年中,销售量都有所上升,虽然上升幅度有所不同,但已经可以证明每一年的十一月都大幅提高了商品的销量,而进一步细分到日期,在双十一前后几天也确实是购买高峰。同理,从此图可知,十二月以及圣诞节对于销售量的影响并没有双十一那样巨大,在2012年与2014年中销售量环比(与11月相比)还出现了大幅回落,可能是双十一拼的元气大伤需要一段时间的休养。值得注意的是2013年的十二月销售量却有大幅增长,无论是环比当年十一月还是同比十二月都达到了销售量的新高;因此假设1成立,假设2部分成立。
要论证假设3仅凭现有数据是不够的,在将用户婴儿表于用户购买量表用VLOOKUP连接后,无法判断每位用户家里有几位婴儿,因此无法判断购买量与用户婴儿数量间的关系。通过搜索后发现,全面开放二胎政策始于2016年1月1日,晚于表中所统计的时间。但是双独二孩政策始于2011年,单独二孩更是从2013年12月就已经开始,那么2014年第四季度的销售量的增长完全可以用政策角度来解释(十月怀胎):单独二孩政策的实行使用户婴儿数量增加,使得在用户数量没有显著增长的情况下,销售量出现了暴涨。假设3(对2014年第四季度的增长)成立。
验证假设4需要的就是各个产品上市的时间。在前面的文章中笔者也对数据进行了初步的介绍,数据表中共含有6种不同的婴儿商品类别共计662种不同的商品。商品数量虽多,但大多商品只有很少的销售量,不符合假设中“爆品”的定义。未来便于统计,笔者将爆品定义为总销售量大于100的产品,筛选后共有115种符合条件的产品;而在这之中,没有一件产品是在2013年12月或2014年12月上市的(上市时间通过初次购买时间判断)。因此假设4不成立。
部分产品购买时间节选,仅凭现有数据无法确定产品上市时间,因此将上市时间定义为初次购买记录的时间,例如50007016号产品,2013年第2季度第一次出现购买记录,便将上市时间确定为2012年第2季度之前通过之前的产品总销量图(浅色线代表购买用户数量),假设5的结论已经呼之欲出:虽然第四季度的购买人数的确有所增长,但增长幅度远小于商品销量增长幅度,因此假设5成立,第四季度中用户的平均购买数量出现了增长。
本文分析了电商平台在第四季度的销售量暴涨的原因,提出了五个假设;经过了对数据的探索性数据分析与构建透视表后,其中的三个假设符合实际情况。厂家对于特定的节日做出了相对应的活动使得购买量出现大幅提升,购买人数也有小幅增长。