18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 电子商务 > 用数据分析方法分析电商数据

用数据分析方法分析电商数据

时间:2023-03-15 21:14:01 | 来源:电子商务

时间:2023-03-15 21:14:01 来源:电子商务

第一步:数据来源

表格为“表1:购买信息”,“表2:婴儿信息”

根据二表内容,本文试图通过假设检验、对比分析、多维度分析方法对数据进行深度分析解读,发现隐藏于数据后面的深层原因,微店铺运营提供扎实的分析依据。

第二步:理解数据

表格1:购买商品 用户ID:用于识别交易用户,在此数据中,用户ID可以重复,因为同一用户可以购买多种商品 商品编号:为某一商品的识别编号,不可重复 商品二级分类:某一商品大类下的再分类 商品一级分类:商品的分类名称 商品属性:商品所具有的特性、属性 购买数量:用户的交易数量 购买时间:交易发生的准确时间

表格2:婴儿信息 用户ID:用户识别交易用户,且每一个用户对应唯一ID 出生日期:婴儿的出生日期 性别:婴儿的性别 第三步:提出问题

假设检验可以从用户、产品、竞品三个维度作为出发点观察、分析数据。根据数据表中的数据,表一着重于描述店铺产品的销量情况,表二着重于描述婴儿信息,所以,可以分别从产品和用户维度展开分析。

1.产品维度

2.用户维度

第四步:数据清洗(不完全展示)

1.选择子集(隐藏不需要的行或列)

根据数据内容可以隐藏部分暂时用不上的数据而不是将其直接删除,鉴于数据列项并不多,所以,可以暂时先不隐藏数据。

2.列名重命名

表一、表二的列名标注已经相当明确,所以列名重命名的工作可以直接跳过。

3.删除重复值

表一为商品购买信息,商品编号用于唯一标识某一商品,所以不会存在重复。实际情况中存在多个用户购买同一商品,所以在购买信息中无需对列进行重复值删除。表二用户ID无重复信息,所以在此工作上无需多做停留。

4.缺失值处理

表一除了“商品属性”列为29828项,其余列均为29972项,而此列商品属性并不明确,对数据后续分析意义不大,所以用0补充。表二无缺失值。

5.一致化处理(对数据列没有统一命名的内容处理)

表一、表二内容基本没有问题,唯独表一购买时间、表二出生日期可以采用标准日期格式再进一步调整。

调整后的日期yyyy/mm/dd

此外,在表2中用0或1表示性别,在识别度上会降低,所以,通过vlookup函数可以分别将0 、1 、2转换为中文“女”、“男”、“未知”。

转换完成后,D列的内容为vlookup内容,将该列复制,以“数值”形式粘贴在E列,然后将D列隐藏。

6.数据排序与异常值处理

经过计算,以“年”为单位,存在一些婴儿年龄异常过高的数据,例如:

所以此处可删除这些异常值,删除后对整体数据影响不大。

第五步:对提出的问题进行分析

(一)产品维度

根据表一的数据透视表可以对比出2012-2015年的各月销售量情况。下图数据是“购买数量”的求和项可视化结果,可以看出,从2012到2015年,该店铺的销售量是呈上升态势的且2015年的11月销量呈现出井喷的态势,随后又回落至平均水平。

上图虽然可以看出各月的销售量增长情况,但还是比较模糊。因为店铺的销售量=每个用户单次购买量的总和,所以,销售量的高低,取决于购买次数和单次购买量。

下图将“购买数量”改为计数后,所呈现出的可视化结果。可以看出,2012-2015年之间每年的月购买次数都比前一年有所增长。

根据上面的可视化结果,我们可以提取出如下有价值的分析分析方向:

1. 总销量的变化情况与什么有关

店铺总销量只与两个因素有关,即购买次数和单次购买量。

根据数据集的历年购买次数和购买量可视化结果可以看出购买量的波动程度比购买次数的波动程度大。可以推断出,存在某一次交易中存在极大销售量的情况。虽然在实际经营中存在发生类似情况的概率,但为了不让这些数值对整个分析影响太大,故可以剔除这种异常过高的值。

从下图可以看出,购买量波动较大,其中,2014年11月、9月,2013年12月等出现极为突出的购买量,且2015年2月数据呈断崖式下降趋势。

剔除异常值后,可视化效果如下:

购买次数与购买量基本成正比。

1.1 单次购买量

2012-2015年单次购买量的平均值基本分布在1.5-2之间,所以,单次购买量对总销售量的影响并非决定因素,在每年的关进活动节点,购买次数(即成交单数)的上升才是带来销售量提升的原因。

1.2 购买次数

2012-2015年购买次数呈显著上升的趋势。一年之中购买次数波动较为剧烈,因为我们需要进一步分析,购买次数为什么会上升或下降呢?如下图所示:每年2月购买次数明显下降,每年5月、11月购买次数明显上升。

如下图所示,2013-2014两年每年5月有3个销售高峰,分别对应5月11/12日,5月20日,5月26日。

经查询,2013年5月12日和2014年5月11日为母亲节,5月20日为“520”节,5月底进入六一儿童节促销时间段,因此,5月份总体购买次数出现上升现象。

下图在11月11日当天消费者购买量明显上升。

12月在12号当天,购买量突然上升,随后第二天回落至正常水平。

以上两个节点分别对应了“双十一”和“上十二”两个年底大促,消费者购买量上升,随之推高2店铺销售量。

再来看一下2013-2014年2月出现销量下降的原因。2013年春节假期为2.9-2.15;2014年春节假期为2.1-2.6。在春节期间,购买次数均出现了U型先下降后上升的趋势。据此可以推测,农历春节是2月份出现销量下滑的主要原因,春节期间店铺员工放假、物流停运、走亲访友等因素影响消费者购买商品。

1.3 购买次数与新老用户的关系

通过“条件格式”筛选“用户ID“列的数据,只发现极个别重复ID,可见为该店铺贡献销量的几乎全部为第一次购物的新用户。据此可以推测,该店铺所销售的商品使用周期较长,或仅针对某一年龄段的婴儿使用。

2 产品之间平均单次购买量的对比分析

下图呈现出了所有一级分类商品的平均单次购买量,整体单次购买量在1~4之间,根据平均单次购买量可以推测出各个商品的耐用程度。根据产品的耐用程度,运营者可以根据促销调节或营销理论展开有针对性的产品运营。

从下图的产品销量图来看,28、50008168两个品类有较为明显的增长趋势,其他品类均保持平稳。

(二)用户维度

1.男女婴对不同商品的需求情况

在所有现有数据中,女婴使用产品的量比男婴使用产品的量更多。

在各品类用户汇总,除了50022520男婴用户多于女婴,其余女婴用户均占多数。

2.各年龄段婴儿对不同商品的需求情况

在所有用户中,商品的主要购买者为未出生、0岁、1岁的用户。

在目前已有的用户信息中,产品50014815为销售占比最高的商品,也收到未出生及0-1岁婴儿的父母青睐,说明该款商品对婴儿父母具有较好的吸引力,也更适用于低龄婴儿。

小结:

1.年度总销量的变化是由购买次数决定的,所以,店铺商家可以尽可能的增加用户的购买次数。而所有购买商品的用户中,几乎全部为新用户,即老用户的复购率相对较低。这取决于商品可能只针对婴儿使用,当婴儿长大后就不在需要使用了, 在这种情况下,老用户停止复购也是合理的。商家在运营过程中可以着重做口碑营销,一方面通过自有渠道吸引新用户,另一方面挖掘老用户资源促使老用户介绍新用户,以此扩大新用户群体。

2.在所有商品中,28、50008168两个品类有较为明显的增长趋势,商家应该关注两个品类商品的存货情况。

3.未出生、0岁、1岁婴儿是商品主要购买群体,商家可以针对这部分群体推出针对性服务,开展节假日促销等。

4.50014815商品是未出生、0岁、1岁婴儿购买量最大的商品。50008168是2-3岁婴儿购买量最大的商品,店家应该根据不同年龄用户开展有针对性的宣传活动。

关键词:数据,分析,方法

74
73
25
news

版权所有© 亿企邦 1997-2025 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭