18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 电子商务 > 某电商母婴产品分析

某电商母婴产品分析

时间:2023-03-26 04:18:01 | 来源:电子商务

时间:2023-03-26 04:18:01 来源:电子商务

【数据集分析】

数据来源于某电商平台婴儿商品的相关数据集,分别是表1购买商品和表2婴儿信息

[表1]该数据集共有29971条购买商品信息记录,共有7个字段,分别为:

user_id:用户id,用户在平台注册的ID,一个ID对应一个用户,不可重复

auction_id:购买行为编号,此处是商品编号,可以作为用户购买行为的唯一识别码

cat_id:商品种类ID,例如从婴儿的吃、穿、玩、洗护、学习以及妈妈专区等进行分类。

cat1:具体商品属于cat_id中的哪个类别,是商品种类的细分类别,可以分析在cat_id各类中,哪个子类别最受欢迎。

property:商品属性,商品的基本参数规格,从各个方面锁定商品,可用于店铺对受欢迎的商品进行锁定,从而加大库存。

buy_mount:购买数量,商品的一次性购买数量。

day:购买时间,可以分析某个时间段哪些商品受欢迎,哪些的季节性较强,同时可以通过促销活动期间高销量商品和平时销量的对比,验证活动的有效性等。

【表2】该数据集共有953条购买商品信息记录,共有3个字段,分别为:

user_id:用户ID,用户在平台注册的ID,一个ID对应一个用户,不可重复,同时匹配表一的用户ID。

birthday:出生日期,由此可得宝宝的年龄,可分析用户在宝宝不同年龄段的商品倾向,哪些商品具有强年龄性,哪些商品是弱年龄性,店铺也可按照年龄阶段将商品进行分类。

gender:性别(0 男性;1 女性),通过对性别的统计,可以分析商品与性别的关联性,强关联和弱关联,或者无关联,强关联的商品可针对宝宝性别,进行商品的优化升级。但商品的销量是否是受性别影响一定要控制好其他影响变量。

一、明确问题

通过对数据的理解,观察现象,把问题定义清楚,明确我们要解决的问题是什么,这是数据分析的第一步。只有明确了问题,才能围绕这个问题展开后面的分析。如果一开始问题就定义错了,那再怎么分析,也是白费时间。

此次我们把问题集中在以下几点:

1、母婴产品在一年中哪个时间段销量最好;

2、各类母婴产品的销售情况;

3、不同年龄在产品上有哪些选择差异;

4、不同性别在产品上有哪些选择差异。

二、理解数据

上篇文章我们已经对两份数据集进行了理解,包括表1-购买商品和表2-婴儿信息内的每个字段含义的认识。

三、数据清洗

数据清洗一共分为以下7步:

在数据分析之前,我们需要对数据进行清洗,是因为我们拿到的初始数据往往具有不完整性、格式不一致、重复性或者异常等情况,这就需要我们一一解决数据中存在的这些问题。

1、选择子集

在分析中,商品属性这一列没有什么作用,将其隐藏,其余列保留。

2、列名重命名

两张表的列名都可以不需要重命名。

3、删除重复值

通过“数据-删除重复值-扩展选定区域-删除重复项-确定”未发现重复值。

4、缺失值处理

通过“选中列-开始-查找-定位条件-空值-确定”未发现空值。

5、一致化处理

将两张表里的时间列统一为日期格式:选择时间这一列-数据-分列-默认下一步-默认下一步-选择【日期】点击【完成】

6、数据排序

两张表可以按照单次购买数量进行排序也可以按照时间进行排序,具体排序方式可结合要分析的问题进行。排序操作:选中某列-开始-排序和筛选-升序or降序

7、异常值处理

通过对每列数据进行筛选,发现性别这列有出现数值【2】,一共26条数据,如果【0】表示“女”,【1】表示“男”【2】无法确定性别,由于这类数据在总数据中占比极小,无论更改为0或者1对分析的影响不大,故将其更改为1。

四、数据分析

通过数据清洗,我们就得到了“干净”的数据,可用于数据分析了,接下来就针对每个问题分别进行分析,其中会用到数据透视表、vlookup多表查询等功能进行问题分析。

1、母婴产品在一年中哪个时间段销量最好;

从上表中我们看出,每个季度都是逐渐递增的,在第四季度达到当年的销售量峰值。同比和环比来说,销售量也是出现递增的趋势。由此可知母婴产品在一年中第四季度销量最好,为何在第四季度销量最好,还需要收集其他数据进一步分析。

2、各类母婴产品的销售情况;

通过在数据透视表里对一级商品和二级商品按销量进行排序发现,一级类别为【28】的二级类别【50011993】的商品销量是最高的,销量为3609。

3、不同年龄在产品上有哪些选择差异;

通过vlookup将两表关联,具体使用如下:

这样就能将表2-婴儿信息中的出生日期和性别关联到表一中,为了更直观显示性别,我们需要将0和1转换为女和男,设定【0】表示女,【1】表示男,用IFS函数可实现转换。

【注】上图中会发现无论是出生日期还是性别中都出现了【N/A】的情况,经分析发现,表1的用户数据远远大于表2,从而出现表一用户ID在表二中不存在,导致出现【N/A】。

通过分析得出:还未出生的宝宝主要会购买【50008168】【50014815】【28】【50008168】这四类商品;1-7岁的宝宝购买最多的商品是【50008168】

4、不同性别在产品上有哪些选择差异。

在性别差异上,男性宝宝购买最多的一级商品是【50008168】其次是【50014815】,而女性宝宝购买最多的是【50014815】其次是【50008168】,排名第三的二者都是【28】这类商品。

在【50008168】中男性宝宝购买最多的二级分类商品分别是【50013636】【50010558】【50006602】

在【50014815】中女性宝宝购买最多的二级分类商品分别是【50018831】【50012456】【50012564】

五、数据可视化

1、母婴产品在各时间段的销量情况;

图3 2012=2015年各季度销量情况
从上图可以看出,总体上销量是上升趋势的(2012年和2015年的数据非全年的,主要对比2013年和2014年全年总销量和各季度销量)

图4 2012-2015年每月销量情况
从图4中可以看出:

1)每年的销售峰值出现在11月期间;

为何会在11月期间出现销售峰值,可采用假设检验分析方法进行分析。

假设1:促销活动

每年电商平台会在11月、12月举办双十一、双十二的促销活动,导致每年的销量峰值出现在11-12月,假设1成立。

假设2:渠道进行了优化

从收集到的数据中暂时无法获取渠道信息进行验证,并且如果是渠道进行优化那么1月份的销量的下滑就无法解释,假设2不成立。

假设3:产品进行了优化

从收集到的数据中暂时无法获取产品优化相关信息,需要获取产品有关的数据采用对比分析后才能进行验证,假设3不成立。

2)每年年初销量下滑,基本是当年的销量最小值的时期。

是什么原因导致每年1-2月的销量降低呢?同样采用假设检验分析方法进行分析。

假设1:电商行业客观规律

通过对2013、2014年1-2月的销量情况分析发现,销量最低值出现在1月底2月初期间,这个时间段刚好是中国的春节假期(2013年春节是2月10日,2014年春节是1月31日),快递公司基本是在春节前一周停运,从而导致销量下滑,而节后恢复正常,销量开始回升。假设1成立。

假设2:产品问题

从已收集的数据中无法得知产品好坏的信息,需要获取产品好评率、回购率、产品优化情况等信息后才能分析,假设2不成立。

假设3:价格问题

从收集的数据中无法得知产品价格,需要获取详细价格信息,有无价格调整,调整前后销量情况这些信息后才能更好分析,假设3不成立。

关键词:产品,分析

74
73
25
news

版权所有© 亿企邦 1997-2025 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭