电商平台母婴用户数据分析
时间:2023-03-26 07:42:01 | 来源:电子商务
时间:2023-03-26 07:42:01 来源:电子商务
一、提出问题
1、哪些商品更受欢迎?
2、不同年龄的购买占比?
3、用户购买行为的变化规律(年变化规律、月变化规律 )
二、数据选取
此次选用阿里云天池里的”2012.7-2015.2电商婴儿用户“数据集
数据集是关于婴儿商品,包含有以下的数据字段:
商品表格字段:包含7个字段,29972行
user_id:用户身份信息
auction_id:购买行为编号
cat_id:商品种类序列号
cat:商品序列号
property:商品属性
buy_mount:购买数量
day:购买时间
婴儿信息表格字段:包含3个字段954行
birthday:出生日期
gender:性别(0 male;1 female)
三、数据清洗
对两个表格进行了整合,保留有用信息,隐藏重复信息
首先,用户可能存在多次购买行为,但每次购买行为编号是不一样的,所以我通过对购买行为编号进行重复值删除,初步筛选出有分析意义的数据。
其次,两个表格有关连的信息是用户身份,所以用vlookup对两个表格进行匹配,得出每个用户身份对位的孩童的年龄(剔除异常值)。其中购买日期早于出生日期的,年龄为0。
PS:大部分匹配不上,仅拿匹配上的数据练手。
数据清洗结果:
四、数据分析:
1、通过数据透视表,行标签为商品种类,2012—2015年可得出商品(50018831)最受欢迎,市场占有率15.22%。
细分到2012年至2015年,2012年下半年最受欢迎的商品依然是(50018831),占比52.6%;2013年最受欢迎的商品依然是(50018831),占比7.1%;2014年最受欢迎的商品(50018825),占比6.58%;2015年1-2月最受欢迎的商品(50018831、50013636)均为7.02%
2、从数据表中,可以得出,家里有不满1岁的孩童的用户,在电商平台购买商品占比最高,达50.9%。然后逐年下降。
3、因为选取的数据仅有2013-2014年有完整的整年数据,通过数据分析可以看出,母婴用户选择电商平台购买的需求在增加。因基数过小,暂时没看出每年的区别。