基于电商母婴数据的分析
时间:2023-03-26 08:04:02 | 来源:电子商务
时间:2023-03-26 08:04:02 来源:电子商务
1.明确问题
婴儿不同年龄段的购买偏好?字段:用户ID、出生日期、商品名称和商品分类
婴儿不同性别的购买偏好?字段:用户ID、性别、商品名称和商品分类
最受欢迎的(销量排名前五)商品、商品种类有哪些?字段:商品编号、商品种类,购买数量
不同时间段内商品的购买数量分布情况? 字段:商品编号、购买数量、购买时间
2.理解数据
3.数据清洗
删除重复值购买商品表:【根据用户ID】、【商品编号】、【购买时间】,进行【删除重复项】操作,未发现重复项
婴儿信息表:根据【用户ID】进行【删除重复项】操作,未发现重复项。
缺失值处理购买商品表:数据量29972行,各个属性值都不缺失。
婴儿信息表:数据量954行,各个属性值都不缺失。
一致化处理购买商品表
购买时间1=LEFT(G2,4)&"/"&MID(G2,5,2)&"/"&RIGHT(G2,2)
将【购买时间】字符串通过【设置单元格格式】转化为时间格式
婴儿信息表
同理操作【出生日期】字段为日期格式
4.数据分析
合并两张表格通过vlookup函数在购买商品表中添加【出生日期】【性别】字段,有957组数据有这两个字段的值,因为总体数据两万多条,如果做缺失处理会丢失很多数据,所以关联好后暂时不做任何处理。
商品的销售情况商品销售情况表从商品销售情况表中可以看出一级分类28的销售情况最好,商品二级分类有6963种。
最受欢迎的商品有哪些?销量较好的前几名商品有哪些对商品一级分类各类别销量进行排序对商品二级分类各类别销量进行排序在excel数据透视表中求中位数
中位数和上四分位数的交易量都为1,说明该商品是不易消耗品。
相同季度不同年份下一级商品分类的销量第一季度第二季度第三季度第四季度基本上每个一级分类的商品在不同年份的同一季度的销量都是上升的。
购买时间对购买数量的影响?购买年份对销量的影响2012年和2015年销量骤减,查看原因是因为2012年只有第三季度第四季度数据、2015年只有第一季度数据。2013至2014年数据是呈现上升趋势的。
购买季度对商品销量的影响根据季度进行销量对比,发现第四季度的销量最好。
婴儿不同年龄的购买偏好分析通过【筛选】功能,筛选出有【出生日期】和【性别】的数据行
通过datedif()函数进行年龄计算,部分数值出现错误,查看原因是因为【出生日期】大于【购买日期】造成的。解决办法,年龄=IF(I8>H8,"未出生",DATEDIF(I8,H8,"Y")),将未出生的婴儿标记为【未出生】。
不同年龄商品购买量年龄描述统计平均年龄是1.7岁,最大值28岁属于异常值。
不同年龄对商品一级分类的需求情况0岁对50014815品类的需求量最多。
1岁对38、50008168、50014815的需求量接近。
2岁对50008168需求量最多。
对此商场可以做一些相似品类推销。
婴儿不同性别的购买偏好男女比例接近1:1可以进行分析不同性别的婴儿对商品的购买情况(0女孩 1男孩)男女比例接近1:1的情况下,女婴消费数量接近男婴的2倍。
不同性别对各个商品分类下的需求情况