对电商数据的业务分析
时间:2023-03-15 23:10:01 | 来源:电子商务
时间:2023-03-15 23:10:01 来源:电子商务
从第三讲的live学习中,熟悉了数据清洗的步骤:选择子集、列的重命名、删除重复值、缺失值处理、一致化处理(无统一命名)、数据排序、异常值处理。熟悉了if find mid left vlookup函数,初步熟悉了透视表的运用。接下来运用以上知识对第表1购买商品、表2婴儿信息进行数据清洗。
第一步:将原始数据另存为两张新表,且加上后缀“清洗数据”,将原始数据另存为两张新表,且加上后缀“清洗数据”
第二步:删除重复值。用户编号是每个用户的唯一编号,如果有重复的数据项,需要对其进行清理。选中用户编号列,点击数据选项卡下的删除选项项如下图:
第三步:简查缺失值。点击用户编号、购买行为编号、商品种类编号、商品类别、购买数量、购买时间,查看右下角计数为“29945”,商品属性列仅有“29803”,存在缺失值,因商品属于无规律可行,无法补充,不做处理。
第四步,使用分列功能,将购买日期列中的数值转换为标准日期格式YMD。同样的,对婴儿信息表的出生日期也进行同样的操作。
第五步,在此数据集中,暂时未发现需要进行其他数据清洗工作的情况(如数据异常值、数据一致化等),因此进行下一步工作,进行数据统计和建模工作。
1、查看一级商品分类的购买量统计
使用数据透视表功能,统计“一级商品分类”的销售量,得出如下结果,其中商品类别“50008168”的购买数量最多。
2、查看一级商品分类的购买量统计
使用数据透视表功能,统计“一级商品分类”的销售量,得出如下结果,其中商品类别“50013636、50010558、50013207”的购买数量最排至前三。
3、按购买时间查看一下一类商品和二类商品在每年和每季度的汇总购买量。从中可以看到每季度排名前三的畅销产品,后续可以根据此信息来进行提前备货。
不足之处:这种分析无论从技术层面还是业务层面过于表面,并没有深入业务层次,用这种练习求职肯定是行不通的。