电商产品数据分析基础
时间:2023-03-15 20:46:01 | 来源:电子商务
时间:2023-03-15 20:46:01 来源:电子商务
数据分析对于电商行业的重要性不言而喻,通过数据分析,可以帮助商家选出爆品,找出运营中的薄弱环节以及与同行的差异。
简单来讲,数据分析可以分为以下五个步骤:
- 明确问题:通过数据分析我们想弄清楚什么问题,找出什么样的规律,得到什么有价值的结论;
- 理解数据:我们需要什么样的数据作为支撑,数据中的每个字段代表了什么;
- 数据清洗:无论是通过爬虫获取的数据,运营产生的数据,还是购买的第三方数据,都需要对数据进行清洗,根据所需解决的问题,对数据进行整理;
- 数据分析或构建模型:将清洗后的数据,进行各个因素之间的相关性分析并进行统计;
- 数据可视化:将数据分析的结果以图表等形式进行展现,便于观察和理解。
下面以淘宝某一段时间婴儿用品的销售数据为例进行分析。
第一步:我们希望通过数据分析弄清楚:(1)哪些商品的销量最好,最受大家的欢迎(2)不同性别的婴儿对产品需求的差异(3)时间因素对产品销售的影响。
第二步:我们通过阿里云天池数据集获得了我们所需的数据,购买商品数据集里共有29972条数据,里面包含“用户ID”,“商品编号”,“商品二级分类”,"商品一级分类","商品属性”,“购买数量”和“购买时间”。婴儿信息中共有954条数据,里面包含“用户ID”,“出生日期”和“性别”。
第三步:数据清洗包含以下几个步骤:
- 选择子集:在源文件中保留数据分析所需的字段,将其他字段隐藏;
- 列名重命名:将字段的名字进行修改,方便理解和记忆
- 删除重复值:在excel中,“数据”->“数据分析”->删除重复值
- 缺失值处理:在excel中,“数据”->“数据分析”->快速填充
- 一致化处理:通过excel中的分列功能,将购买时间的数据类型,从数值型转化为日期型;
- 数据排序:根据购买时间将所有的数据升序排列;数据的时间范围为2012年7月2日至2015年5月2日;
- 异常值处理:通过筛选功能,检查是否存在异常值,如果存在,将其更正;
第四步:通过数据透视表进行数据分析,弄清楚每年,每季度,每月份的婴儿用品的销量如何。我们通过不同年份的同期对比可以发现,婴儿用品的数量呈现逐年递增,表明母婴用品的销量长期看涨。单月销售最高的为2014年11月份,总共销售13044件。此外,还可以通过修改汇总项的值汇总依据,可以显示最大值、最小值和平均值等数据。
因为有同一个用户ID重复购买不同的商品,所以用数据透视表将用户ID和购买数量分类汇总,得到每个用户的总购买数量;再用VLOOKUP函数,在婴儿信息中查找对应用户ID的购买数量。
从性别差异上看,除品类50022520外,女宝宝的购买数量比例都高于男宝宝。
第五步:数据可视化:根据所需要的结果,可以选择合适的图标形式对数据作图,使数据直观的呈现出来。