对于电商数据的探索分析
时间:2023-03-15 23:48:01 | 来源:电子商务
时间:2023-03-15 23:48:01 来源:电子商务
这次数据分析希望解析的问题是:
1. 对于商品购买数据:如何快速查询多条件限制下的指定字段的值(比如某年某月某产品的销量)、商品销量随时间的变化是否有规律。
2. 对于婴儿信息:如何找出各年龄段男女消费者比例。
根据课程知识,数据分析应该从数据清洗开始而后转入数据分析;同时数据分析(这里使用透视表)存在分组à应用分析函数à输出结果的三个步骤。因而下文会根据这些原则组织内容。
Pt1. 商品购买数据的分析
Step1: 数据清洗:利用分列功能对日期进行格式化,之后通过筛选功能确认各字段没有异常值。
Step2: 数据分析/创建通用表: 本次试图分析的字段为购买日期/购买数量和商品分类。显然,这里应按照商品分类进行数据分组,因而将商品分类字段选择为行,将商品销量选择为计数值,剩余的日期自动被分为年/月/日三个字段,可以根据希望分析的内容进行调整,其中一个字段在列(作为分析商品销量的自变量),剩余在行,这样可以通过行字段的扩展展开精细查找。下图为通用表格的例子:
Step3: 数据分析/销量---年:这里以各商品销量随年变化的规律分析为例,图示如下:
15年仅收录第一季度数据,没有参考价值。纵向来看,每款商品 都随着年份增加有了较大的销量提升;横向来看(28/5008168/50014815)三款产品和其他产品的增长基数和幅度有较大差距,28号产品在13年取得爆炸增长,5**68和5**15在14年实现突破,通过添加季度子列可以更详细看到他们分别发力的季度和月份分别考证其成功原因,同时考虑调整后几个产品的销售/生产策略。以28为例:28在13年第四季度的12月份取得了非常好的销售成绩,是全年销量增长的原因:
Pt2. 婴儿信息的分析
Step1: 数据清洗:使用if函数将0/1变成女/男来方便阅读;使用mid函数截取出生年份并用2020减去来获得大致的年龄数据。
Step2: 数据分析: 由于希望按年龄求男女消费者的占比,将年龄作为行以3为步长进行分组;将男女性别作为列,在计数项区域分别以数字和百分比表示数据: