关于电商案例的数据分析
时间:2023-03-15 21:46:02 | 来源:电子商务
时间:2023-03-15 21:46:02 来源:电子商务
数据分析分为5个步骤:
1. 提出问题明确自己需要通过数据分析解决什么的问题。
2. 理解数据理解数据各个字段的含义。
3. 数据清洗- 1. 选择子集
- 2. 列名重命名
- 3. 删除重复值
- 4. 缺失值处理
- 5. 一致化处理 (分列处理)
- 6. 数据排序
- 7. 异常值处理
4. 构建模型:运用函数、数据透视表,分析工具库(描述统计分析)5. 数据可视化具体的案例分析演练一. 提出问题- 这几年的销售情况如何?
- 哪种商品销售的数量最多?
- 年龄与购买商品数量之间有什么联系?
- 性别与购买商品种类之间有什么联系?
二. 理解数据今年每个月的销售情况是怎么样的?
User id:用户id号
Auction id:标记用户行为
Cat id:一级类目
Cat 1:子类目
Property :属性
Buy amount:购买的数量
Day:购买日期
Birthday:生日
l Gender:0代表男性,1代表女性
三. 数据清洗(1). 复制粘贴一份新的Excel文件,并重命名:表1购买商品 - 数据清洗结果;表2婴儿信息 - 数据清洗结果
(2). 隐藏暂时无关的字段Auction id,property
(3). 删除重复值: 无重复值
(4). 缺失值处理:未发现缺失值
(5). 一致化处理:时间按照yyyy/m/d的格式输出
商品表-yyyy/m/d的格式婴儿表-yyyy/m/d的格式(6). 按时间升序排序
商品表-时间升序排列婴儿表-时间升序排列(7). 异常值处理:性别中筛选出“2”的结果将不列入计算
异常值-不列入计算清洗结果如下:
表1购买商品 - 数据清洗结果表2婴儿信息 - 数据清洗结果四.构建模型
哪种商品销售的数量最多?
类别5001883的商品在四年间卖出12657件5. 数据可视化
这几年的销售情况如何?
2012-2015年的商品销售情况-单位(月)2012-2015年的商品销售情况-单位(年)由图观察得知,2012-2015年中,2014年的商品销售情况最为乐观,购买量达到42241,其中11月份的购买量更是多达全年的1/4,达到13044,同时也是四年间销量最好的一个月。
年龄与购买数量之间的联系通过观察上图得知,年龄在7岁和8岁时,商品购买数量的占比分别达到了整个样本人群的21%和24%;相反,17岁和35岁购买数量的占比最少,甚至不足1%。
性别与购买商品种类之间有什么联系?
性别与购买数量之间的联系