电子商务数据集分析
时间:2023-03-15 22:12:02 | 来源:电子商务
时间:2023-03-15 22:12:02 来源:电子商务
数据分析重要的就是数据, 所以当我们拿到数据首先就是要去备份,把原数据备份一份然后再进行数据处理。
首先理解数据,将英文表头改为中文加粗更容易理解;
对重复数据进行删除;
对异常值处理,经对数据理解客户账号不应该有空值,发现空值为异常值删除不做考虑;
为方便后面的数据处理, 我们将发票号码,货物号码统一数据类型,将其全部转化成文本类型。
转化前转化后因为我们主要分析经销商销售情况,但是我们发现数量有负数, 考虑到应该是退货的情况,所以就要剔除退货的数据,我就使用left函数来判断第一个字符是什么开头进而识别是退货还是购买。经识别后是退货的数据进行删除,本次分析不考虑退货。
因为要分析时间与销量的关系,我们需要对日期做处理。
首先进行分列,将年月日与时间分开,同时将年月日转换成日期格式
注意红色框日期格式,如果日期格式不对,格式就转换不成功;
结果最后变成这种格式,我们可以针对日期做操作。
我们分析销量就要离不开总金额,新增一列总金额
数据清洗干净后,我们对数据进行描述统计分析。
1、首先对购买数量分析得出结果是:
从这里可以看出极大值很大,存在的偏差很大,平均销量大于中位数,大多数用户都购买的是少量,其中最多的是购买1件商品,分析得出改店铺不止做批发而且单用户购买也支持,
2、对价格进行分析
从这里可以看到,均价一直处于3.12,价格有特别高的,存在极值的影响,把平均值拉高。
通过对日期与购买量,日期与客户下单量
日期与购买量统计得出:
从上图中可以看出 9,10,11月份购买量最多,这三个月用户购买多
日期与客户下单量
前八个月订单数在25000笔左右,九到十一月订单数增长很快,12月跌到全年最低值
通过对国籍分析:
前十的国籍主要集中图上黄色部分,其他国加的购买力低,猜测应该会有其他替代品,由于没有数据暂时不分析,但是我觉得我们可以针对这购买力不多也不少的国家做促销活动,来提升他们对我们产品的使用,或者做一些广告宣传等等;
通过此次练习,个人感悟是:多听几遍老师讲的课程,根据老师的步骤多操作几遍,一遍两遍都不够,然后自己再找一写数据进行练习,多练几次,自己会慢慢有思路;
争取再下一关自己做的更好!