电商数据分析(数据分析篇)
时间:2023-03-15 20:10:02 | 来源:电子商务
时间:2023-03-15 20:10:02 来源:电子商务
上一篇文章中,我们对一份美国2020年电商数据进行了前期的数据处理,具体内容可查看下面的链接。
这篇文章中,我们将在处理好的数据的基础上进行分析和可视化呈现。
在分析数据前,先提出一些问题:
- 2020年的不同时间里,产品都卖得怎么样?
- 哪些地区比较有购买力?
- 客户都消费了多少钱?哪些客户比较有购买力?
- 哪些产品比较挣钱?
- 客户都爱选择什么运输模式?
下面,我们将从时间、地区、客户、产品、折扣和运输模式等几个方面对数据进行分析。
销售额和利润随时间变化的情况
插入数据透视表,将订单日期作为数据透视表的行,勾选销售额(求和项)和利润(求和项)作为统计值进行分析,然后制作折线图。
由图可以看出,2020年1月至12月期间,销售额是随着时间逐步增长的。但是利润却并没有随着销售额的增长而增长,而是呈现出基本持平的状态。
各地区销售情况
插入数据透视表,将区域作为行,勾选销售额(求和项)作为统计值进行分析,然后制作柱状图。
插入数据透视表,将州作为行,勾选销售额(求和项)作为统计值进行分析,然后制作柱状图。
插入数据透视表,将城市作为行,勾选销售额(求和项)作为统计值进行分析,然后选出销售额排名前十的城市。
由上面的分析图可知,各个区域的销售额从高到低依次是西部、东部、中部和南部。
销售额靠前的州主要是位于东部和西部的加州(California)、纽约州(New York)、华盛顿州(Washington)等。
销售额靠前的城市也主要是位于东部和西部的纽约(New York City)、西雅图(Seattle)、洛杉矶(Los Angeles)、费城(Philadelphia)等。
客户情况
插入数据透视表,将客户类型作为行,勾选客户ID(计数项)作为统计值进行分析,然后制作饼图。
从客户类型来看,有50%的客户是个人消费者,30%的客户是公司,20%的客户是家庭办公室。
之前在数据处理过程中,我依据客户的累计购买金额,将客户分成了不同的档次(如下图所示)。
这里,我们要选中中间这部分包含购买金额档次的表,在此基础上插入数据透视表,以客户ID作为行,勾选购买金额档次(计数项)作为统计值进行分析,然后制作柱状图。
由图可知,0-500美元这个金额档次的客户数目最多,有305个客户,说明大部分客户2020的消费额都在500美元以下。
随着购买金额档次的升高,相应档次的客户数量也在减少。到3500-4000及更高的金额档次中,对应的客户人数都只有个位数了。
回到原来有所有数据的表格,在此基础上插入数据透视表,将客户ID作为行,勾选销售额(求和项)作为统计值进行分析,然后选出销售额排名前十的客户。
可以看出,RB-19360、TA-21385、HL-15040是购买金额最多的三个客户,累计购买金额都超过了一万美元,其他购买金额靠前的客户也买了超过五千美元的商品,这些客户可以作为重要客户重点维护。
产品销售情况
插入数据透视表,将产品类别作为行,勾选销售额(求和项)和利润(求和项)作为统计值进行分析,然后制作柱状图。
插入数据透视表,将产品子类别作为行,勾选销售额(求和项)和利润(求和项)作为统计值进行分析,然后制作横向柱状图。
由图可知,销售额和利润从高到低的产品大类依次是科技、办公和家具。
销售额最高的三个子类别分别是科技/手机、家具/椅子、办公/活页夹。利润最高的三个子类分别是科技/复印机、科技/电子配件、科技/手机。
下面要统计销售额和利润排行前十的产品。因为我发现有不同的产品共用一个产品ID的情况,所以这里我选择用产品名称来进行统计。
插入数据透视表,将产品名称作为行,勾选销售额(求和项)和利润(求和项)作为统计值进行分析,然后分别选出销售额排行前十和利润排行前十的产品。
将销售额前十的产品和利润前十的产品结合在一起看,发现佳能复印机(Canon imageCLASS 2200 Advanced Copier)、惠普复印机(Hewlett Packard LaserJet 3310 Copier)、GBC电动装订系统(GBC DocuBind TL300 Electric Binding System)、三星手机(Samsung Galaxy Mega 6.3)这四款产品表现良好,在销售额和利润上都做到了排名前十。
有几款产品如马丁电动开信刀(Martin Yale Chadless Opener Electric Letter Opener)、Cubify3D打印机(Cubify CubeX 3D Printer Triple Head Print)、Fellowes电动冲床(Fellowes PB500 Electric Punch Plastic Comb Binding Machine with Manual Bind)等虽然销售额很高,但是总利润为负数。
折扣
下面来看下折扣的情况。插入数据透视表,将折扣作为行,勾选数量(求和项)作为统计值进行分析,然后制作柱状图。
插入数据透视表,将折扣作为行,勾选销售额(求和项)和利润(求和项)统计值进行分析,然后制作柱状图。
由图可知,大部分商品都没有折扣或者打了八折。相应的,没有折扣的商品和打八折的商品的销售额和利润也较高。
有意思的是,七折和低于七折的商品的总利润都是负数,说明商品的折扣低于七折就不怎么挣钱了。
运输模式
插入数据透视表,将运输模式作为行,勾选订单号(计数项)统计值进行分析,然后制作饼图。
大部分客户(57%)都选择了费用便宜的标准运输模式,其次是二等(20%)和一等(17%),而当天送达这种最贵的运输模式仅有6%的客户选择。
总结
- 2020年销售额随着时间的增加而增长。但是利润没有随着销售额的增长而增长,而是呈现出基本持平的状态。
- 位于东部和西部的几个主要的州(California、New York、Washington等)和几个主要的城市(New York City、Seattle、Los Angeles、Philadelphia等)的销售额较高。
- 50%的客户是个人消费者。0-500美元这个累计消费档次的客户数目最多。
- 大类中,科技类的产品销售额和利润最高。子类别中,利润方面也主要是科技类的子类别(复印机、电子配件、手机)排名靠前。
- 大部分商品都没有折扣或者打了八折。七折和低于七折的商品的总利润都是负数,因此不建议将商品的折扣设置低于七折。
- 大部分客户(57%)都选择了费用便宜的标准运输模式。