电商数据分析—PPT
时间:2023-03-15 20:52:01 | 来源:电子商务
时间:2023-03-15 20:52:01 来源:电子商务
本数据集来源:
天池数据集
一、理解数据
数据集中是商品购买信息表和婴儿个人信息表,如下:
购买商品信息表婴儿信息表二、提出问题
1.在统计时间段内所有种类商品的销售情况;
2.受众各年龄段与不同种类商品需求量关系;
3.受众性别与各类商品销量有何关系;
三、用Excel进行数据清洗
1.选择子集并重命名
根据以上问题选择所需要的子集进行分析,如下图:
2.删除重复值:通过操作未发现重复值。
3.缺失值处理:通过定位空值,未发现缺失值。
4.一致化处理:
对商品购买时间和婴儿出生日期进行一致化处理,如下:
5.数据排序:对商品购买数量和婴儿生产日期做降序和升序排列,如下:
6.异常值处理:婴儿信息表中,第一条出生日期不在婴儿年龄段内,为异常值,将其删除。
三、构建模型
利用vlookup对两张表中的数据进行关联,整理出所需内容;
使用excel中数据透视表对提出的问题进行汇总分析;
1.对婴儿年龄进行描述统计分析,如下图:
通过对年龄的描述统计分析可以看出,商品的受众年龄集中在1~2岁,平均年龄和中位数均1岁,可知主要消费群体在低年龄段。
2.对表一插入数据透视表,分析这6类商品四年内的销售趋势;
由于2012年与2015年月份不完整,我们单独对2013年和2014年进行对比,可看出,商品总销量是呈上升趋势的;再对比各月份的销售量情况可以看出2013年12月和2014年11月是每年销量最高的月份,由所在平台分析2013年应是年底囤货导致销量升高,而2014年12月销量远高于其它月份则应是由于阿里巴巴在这一年上市,双11活动特别火爆所致;因此1到4月份销量处于淡季,其它月份正常波动;
再对2013年和2014年各类商品销售情况做分析,如下:
可以看出,两年内除去商品38,其它各类商品销量都是呈增长其中50008168增长最多;两年内销量最高的是商品50008168,商品38、商品122650008和商品50022520则销量最低,对于商品50008168不仅销售量最高,增长量也是最高,可分析出用户对本商品的需求较大,可运用AARRR模型对产品进行运营将其打造为爆款产品推出,而销量最低的三款商品,则需要产品属性,价格和渠道等数据才能分析出其滞销根本原因;
高低销量商品的用户年龄与性别分析通过排序对比发现销量较高一类商品(28、50014815、50008168)与低销量商品的用户同样分布于低年龄段;28和50014815两个高销量商品男性购买数量大幅度高于女性,其它四类商品则无明显差异,因此针对男女性别差异可将此分为两类别商品进行销售。
3.利用数据透视表对受众年龄段与各类商品销售量进行分析;
(1)对婴儿年龄增长与销量关系进行分析
由上面三图可看出,低年龄段购买商品数量最多,占比高达82.12%,其次是中年龄段、高年龄段,我们可以分析出,随着用户婴儿年龄增长对婴儿用品的需求量是在降低的;
(2)在各年龄段中婴儿所需各类产品比重与年龄的关系
而对每个年龄段各类商品进行降序排列后可看出50008168这个商品的销量都是最高的,其次是28和50014815,在各年龄段中销量最低的是,38、50022520和122650008,在高年龄段中,各类商品所需占比较为接近,50022520这类商品已经没有需求;对比在各年龄段中各类商品所占销量比例,可分析出用户对所有种类产品的需求占比并不随年龄增长有较大改变;
(3)对多次购买商品用户进行行为分析,如下:
通过对多次购买用户进行行为分析发现,购买四次的用户所购商品均为28,且在2014年的第一、三、四季都有购买记录,根据商品销量和促销活动可将第四季视为促销季,此类用户在交易的高低峰期,都在购买产品,可分析出28商品为婴儿用品的必需品;通过对购买量在排名前10的用户分析,购买量第一的用户是在2014年第四季度购买了10000的50014815,此用户应为线下商店的购买行为,可针对此用户进行商品合作,而针对其他购买次数为1 且都在第四季度购买的用户我们可将其视为促销型用户,可针对其购买商品类别进行推销。
4.插入数据透视表对受众性别和商品销量之间关系进行分析
通过上图可以看出,每类商品中男女购买量,都大致接近,除去“50022520”这类商品女性需求量大于男性外,其它商品都是男性需求量稍微高一些,可分析出婴儿性别对某类商品的销量并无明显影响;
•交易高低峰用户购买行为与婴儿性别关系
可看出,无论在交易高峰期还是低峰期,男性婴儿购买频率是高与女性的
,男性用户存在少量多次购买情况,可针对此改变消费者购物习惯;
总结:
1.天猫淘宝用户的消费群体主要集中在婴儿年龄0-2岁,并且随着用户婴儿年龄增长对婴儿用品的需求量是在降低的;在低、中年龄段婴儿所需商品所占比重结构是相似的,而高年龄段则各类商品所需数量大致接近,且在高年龄段50022520商品已无需求,销售人员可针对调整销售策略。
2. 28商品为婴儿用品的必需品,可大面积进行推广,改变用户观念;购买量第一的用户是在2014年第四季度购买了10000的50014815,此用户应为线下商店的购买行为,可针对此用户进行商品合作,而针对其他购买次数为1 且都在第四季度购买的用户我们可将其视为促销型用户,可针对其购买商品类别进行推销。
3. 28和50014815两个高销量商品男性购买数量大幅度高于女性,其它四类商品则无明显差异,因此针对男女性别差异可将此分为两类别商品进行销售。
四、可视化报告