婴儿电商市场分析
时间:2023-03-26 02:30:01 | 来源:电子商务
时间:2023-03-26 02:30:01 来源:电子商务
一、立足业务,解决实际问题。大多数的数据分析都是为了解决实际的问题,或者为解决实际问题提供判断依据。这时就要求数据分析师对公司的业务非常的了解,只有了解了实际的业务之后,才能主动从中发现问题,理解业务部门提出的问题,以便更好的解决问题。一个不熟悉业务的数据分析师就不是一个好的数据分析师。
当boss给你一大堆数据,让你分析一下。你第一反应肯定是要明确boss的需求,如boss想通过这个分析的结果去解决哪些实际的问题,有时候不仅要完成boss所交代的任务,而且还要站在boss的角度上去发现那些boss也没发现的问题,这样就可以得到boss的青睐。
设想一下作为一个开淘宝店的店主,通过技术的手段拿到了自己运营多年店铺的后台数据,他会想从中得到哪些信息呢?
(1)历史的销量如何,未来的销量走势?
(2)各商品历史销量情况,如何进行选品,以实现销量最大化?
(3)对客户性别、年龄等信息进行了解。
二、理解数据打开源始数据之后,首先要对各字段进行理解,将原有的字段翻译为方便自己理解的大白话字段。
针对于第一步提出的我问题,需要找到解决这个问题需要用到数据集里面的哪些字段。如“购买数量”“购买时间”“商品种类”“用户ID”“出生日期”“性别”这些字段都是需要用到的,接下来对这些字段的数据进行清洗,处理一些重复的、缺失的数据。
三、清洗数据(1)去重复值想要去除数据集里面的重复数据,就得找到该数据集里面的一个可以作为“主键ID”的字段,这个字段的数据是不会出现重复的。数据集里面所有的字段都可以出现重复值,这里就无法进行去除重复值的操作。如果要去除重复值,则需要新添加一个新字段作为“主键ID”。
(2)缺失值处理计算出“用户ID”字段的数值,然后去和其他的字段进行对比,如果少于这个数值这说明该字段数据是有缺失部分的。对于缺失的数据可以采用补齐,删除,平均值替代等方式进行处理。
(3)一致化处理为了方便后续的数据处理,就需要对字段格式等进行处理。如用数据分列将文本格式的“购买时间”更改为日期格式,再对单元格显示进行调整,改为“日期”显示方式。
(4)去繁就简,添加需要的字段将数据集里面用不上的字段进行隐藏处理,尽量不要删除。对于一些额外的字段需要进行添加,如业务分析需要用到用户年龄,则需要添加年龄这个字段,并根据前面“出生日期”字段进行简单的计算就可以得到。
四、数据分析、构建模型(1)历史的销量如何,未来的销量预估?
将第一步提出的问题转化为具体的数据模型。如想预估未来的销量,就需要知道历史的业绩情况及未来业绩发展的趋势。
(2)各商品历史销量情况,如何进行选品,以实现销量最大化?
商品类别50008168销量相比其他类别是最好的,建议商品选品都选这种类别的。所有商品的销量周期都是一致的,在第四年的时候就需要提前换新的商品,避免销量出现明显的下滑。
(3)对客户性别、年龄等信息进行了解,哪些是优质客户,做好老客户的维系工作及新客户的开发工作。
客户群体中,男性占52.75%,女性占47.25%。客户的年龄段主要集中在4-12岁,占比94.43%。