电商用户行为数据分析
时间:2023-03-15 22:28:01 | 来源:电子商务
时间:2023-03-15 22:28:01 来源:电子商务
1 背景介绍
在快节奏的生活中,网络购物逐渐发展成了最受大众喜爱的购物方式之一。从用户行为中分析用户习惯与喜好、优化产品体验,成为提高用户留存、提升平台口碑、提高电商竞争力的关键。
2 提出问题
1) 日活与留存情况如何?
2) 何时做用户推送最好?
3) 用户的行为路径是什么样的?
4) 如何对客户做精细化运营?
5) 什么商品卖得最好,哪些做得不够好?
6) 各环节转化率如何?
3 结论
1) PV、UV整体趋势相似,双十二当天达到峰值,随后回落到正常值。
2) UV呈平缓上升趋势,日活提高不明显。
3) 第7日与第14日的留存率大多数在中位数之下,且留存率日环比大多为负增长。
4) 用户每天最活跃的时段为21-22点。
5) 用户购买前会进行多次点击,其次是加购。
6) 总PV按点击、加购、收藏、购买依次降低。
7) 重要挽留客户占比最高,而后依次是重要价值客户、重要深耕客户、重要唤回客户。
8) 销量最好的商品ID是:38063851、239436199、14136232。销量最好的品类是1863,销量为0的品类共有10种。
9) 从点击到收藏、加购的转化率为65.84%,从收藏、加购到购买的转化率为60.26,从购买到复购的转化率为41.56%。
4 数据说明
4.1 数据来源
本次数据选取于阿里天池新人实战赛之[离线赛]2020赛季,数据包含某电商移动端 2014年 11月 18 日至 2014 年 12 月18日,共1546,3110行用户行为数据。
4.2 字段说明
字段 | 字段说明 | 提取说明 |
---|
user_id | 用户标识 | 抽样&字段脱敏 |
item_id | 商品标识 | 字段脱敏 |
behavior_type | 用户对商品的行为类型 | 包括浏览、收藏、加购物车、购买,对应取值分别是1、2、3、4。 |
user_geohash | 用户位置的空间标识,可以为空 | 由经纬度通过保密的算法生成 |
item_category | 商品分类标识 | 字段脱敏 |
time | 行为时间 | 精确到小时级别 |
4.3 数据清洗
4.3.1 数据选择1) 以上字段均为有效字段,故选取所有字段。
2) 考虑到电脑配置,本次随机抽取100,0000行数据进行分析。
4.3.2 数据去重利用Pandas的drop_duplicates() 方法对数据进行去重,发现没有重复数据。
4.3.3 缺失值处理使用Pandas的isnull() 方法查找缺失值,发现只有“user_geohash”列存在缺失值, 暂不做处理。
4.3.4 时间值处理将原时间列time分为date(日期列)与hour(小时列),并将数据类型修改为日期类型与整型。
4.3.5 排序处理将所有数据按date、hour、user_id升序排列。
4.3.6 异常值处理1) 日期异常值:排序后,所有日期均在2014-11-18到2014-12-18之间,无异常值。
2) 小时异常值:排序后,所有小时数均在00与23之间,无异常值。
3) 行为异常值:所有行为值均为1、2、3、4中的一个,无异常值。
5 分析说明
5.1 分析思路
1) 分析每日DAU,用户的次日、3日、7日、14日留存率,找出二次激活用户的关键时间点。
2) 找出用户每天最活跃的时段,了解用户的行为时间模式。
3) 分析用户购买前的行为,了解用户的购买行为模式。
4) 基于RFM模型,找出价值客户。
5) 分析销量最好、最次的商品和品类,以及复购率情况。
6) 用户从浏览到最终购买整个过程的流失情况,提出改善转化率的意见
5.2 分析方法
1) 电商行业,使用“人货场”模型进行指标拆解。
2) 淘宝用户行为,利用“AIPL”模型进行转化率分析。
3) 用户精细化运营,选择“RFM”模型进行用户分层。
6 方案实现
6.1 使用工具
1) 数据库:MySql与Navicat,导入及存储数据。
2) 数据处理:pycharm,主要使用sqlachemy进行数据库连接、数据读取与写入;pandas与numpy进行数据清洗和统计。
3) 数据可视化:tableau,利用tableau进行图表绘制。
6.2 具体实现
6.2.1 数据处理1) 导入相关库。
2) 抽样并导入数据。
3) 删除重复数据。
4) 定义表头。
5) 查找缺失值,只有地理位置列有缺失,不影响本次统计分析,不做处理。
6) 查看数据类型。
7) 处理日期值。
8) 按时间和用户对数据进行升序排列。
6.2.2 日PV、UV分析
1) 统计总量
ⅰ. 总PV:1000,000。
ⅱ. 总UV:262,733。
2) 按日期统计PV、UV。
i. 获取唯一日期值。
ⅱ. 统计日PV。
ⅲ. 统计日UV。
ⅳ. 绘图与分析。
- PV、UV整体趋势相似,符合预期。
- 双十二 PV、UV达到峰值,符合预期。
- 双十二之后PV、UV回落到日常值,符合预期。
- UV呈平缓上升趋势,日活提高不明显。
6.2.3 留存率分析
1) 自定义留存率函数。
2) 统计每日的次日、第3日、第7日、第14日留存率。
3) 统计日环比。
4) 绘图与分析。
i. 第1日、第3日、第7日、第14日留存率对比。
- 可以看出留存率趋势相近,但第7日与第14日的留存率大多数在中位数之下,考虑第7日是用户留存的关键日期。
- 留存率均达到峰值的,均为双十二活动影响,符合预期。
ⅱ. 留存率日环比、周环比对比。
- 双十二活动过后,UV降低,留存率为负,符合预期。
- 日环与周环比相比,负增长日较多。
6.2.4 日活跃时间段分析
1) 统计不同时刻、不同行为的PV。
2) 统计不同时刻、不同行为的UV。
3) 绘图分析。
由下图可知:
- 不同时刻PV、UV趋势相似,且用户以点击浏览为主,且加购用户比收藏用户要多。
- 用户活跃最活跃的时段为21-22点,0点之后活跃度降低,3-5点最低,6点后开始上升,10点后达到水平值,10-18点期间用户活跃度一般,19点后活跃度开始当日的二次上升,至21点达到峰值。
6.2.5 行为路径分析
分析用户购买前的4个行为,了解用户行为路径。
1) 获取具有购买行为的用户。
2) 将行为默认值设置为“空”,并补齐第5个行为为购买。
3) 获取购买的前4个行为。
4) 拼接行为路径。
5) 绘图分析。
共计196种不同的行为路径,选取用户数TOP10的记录进行绘图。由图可见:
- 用户购买前最常见的行为是点击,其次是加购。
- 用户收藏的商品购买的并不多。
6.2.6 用户价值分析
对用户进行RFM分析,实现用户分层与精细化运营。
1) 设定当前日期。
2) 获取具有购买行为的用户。
3) 计算购买日与当前日期的间隔天数。
4) 以最近一次购买日的间隔天数作为用户的R值。
5) 计算F值。
6) 计算平均值。
7) 将用户的R、F值与均值比较。
8) 用户分层,由于没有M值,本次仅将用户分为四层。
9) 绘图分析。
- 重要价值客户、重要挽留客户与重要深耕客户占比相当,其中重要价值客户占比30.04%,是创造价值的主力军。
- 重要挽留客户占比30.77%,占比最高,已接近流失阶段,需要提升这部分用户的粘性,并进行消费刺激。
- 重要深耕客户近期活跃,但消费频次较低,需进行消费刺激。
- 重要唤回客户占比11.53%,为过去消费频次较高的客户,考虑是否转到其它平台,可对其采取优惠策略等进行唤回。
6.2.7 商品分析
1) 获取商品唯一ID及所属品类。
2) 获取各商品点击、收藏、加购、购买PV量。
3) 获取各商品的购买用户数。
4) 获取各商品复购率。
5) 绘图分析。
i. 销量Top10商品与品类。
- 本次统计共计商品734,163种,销量最好的商品ID是:38063851、239436199、14136232。
- 销量最好的商品不超过5个,用户复购商品0种,收藏和加购数也极低,但是点击量都比销量高出近一倍,对商品详情页做进一步分析优化。
- 销量最好的品类是1863,共计购买用户数221个。
ⅱ. 下图为销量为0的品类,共计10种,这些品类下的商品销量均为0,考虑这些品类与商品做进一步的分析和优化调整。
6.2.8 漏斗转化分析
1) 获取用户行为与对应用户数。
2) 收藏与加购后续阶段均可能为购买,故将其视为同一阶段,进行去重加和处理。
3) 统计存在复购行为的用户数。
4) 计算转化率。
5) 绘图分析。
- 从点击到收藏、加购的用户有六成,考虑优化个性化推荐,提高用户收藏与加购率。
- 考虑有用户从点击到直接购买,购买人数仅占点击人数的一半,流失率较高。
- 存在复购行为的用户占购买用户的41.56%,复购率尚可。
7 总结与建议
7.1 日PV、UV
- PV、UV整体趋势相似,受双十二影响,双十二当天为近一月峰值,随后回落到正常值,符合预期。
- UV呈平缓上升趋势,需采取拉新措施提高新增用户数,或提高用户粘性。
7.2 留存率
- 第7日与第14日的留存率大多数在中位数之下,考虑第7日是用户留存的关键日期。
- 留存率日环比大多为负增长,考虑新用户影响,应结合渠道拉新进行进一步分析。
7.3 日活跃时间段
- 用户每天最活跃的时段为21-22点,0点之后活跃度降低,3-5点最低,6点后开始上升,10点后达到水平值,10-18点期间用户活跃度一般,19点后活跃度开始当日的二次上升,至21点达到峰值,可在21-22点进行重点推送与直播等,其余推送可在10-18点进行。
- 用户以点击浏览为主,且加购用户比收藏用户要多,可对购物车商品价格变动做醒目提醒。
7.4 用户行为路径
- 用户购买前会进行多次点击,其次是加购。
- 收藏的商品被购买的不多,可针对收藏夹商品采取提醒策略,或考虑奢侈品策略。
7.5 用户价值
- 重要价值客户、重要挽留客户与重要深耕客户占比相当,其中重要价值客户占比30.04%,是创造价值的主力军。
- 重要挽留客户占比30.77%,占比最高,已接近流失阶段,需要提升这部分用户的粘性,并进行消费刺激。
- 重要深耕客户近期活跃,但消费频次较低,需进行消费刺激。
- 重要唤回客户占比11.53%,为过去消费频次较高的客户,考虑是否转到其它平台,可对其采取优惠策略等进行唤回。
7.6 商品分析
- 本次统计共计商品734,163种,销量最好的商品不超过5个,用户复购商品0种,收藏和加购数也极低,但是点击量都比销量高出近一倍。
- 销量最好的品类是1863。
- 销量为0的品类共有10种,这些品类下的商品销量均为0,考虑是否对品类或商品做优化调整。
7.7 各环节转化率
- 从点击到收藏、加购的用户有六成,考虑优化个性化推荐,提高用户收藏与加购率。
- 考虑有用户从点击到直接购买,购买人数仅占点击人数的一半,流失率较高。
- 存在复购行为的用户占购买用户的41.56%,复购率尚可。