18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 电子商务 > 电商用户行为数据分析

电商用户行为数据分析

时间:2023-03-15 22:28:01 | 来源:电子商务

时间:2023-03-15 22:28:01 来源:电子商务

1 背景介绍

在快节奏的生活中,网络购物逐渐发展成了最受大众喜爱的购物方式之一。从用户行为中分析用户习惯与喜好、优化产品体验,成为提高用户留存、提升平台口碑、提高电商竞争力的关键。

2 提出问题

1) 日活与留存情况如何?

2) 何时做用户推送最好?

3) 用户的行为路径是什么样的?

4) 如何对客户做精细化运营?

5) 什么商品卖得最好,哪些做得不够好?

6) 各环节转化率如何?

3 结论

1) PV、UV整体趋势相似,双十二当天达到峰值,随后回落到正常值。

2) UV呈平缓上升趋势,日活提高不明显。

3) 第7日与第14日的留存率大多数在中位数之下,且留存率日环比大多为负增长。

4) 用户每天最活跃的时段为21-22点。

5) 用户购买前会进行多次点击,其次是加购。

6) 总PV按点击、加购、收藏、购买依次降低。

7) 重要挽留客户占比最高,而后依次是重要价值客户、重要深耕客户、重要唤回客户。

8) 销量最好的商品ID是:38063851、239436199、14136232。销量最好的品类是1863,销量为0的品类共有10种。

9) 从点击到收藏、加购的转化率为65.84%,从收藏、加购到购买的转化率为60.26,从购买到复购的转化率为41.56%。

4 数据说明

4.1 数据来源

本次数据选取于阿里天池新人实战赛之[离线赛]2020赛季,数据包含某电商移动端 2014年 11月 18 日至 2014 年 12 月18日,共1546,3110行用户行为数据。

4.2 字段说明

字段字段说明提取说明
user_id用户标识抽样&字段脱敏
item_id商品标识字段脱敏
behavior_type用户对商品的行为类型包括浏览、收藏、加购物车、购买,对应取值分别是1、2、3、4。
user_geohash用户位置的空间标识,可以为空由经纬度通过保密的算法生成
item_category商品分类标识字段脱敏
time行为时间精确到小时级别

4.3 数据清洗

4.3.1 数据选择

1) 以上字段均为有效字段,故选取所有字段。

2) 考虑到电脑配置,本次随机抽取100,0000行数据进行分析。

4.3.2 数据去重

利用Pandas的drop_duplicates() 方法对数据进行去重,发现没有重复数据。

4.3.3 缺失值处理

使用Pandas的isnull() 方法查找缺失值,发现只有“user_geohash”列存在缺失值, 暂不做处理。

4.3.4 时间值处理

将原时间列time分为date(日期列)与hour(小时列),并将数据类型修改为日期类型与整型。

4.3.5 排序处理

将所有数据按date、hour、user_id升序排列。
4.3.6 异常值处理

1) 日期异常值:排序后,所有日期均在2014-11-18到2014-12-18之间,无异常值。

2) 小时异常值:排序后,所有小时数均在00与23之间,无异常值。

3) 行为异常值:所有行为值均为1、2、3、4中的一个,无异常值。

5 分析说明

5.1 分析思路

1) 分析每日DAU,用户的次日、3日、7日、14日留存率,找出二次激活用户的关键时间点。

2) 找出用户每天最活跃的时段,了解用户的行为时间模式。

3) 分析用户购买前的行为,了解用户的购买行为模式。

4) 基于RFM模型,找出价值客户。

5) 分析销量最好、最次的商品和品类,以及复购率情况。

6) 用户从浏览到最终购买整个过程的流失情况,提出改善转化率的意见

5.2 分析方法

1) 电商行业,使用“人货场”模型进行指标拆解。

2) 淘宝用户行为,利用“AIPL”模型进行转化率分析。

3) 用户精细化运营,选择“RFM”模型进行用户分层。

6 方案实现

6.1 使用工具

1) 数据库:MySql与Navicat,导入及存储数据。

2) 数据处理:pycharm,主要使用sqlachemy进行数据库连接、数据读取与写入;pandas与numpy进行数据清洗和统计。

3) 数据可视化:tableau,利用tableau进行图表绘制。

6.2 具体实现

6.2.1 数据处理

1) 导入相关库。

2) 抽样并导入数据。

3) 删除重复数据。

4) 定义表头。

5) 查找缺失值,只有地理位置列有缺失,不影响本次统计分析,不做处理。

6) 查看数据类型。

7) 处理日期值。

8) 按时间和用户对数据进行升序排列。

6.2.2 日PV、UV分析

1) 统计总量

ⅰ. 总PV:1000,000。

ⅱ. 总UV:262,733。

2) 按日期统计PV、UV。

i. 获取唯一日期值。

ⅱ. 统计日PV。

ⅲ. 统计日UV。

ⅳ. 绘图与分析。

6.2.3 留存率分析

1) 自定义留存率函数。

2) 统计每日的次日、第3日、第7日、第14日留存率。

3) 统计日环比。

4) 绘图与分析。

i. 第1日、第3日、第7日、第14日留存率对比。

ⅱ. 留存率日环比、周环比对比。

6.2.4 日活跃时间段分析

1) 统计不同时刻、不同行为的PV。

2) 统计不同时刻、不同行为的UV。

3) 绘图分析。

由下图可知:

6.2.5 行为路径分析

分析用户购买前的4个行为,了解用户行为路径。

1) 获取具有购买行为的用户。

2) 将行为默认值设置为“空”,并补齐第5个行为为购买。

3) 获取购买的前4个行为。

4) 拼接行为路径。

5) 绘图分析。

共计196种不同的行为路径,选取用户数TOP10的记录进行绘图。由图可见:

6.2.6 用户价值分析

对用户进行RFM分析,实现用户分层与精细化运营。

1) 设定当前日期。

2) 获取具有购买行为的用户。

3) 计算购买日与当前日期的间隔天数。

4) 以最近一次购买日的间隔天数作为用户的R值。

5) 计算F值。

6) 计算平均值。

7) 将用户的R、F值与均值比较。

8) 用户分层,由于没有M值,本次仅将用户分为四层。

9) 绘图分析。

6.2.7 商品分析

1) 获取商品唯一ID及所属品类。

2) 获取各商品点击、收藏、加购、购买PV量。

3) 获取各商品的购买用户数。

4) 获取各商品复购率。

5) 绘图分析。

i. 销量Top10商品与品类。

ⅱ. 下图为销量为0的品类,共计10种,这些品类下的商品销量均为0,考虑这些品类与商品做进一步的分析和优化调整。

6.2.8 漏斗转化分析

1) 获取用户行为与对应用户数。

2) 收藏与加购后续阶段均可能为购买,故将其视为同一阶段,进行去重加和处理。

3) 统计存在复购行为的用户数。

4) 计算转化率。

5) 绘图分析。

7 总结与建议

7.1 日PV、UV

7.2 留存率

7.3 日活跃时间段

7.4 用户行为路径

7.5 用户价值

7.6 商品分析

7.7 各环节转化率

关键词:数据,分析,用户

74
73
25
news

版权所有© 亿企邦 1997-2025 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭