18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 电子商务 > 从电商开始,入门数据分析

从电商开始,入门数据分析

时间:2023-03-15 22:38:01 | 来源:电子商务

时间:2023-03-15 22:38:01 来源:电子商务

听取老师的建议,从电商数据开始学习数据分析。

描述统计分析

一、四个常用指标

1.平均数

2.四分位数

下界(0%)—下四分位数Q1(25%)—中位数Q2(50%)—上四分位数Q3(75%)—上界(100%)

箱线图(from百度百科)
四分位数的应用:

检查方法Tukey`s test最小估计值:Q1-k(Q3-Q1)最大估计值:Q3+k(Q3-Q1)k=1.5中度异常k=3极度异常处理方法:错误标记的数据,在数据分析前进行修正;被错误包含在数据集中的值,将异常值删除;反常值,正确被记录应该保留;3.标准差=波动大小

标准差的单位与原计算数值相同;标准差大小好坏与研究问题相关。

举例:NBA球员稳定性;股票波动大小。

4.标准分=距离平均值多少个标准差

标准分=0,即数值等于平均值;标准分>0,即数值大于平均值;标准分<0,即数值小于平均值。

案例:质量管理

二、数据集信息

表1

user_id用户id

auction_id购买行为编号

cat_id商品种类id

cat1商品类别

property商品属性

buy_mount购买数量

day购买时间

表2

user_id用户id

birthday出生日期

gender性别 0男性1女性

三、需要统计信息

  1. 表1用户的购买频次,筛选是否有同一用户的重复购买行为,对同一用户的购买行为进行合并。
  2. 表1商品类别分类统计,统计所有类别的商品及购买量,得出商品类别购买量排序
  3. 表1商品种类分类统计,统计所有的商品种类及购买量,得出商品种类购买量排序。与商品类别匹配。
  4. 表1购买数量的频次统计。
  5. 表1购买时间。转换成时间格式,并可以统计季节季度时间星期时间
  6. 表2用户id和表1用户id进行匹配。
  7. 表1数据和表2数据进行购买时间婴儿年龄计算。
  8. 表2婴儿性别统计。

四、业务问题

  1. 用户喜欢在周几下单?一周的购买趋势是怎样的?(buy_mount购买数量 & day购买时间)
  2. 哪一个类别的商品销量最好?每个类别的商品中,不同种类的商品销量是怎样的?(cat_id商品种类id & cat1商品类别 & buy_mount购买数量)
  3. 不同季度每个类别商品的销量是怎样的?不同类别商品的季节波动大吗(cat_id商品种类id & cat1商品类别 & buy_mount购买数量 & day购买时间)
  4. 婴儿的年龄会影响到父母的购买行为吗?(birthday生日 & buy_mountg购买数量 & day购买日期)
  5. 男女婴儿各自偏好的商品类别是什么?ueser id用户ID & gender性别 & cat id商品类别 & buy mount购买数量)
  6. 用户单位时间内(例如一年)购买行为统计。购买最多的前百分之二十用户总共购买商品多少件,每个人的购买量是多少?剩下的百分之八十用户总共购买多少件,每个人的购买数量是多少?用来统计高价值用户(ueser id用户ID & buy mount购买数量)

关键词:入门,数据,分析

74
73
25
news

版权所有© 亿企邦 1997-2025 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭