SQL实战(4)——2021年11月每天新用户的次日留存率
现有表:用户行为日志表tb_user_log

问题:统计2021年11月每天新用户的次日留存率(保留2位小数)
注:
- 次日留存率为当天新增的用户数中第二天又活跃了的用户数占比。
- 如果in_time-进入时间和out_time-离开时间跨天了,在两天里都记为该用户活跃过,结果按日期升序。
输出示例:
示例数据的输出结果如下:

解释:
11.01有3个用户活跃101、102、103,均为新用户,在11.02只有101、103两个又活跃了,因此11.01的次日留存率为0.67;
11.02有104一位新用户,在11.03又活跃了,因此11.02的次日留存率为1.00;
11.03有105一位新用户,在11.04未活跃,因此11.03的次日留存率为0.00;
11.04没有新用户,不输出。
解题思路:
1.先找出每个用户第一次登陆时间(11月新增用户)--t0;
2.因为登入、登出都算活跃,因此用union将两种活跃时间取并集--t1;
3.将t0和t1左连接,新用户当天登陆并且第2天依旧登陆才会保留整个记录,否则右表记录为空--t2;
4.得到每天新用户第二天是否登陆表后,开始计算每天的次日留存率:根据日期分组计算,次日活跃用户个数/当天新用户个数;
WITH t0 as (SELECT uid,min(date(in_time)) first_sign FROM tb_user_log GROUP BY uid HAVING month(first_sign)=11),t1 as (SELECT uid,date(in_time) dt FROM tb_user_logunionSELECT uid,date(out_time) dt FROM tb_user_log),t2 as (SELECT t0.uid,first_sign,dt FROM t0 LEFT JOIN t1 on t0.uid = t1.uid AND t1.dt = TIMESTAMPADD(day,1,t0.first_sign))
SELECT DISTINCT first_sign,round(((count(dt) over w)/(count(first_sign) over w)),2) rt
FROM t2
window w as (PARTITION by first_sign)
最后附上数据源:
DROP TABLE IF EXISTS tb_user_log;
CREATE TABLE tb_user_log (id INT PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID',uid INT NOT NULL COMMENT '用户ID',artical_id INT NOT NULL COMMENT '视频ID',in_time datetime COMMENT '进入时间',out_time datetime COMMENT '离开时间',sign_in TINYINT DEFAULT 0 COMMENT '是否签到'
) CHARACTER SET utf8 COLLATE utf8_bin;INSERT INTO tb_user_log(uid, artical_id, in_time, out_time, sign_in) VALUES(101, 0, '2021-11-01 10:00:00', '2021-11-01 10:00:42', 1),
(102, 9001, '2021-10-30 10:00:00', '2021-10-30 10:00:09', 0),
(109, 9001, '2021-10-31 10:00:00', '2021-10-31 10:00:09', 0),
(102, 9001, '2021-11-01 10:00:00', '2021-11-01 10:00:09', 0),
(103, 9001, '2021-11-01 10:00:01', '2021-11-01 10:01:50', 0),
(101, 9002, '2021-11-02 10:00:09', '2021-11-02 10:00:28', 0),
(101, 9003, '2021-11-02 10:00:51', '2021-11-02 10:00:59', 0),
(104, 9001, '2021-11-02 10:00:28', '2021-11-02 10:00:50', 0),
(105, 9001, '2021-11-02 10:00:28', '2021-11-02 10:00:50', 0),
(106, 9001, '2021-11-02 10:00:28', '2021-11-02 10:00:50', 0),
(107, 9003, '2021-11-03 11:00:55', '2021-11-03 11:01:24', 0),
(104, 9003, '2021-11-03 11:00:45', '2021-11-03 11:00:55', 0),
(105, 9003, '2021-11-03 11:00:53', '2021-11-03 11:00:59', 0),
(109, 9002, '2021-11-04 11:00:55', '2021-11-04 11:00:59', 0);
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
