连续活跃登陆的用户指至少连续2天都活跃登录的用户 解决类似场景的问题 创建数据 思路一: 1、因为每天用户登录次数可能不止一次,所以需要先将用户每天的登录日期去重。 2、再用row_number() over(partition by _ order by _)函数将用户 ...
连续活跃登陆的用户指至少连续 天都活跃登录的用户 解决类似场景的问题 创建数据 CREATE TABLE test active dt string, user id string, age int ROW format delimited fields terminated BY , INSERT INTO TABLE test active VALUES , user , , , user , ...
2022-01-18 16:53 0 867 推荐指数:
连续活跃登陆的用户指至少连续2天都活跃登录的用户 解决类似场景的问题 创建数据 思路一: 1、因为每天用户登录次数可能不止一次,所以需要先将用户每天的登录日期去重。 2、再用row_number() over(partition by _ order by _)函数将用户 ...
昨天群上有人发个阿里的面试题,题目描述大概如下: 数据源:用户登录表,只有俩个字段,uid和dt 试用HQL抽取出连续登录了K天的用户uid 第一个想法就是直接用一个UDF解决,按uid分组,把dt收集起来然后在UDF里面判断是否满足条件 其中isExist的逻辑是判断 ...
CREATE TABLESPACE TEST_DBDATAFILE '/mnt/data/oracledata/TEST_DB .dbf' SIZE 5000M AUTOEXTEND ONUNIFOR ...
一、Hive-sql 常用优化 MapReduce 流程: Input->split->map->buffer(此处调整其大小)->spill->spill过多合并->merge->combine(减少reduce压力)->shuffle ...
点击上方“蓝字”关注我们 第一题 需求 我们有如下的用户 ...
如何判断连续: 根据用户id分组排序(rn),再用login_date减去排序的天数,记为date_fg,如果连续则date_fg相等 select user_id, count(1) cnt from (select user_id, login_date, row_number ...
很简单的sql 用户分析语句 :只要自定义简单的udf函数 获取统计时间createdatms字段的 ...