flink实时计算uv,并每天使用离线数据更正计算结果

文章目录

  • flink实时计算uv,并每天使用离线数据更正计算结果
    • 需求
    • 思考
      • 1.怎么在flink中判断是新用户?
      • 2.flink怎么获取离线数据的结果?
      • 3.kafka join hive的字段?
      • 4.使用常量字段join,后续处理?
      • 5.开窗口
      • 6.ds1 interval join ds2
      • 7.后续处理
      • 8.夸一下自己
    • 代码

flink实时计算uv,并每天使用离线数据更正计算结果

需求

数据一部分发到kafka实时计算,一部分存到hive离线计算。每天用hive计算的结果更正实时计算的结果。

比如hive在2022-05-08号凌晨跑批计10分钟算出08号之前的历史的uv,flink实时计算uv是用今天新增+跑批uv。

思考


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部