大数据笔试真题——Azkaban,kylin面试题
第十三,十四章目录
第十三章 Azkaban
一个批量工作流任务调度器
13.1 Oozie和Azkaban的区别
工作流配置上:azkaban使用properties或yml,oozie使用xml工作流传参上:azkaban直接传参,oozie还额外支持EL表达式定时任务上:azkaban基于时间,oozie还额外基于数据资源管理上:azkaban有权限管理,oozie暂无重试机制上:azkaban支持job级别的重试,oozie支持更细粒度的重试反馈机制上:azkaban根据进程的反馈判断是否成功,oozie则根据yarn的作业判断是否成功使用难度上:azkaban开箱即用,oozie需要复杂的编译和安装才可以使用自由度上:azkaban只能通过shell执行job,oozie则可以根据情况定制jar包执行job
第十四章 kylin引擎
14.1 概念
kylin是通过预计算的方式,使用MR引擎提前聚合数据源统计多个维度组合的聚合函数值,用这些聚合结果构建一个数据立方体以支持进一步的复杂查询的查询引擎,预计算的结果存放在hbase中。
14.2 结构
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
