(单选)以下关于大数据Kappa架构描述不正确的是?
(A)Kappa架构在Lambda架构的基础上进行了优化,将实时和流部分进行了合并,将数据通道以消息队列进行替代,依旧以流处理为主,但是数据却在数据湖层面进行了存储
(B)在Kappa架构中,如果需要进行离线分析或者我次计算的时候,不必像实时分析那样将数据湖的数据再次经过消息队列重播少次
(C)Kappa架构的缺点∶实施难度相对较高,第其是在数据重播的部分
(D)Kappa架构的优点∶解决了Lambda架构里面的冗余部分,以数据可重播的超凡脱俗的思想进行了设计,整个架构军常简洁
参考答案
继续答题:下一题
更多HCIE大数据试题
- 1以下关于大数据流式架构的相关描述正确的有。
- 2ETL主要负责将分布的、异构的数据(Extract阶段)根据一定的业务规则进行数据清洗、转换、集成(Tra立sferr 阶段)。最终将处理后的数据加载到数据目的地(亿*ad 阶段),比如数据仓库,
- 3当数据预处理完成后,我们需要选择有意义的特征输入算法和模型进行训练。通常来说,可以从哪些方面考虑来如何进行特征选择?
- 4在MS中,"决策树分类"节点的参数设置描述不准确的是?
- 5在有监督学习中,我们如何使用聚类方法? *1.我们可以先创建聚类类别,然后在每个类别上用监督学习分别进行学习2.我们可以使用聚类"类别id"作为一个新的特征项,然后再用监督学习分别进行学习3.在进行监督学习之前,我们不能新建聚类类别4.我们不可以使用聚类"类别id"挣为一个新的特征项,然后再用监督学习分别进行学习
- 6(单选)在案例"银行客户精准画像"中,数据阶段可以做的质量核查不包括?