(单选)以下关于大数据Kappa架构描述不正确的是?
(A)Kappa架构在Lambda架构的基础上进行了优化,将实时和流部分进行了合并,将数据通道以消息队列进行替代,依旧以流处理为主,但是数据却在数据湖层面进行了存储
(B)在Kappa架构中,如果需要进行离线分析或者我次计算的时候,不必像实时分析那样将数据湖的数据再次经过消息队列重播少次
(C)Kappa架构的缺点∶实施难度相对较高,第其是在数据重播的部分
(D)Kappa架构的优点∶解决了Lambda架构里面的冗余部分,以数据可重播的超凡脱俗的思想进行了设计,整个架构军常简洁
参考答案
继续答题:下一题
更多HCIE大数据试题
- 1(判断)K-Means算法选择初始中心点的基本思想就是,初始的聚类中心之间的相互距离要尽可能的近。
- 2在有监督学习中,我们如何使用聚类方法? *1.我们可以先创建聚类类别,然后在每个类别上用监督学习分别进行学习2.我们可以使用聚类"类别id"作为一个新的特征项,然后再用监督学习分别进行学习3.在进行监督学习之前,我们不能新建聚类类别4.我们不可以使用聚类"类别id"挣为一个新的特征项,然后再用监督学习分别进行学习
- 3(单选)以下哪个选项不是矩阵乘法对向量的变换?
- 4对于随机森林和GradientBosting Trees.下面说法正确的是?
- 5以下哪些方法是对数据集根据一定规则按列变换?
- 6Spark Mlib 中特征提取的基本方法,包括· TF-ID(F)Word2Vec、ChiSqselecdor 等方法。