更多HCIE大数据试题
- 1在有监督学习中,我们如何使用聚类方法? *1.我们可以先创建聚类类别,然后在每个类别上用监督学习分别进行学习2.我们可以使用聚类"类别id"作为一个新的特征项,然后再用监督学习分别进行学习3.在进行监督学习之前,我们不能新建聚类类别4.我们不可以使用聚类"类别id"挣为一个新的特征项,然后再用监督学习分别进行学习
- 2(单选)以下关于大数据Kappa架构描述不正确的是?
- 3RDDResilient Di stributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个可变、可分区、里面的元素可并行计算的集合。
- 4以下哪些不属于模型超参数的搜索算法?
- 5以下关于Spark ML1ib中决策树模型超参数描述不正确的是?
- 6(单选)以下哪个选项不属于数据减洗的范畴?