多选题 : 以下哪些是数据理解阶段的工作?
(A)识别据的质量问题
(B)探测引起兴趣的子集去形成隐含信息的假设
(C)首次发现数据的内部属性
(D)从初始的数据收集开始,通过一些活动的处理,目的是熟悉数据
参考答案
继续答题:下一题
更多HCIE大数据试题
- 1当数据预处理完成后,我们需要选择有意义的特征输入算法和模型进行训练。通常来说,可以从哪些方面考虑来如何进行特征选择?
- 2GBDT(Gradient Boosting Decision Tree,简称GBDT)梯度提升决策树中的树都是回归树,不是分类树。
- 3以下关于 K-折交叉验证法描述错误的是?
- 4(单选)在其它条件不变的前逞下家以千哪一方法容易引起模型的过拟合问题?
- 5传统的ETL与ELT存在局限性,为了更好地适应多数据源.实时数据处理.高容惜.并行化等业务需求,基于Kafka的ETL矿架应运而生,以下关于Kafka Connec 的描述正确的是?
- 6以下关于Spark ML1ib中决策树模型超参数描述不正确的是?