多选题 : 当数据预处理完成后,我们需要选择有意义的特征输入算法和模型进行训练。通常来说,可以从哪些方面考虑来如何进行特征选择?
(A)特征是否发散
(B)特征与目标的相关性
(C)特征的名称
(D)以上全都正对
参考答案
继续答题:下一题
更多HCIE大数据试题
- 1以下关于对数损失函数描述正确的是?
- 2(判断)数据的ETL,其中E为Extract,T为Transform,L为Load。
- 3(判断)哑编码与OneHot 编码很实似区别在于哑变量认为对于一个具有N 个类别的特征,我们只需要考察N-1个类别是否存在,第N个类别自然就能得到。
- 4RDDResilient Di stributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个可变、可分区、里面的元素可并行计算的集合。
- 5GBDT(Gradient Boosting Decision Tree,简称GBDT)梯度提升决策树中的树都是回归树,不是分类树。
- 6除了精确率(Precision)和召回率(Recal1),以下还有哪些常用的模型评估指标?