更多HCIE大数据试题
- 1(单选)"点击率问题"是这样一个预测问题,99%的人不会点击,而1%的人会点击,所以这是一个非常不平衡的数据集。假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是?
- 2(判断)若数据集中存在不均衡数据,都需要进行不均衡数据处理。
- 3CRISP-DM(跨行业数据挖掘标准流程)是当今数据挖掘业界通用流行的标准之一除了商业理解和数据理解之外还包含了哪些步骤?
- 4强规则是指同时满足最小支持度阈值和最小置信度阈值的规则。
- 5以下关于Spak MLlib中分类模型评估指标描述正确的是?
- 6Spark MLlib中的Basic Statistic是专门用于进行大数据集群上的统计分析工具,以下哪个不属于Basic Statisti6发持的功能?