更多HCIE大数据试题
- 1假设场景如下:癌症检查数据样本有10000个,其中10个数据样本是有癌症,其他是无癌症,假设分类模型在无癌症数据9990中预测正确了9980个,在10个癌症数据中预测正确了9个,此时真阳=9,真阴=9980,假阳=10,假阴=1。则模型准确率是多少?
- 2Spark Llib由一些通用的学习算法和工具组成,包括分类、回归、聚类、关联规则、优化计算、协同过滤、降维和推荐多种机器学习算法
- 3在有监督学习中,我们如何使用聚类方法? *1.我们可以先创建聚类类别,然后在每个类别上用监督学习分别进行学习2.我们可以使用聚类"类别id"作为一个新的特征项,然后再用监督学习分别进行学习3.在进行监督学习之前,我们不能新建聚类类别4.我们不可以使用聚类"类别id"挣为一个新的特征项,然后再用监督学习分别进行学习
- 4(单选)一般而言,若数据类别比例超过(),即认为数据集中存在不均衡数据的现象。
- 5以下关于奇异值分解错误的是?
- 6(单选)当决策树出现过拟合后,需要使用)技术来缩小树的结构和规模。