更多数据挖掘试题
- 1利用 Apriori 算法计算频繁项集可以有效降低计算频繁集的时间复杂度。 在 以下的购物篮中产生支持度不小于 3 的候选 3- 项集,在候选 2- 项集中需要剪枝 的是()ID项集:1 面包、牛奶。2 面包、尿布、啤酒、鸡蛋。3 牛奶、尿布、啤酒、可乐。4 面包、牛奶、尿布、啤酒。5 面包、牛奶、尿布、可乐
- 2以下属于分类器评价或比较尺度的有: ()
- 3考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为
- 4()都属于分裂的层次聚类算法。
- 5在分类树中,节点的纯度越高,则互熵的值越大。
- 6有关数据质量的认识正确的是?