更多HCIE大数据试题
- 1(判断)哑编码与OneHot 编码很实似区别在于哑变量认为对于一个具有N 个类别的特征,我们只需要考察N-1个类别是否存在,第N个类别自然就能得到。
- 2两个变量的Pearson相关性系数为零,但这两个变量的值同样可以相关。
- 3在有监督学习中,我们如何使用聚类方法? *1.我们可以先创建聚类类别,然后在每个类别上用监督学习分别进行学习2.我们可以使用聚类"类别id"作为一个新的特征项,然后再用监督学习分别进行学习3.在进行监督学习之前,我们不能新建聚类类别4.我们不可以使用聚类"类别id"挣为一个新的特征项,然后再用监督学习分别进行学习
- 4(判断)K-Means算法选择初始中心点的基本思想就是,初始的聚类中心之间的相互距离要尽可能的近。
- 5下哪些属于模型的超参数?
- 6数据挖掘的开发工具除了Python以外,还包含以下哪些工具?