更多HCIE大数据试题
- 1Spark Llib由一些通用的学习算法和工具组成,包括分类、回归、聚类、关联规则、优化计算、协同过滤、降维和推荐多种机器学习算法
- 2(判断)一家公司或企使用数据挖掘作为工具或方法处理商业问题就像拥有了一把金钥匙,这往往比拥有大量的熟悉和理解业务的人员更重要。
- 3TF-IDF(词频-逆文档频率)是在文本挖掘中广泛使用的特殊向量化方法,以反映词语对语料库中的文档的重要性。
- 4(判断)大数据统架构将机器学习和数据处理进一步整合,从核心上来说,统一架构依然以大数据基础架构为主,只是对其进行了优化和改造,重点是在流处理层新增了数据服务层(数据挖掘、机器学习等
- 5(判断)华为M机S机器学习服务以MLS实例的方式提供给用户,具备的优势包括开放交互式Notebook,支持多种开源建模语言(Python等)。
- 6可以用来计算相似度的指标有?