RDDResilient Di stributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个可变、可分区、里面的元素可并行计算的集合。
(A)TRUE
(B)FALSE
参考答案
继续答题:下一题
更多HCIE大数据试题
- 1(判断)K-Means算法选择初始中心点的基本思想就是,初始的聚类中心之间的相互距离要尽可能的近。
- 2关于各种分类算法的特点,以下说法正确的是?
- 3数据挖掘可以为企业实现如下哪些价值?
- 4两个变量的Pearson相关性系数为零,但这两个变量的值同样可以相关。
- 5设X.Y是两个随机变量C是常数,以下关于方差的性质描述错误的是?
- 6DUGP(Unitied Data Governance中1atform)华为大数据统一数据治理平台,为运营商提供全面高效的数据资产管控环境。实现了数据集中.统一和共享。包括统的数据采集和整合。统一的全、标准、生命周期和质量管理。以及多维度数提云图功能。提供开箱即用的可以实现全生命周期的主数据管理。包括主数据的集中存储、0、主数据清洗、主数据监管和主数据的共享满足集团对于企业级别主数据的管理平台的要求。