ETL主要负责将分布的、异构的数据(Extract阶段)根据一定的业务规则进行数据清洗、转换、集成(Tra立sferr 阶段)。最终将处理后的数据加载到数据目的地(亿*ad 阶段),比如数据仓库,
(A)TRUE
(B)FALSE
参考答案
继续答题:下一题


更多HCIE大数据试题
- 1(单选)下列哪个选项不是常用的聚类算法?
- 2RDDResilient Di stributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个可变、可分区、里面的元素可并行计算的集合。
- 3(单选)若随机变量X服从正态分布N(u,o^2),则随机变量Y=aX+b服从以下哪个正态分布?
- 4现实中大数据挖掘任务往社特征属性过多,而一个普遍存在的事实是,大数据集带来的关键信息只聚集在部分甚至少数特征上,因此我们需要进行以下哪种操作?
- 5凸优化是机器学习的一个根本性问题,很多能A问题可以通过一定的手段或方法转化为一个凸问题,一旦转化为一个题,那么理论上来说,这个问题便得到了解诀。以下哪些是非凸优化问要转化为凸优化问题的方法?
- 6(单选)朴素贝叶斯分类方法(Naive Bayes)是一种特殊的Bayes分类器,特征变量是x,类别标签是C,它的一个假定是?