更多阿里云大数据助理工程师认证(ACA)试题
- 1传统的MapReduce模型要求每一轮MapReduce操作之后,数据必须落地到分布式文件系统上。而一般的MapReduce应用通常由多个MapReduce作业组成,每个作业结束之后需要写入磁盘,接下去的Map任务很多情况下只是读一遍数据,为后续的Shuffle阶段做准备,这样其实造成了冗余的IO操作。为了解决这一问题,提供更优的性能,大数据计算服务提供了扩展的MapReduce模型,该模型区别于普通MapReduce模型的主要特点是:()。
- 2在ADS中,为了更高效的进行表关联,两个事实表进行Join的必要条件不包括以下()。
- 3聚类和分类的最终目的都是把新记录归到不同的类别中去其区别主要在于用于训练的记录是否有结果标记。两者的使用流程算法的核心思想基本致。
- 4阿里云流计算可以直接读写下列()产品的数据。
- 5可以使用大数据开发套件DataWorks创建各种工作任务并能够根据实际需要配置调度周期。调度周期的粒度支持天/周/月/小时/分钟/秒。
- 6MaxCompute SQL的过滤条件wher e中支持多种过滤条件包括 likelike等其中ake是从右向左匹配字符