传统的MapReduce模型要求每一轮MapReduce操作之后,数据必须落地到分布式文件系统上。而一般的MapReduce应用通常由多个MapReduce作业组成,每个作业结束之后需要写入磁盘,接下去的Map任务很多情况下只是读一遍数据,为后续的Shuffle阶段做准备,这样其实造成了冗余的IO操作。为了解决这一问题,提供更优的性能,大数据计算服务提供了扩展的MapReduce模型,该模型区别于普通MapReduce模型的主要特点是:()。
(A)支持Map后连接任意多个Reduce操作,如Map-Reduce-Reduce
(B)支持Map后不连接Reduce,而是连接另一个map,如Map-Map-Reduce
(C)支持Chain Mapper/Reducer,即支持Map-Reduce-Map-Reduce
(D)支持没有Map,直接进入Reduce
参考答案
继续答题:下一题
更多阿里云大数据助理工程师认证(ACA)试题
- 1对于ADS的特色功能,以下说法正确的是:()。
- 2关于Maxcompute中的运算符的说法,正确的是:()。
- 3运营人员为了搞促销,需要找出目标客户名单,这批客户的信息存储在大数据计算服务(MaxCompute,原ODPS )的user表中,并且用户名字段username中包含“vip”字样,通过执行SQL语句()可以找出这批客户。
- 4任务(Task是 Max Compute的基本计算单元。SQ及 MapReduce功能都是通过任务(rask)完成的对于用户提交的大多数任务包括 SQL DDL, SQL DM以及 MapReduce等待 Max Compute都会对其进行解析得出任务的执行计划再通过计算层进行处理。
- 5MaxCompute适用于离线数据的处理、分析或挖掘,它同时提供存储和计算两种能力,支持SQL 和编程(Map/Reduce框架)等多种使用方式。
- 6Dataworks中,调度任务每次运行前都先将任务实例化,即生成实例,调度运行时实际上在 执行相应的实例。按天调度的周期性任务每天生成一个自动调度实例;按00:00至23: 59之间每隔一 小时执行一次的周期性任务,每天生成24个自动调度实例。