DataX是阿里集团发起的开源项目,是一种离线数据同步的工具,支持多种异构数据源之间的高效数据同步。使用DataX将存储在对象存储OSS中的数据同步至阿里云端大数据计算服务(MaxCompute,原ODPS)时,以()为粒度进行切分实现并发处理。
(A)没有任何切分
(B)OSS的object
(C)OSS的endpoint
(D)OSS的Bucket
参考答案
继续答题:下一题
更多阿里云大数据助理工程师认证(ACA)试题
- 1在SQL解析中,下列哪些操作先于SELECT操作?
- 2ADS的维度表租中存放的表的特点包括:()。
- 3某个企业采用了阿里云的大数据计算服务 Max Compute完成业务订单系统日志管理数据的存储。因为多种数据的安全级别不同必须要开设多个阿里云账户来完成数据管理。
- 4运营人员为了搞促销,需要找出目标客户名单,这批客户的信息存储在大数据计算服务(MaxCompute,原ODPS )的user表中,并且用户名字段username中包含“vip”字样,通过执行SQL语句()可以找出这批客户。
- 5任务(Task是 Max Compute的基本计算单元。SQ及 MapReduce功能都是通过任务(rask)完成的对于用户提交的大多数任务包括 SQL DDL, SQL DM以及 MapReduce等待 Max Compute都会对其进行解析得出任务的执行计划再通过计算层进行处理。
- 6传统的MapReduce模型要求每一轮MapReduce操作之后,数据必须落地到分布式文件系统上。而一般的MapReduce应用通常由多个MapReduce作业组成,每个作业结束之后需要写入磁盘,接下去的Map任务很多情况下只是读一遍数据,为后续的Shuffle阶段做准备,这样其实造成了冗余的IO操作。为了解决这一问题,提供更优的性能,大数据计算服务提供了扩展的MapReduce模型,该模型区别于普通MapReduce模型的主要特点是:()。