多选题 : Maxcompute的某个带有Join的SQL运行效率很低,可以采取以下()措施来检验或者改善。
(A)检查连接键是否存在数据倾斜
(B)检查是否有多对多连接
(C)如小表关联大表,可以考虑使用mapjoin优化
(D)检查是否有笛卡尔积
参考答案
继续答题:下一题
更多阿里云大数据助理工程师认证(ACA)试题
- 1Maxcompute中可以通过配额管理一个项目中可以使用的资源的上限,包括:()资源。
- 2传统的MapReduce模型要求每一轮MapReduce操作之后,数据必须落地到分布式文件系统上。而一般的MapReduce应用通常由多个MapReduce作业组成,每个作业结束之后需要写入磁盘,接下去的Map任务很多情况下只是读一遍数据,为后续的Shuffle阶段做准备,这样其实造成了冗余的IO操作。为了解决这一问题,提供更优的性能,大数据计算服务提供了扩展的MapReduce模型,该模型区别于普通MapReduce模型的主要特点是:()。
- 3DataX是阿里集团发起的开源项目,是一种离线数据同步的工具,支持多种异构数据源之间的高效数据同步。使用DataX将存储在对象存储OSS中的数据同步至阿里云端大数据计算服务(MaxCompute,原ODPS)时,以()为粒度进行切分实现并发处理。
- 4关于MaxCompute的视图的描述,下列正确的是:()。
- 5MaxCompute SQL中,内置函数ROUND0用于向上取整数。
- 6DRDS中的表T的分库分表键分别为col1和col2,则下列语句中()不会进行全表扫描。