更多阿里云大数据助理工程师认证(ACA)试题
- 1MaxCompute的Java SDK在发起访问请求失败时会尽可能自动重试。
- 2某BI系统构建在大数据计算服务上,某数据分析员在分析订单的地域分布时,需要把订单表order(占用存储空间约10G)与地狱维表region(占用存储空间100M)关联起来,两张表的结构如下:create table order( order_id string, region_id string, order amt bigint); create table region(region_id string, region_name string)在运行时发现由于订单大量集中在上海地区,数据的倾斜导致整体运行时间较长,运行的SQL语句如下:select region_name, sum(order_amt)amt from order t1 join region t2 on t1.region_id=t2.region_id;此时可以考虑通过()优化SQL的运行效率。
- 3传统的MapReduce模型要求每一轮MapReduce操作之后,数据必须落地到分布式文件系统上。而一般的MapReduce应用通常由多个MapReduce作业组成,每个作业结束之后需要写入磁盘,接下去的Map任务很多情况下只是读一遍数据,为后续的Shuffle阶段做准备,这样其实造成了冗余的IO操作。为了解决这一问题,提供更优的性能,大数据计算服务提供了扩展的MapReduce模型,该模型区别于普通MapReduce模型的主要特点是:()。
- 4ADS中可以使用explain查看执行计划,以下节点()属于逻辑计划。
- 5下列操作符属于MaxCompute SQL位运算符的是:()。
- 6大数据计算类的产品或者服务如Hiv eMax Compute等,具备了海量数据存储和实时计算的能力可以直接使用这些产品去支持OLTP的业务系统取代成本高昂的关系型数据库。