更多阿里云大数据助理工程师认证(ACA)试题
- 1随着社会数据收集手段的不断丰富及完善,越来越多的行业数据被积累下来,数据规模已经增长到了传统软件行业无法承载的海量数据级别。大数据计算服务可以很多的利用存储和计算能力去处理、分析这些海量数据,发现价值。以下说法中正确的有:()。
- 2与DataWorks经常在一起配合使用的阿里云服务包括:()。
- 3在大数据计算服务的数据仓库中的订单表fact_order,建表语句如下:create table fact_order(order_id string, order_amt double, order_dt string) partitioned by (dt string);此表中的数据是从ods_order加工而来,ods_order建表语句如下:create table ods_order(order_id string, order_amt bigint, order_dt string); ods_order中有一条记录数据值是order_id order_amt order_dt 0001 100 20160301运行SQL语句将数据从ods_order加载到fact_order中:insert overwrite table fact_order partition(dt=’20160301’) select* from ods_order;对此语句的执行结果描述正确的是:()。
- 4某公司采用阿里云大数据开发套件DataWorks实现了数据分析的功能。因为业务变化而调整了某些数据表的表结构,业务人员需要了解哪些相关表格受到了影响,此时可以采用DataWorks中()解决这个问题。
- 5关于Maxcompute中的任务(Instance)、作业(Job)、作业实例(Instance)以及工作流(Workflow)描述错误的是:()。
- 6传统的MapReduce模型要求每一轮MapReduce操作之后,数据必须落地到分布式文件系统上。而一般的MapReduce应用通常由多个MapReduce作业组成,每个作业结束之后需要写入磁盘,接下去的Map任务很多情况下只是读一遍数据,为后续的Shuffle阶段做准备,这样其实造成了冗余的IO操作。为了解决这一问题,提供更优的性能,大数据计算服务提供了扩展的MapReduce模型,该模型区别于普通MapReduce模型的主要特点是:()。