更多阿里云大数据助理工程师认证(ACA)试题
- 1某地区级网络提供商使用Maxcompute存储、分析宽带用户的流量信息,用户每登陆一次产生一条纪录,日均记录数在2000万条左右,目前最常见为基于区县(该市共有12个区县)、日期(天)的各种查询,其中部分查询只带有区县信息。架构师在设计用户登陆信息表时,决定建成分区表,对于分区列的选取,以下性能最好的是:()。
- 2DRDS和普通的关系型数据库(如MySQL)相比,SQL优化要特别考虑的是:()。
- 3使用大数据开发套件DataWorks时,配置计算引擎是一步很重要的任务,否则无法进行数据存储和计算。
- 4大数据计算服务中,日志表ods_order是一张非分区表,结构如下:create table ods_order(order_id string, order_date string, order_amt decimal); fact_order是一张按日期分区的表,结构如下:create table fact_order(order_id string, order_amt decimal) partitioned by (order_dt string); 现在需要将数据从ods_order加载到fact_order表中,并且按照order_date进行分区,执行了以下SQL:insert overwrite table fact_order partition(order_dt) select order_id, order_amt, order_date as order_dt from ods_order; ods_order表中的order_date有部分记录取值为NULL,对执行结果描述正确的是:()。
- 5Maxcompute MR可以通过控制Reducer的个数来进行调优,以下()方法可以帮用户调节Reducer的个数。
- 6现有的Spark作业可以无缝迁移到流计算。