多选题 : 出于效率和成本的考虑,在使用Maxcompute MR的时候,输入表最好应该只包含需要处理的字段,其余多余字段应该忽略。输入表wc_in包含10个字段,MR只对其中三个字段(c1,c2,c3)进行了处理,以下说法正确的是:()。
(A)使用包com.aliyun.odps.data中的TableInfo类中的setCols()方法指定处理的列c1,c2,c3 from wc_in;同时调用MR的时候输入新表wc_in_new
(B)MR的输入为一个SQL 查询:select c1,c2,c3 from wc_in;
(C)重建一张表wc_in_new,只包含三个字段(c1,c2,c3),加载数据:insert into table wc_in_new select c1,c2,c3 from wc_in;同时调用MR的时候
(D)建一个视图v_wc_in,视图仅包括相应的三个字段:create view v_wc_in select c1,c2,c3 from wc_in;然后把视图v_wc_in作为MR的输入
参考答案
继续答题:下一题
更多阿里云大数据助理工程师认证(ACA)试题
- 1关于MaxCompute MR,说法正确的是:()。
- 2在大数据计算服务SQL中使用distribute by和sort by可以对数据进行局部排序,以下对distribute by、sort by的用法描述正确的有:()。
- 3OTS支持多种数据类型,包括:()。
- 4阿里云MaxCompute中,Table的名字描述中错误的是:()。
- 5调度任务的时候,常见的有两种方式,一种是依赖,比如A依赖B,是指A任务能运行的 前提条件之一是同周期的B任务成功完成,另一种是触发,比如A触发B,是指A任务完成后自动会幵始 触发B任务运行,具体时间点无法确定,依赖于A任务的运行时间。目前Dataworks不支持触发,只支持依赖。
- 6以下Maxcompute SQL中语法错误的是:()。