多选题 : 出于效率和成本的考虑,在使用Maxcompute MR的时候,输入表最好应该只包含需要处理的字段,其余多余字段应该忽略。输入表wc_in包含10个字段,MR只对其中三个字段(c1,c2,c3)进行了处理,以下说法正确的是:()。
(A)使用包com.aliyun.odps.data中的TableInfo类中的setCols()方法指定处理的列c1,c2,c3 from wc_in;同时调用MR的时候输入新表wc_in_new
(B)MR的输入为一个SQL 查询:select c1,c2,c3 from wc_in;
(C)重建一张表wc_in_new,只包含三个字段(c1,c2,c3),加载数据:insert into table wc_in_new select c1,c2,c3 from wc_in;同时调用MR的时候
(D)建一个视图v_wc_in,视图仅包括相应的三个字段:create view v_wc_in select c1,c2,c3 from wc_in;然后把视图v_wc_in作为MR的输入
参考答案
继续答题:下一题
更多阿里云大数据助理工程师认证(ACA)试题
- 1MaxCompute的控制层由:()部分组成。
- 2任务(Task是 Max Compute的基本计算单元。SQ及 MapReduce功能都是通过任务(rask)完成的对于用户提交的大多数任务包括 SQL DDL, SQL DM以及 MapReduce等待 Max Compute都会对其进行解析得出任务的执行计划再通过计算层进行处理。
- 3某数据仓库,从各个业务系统采集数据,因业务系统不同,所以保存数据的样式也不同,比如性别字段,有的业务系统保存的是:男、女,有的业务系统保存但是:man、female,有的业务系统保存的是:1、0,现需要将性别字段信息统一调整为:1、0的格式,这种情况主要是在处理哪种数据质量问题?
- 4用户可以跨项目空间读未保护的项目空间数据。
- 5关于ADS中的ECU,()说法是正确的。
- 6流计算可以实现多种复杂规则引擎告警,针对单一一条数据存在多条复杂规则告警,且该规则在系统运行时变化。