在大数据计算服务(MaxCompute,原ODPS)中,使用MapReduce开发一个分词程序,即输入为保存在表中的多篇文章(每篇文章一行纪录),参考一个字典文件(该文件会经常更新)进行分词。简而言之,在执行该程序的时候,既需要输入待分词的文章(已经保存在表中了),又需要输入字典(为经常变动的本地文件),以下最合理的解决方案为:()。
(A)将这个字典与源代码一起进行打包,直接执行即可
(B)每次都将字典文件作为资源上传到大数据计算服务上,然后MR中通过资源的方式来访问
(C)将字典打包jar包,使用jar命令执行MR程序时,通过resources参数指定该jar包
(D)将字典文件保存在本地,在MR中通过访问本地最新的字典文件实现
参考答案
继续答题:下一题
更多阿里云大数据助理工程师认证(ACA)试题
- 1Maxcompute对SQL DML语句进行解析后,得到执行计划。构成执行计划的是由多个有相互依赖关系的()组成。
- 2在阿里云MaxCompute中,在一个multi insert中:对于未分区表,该表不能出现多次。
- 3使用Maxcompute SQL:create table t1 like t2;建表时,表t1不会具有表t2的()属性。
- 4阿里云大数据计算服务(MaxCompute,原ODPS)中的表event是分区表,分区键是 dt (类型为string),每天生成一个分区,现在表中有dt=20160101至dt=20160531共5个 月的数据,为了统计3月份eventid非空的数据量,幵发人员运行了以下语句:select count(*) from event where substr(dt,1,6)=201603 and eventid is not null;对此任务的描述正确的是:()。
- 5关于QuickBI以下说法错误的是()
- 6MaxCompute在多控制集群情况下,每个控制集群会保存一份元数据。