更多阿里云大数据助理工程师认证(ACA)试题
- 1大数据计算服务中的日志表log是一张分区表,分区键是dt,每天产生一个分区用于存储当天新增的数据,现在共有dt=‘20160101’至dt=‘20160131’共31个分区的数据,为了删除20160101当天新增的数据,可以通过()方式实现。
- 2ADS的普通表分区,支持()分区方式。
- 3小王正在使用Maxcompute进行自然语言分析,他从门户网站上搜集了1000篇新闻报道,然后每篇存成一条纪录,然后基于这些纪录去做分词,即将每条纪录中的内容拆成很多独立的词语,保存到另一张表中,每个词语一条记录。小王对自定义函数比较熟悉,他想通过编写自定义函数实现分词功能。请帮小王做一下选择,从功能角度来看,()自定义函数更适合处理这种场景。
- 4数据计算服服务MaxCompute,原ODPS )中的用户表dim_user是一张非分区表, 有100万条记录,tmp_user和dim_user的表结构相同,有110万条记录,执行以下SQL语句insert overwrite table dim_user select * from tmp_user;执行成功后,对表 dim_user 中的数据描述正确的是:()。
- 5MaxCompute基于标签的安全(LabelSecurity)是项目空间级别的一种自主访问控制机制(DAC)。
- 6使用大数据计算服务(MaxCompute,原ODPS )的odpscmd客户端中的jar命令调用MapReduce时,需要指定两个参数:classpath和resources。比如以下命令执行了一个MapReduce程序,输入为表t_in,输出为表t_out:jar-resources test.jar-classpath test.jar test t_in t_out;其中,test.jar出现了两次,请判断以下说法正确的是:()。