更多阿里云大数据助理工程师认证(ACA)试题
- 1在数据分析建模的过程中,Kimball模式建模一般遵循四步骤流程,分别是选取要建模的业务处理过程,确定业务处理的粒度,选定最终事实表的维度,确定最终事实表的事实四个步骤。如果一位同事咨询你想了解某个表中每一行的内容代表了什么具体的含义,其实是想咨询你这个表的数据建模里的哪一个步骤信息?
- 2Maxcompute对SQL DML语句进行解析后,得到执行计划。构成执行计划的是由多个有相互依赖关系的()组成。
- 3在大数据计算服务(MaxCompute,原ODPS)中,使用MapReduce开发一个分词程序,即输入为保存在表中的多篇文章(每篇文章一行纪录),参考一个字典文件(该文件会经常更新)进行分词。简而言之,在执行该程序的时候,既需要输入待分词的文章(已经保存在表中了),又需要输入字典(为经常变动的本地文件),以下最合理的解决方案为:()。
- 4MaxCompute表的lifecycle指明此表的生命周期,create table like语句不会复制源表的生命周期属性。
- 5在大数据计算服务(MaxCompute,原ODPS )的表中存有一批网站及其相互之间链接关系,开发人员希望通过pagerank算法来分析这批网站的排名,即把网站看做节点,把网站之间的连接关系看做权重,从而实现对网站的评分。()计算框架更适合实现这个场景。
- 6MaxCompute SQL创建表的时候可以设置表的生命周期如果某表的 lifecyle设置为7天则表示该表最多存在7天在创建7天后自动回收。