更多阿里云大数据助理工程师认证(ACA)试题
- 1Graph最早是由Google提出的分布式数据处理模型。
- 2关于可视化图表——柱图,以下说法错误的是?
- 3关于MaxCompute,-个用户多个项目空间,通过权限可以多个项目空间中的可以相互访问。
- 4ADS使用DUMP DATA导出数据时,以限制导出行数为1000为例(LIMIT 1000),()说法是正确的。
- 5某BI系统构建在大数据计算服务上,某数据分析员在分析订单的地域分布时,需要把订单表order(占用存储空间约10G)与地狱维表region(占用存储空间100M)关联起来,两张表的结构如下:create table order( order_id string, region_id string, order amt bigint); create table region(region_id string, region_name string)在运行时发现由于订单大量集中在上海地区,数据的倾斜导致整体运行时间较长,运行的SQL语句如下:select region_name, sum(order_amt)amt from order t1 join region t2 on t1.region_id=t2.region_id;此时可以考虑通过()优化SQL的运行效率。
- 6在分析型数据库 AnalyticDB中创建表时可以指定一列或是多列作为聚集列这样如果用户的查询条件中指定聚集列的内容或是范围查询效率就会有较大提高因此应该尽可能多的使用聚集列。