更多阿里云大数据助理工程师认证(ACA)试题
- 1某BI系统构建在大数据计算服务上,某数据分析员在分析订单的地域分布时,需要把订单表order(占用存储空间约10G)与地狱维表region(占用存储空间100M)关联起来,两张表的结构如下:create table order( order_id string, region_id string, order amt bigint); create table region(region_id string, region_name string)在运行时发现由于订单大量集中在上海地区,数据的倾斜导致整体运行时间较长,运行的SQL语句如下:select region_name, sum(order_amt)amt from order t1 join region t2 on t1.region_id=t2.region_id;此时可以考虑通过()优化SQL的运行效率。
- 2Maxcompute SQL支持的Join操作类型包括:()。
- 3某企业准备上线一个项目,去搜集国内主要门户、论坛中和本公司相关的消息,一旦有符合预定义类型的消息出现,将第一时间反馈给公司的公共关系部,该场景属于典型的()。
- 4ADS一个普通表组最多可以包含:()个表。
- 5数据仓库某个库表中的一个cust_id字段表明是一个客户,但发现这个表里存在多个一样的cust_id值,这种情况违反了哪种数据质量管理要求?
- 6检索借阅了《精通SQL语言》一书的借书证号。