多选题 : 在大数据计算服务SQL中使用distribute by和sort by可以对数据进行局部排序,以下对distribute by、sort by的用法描述正确的有:()。
(A)数据会按照distribute by指定的列进行分片,hash值相同的数据会在一个分片中
(B)使用sort by子句时,必须有distribute by子句
(C)sort by和order by的用法没有区别
(D)在一个分片中,数据会按照sort by指定的列进行局部排序
参考答案
继续答题:下一题
更多阿里云大数据助理工程师认证(ACA)试题
- 1在大数据开发套件DataWorks中运行任务实例时,需要设置“业务日期’该日期是指实例运行时的日期 ()
- 2以下Maxcompute SQL中语法错误的是:()。
- 3大数据计算服务(MaxCompute,原ODPS )中的用户表dim_user是一张非分区表,另外有一部分新增用户的数据存在user_delta表中,两张表的结构相同,为了在dim_user表中得到全量的用户数据,可以采用()方式。
- 4任务调度时间为2017-10-2701:00:00,那么bdp.system.cyctim的结果为 20171027010000。
- 5阿里云流计算目前可以支持SQL和MapReduce。
- 6大型会员制连锁超市S使用OTS来存储消费记录表,里面包含了客户的vip卡号、订单标识,超市分店标识,商品标识,购买时间等,业务逻辑遵循以下规则:每个vip卡号对应一个客户,同时一个客户职能拥有一个vip卡号;该连锁超市的不同分店都拥有唯一的分店标识;订单标识按照时间顺序产生;为了让数据分布和访问了的分布尽可能均匀,一下备注主键中()最合适。