登录  注册

首页->阿里云认证

多选题 :  在淘宝商家中,某些大型店铺的浏览PV远远超过一般店铺的PV,当浏览日志数据表和商铺维表进行join关联时,会按照商铺ID进行分发,导致某个Instance处理的数据量远远超过其他Instance,造成整个任务因为这个长尾的Instance无法结束,针对上述问题可行的优化方案包括____.

(A)如果日志数据表包含大量的空值,直接将空值删除,然后使用MAP JOIN

(B)对商铺维表进行缓存,使用MAP JOIN提高性能

(C)如果两张表都比较大,直接采用笛卡尔积运算

(D)日志数据表数据用热点Key切分成热点数据和非热点数据两部分分别处理,最后合并

参考答案
继续答题:下一题
微考学堂微考学社

更多阿里云认证试题

考试