多选题 : MapReduce最早是由Google提出的分布式数据处理模型,随后受到了业内的广泛关注,并被大量应用到各种商业场景中。以下场景中,()适合用MapReduce来实现。
(A)交互式查询:基于海量数据的透视分析,用户可以通过上卷、下钻、切片等交互操作,了解数据集细节
(B)机器学习:监督学习、无监督学习、分类算法如决策树、SVM等
(C)文本统计分析:比如词频TFIDF分析;学术论文、专利文献的引用分析和统计;维基百科数据分析等
(D)Web访问日志分析;分析和挖掘用户在web上的访问、购物行为特征,分析用户访问行为
参考答案
继续答题:下一题
更多阿里云大数据助理工程师认证(ACA)试题
- 1大数据计算服务(MaxCompute,原ODPS )中的日志表log是一张分区表,分区键是dt,每天产生一个分区用于存储当天新增的数据,现在共有dt=’20160101’至dt=’20160131’共31个分区的数据,为了删除20160101当天新增的数据,可以通过()方式实现。
- 2随机获取一条记录,以下哪个语句是正确的?
- 3在project中已经开启了 label security(列级别授权)的前提下,用户申请了一张表tbl 的读权限,后来管理员将该表中的字段x的安全等级设置为了 4,且用户的安全级别为1, 用户能否读该表中的数据()。
- 4在MaxCompute中,所有的请求都会被转化为任务(Task)。
- 5大数据计算服务(MaxCompute,原ODPS )提供了完整的丰富的安全策略和授权策略,来保护我们的数据,在想下载数据到本地的时候,除了要有相应的权限之外,还要选择合适的下载方式。现在大数据计算服务的某表中有1000万行数据,需要把这些数据全部导出到本地。下面()是可行的方法。
- 6MaxCompute Graph支持以下()编辑操作。