多选题 : MapReduce最早是由Google提出的分布式数据处理模型,随后受到了业内的广泛关注,并被大量应用到各种商业场景中。以下场景中,()适合用MapReduce来实现。
(A)交互式查询:基于海量数据的透视分析,用户可以通过上卷、下钻、切片等交互操作,了解数据集细节
(B)机器学习:监督学习、无监督学习、分类算法如决策树、SVM等
(C)文本统计分析:比如词频TFIDF分析;学术论文、专利文献的引用分析和统计;维基百科数据分析等
(D)Web访问日志分析;分析和挖掘用户在web上的访问、购物行为特征,分析用户访问行为
参考答案
继续答题:下一题
![微考学堂](/images/gzh.png)
![微考学社](/images/xcx.png)
更多阿里云大数据助理工程师认证(ACA)试题
- 1ADS中两个普通表关联,对于join key,()说法是不正确的。
- 2DataWorks中可以配置任务调度的时间粒度目前支持等时间粒度的调度。( )
- 3资源(Resource)是大数据计算服务(MaxCompute,原ODPS)的特有概念。用户如果想使用MaxCompute的MapReduce或自定义函数(UDF)功能,需要依赖资源来完成。Dataworks中,可以通过数据开发面板的资源管理上传资源,目前支持的资源类型有:()。
- 4阿里云流计算目前可以支持SQL和MapReduce。
- 5大数据计算服务(MaxCompute,原ODPS )SQL中支持join、left join、right join、full join等,对于连接条件描述正确的有:()。
- 6Maxcompute通过eclipse plugin提供了MR的编程框架,开发时通常需要添加以下()类。