更多Hadoop试题
- 1MapReduce框架对多个Map Task的输出,按照不同的分区,通过网络Copy到不同的Reduce节点,这个过程称作Shuffle
- 2MapReduce批处理模型是先将数据存储于文件系统或数据库,然后对存储系统中的静态数据进行处理运算,这一步骤并不是实时在线的,因此又被称为离线批处理模式。()
- 3Hadoop3.x中,一个2G的文件,会产生多少个map任务?
- 4对Client/Server系统而言,()的吞吐率是指服务器在单位时间内对所有的客户端完成的任务数。
- 5下面哪个是分布式数据库()
- 6Secondary NameNode是NameNode的备份,可以有效解决Hadoop集群单点故障问题