更多华为HCIP大数据试题
- 1在 MapReduce 的应用程序开发中,下列哪个 Java 类负责管理和运行一个计算任务?
- 2FusionInsight HD 的 Hive 中,用户自定义的 UDF 可以和 Hive 内置的 UDF 重名,这种情况下,将使用用户自定义的 UDF。
- 3向 HBase 集群中增加 RegionServer 主机时,必须先停止原集群,原因是HBase 不支持动态扩容。
- 4Spark Streaming 可以从 Kafka 接收数据并进行计算,计算结果只能存入 HDFS,不能再写回 Kafka。
- 5HBase 表的 rowkey 设计是一个很重要的开发设计环节。假设存在如下场景,最频繁的查询场景是基于手机号查询每个月、每半年的历史通话记录, 以下哪个 rowkey 设计是最优的?