更多2023中级大数据分析师试题
- 1Spark是一种快速、分布式、可扩展、容错的集群计算框架。
- 2RDD中的获得当前rdd中元素数据的操作为count()。
- 3关于Hive中parse_url函数能够解析的信息包括()。
- 4val rdd1 = sc.parallelize(List(1,2,3))val rdd2 = sc.parallelize(List(1,2,4))val rdd3 = rdd1.union(rdd2)上述语句执行以后,rdd3的元素是()。
- 5在MapReduce编程中,Mapper类中的map函数的第一个参数是()。
- 6()在HDFS上进行文件写入时,Namenode根据文件大小和配置情况,返回部分Datanode信息;并负责将文件划分为多个Block,根据Datanode的地址信息,按顺序写入到每一个Datanode块。