某数据仓库,从各个业务系统采集数据,因业务系统不同,所以保存数据的样式也不同,比如性别字段,有的业务系统保存的是:男、女,有的业务系统保存但是:man、female,有的业务系统保存的是:1、0,现需要将性别字段信息统一调整为:1、0的格式,这种情况主要是在处理哪种数据质量问题?
(A)一致性
(B)及时性
(C)准确性
(D)唯一性
参考答案
继续答题:下一题
更多阿里云大数据助理工程师认证(ACA)试题
- 1在阿里云MaxCompute中,可以在插入数据之前为一张非分区表添加分区,并插入数据。
- 2MP( Massive parallel processing,大规模并行处理)由多个松耦合处理单元组成每个单元拥有自己的CPU内存存储等每个单元内都有操作系统和管理数据库的实例副本,最大的特点在于不共享资源
- 3Maxcompute通过eclipse plugin提供了MR的编程框架,开发时通常需要添加以下()类。
- 4大数据计算服务(MaxCompute,原ODPS )中的日志表log是一张分区表,分区键是dt,每天产生一个分区用于存储当天新增的数据,现在共有dt=’20160101’至dt=’20160131’共31个分区的数据,为了删除20160101当天新增的数据,可以通过()方式实现。
- 5Maxcompute表T中某列C的数据类型为bigint,需要修改为double,以下()方式可以实现。
- 6大数据计算服务表fact_sale_detail的建表语句如下:create table fact_sale_detail(sale_date datetime, region string, amt decimal) partitioned by (dt string); 包括dt=’20160229’, dt=’20160301’, dt=’20160302’, dt=’20160303’共四天的数据,每个分区中只包含当天的销售数据。Udf_substr为自定义的数据(UDF),功能和substr相同但是性能更好。现在想要统计3月份的按天销售汇总金额,以下()方式经过分区剪裁后只需要付3个分区的数据久可以完成计算。