Hadoop生态系统中,()的主要设计目的是在Hadoop与传统数据库之间进行数据的ETL操作。
A.HDFS
B.Flume
C.Hive
D.Sqoop
A.HDFS
B.Flume
C.Hive
D.Sqoop
第5题
A.HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件
B.HBase是针对谷歌BigTable的开源实现
C.HBase多用于存储非结构化和半结构化的松散数据
D.HBase是一种关系型数据库,现成功应用于互联网服务领域
第6题
A.hdfsdfs-13[文件目录]
B.hdfsdfs-du[文件目录]
C.hdfsdfs-13-R[文件目录]
D.hafsdfs-du-R[文件目录]
第7题
A.Hadoop是一个由Apache基金会开发的分布式系统开源架构
B.Hadoop的初始设计思想来源于Google发布的学术论文
C.Hadoop在当前衍生的一系列优秀的开源项目,包括Hbase,Hive等
D.Hadoop的两个核心部分是HDFS和MapReduce计算框架
第8题
A.TextInputFormat
B.KeyValueInputFormat
C.SequenceFileInputFormat
D.以上都不对
第9题
A.Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文本映射为一张数据库表,并提供简单的SQL查询功能
B.Hive可以直接使用SQL语句进行相关操作
C.Hive能够在大规模数据集上实现低延迟快速的查询
D.Hivez在加载数据过程中不会对数据进行任何的修改,只是将数据移动到HDFS中Hive设定的目录下
第10题
A.oracle
B.Mysql
C.hive
D.hadoop
第11题
A.负责执行由JobTracker指派的任务
B.协调数据计算任务
C.负责协调集群中的数据存储
D.存储被拆分的数据块