在FusionInsight集群中,Spark主要与以下哪些组件进行交互?()
A.HDFS
B.YARN
C.Hive
D.ZooKeeper
A.HDFS
B.YARN
C.Hive
D.ZooKeeper
第2题
B.支持复制和数列两种数据分布策略
C.复制是指将表中的所有数据复制到集群的每一个DN实例上,主要是用于记录较小的表
D.散列是指将表中的所有数据复制到集群的每一个DN实例上,主要是用于记录较小的表
第4题
A.cm_server:负责集群状态管理、故障仲裁
B.gs_gtm:生成和维护全局事务ID、事务快照、时间戳等全局唯一的信息。
C.gaussdb:接受客户或应用连接,分解调度SQL在各DN上执行,返回执行结果,多个CN对等,采用主备进程以保障可靠性
D.cm_agent:负责节点实例状态监控
第5题
A."us" 表示用户空间占用CPU百分比
B."sy" 表示内核空间占用CPU百分比
C."id" 表示进程ID
D."%MEM" 表示进程占用的内存百分比
第6题
A.audit_database_progress
B.audit_login_logout
C.audit_user_locked
D.audit_dmlstate_select
第9题
A.用户口令复杂度检验参数
B.用户登录失败多少次后锁定
C.用户口令中最少小写字母个数和用户本次登录数据库时间长才长短
D.用户口令过期提醒时间
第10题
A.尽量选择distinct值比较多的列,保证数据均匀分布
B.分布均匀是为了避免数据节点之间数据流动,提高性能
C.尽量选择join或者group列做分布列
D.选择join列或者group列是为了避免木桶效应,各个主机对等执行