表格内为GBase8a数据库的术语,方便理解与交流。

术语

介绍

镜像

是指两个集群结构(分片数量,节点数量,分布情况)完全相同

分布情况

是指两个集群的相同分片的hash值一致;简单可以理解为同样的数据,在两个集群上导入会落到同样的分片上

一组可用分片

指一个表在集群上的各个分片(例如:n1、n2、n3、n4)都存在一个状态正常的分片(可以使用SHOW DATACOPYMAP vcname.dbname.tablename查看表分片及其状态)

主集群

同步的源端集群,可以理解为正在使用,需要备份的集群

备集群

同步的目的端集群,可以理解为作为镜像备份的集群

主分片

表的主分片仅存在于分布表(随机分布表和哈希分布表)。在集群中的每个节点上都会存在表的主分片,表的主分片为表名_dpname取值(dpname就是执行gcadmin后,dpname列的显示的取值,目前dpname都是以n1、n2、……的顺序显示)。例如:n1->node1,n2->node2,n3->node3,n4->node4,集群运行任务时优先选择主分片

备分片

主分片的备份分片,用于备份主分片的数据,存放于和主分片不同的节点上

备份周期

一个备份周期包括一次全量备份和这次全量备份基础上的所有增量备份

备份点

一个备份周期中的各个增量备份称为这个备份周期中的备份点

DC(Data Cell)

数据单元,列存数据落盘时一列数据中65536个数据打包压缩成一个DC,集群从磁盘读取数据和处理数据的单元。

临时表

创建表时使用TEMPORARY关键字,这样创建的表为临时表,临时表仅存在于当前session中。

预租磁盘

预租磁盘空间可以预先批量分配磁盘块,这样尽量保证了列的DC数据文件在磁盘块上存储连续。在顺序读取列DC数据时,性能会有明显提升。

静态哈希分布

是指在使用CREATE TABLE时,明确使用DISTRIBUTED BY(col_name)指定哈希列,那么,表中的数据就会按照这个定义的哈希列进行哈希分布存储,这种方式就叫做静态哈希分布。

动态哈希分布

一般出现在多表JOIN ON查询时的情况。例如表a和表b,创建表a时,使用DISTRIBUTED BY('hash_col')定义了哈希列,表b没有指定哈希列,在表a和表b进行JOIN ON查询时,例如,“SELECT a.* FROM a JOIN b ON a.hash_col= b.col;”,在这条SQL语句中,表a和表b进行了JOIN后的等值查询a.hash_col= b.col,虽然a.hash_col是哈希列,b.col不是哈希列,但是此时会对b.col列进行动态哈希列的计算,然后再进行等值比较。

kafka topic

一个消息队列,消息根据topic进行归类,集群中一个topic对应一个表

kafka broker

一个Kafka实例称为一个broker,kafka集群由多个broker组成


GBase数据库
1 声望2 粉丝

GBase数据库知识分享