DistSQL 深度解析：打造动态化的分布式数据库

一、背景

自 ShardingSphere 5.0.0 版本发布以来，DistSQL 为 ShardingSphere 生态带来了强大的动态管理能力，通过 DistSQL，用户可以：

在线创建逻辑库；
动态配置规则（包括分片、数据加密、读写分离、数据库发现、影子库、全局规则等）；
实时调整存储资源；
即时切换事务类型；
随时开关 SQL 日志；
预览 SQL 路由结果；
...
同时，随着使用场景的深入，越来越多的 DistSQL 特性被发掘出来，众多宝藏语法也受到了用户的喜爱。
二、内容提要
本文将以数据分片为例，深度解析 Sharding 相关 DistSQL 的应用场景和使用技巧。同时，通过实践案例将一系列 DistSQL 语句进行串联，为读者展现一套完整实用的 DistSQL 分片管理方案。

本文案例中将用到以下 DistSQL：
在这里插入图片描述

三、实战演练

3.1 场景需求

创建两张分片表 t_order 和 t_order_item；
两张表均以 user_id 字段分库，以 order_id 字段分表；
分片数量为 2 库 x 3 表；

如图：

Alt

3.2 环境准备

准备可供访问的 MySQL 数据库实例，创建两个新库 demo_ds_0、demo_ds_1；
以 MySQL 为例，也可使用 PostgreSQL 或 openGauss 数据库。
部署 Apache ShardingSphere-Proxy 5.1.2 和 Apache ZooKeeper，其中 ZooKeeper 将作为治理中心，存储 ShardingSphere 元数据信息；
配置 Proxy conf 目录下的 server.yaml，内容如下；

mode:
type: Cluster
  repository:
    type: ZooKeeper
    props:
      namespace: governance_ds
      server-lists: localhost:2181  # ZooKeeper 地址
      retryIntervalMilliseconds: 500
      timeToLiveSeconds: 60
      maxRetries: 3
      operationTimeoutMilliseconds: 500
  overwrite: false

rules:
  - !AUTHORITY
    users:
      - root@%:root

启动 ShardingSphere-Proxy，并使用客户端连接到 Proxy，例如

mysql -h 127.0.0.1 -P 3307 -u root -p

3.3 添加存储资源

创建逻辑数据库

CREATE DATABASE sharding_db;USE sharding_db;

添加存储资源，对应之前准备的 MySQL 数据库

ADD RESOURCE ds_0 (
HOST=127.0.0.1,
 PORT=3306,
 DB=demo_ds_0,
 USER=root,
 PASSWORD=123456
), ds_1(
 HOST=127.0.0.1,
 PORT=3306,
 DB=demo_ds_1,
 USER=root,
 PASSWORD=123456
);

查看存储资源

mysql> SHOW DATABASE RESOURCES\\G;
*************************** 1. row ***************************
                        name: ds_1
                        type: MySQL
                        host: 127.0.0.1
                        port: 3306
                          db: demo_ds_1
                         -- 省略部分属性
*************************** 2. row ***************************
                        name: ds_0
                        type: MySQL
                        host: 127.0.0.1
                        port: 3306
                          db: demo_ds_0
                         -- 省略部分属性

查询语句加了 \G 是为了让输出格式更易读，非必需。

3.4 创建分片规则

ShardingSphere 分片规则支持“常规分片”和“自动分片”两种配置方式，它们的分片效果是等价的，区别在于“自动分片”的配置定义更加简洁，而“常规分片”配置方式更加灵活自主。
还不了解“自动分片”的同学可以参考：

《DistSQL：像数据库一样使用 Apache ShardingSphere》

《分片利器 AutoTable：为用户带来「管家式」分片配置体验》

接下来，我们将采用“常规分片”的方式，使用 INLINE 表达式算法实现需求描述的分片场景。

3.4.1 主键生成器

创建主键生成器

CREATE SHARDING KEY GENERATOR snowflake\_key\_generator \(
TYPE(NAME=SNOWFLAKE)
);

查询主键生成器

mysql> SHOW SHARDING KEY GENERATORS;
+-------------------------+-----------+-------+
| name                    | type      | props |
+-------------------------+-----------+-------+
| snowflake_key_generator | snowflake | {}    |
+-------------------------+-----------+-------+
 1 row in set (0.01 sec)

3.4.2 分片算法

创建一个分库算法，由 t_order 和 t_order_item 共用

-- 分库时按 user_id 对 2 取模
CREATE SHARDING ALGORITHM database_inline (
TYPE(NAME=INLINE,PROPERTIES("algorithm-expression"="ds_${user_id % 2}"))
);

为 t_order 和 t_order_item 创建不同的分表算法

-- 分表时按 order_id 对 3 取模
CREATE SHARDING ALGORITHM t_order_inline (
TYPE(NAME=INLINE,PROPERTIES("algorithm-expression"="t_order_${order_id % 3}"))
);
CREATE SHARDING ALGORITHM t_order_item_inline (
TYPE(NAME=INLINE,PROPERTIES("algorithm-expression"="t_order_item_${order_id % 3}"))
);

查询分片算法

mysql> SHOW SHARDING ALGORITHMS;
+---------------------+--------+---------------------------------------------------+
| name                | type   | props                                             |
+---------------------+--------+---------------------------------------------------+
| database_inline     | inline | algorithm-expression=ds_${user_id % 2}            |
| t_order_inline      | inline | algorithm-expression=t_order_${order_id % 3}      |
| t_order_item_inline | inline | algorithm-expression=t_order_item_${order_id % 3} |
+---------------------+--------+---------------------------------------------------+
 3 rows in set (0.00 sec)

3.4.3 默认分片策略

分片策略由分片键和分片算法组成，其概念可参考《分片策略》

分片策略包含分库策略（databaseStrategy）和分表策略（tableStrategy）。
由于 t_order 和 t_order_item 的分库字段和分库算法相同，我们创建一个默认策略，未配置分库策略的分片表都使用它：

创建默认分库策略

CREATE DEFAULT SHARDING DATABASE STRATEGY (
TYPE=STANDARD,SHARDING_COLUMN=user_id,SHARDING_ALGORITHM=database_inline
);

查询默认策略

mysql> SHOW DEFAULT SHARDING STRATEGY\G;
*************************** 1. row ***************************
                 name: TABLE
                 type: NONE
      sharding_column:
 sharding_algorithm_name:
 sharding_algorithm_type:
sharding_algorithm_props:
*************************** 2. row ***************************
                 name: DATABASE
                 type: STANDARD
      sharding_column: user_id
 sharding_algorithm_name: database_inline
 sharding_algorithm_type: inline
sharding_algorithm_props: {algorithm-expression=ds_${user_id % 2}}
 2 rows in set (0.00 sec)

未配置默认分表策略，因此 TABLE 类型的默认策略是 NONE。

3.4.4 分片规则

主键生成器和分片算法都已就绪，现在开始创建分片规则：

t_order

CREATE SHARDING TABLE RULE t_order (
DATANODES("ds_${0..1}.t_order_${0..2}"),
TABLE_STRATEGY(TYPE=STANDARD,SHARDING_COLUMN=order_id,SHARDING_ALGORITHM=t_order_inline),
KEY_GENERATE_STRATEGY(COLUMN=order_id,KEY_GENERATOR=snowflake_key_generator)
);

DATANODES 指定了分片表的数据节点；
TABLE_STRATEGY 指定了分表策略，其中 SHARDING_ALGORITHM 使用了已创建好的分片算法 t_order_inline；
KEY_GENERATE_STRATEGY 指定该表的主键生成策略，若不需要主键生成，可省略该配置。

t_order_item

CREATE SHARDING TABLE RULE t_order_item (
DATANODES("ds_${0..1}.t_order_item_${0..2}"),
TABLE_STRATEGY(TYPE=STANDARD,SHARDING_COLUMN=order_id,SHARDING_ALGORITHM=t_order_item_inline),
KEY_GENERATE_STRATEGY(COLUMN=order_item_id,KEY_GENERATOR=snowflake_key_generator)
);

查询分片规则

mysql> SHOW SHARDING TABLE RULES\G;
*************************** 1. row ***************************
                         table: t_order
             actual_data_nodes: ds_${0..1}.t_order_${0..2}
           actual_data_sources:
        database_strategy_type: STANDARD
      database_sharding_column: user_id
 database_sharding_algorithm_type: inline
database_sharding_algorithm_props: algorithm-expression=ds_${user_id % 2}
           table_strategy_type: STANDARD
         table_sharding_column: order_id
 table_sharding_algorithm_type: inline
table_sharding_algorithm_props: algorithm-expression=t_order_${order_id % 3}
           key_generate_column: order_id
            key_generator_type: snowflake
           key_generator_props:
*************************** 2. row ***************************
                         table: t_order_item
             actual_data_nodes: ds_${0..1}.t_order_item_${0..2}
           actual_data_sources:
        database_strategy_type: STANDARD
      database_sharding_column: user_id
 database_sharding_algorithm_type: inline
database_sharding_algorithm_props: algorithm-expression=ds_${user_id % 2}
           table_strategy_type: STANDARD
         table_sharding_column: order_id
 table_sharding_algorithm_type: inline
table_sharding_algorithm_props: algorithm-expression=t_order_item_${order_id % 3}
           key_generate_column: order_item_id
            key_generator_type: snowflake
           key_generator_props:
 2 rows in set (0.00 sec)

💡至此，t_order 和 t_order_item 的分片规则已配置完成。什么？有点复杂？
好吧，其实也可以忽略单独创建主键生成器、分片算法、默认策略的步骤，一步完成分片规则，让我们来加点糖。

3.5 语法糖

现在，需求中要增加一张分片表 t_order_detail，我们可以这样一步完成分片规则的创建：

CREATE SHARDING TABLE RULE t_order_detail (
DATANODES("ds_${0..1}.t_order_detail_${0..1}"),
DATABASE_STRATEGY(TYPE=STANDARD,SHARDING_COLUMN=user_id,SHARDING_ALGORITHM(TYPE(NAME=INLINE,PROPERTIES("algorithm-expression"="ds_${user_id % 2}")))),
TABLE_STRATEGY(TYPE=STANDARD,SHARDING_COLUMN=order_id,SHARDING_ALGORITHM(TYPE(NAME=INLINE,PROPERTIES("algorithm-expression"="t_order_detail_${order_id % 3}")))),
KEY_GENERATE_STRATEGY(COLUMN=detail_id,TYPE(NAME=snowflake))
);

说明：

上述语句中指定了分库策略、分表策略、主键生成策略，但都没有引用已经存在的算法，因此 DistSQL 引擎会自动用输入的表达式创建相应的算法，供 t_order_detail 分片规则使用。
此时我们再来查看主键生成器、分片算法和分片规则，结果如下：

主键生成器

mysql> SHOW SHARDING KEY GENERATORS;
+--------------------------+-----------+-------+
| name                     | type      | props |
+--------------------------+-----------+-------+
| snowflake_key_generator  | snowflake | {}    |
| t_order_detail_snowflake | snowflake | {}    |
+--------------------------+-----------+-------+
 2 rows in set (0.00 sec)

分片算法

mysql> SHOW SHARDING ALGORITHMS;
+--------------------------------+--------+-----------------------------------------------------+
| name                           | type   | props                                               |
+--------------------------------+--------+-----------------------------------------------------+
| database_inline                | inline | algorithm-expression=ds_${user_id % 2}              |
| t_order_inline                 | inline | algorithm-expression=t_order_${order_id % 3}        |
| t_order_item_inline            | inline | algorithm-expression=t_order_item_${order_id % 3}   |
| t_order_detail_database_inline | inline | algorithm-expression=ds_${user_id % 2}              |
| t_order_detail_table_inline    | inline | algorithm-expression=t_order_detail_${order_id % 3} |
+--------------------------------+--------+-----------------------------------------------------+
 5 rows in set (0.00 sec)

分片规则

mysql> SHOW SHARDING TABLE RULES\G;
*************************** 1. row ***************************
                         table: t_order
             actual_data_nodes: ds_${0..1}.t_order_${0..2}
           actual_data_sources:
        database_strategy_type: STANDARD
      database_sharding_column: user_id
 database_sharding_algorithm_type: inline
database_sharding_algorithm_props: algorithm-expression=ds_${user_id % 2}
           table_strategy_type: STANDARD
         table_sharding_column: order_id
 table_sharding_algorithm_type: inline
table_sharding_algorithm_props: algorithm-expression=t_order_${order_id % 3}
           key_generate_column: order_id
            key_generator_type: snowflake
           key_generator_props:
*************************** 2. row ***************************
                         table: t_order_item
             actual_data_nodes: ds_${0..1}.t_order_item_${0..2}
           actual_data_sources:
        database_strategy_type: STANDARD
      database_sharding_column: user_id
 database_sharding_algorithm_type: inline
database_sharding_algorithm_props: algorithm-expression=ds_${user_id % 2}
           table_strategy_type: STANDARD
         table_sharding_column: order_id
 table_sharding_algorithm_type: inline
table_sharding_algorithm_props: algorithm-expression=t_order_item_${order_id % 3}
           key_generate_column: order_item_id
            key_generator_type: snowflake
           key_generator_props:
*************************** 3. row ***************************
                         table: t_order_detail
             actual_data_nodes: ds_${0..1}.t_order_detail_${0..1}
           actual_data_sources:
        database_strategy_type: STANDARD
      database_sharding_column: user_id
 database_sharding_algorithm_type: inline
database_sharding_algorithm_props: algorithm-expression=ds_${user_id % 2}
           table_strategy_type: STANDARD
         table_sharding_column: order_id
 table_sharding_algorithm_type: inline
table_sharding_algorithm_props: algorithm-expression=t_order_detail_${order_id % 3}
           key_generate_column: detail_id
            key_generator_type: snowflake
           key_generator_props:
 3 rows in set (0.01 sec)

说明：
CREATE SHARDING TABLE RULE 语句中，DATABASE_STRATEGY、TABLE_STRATEGY 和 KEY_GENERATE_STRATEGY 均可以引用已有算法，达到复用的目的，也可以通过语法糖快速定义，差异是会创建额外的算法对象。用户可根据场景灵活搭配使用。