分库分表 - 分表分库 - 个人文章

分表分库（Sharding）是一种常用于处理大量数据的技术手段，它的目的是通过将数据水平切分成多个小的部分来提高数据库的性能、可扩展性和可维护性。简单来说，分表分库就是将数据按某种规则分散存储在多个表或者数据库中。

当单一的数据库变得庞大并且承载了大量的数据时，可能会面临以下问题：

为了应对这些问题，分表分库技术应运而生。

分表是将一个大的数据表拆分成多个小的数据表。每个表的数据只包含原始表的一部分。

水平分表（Horizontal Sharding）：
- 将数据按照某种规则（如 ID、时间、地理位置等）分割成多个子表，每个子表存储数据的一个子集。
- 例子：假设一个订单表的 ID 从 1 到 1000，我们可以将这些数据分布到多个子表中，表 A 存储 ID 1-500，表 B 存储 ID 501-1000。
垂直分表（Vertical Sharding）：
- 将表按字段拆分，把不同的列存储在不同的表中。每个表存储一部分列而不是一部分行。
- 例子：用户表（users）包含很多字段，可以把用户的基本信息（如名字、邮箱）存储在表 A，把用户的详细信息（如个人资料、偏好设置）存储在表 B。

分库是将数据分散存储到不同的数据库实例中。每个数据库实例存储一部分数据。

按照业务分库：
- 不同的业务模块或者业务领域使用不同的数据库来存储数据。
- 例子：一个电商平台可能将用户信息存储在 user_db 数据库中，订单信息存储在 order_db 数据库中。
按照数据范围分库：
- 将数据按范围分割，不同的数据范围存储在不同的数据库中。
- 例子：一个系统将 ID 为 1-1000 的数据存储在 db1 数据库中，ID 为 1001-2000 的数据存储在 db2 数据库中，依此类推。

在实际的分布式系统中，分表和分库往往是一起使用的，即 分表分库。分表主要是降低单个表的数据量，而分库主要是分散负载到不同的数据库实例。

例如，在一个大型的电商系统中：

分表分库是通过将数据水平和/或垂直划分到不同的表和数据库中来提升系统的性能和扩展性。分表分库可以有效地解决大数据量、高并发带来的数据库性能瓶颈，并提高系统的可扩展性和容错能力，但也带来了查询复杂度、数据一致性等方面的挑战。因此，合理设计分表分库策略对于系统的稳定性和可维护性至关重要。

分表分库