今天分享的是训练营的朋友在某讯外包的面经,他在面完后跟我说:数据一致性策略好久没问,有点忘了,所以这一块答的不太好
。
我一直都会和大家强调复习的重要性,尤其是这种常见的问题。看看下面的问题你都能答得上来吗?
基础部分 - MYSQL和Redis
一、MySQL索引分类
普通索引(INDEX)
- 这是最基本的索引类型,它没有任何限制。它可以创建在任何数据类型的列上,主要目的是加快对数据的查询速度。例如,在一个存储用户信息的表中,对用户的姓名列创建普通索引。如果经常需要根据姓名来查找用户记录,这个索引就能提高查询效率。语法为
CREATE INDEX index_name ON table_name (column_name);
。
- 这是最基本的索引类型,它没有任何限制。它可以创建在任何数据类型的列上,主要目的是加快对数据的查询速度。例如,在一个存储用户信息的表中,对用户的姓名列创建普通索引。如果经常需要根据姓名来查找用户记录,这个索引就能提高查询效率。语法为
唯一索引(UNIQUE)
- 唯一索引要求索引列的值必须是唯一的,但是允许有空值。它主要用于保证数据的唯一性,同时也能提高查询性能。比如在用户表中的手机号码列,因为每个用户的手机号码应该是唯一的,就可以创建唯一索引。语法是
CREATE UNIQUE INDEX index_name ON table_name (column_name);
。
- 唯一索引要求索引列的值必须是唯一的,但是允许有空值。它主要用于保证数据的唯一性,同时也能提高查询性能。比如在用户表中的手机号码列,因为每个用户的手机号码应该是唯一的,就可以创建唯一索引。语法是
主键索引(PRIMARY KEY)
- 主键索引是一种特殊的唯一索引,它要求列的值不能为空且唯一。一个表只能有一个主键,它用于唯一标识表中的每一行记录。例如在订单表中,订单编号通常作为主键索引,因为每个订单编号唯一且不能为空。在创建表时可以直接指定主键,如
CREATE TABLE orders (order_id INT PRIMARY KEY,...);
。
- 主键索引是一种特殊的唯一索引,它要求列的值不能为空且唯一。一个表只能有一个主键,它用于唯一标识表中的每一行记录。例如在订单表中,订单编号通常作为主键索引,因为每个订单编号唯一且不能为空。在创建表时可以直接指定主键,如
组合索引(INDEX)
- 组合索引是基于多个列创建的索引。例如,在一个员工表中,经常需要根据部门和职位来查询员工信息,就可以创建一个包含部门和职位两个列的组合索引。语法为
CREATE INDEX index_name ON table_name (column1, column2);
。在使用组合索引时,要注意遵循最左前缀原则,即查询条件中必须包含组合索引的最左边的列,才能有效利用组合索引。
- 组合索引是基于多个列创建的索引。例如,在一个员工表中,经常需要根据部门和职位来查询员工信息,就可以创建一个包含部门和职位两个列的组合索引。语法为
二、聚簇与非聚簇的区别
聚簇索引(Clustered Index)
- 数据存储方式:在聚簇索引中,数据行的物理存储顺序与索引的顺序相同。也就是说,索引叶子节点直接包含了数据行。例如在InnoDB存储引擎中,主键索引就是聚簇索引。如果主键是一个自增的整数,那么数据会按照主键值的大小顺序物理存储在磁盘上。
- 查询性能优势:对于基于主键的范围查询非常高效。因为数据在物理上是按照主键顺序存储的,当进行范围查询(如
WHERE primary_key BETWEEN value1 AND value2
)时,磁盘I/O相对连续,减少了随机I/O的次数,从而提高了查询效率。
非聚簇索引(Non - Clustered Index)
- 数据存储方式:非聚簇索引的索引结构和数据存储是分离的。索引叶子节点存储的是指向数据行的指针(在不同存储引擎中指针的形式可能不同)。例如在MyISAM存储引擎中,索引和数据是分开存储的,索引叶子节点存储的是数据行在数据文件中的地址。
- 查询性能特点:非聚簇索引在进行查询时,首先要通过索引找到数据行的指针,然后再根据指针去获取数据行。对于频繁修改数据的表,如果使用非聚簇索引,更新索引的成本相对较低,因为索引和数据是分开存储的,修改数据时不需要大量地调整索引结构。
三、在InnoDB与MyISAM中支持聚簇与非聚簇情况及形式
InnoDB
- 支持情况:InnoDB支持聚簇索引。它默认会以主键作为聚簇索引,如果没有定义主键,InnoDB会选择一个唯一非空索引作为聚簇索引,如果没有这样的索引,InnoDB会隐式定义一个6字节的ROWID作为聚簇索引。
- 形式特点:数据行存储在聚簇索引的叶子节点。非聚簇索引的叶子节点存储的是主键值,当通过非聚簇索引查询数据时,需要先通过非聚簇索引找到主键值,再通过主键值在聚簇索引中找到数据行,这就是所谓的“回表”操作。
MyISAM
- 支持情况:MyISAM不支持聚簇索引,它只支持非聚簇索引。
- 形式特点:数据和索引是分开存储的。索引叶子节点存储的是数据行在数据文件中的地址。当进行查询时,通过索引找到数据行的地址,再去数据文件中获取数据行。
四、索引失效场景
使用函数或表达式对索引列进行操作
- 例如,在一个存储用户年龄的列上有索引,但是查询语句是
SELECT * FROM users WHERE YEAR(birth_date) = 1990;
(假设birth_date
列有索引),这种情况下索引会失效。因为数据库在执行查询时,需要对每一行数据的birth_date
列应用YEAR
函数,而不是直接使用索引来匹配。
- 例如,在一个存储用户年龄的列上有索引,但是查询语句是
隐式类型转换
- 如果索引列是整数类型,而查询条件中传入的是字符串类型,数据库会进行隐式类型转换。例如,索引列
user_id
是INT
类型,查询语句是SELECT * FROM users WHERE user_id = '123';
,这种情况下可能会导致索引失效。
- 如果索引列是整数类型,而查询条件中传入的是字符串类型,数据库会进行隐式类型转换。例如,索引列
在索引列上进行计算
- 比如在一个价格列有索引,查询语句是
SELECT * FROM products WHERE price* 0.8 < 100;
,对索引列price
进行了乘法计算,这会导致索引失效。
- 比如在一个价格列有索引,查询语句是
使用
OR
连接条件,其中部分条件没有索引- 假设在
user_name
和user_email
列上有索引,查询语句是SELECT * FROM users WHERE user_name = 'John' OR user_age = 30;
(假设user_age
列没有索引),这种情况下索引可能会失效。不过在一些数据库版本中,对于这种情况会有优化,但还是要尽量避免这种写法。
- 假设在
LIKE
操作以通配符开头- 如果查询语句是
SELECT * FROM products WHERE product_name LIKE '%phone';
,索引会失效。因为数据库需要对每一行数据进行匹配,无法直接利用索引。但是如果是SELECT * FROM products WHERE product_name LIKE 'phone%';
,索引是可以使用的。
- 如果查询语句是
五、哪些查询操作会导致回表
非聚簇索引查询非索引列数据
- 当通过非聚簇索引查询数据时,如果查询的列不在非聚簇索引中,就需要回表。例如在InnoDB存储引擎中,有一个用户表,在用户姓名列上有非聚簇索引,查询语句是
SELECT user_id, user_age, user_name FROM users WHERE user_name = 'John';
,如果只在姓名列上有非聚簇索引,查询user_id
和user_age
列时就需要通过姓名列的非聚簇索引找到主键值,再通过主键值在聚簇索引(数据行存储位置)中获取user_id
和user_age
列的数据,这就是回表操作。
- 当通过非聚簇索引查询数据时,如果查询的列不在非聚簇索引中,就需要回表。例如在InnoDB存储引擎中,有一个用户表,在用户姓名列上有非聚簇索引,查询语句是
组合索引部分使用不符合最左前缀原则后的查询
- 假设有一个组合索引(
column1
,column2
,column3
),查询语句是SELECT * FROM table_name WHERE column2 = value2 AND column3 = value3;
,由于没有从组合索引的最左边列(column1
)开始查询,数据库可能会先通过索引找到部分匹配的行,然后再回表去检查这些行是否满足column2 = value2 AND column3 = value3
的条件。
- 假设有一个组合索引(
六、explain调优中的一些关键字段以及含义
id
- 含义:表示查询中每个SELECT子句的唯一标识符。如果是一个简单的查询,只有一个
SELECT
语句,id
通常为1。如果是复杂的查询,包含子查询或联合查询,id
可以用来区分不同的SELECT
语句。id
的值越大,表示该SELECT
语句越先执行。 - 示例:在一个包含子查询的查询语句中,如
SELECT * FROM table1 WHERE column1 IN (SELECT column2 FROM table2);
,子查询的id
可能为2,外层查询的id
为1。
- 含义:表示查询中每个SELECT子句的唯一标识符。如果是一个简单的查询,只有一个
select_type
- 含义:表示查询的类型。常见的类型有
SIMPLE
(简单查询,不包含子查询或联合查询)、SUBQUERY
(子查询)、DERIVED
(派生表查询,在FROM
子句中使用子查询的情况)等。 - 示例:对于查询
SELECT * FROM (SELECT column1 FROM table1) AS derived_table;
,select_type
对于外层查询是DERIVED
,对于内层子查询是SIMPLE
。
- 含义:表示查询的类型。常见的类型有
type
- 含义:表示MySQL在表中找到所需行的方式,从好到差依次为
system
(表只有一行记录,是const类型的特例)、const
(通过索引一次就找到了,用于主键或唯一索引查询)、eq_ref
(对于每个索引键,表中只有一条记录与之匹配)、ref
(使用非唯一索引进行查询,返回匹配某个单独值的所有行)、range
(只检索给定范围的行,如使用BETWEEN
、IN
等操作)、index
(全索引扫描)、ALL
(全表扫描)。 - 示例:如果查询
SELECT * FROM users WHERE user_id = 1;
(假设user_id
是主键),type
可能是const
;如果是SELECT * FROM products WHERE price BETWEEN 10 AND 20;
,type
可能是range
。
- 含义:表示MySQL在表中找到所需行的方式,从好到差依次为
possible_keys
- 含义:表示查询可能使用的索引。这些索引是根据查询条件和表结构分析出来的。
- 示例:在一个包含多个列索引的表中,如
CREATE TABLE table_name (column1 INT, column2 VARCHAR(100), INDEX(column1, column2));
,对于查询SELECT * FROM table_name WHERE column1 = 1 AND column2 = 'value';
,possible_keys
可能包含刚才创建的组合索引。
key
- 含义:表示MySQL实际使用的索引。如果
key
为NULL
,表示没有使用索引,可能是因为没有合适的索引或者索引失效等原因。 - 示例:在上面的例子中,如果MySQL确定使用了组合索引来执行查询,
key
的值就是创建的组合索引的名称。
- 含义:表示MySQL实际使用的索引。如果
key_len
- 含义:表示MySQL使用的索引的长度。这个长度可以用来判断索引的使用情况,特别是对于组合索引,可以知道实际使用了组合索引中的哪些列。
- 示例:对于一个组合索引(
column1
,column2
),如果column1
是INT
类型(4字节),column2
是VARCHAR(10)
类型(假设字符集是UTF8,每个字符最多3字节,加上长度字节共31字节左右),如果查询只用到了column1
,key_len
可能是4字节左右;如果用到了column1
和column2
,key_len
可能是35字节左右。
rows
- 含义:表示MySQL根据表统计信息和索引使用情况,估算的需要读取的行数。这个数字越小,表示查询可能越高效。
- 示例:在一个有1000行数据的表中,如果是全表扫描,
rows
可能是1000;如果通过索引能够快速定位到部分行,rows
可能是10或者更少。
Extra
- 含义:包含一些额外的信息,用于解释查询的执行情况。例如
Using index
表示查询只使用了索引中的信息,不需要回表;Using where
表示查询使用了WHERE
条件来过滤数据;Using filesort
表示需要进行文件排序,这可能会影响查询性能。 - 示例:对于查询
SELECT column1 FROM table_name WHERE column1 > 10 ORDER BY column1;
,如果没有合适的索引来支持排序,Extra
可能会出现Using filesort
。
- 含义:包含一些额外的信息,用于解释查询的执行情况。例如
七、Redis一个值,数据库一个值,你怎么保证数据一致性
使用事务
- 在应用程序中,可以将对Redis和数据库的操作封装在一个事务中。例如,在支持分布式事务的环境中(如使用Seata框架),可以开启一个全局事务。当需要更新数据时,先更新数据库,然后在事务的同一个阶段更新Redis。如果在更新数据库或者Redis过程中出现错误,事务可以进行回滚,保证数据的一致性。
消息队列
- 可以使用消息队列来协调Redis和数据库的更新。当有数据更新请求时,将更新操作作为一个消息发送到消息队列。有专门的消费者来处理这个消息,先更新数据库,然后更新Redis。如果更新过程中出现故障,消息队列可以保证消息不会丢失,在系统恢复后可以重新处理消息,从而保证数据一致性。
缓存更新策略 - 先更新数据库,再删除Redis缓存
- 这种策略被称为“Cache - Aside Pattern”。当数据需要更新时,先更新数据库,然后删除Redis中的对应缓存。下一次查询数据时,如果Redis中没有缓存,就会从数据库中读取最新的数据并更新到Redis中。这样可以避免数据不一致的情况,因为只有在数据库更新成功后才会去操作Redis缓存。
八、你先更新Redis或者更新数据库的理由是什么?
先更新数据库的理由
- 数据完整性:数据库是数据的最终存储位置,具有持久化和事务等特性。先更新数据库可以确保数据在存储层面首先得到更新,减少数据丢失的风险。例如在金融系统中,账户余额的更新必须先在数据库中完成,这样即使后续Redis更新出现问题,数据的最终状态在数据库中是正确的。
- 适合复杂业务逻辑:对于涉及多个表关联或者复杂的业务验证的情况,数据库的更新操作可以利用数据库的事务机制和存储过程等功能。这些功能可以保证在复杂的业务逻辑下数据的一致性。例如在电商系统的订单处理中,需要更新订单表、库存表等多个表,先在数据库中完成这些操作可以利用数据库的事务来保证数据的完整性。
先更新Redis的理由
- 性能优化:如果对性能要求极高,并且数据的一致性要求在一定时间内允许有小的偏差,先更新Redis可以立即返回响应给客户端。例如在一些对响应速度要求极高的读多写少的场景,如热点新闻系统,先更新Redis可以让后续的读请求快速获取到更新后的内容,然后再异步更新数据库。
- 缓存预热:在系统启动或者新数据加入时,先更新Redis可以提前将数据缓存起来,提高系统的初始响应速度。例如在一个推荐系统中,新的推荐内容加入后,先将其放入Redis缓存,这样当用户请求推荐内容时,可以快速从Redis中获取,同时后台再慢慢更新数据库来保证数据的最终一致性。
Kafka部分
一、Kafka各部分的组成(比如生产者、消费者)
生产者(Producer)
- 生产者是消息的产生者,负责将消息发送到Kafka集群。它可以从各种数据源(如日志文件、数据库等)读取数据,然后将数据封装成消息发送到Kafka的主题(Topic)中。生产者在发送消息时,可以指定消息所属的主题、分区(如果需要)等信息。例如,在一个日志收集系统中,日志收集器作为生产者,将收集到的日志消息发送到Kafka的日志主题中。
消费者(Consumer)
- 消费者是消息的接收者,它从Kafka集群中订阅主题,并从主题的分区中拉取消息进行消费。消费者可以是单个应用程序,也可以是一个消费者组(Consumer Group)。消费者组内的消费者可以共同分担对主题消息的消费任务,实现消息的负载均衡和高可用性。例如,在一个数据处理系统中,数据处理应用程序作为消费者,从Kafka的主题中获取消息,然后进行数据清洗、分析等操作。
主题(Topic)
- 主题是Kafka对消息进行分类的一种方式,类似于数据库中的表。生产者将消息发送到特定的主题,消费者从特定的主题中订阅和消费消息。一个主题可以有多个分区,用于实现数据的并行处理和存储。例如,在一个电商系统中,可以有“订单主题”“用户主题”等,分别用于处理订单相关消息和用户相关消息。
分区(Partition)
- 分区是主题的物理划分,每个分区在存储上是一个独立的日志文件。消息在分区中按照一定的顺序存储,分区的主要作用是提高Kafka的吞吐量和可扩展性。通过将主题划分为多个分区,可以让多个生产者和消费者同时对不同的分区进行操作,实现并行处理。例如,一个主题有3个分区,生产者可以同时向这3个分区发送消息,消费者也可以从这3个分区中同时拉取消息。
Broker
- Broker是Kafka集群中的服务器节点,它负责存储和转发消息。一个Kafka集群可以有多个Broker,每个Broker可以存储多个主题的分区。当生产者发送消息时,消息会被发送到一个或多个Broker上;当消费者请求消息时,也是从Broker上获取消息。Broker之间可以相互通信,实现数据的复制和负载均衡等功能。例如,在一个有5个Broker的Kafka集群中,主题的分区可以分布在不同的Broker上,以提高集群的可靠性和性能。
二、为什么有分区的概念?分区的缺点与优点是什么?
分区的优点
- 提高吞吐量:通过将主题划分为多个分区,Kafka可以同时处理多个分区的读写操作。多个生产者可以并发地向不同分区写入消息,多个消费者也可以同时从不同分区读取消息,从而大大提高了整个系统的消息处理吞吐量。例如,在一个大数据日志收集系统中,有大量的日志消息需要处理,将日志主题划分为多个分区后,可以让多个日志收集器(生产者)同时向不同分区发送消息,同时多个日志处理程序(消费者)也能同时从不同分区获取消息进行处理。
- 实现负载均衡:分区可以在消费者组内实现负载均衡。消费者组中的每个消费者可以分配到一个或多个分区进行消费,这样可以根据消费者的处理能力合理分配分区,避免某个消费者负载过重。例如,在一个有3个消费者的消费者组和一个包含6个分区的主题的情况下,每个消费者可以平均分配到2个分区进行消费,从而平衡了消费者之间的负载。
- 存储扩展性:分区在存储上是独立的日志文件,这使得Kafka的存储可以方便地进行扩展。当数据量不断增加时,可以通过增加分区数量或者增加Broker数量来存储更多的消息。例如,随着业务的增长,日志数据量越来越大,通过增加日志主题的分区数量,可以将更多的日志消息存储在Kafka集群中。
分区的缺点
- 顺序性问题:分区之间是无序的,这对于一些对消息顺序有严格要求的应用场景会带来挑战。如果业务需要严格保证消息的全局顺序,需要额外的处理来协调不同分区之间的顺序,这增加了系统的复杂性。例如,在一个订单处理系统中,如果订单的创建、支付、发货等消息分布在不同分区,就需要采取特殊措施来保证这些消息按照正确的顺序被消费。
- 管理复杂性:分区数量的增加会导致系统管理的复杂性增加。例如,需要合理地分配分区到不同的Broker,考虑分区的备份策略,以及在分区出现故障或者进行调整时,需要进行更多的操作来维护系统的稳定性和数据的完整性。
三、分区之间是无序的,我如何保证我一个顺序消费?
单分区处理
- 如果对消息顺序有严格要求,最直接的方法是将相关的消息都发送到同一个分区。可以通过自定义分区策略,根据消息的关键属性(如业务流水号等)将相关消息都路由到同一个分区。例如,在一个金融交易系统中,对于同一笔交易的所有操作消息(如开户、存款、取款等),根据交易编号将这些消息都发送到同一个分区,然后消费者按照消息在该分区中的顺序进行消费,这样就能保证同一笔交易的消息顺序。
全局有序与局部有序
- 如果无法将所有消息都发送到同一个分区,可以考虑采用全局有序和局部有序相结合的方式。对于关键业务流程,保证这些流程相关的消息在局部(某个分区)内是有序的,然后在应用层通过逻辑来协调不同分区之间的顺序。例如,在一个电商系统中,对于一个订单的消息(下单、支付、发货),可以将同一订单的消息发送到同一个分区保证局部有序,对于不同订单之间的消息顺序,可以通过在应用程序中记录订单的创建时间等信息,在消费时按照时间顺序或者业务优先级来协调不同订单消息的消费顺序。
使用额外的顺序协调机制
- 可以在应用程序中引入额外的顺序协调机制,如分布式锁或者序列号管理系统。当消费者从不同分区获取消息后,通过获取分布式锁或者根据序列号来确定消息的消费顺序。例如,在一个多线程消费多个分区消息的场景中,使用分布式锁来保证同一时间只有一个线程能够处理关键顺序消息,其他线程等待,从而保证消息的顺序消费。
四、分区策略KEY - BASE这个KEY是业务生成还是内置生成?
业务生成
- 在大多数情况下,分区策略中的KEY是由业务生成的。业务可以根据消息的关键属性来生成KEY,这个属性通常与业务逻辑紧密相关。例如,在一个用户行为跟踪系统中,消息是用户的各种行为(如登录、浏览商品、购买等),可以以用户ID作为KEY。这样,对于同一个用户的所有行为消息可以根据用户ID被路由到同一个分区,方便后续对单个用户行为的分析和处理。
内置生成(较少情况)
- 虽然较少,但在一些简单的场景下,Kafka也可以提供内置的KEY生成方式。例如,当消息没有明显的业务关键属性可以作为KEY,或者业务对分区没有特殊要求时,Kafka可能会根据消息的元数据(如消息的时间戳等)生成一个默认的KEY。不过这种情况相对较少,因为这样生成的分区可能无法很好地满足业务的实际需求。
五、KEY的分区算法怎么做的?
取模算法
- 最常见的分区算法是取模算法。假设主题有
n
个分区,对于给定的KEY,计算hash(key) % n
,其中hash(key)
是对KEY进行哈希计算(如使用Java中的hashCode
方法等)。通过这种方式,将KEY对应的消息分配到不同的分区。例如,一个主题有5个分区,对于用户ID作为KEY的消息,计算用户ID的哈希值后对5取模,根据结果将消息发送到对应的分区。这种算法简单有效,但可能会导致分区负载不均衡的情况,特别是当KEY的分布不均匀时。
- 最常见的分区算法是取模算法。假设主题有
一致性哈希算法
- 一致性哈希算法是一种改进的分区算法。它将整个哈希值空间组织成一个虚拟的圆环,将分区和KEY都映射到这个圆环上。当添加或删除分区时,只会影响到圆环上相邻的分区,而不是像取模算法那样可能会导致大量消息的重新分配。例如,在一个动态扩展分区的Kafka集群中,使用一致性哈希算法可以减少分区调整对消息分布的影响,提高系统的稳定性。
自定义分区算法
- 根据业务需求,也可以自定义分区算法。例如,业务可能有特殊的分区要求,如根据地域、业务类型等因素来分配消息到不同分区。自定义分区算法可以在生产者代码中实现,通过实现
Partitioner
接口,根据业务规则来计算KEY对应的分区。例如,在一个跨国电商系统中,根据订单的发货地将订单消息分配到不同的分区,以方便不同地区的订单处理系统进行消费。
- 根据业务需求,也可以自定义分区算法。例如,业务可能有特殊的分区要求,如根据地域、业务类型等因素来分配消息到不同分区。自定义分区算法可以在生产者代码中实现,通过实现
六、消息丢失的场景有哪些?
生产者丢失消息
- 未收到ACK确认:在异步发送消息模式下,生产者发送消息后,如果没有收到Kafka Broker的ACK确认就认为消息发送成功,可能会导致消息丢失。例如,由于网络故障或者Broker故障,消息没有真正到达Broker,但生产者却以为发送成功了。
- 缓冲区溢出:如果生产者的消息发送缓冲区已满,并且配置为丢弃旧消息,当新消息不断产生时,旧消息可能会被丢弃,从而导致消息丢失。例如,在一个高并发的消息产生场景中,生产者的缓冲区设置过小,无法及时将消息发送到Kafka,就可能会出现这种情况。
消费者丢失消息
- 自动提交偏移量:如果消费者在没有完全处理完消息的情况下就自动提交了偏移量,当消费者出现故障或者重新启动后,会从已经提交的偏移量位置开始消费,导致未处理的消息丢失。例如,消费者在处理消息的过程中发生了异常,但偏移量已经自动提交,下次消费时就会跳过这些未处理的消息。
- 消费逻辑错误:在消费者的处理逻辑中,如果出现错误导致消息没有正确处理就被认为是处理完成,也会导致消息丢失。例如,在消息处理过程中,没有正确地将消息存储到数据库或者其他存储介质中,但消费者却更新了偏移量,认为消息已经处理完成。
Broker丢失消息
- 副本未及时同步:在Kafka中,消息是通过多个副本进行存储来保证可靠性。如果主副本(Leader)上的消息没有及时同步到从副本(Follower),并且主副本出现故障,在没有完全同步的情况下,这些未同步的消息可能会丢失。例如,在网络拥塞或者Broker负载过高的情况下,副本之间的同步延迟较大,当主副本不可用时,未同步的消息就会丢失。
七、消息丢失的对策有哪些?
生产者对策
- 配置ACK机制:将生产者的
acks
参数设置为合适的值。acks = 1
表示只要Leader副本收到消息就返回ACK,acks = all
表示所有副本(包括Follower)都收到消息后才返回ACK。通过设置acks = all
可以提高消息发送的可靠性,但会降低消息发送的效率。同时,要设置合理的重试次数和重试间隔,当没有收到ACK时进行重试。 - 调整缓冲区大小:根据消息产生的速度和网络情况,合理调整生产者的消息发送缓冲区大小,避免缓冲区溢出。可以通过性能测试来确定合适的缓冲区大小,并且设置缓冲区满时的处理策略,如阻塞生产者而不是丢弃消息。
- 配置ACK机制:将生产者的
消费者对策
- 手动提交偏移量:消费者手动控制偏移量的提交,在消息完全处理完成后再提交偏移量。可以通过在消息处理成功后,调用
commitSync
或commitAsync
方法来提交偏移量。这样可以避免在消息未处理完成时就提交偏移量导致消息丢失。 - 消息处理重试机制:在消费者的处理逻辑中,对于处理失败的消息,设置重试机制。可以将处理失败的消息放入重试队列,在一定次数内进行重试,直到消息处理成功。同时,要注意处理重试过程中的消息幂等性问题,避免重复处理消息导致数据不一致。
- 手动提交偏移量:消费者手动控制偏移量的提交,在消息完全处理完成后再提交偏移量。可以通过在消息处理成功后,调用
Broker对策
- 优化副本同步策略:调整Kafka的副本同步参数,如
min.insync.replicas
(最小同步副本数)和replica.lag.time.max.ms
(副本同步延迟最大时间)等参数。增加最小同步副本数可以提高消息存储的可靠性,但会降低消息写入的效率。同时,要确保Broker之间的网络畅通,减少副本同步延迟,保证消息能够及时同步到所有副本。
- 优化副本同步策略:调整Kafka的副本同步参数,如
八、生产者可靠性级别?
最多一次(At - Most - Once)
- 这种可靠性级别是指消息最多被发送一次,可能会有消息丢失的情况。在这种模式下,生产者发送消息后,不会等待任何确认就认为消息发送成功。例如,在一些对消息丢失不太敏感的场景,如日志收集系统中,如果丢失一些不太重要的日志消息是可以接受的,就可以采用最多一次的可靠性级别,以提高消息发送的效率。
至少一次(At - Least - Once)
- 生产者会保证消息至少被发送一次。这意味着消息可能会被重复发送,需要消费者来处理消息的重复问题。在这种模式下,生产者发送消息后,会等待Broker的ACK确认,如果没有收到确认,会进行重试。例如,在金融交易系统中,为了保证交易消息不丢失,采用至少一次的可靠性级别,消费者需要处理可能出现的重复交易消息,通过幂等性设计来保证数据的一致性。
精确一次(Exactly - Once)
- 这是最高的可靠性级别,生产者保证消息精确地被发送一次,消费者也精确地接收和处理一次。要实现精确一次的可靠性,需要在生产者、消费者和Kafka集群之间进行复杂的协调。例如,通过使用事务或者幂等性生产者等机制来保证消息的精确一次发送,在消费者端也需要通过合适的偏移量管理和消息处理逻辑来保证消息的精确一次处理。在一些对数据准确性和一致性要求极高的场景,如订单处理系统,就需要采用精确一次的可靠性级别。
欢迎关注 ❤
我们搞了一个免费的面试真题共享群,互通有无,一起刷题进步。
没准能让你能刷到自己意向公司的最新面试题呢。
感兴趣的朋友们可以加我微信:wangzhongyang1993,备注:sf面试群。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。