查看原文
其他

MySQL 默认隔离级别是 RR,为什么阿里等大厂会改成 RC?

The following article is from Hollis Author Hollis


MySQL 的默认隔离级别是 Repeatable Reads以及背后的原因。


主要是因为MySQL在主从复制的过程是通过bin log 进行数据同步的,而MySQL早期只有statement这种bin log格式,这种格式下,bin log记录的是SQL语句的原文。
当出现事务乱序的时候,就会导致备库在 SQL 回放之后,结果和主库内容不一致。
为了解决这个问题,MySQL默认采用了Repetable Read这种隔离级别,因为在 RR 中,会在更新数据的时候增加记录锁的同时增加间隙锁。可以避免这种情况的发生。
关于MySQL的加锁方式及加锁原则,可以参考另外一篇《求你了,别再说数据库锁的只是索引了!》,这里就不再赘述了。

在我知道MySQL 默认隔离级别是RR后,很长一段时间都以为应该不会有人去修改这个默认配置。

但是直到有一天,我们线上发生了一次死锁的问题,我在排查的过程中,才发现我们的数据库用的隔离级别没有使用默认的 RR,而是修改成了Read Committed 。

大家可以通过这个命令查看数据库当前的隔离级别:

select @@tx_isolation;

那么,这里不禁就有疑问了,为啥阿里要把这个数据库隔离级别修改成 RC 呢,背后有什么思考吗?


RR 和 RC 的区别

想要搞清楚这个问题,我们需要先弄清楚 RR 和 RC 的区别,分析下各自的优缺点。

一致性读

一致性读,又称为快照读。快照即当前行数据之前的历史版本。快照读就是使用快照信息显示基于某个时间点的查询结果,而不考虑与此同时运行的其他事务所执行的更改。

在MySQL 中,只有READ COMMITTED 和 REPEATABLE READ这两种事务隔离级别才会使用一致性读。

在 RC 中,每次读取都会重新生成一个快照,总是读取行的最新版本。

在 RR 中,快照会在事务中第一次SELECT语句执行时生成,只有在本事务中对数据进行更改才会更新快照。

在数据库的 RC 这种隔离级别中,还支持"半一致读" ,一条update语句,如果 where 条件匹配到的记录已经加锁,那么InnoDB会返回记录最近提交的版本,由MySQL上层判断此是否需要真的加锁。

锁机制

数据库的锁,在不同的事务隔离级别下,是采用了不同的机制的。在 MySQL 中,有三种类型的锁,分别是Record Lock、Gap Lock和 Next-Key Lock。

Record Lock表示记录锁,锁的是索引记录。
Gap Lock是间隙锁,锁的是索引记录之间的间隙。
Next-Key Lock是Record Lock和Gap Lock的组合,同时锁索引记录和间隙。他的范围是左开右闭的。

在 RC 中,只会对索引增加Record Lock,不会添加Gap Lock和Next-Key Lock。

在 RR 中,为了解决幻读的问题,在支持Record Lock的同时,还支持Gap Lock和Next-Key Lock;

主从同步

在数据主从同步时,不同格式的 binlog 也对事务隔离级别有要求。

MySQL的binlog主要支持三种格式,分别是statement、row以及mixed,但是,RC 隔离级别只支持row格式的binlog。如果指定了mixed作为 binlog 格式,那么如果使用RC,服务器会自动使用基于row 格式的日志记录。

而 RR 的隔离级别同时支持statement、row以及mixed三种。


为什么互联网公司选择使用 RC

提升并发

互联网公司和传统企业最大的区别是什么?

高并发!

没错,互联网业务的并发度比传统企业要高处很多。2020年双十一当天,订单创建峰值达到 58.3 万笔/秒。

很多人问,要怎么做才能扛得住这么大的并发量。其实,这背后的优化多到几个小时都讲不完,因为要做的、可以做的事情实在是太多了。

而有一个和我们今天这篇文章有关的优化,那就是通过修改数据库的隔离级别来提升并发度。

为什么 RC 比 RR 的并发度要好呢?

首先,RC 在加锁的过程中,是不需要添加Gap Lock和 Next-Key Lock 的,只对要修改的记录添加行级锁就行了。

这就使得并发度要比 RR 高很多。

另外,因为 RC 还支持"半一致读",可以大大的减少了更新语句时行锁的冲突;对于不满足更新条件的记录,可以提前释放锁,提升并发度。

减少死锁

因为RR这种事务隔离级别会增加Gap Lock和 Next-Key Lock,这就使得锁的粒度变大,那么就会使得死锁的概率增大。

死锁:一个事务锁住了表A,然后又访问表B;另一个事务锁住了表B,然后企图访问表A;这时就会互相等待对方释放锁,就导致了死锁。



总结

本文介绍了一些 MySQL数据库的 RR 和 RC 两种事务隔离级别。他们主要在加锁机制、主从同步以及一致性读方面存在一些差异。

而很多大厂,为了提升并发度和降低死锁发生的概率,会把数据库的隔离级别从默认的 RR 调整成 RC。

当然,这样做也不是完全没有问题,首先使用 RC 之后,就需要自己解决幻读的问题,这个其实还好,很多时候幻读问题其实是可以忽略的,或者可以用其他手段解决。

还有就是使用 RC 的时候,不能使用statement格式的 binlog,这种影响其实可以忽略不计了,因为MySQL是在5.1.5版本开始支持row的、在5.1.8版本中开始支持mixed,后面这两种可以代替 statement格式。

所有的技术方案的选择,都是一种权衡的艺术!

- EOF -


推荐阅读  点击标题可跳转

1、数据库的锁,到底锁的是什么?

2、一文彻底读懂 MySQL 事务的四大隔离级别

3、再有人问你 MySql 的隔离级别是什么,就把这篇文章发给他!



看完本文有收获?请转发分享给更多人

推荐关注「数据分析与开发」,提升数据技能

点赞和在看就是最大的支持❤️

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存