Skip to content

第02讲:深入理解事务与锁机制(下)

MySQL 锁分类

前文提到了锁,下面将详细讲解 MySQL 的锁,我们先来看看锁的分类,在 MySQL 中有三种级别的锁:页级锁、表级锁、行级锁。

  • 表级锁:开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低。 会发生在:MyISAM、memory、InnoDB、BDB 等存储引擎中。

  • 行级锁:开销大,加锁慢;会出现死锁;锁定粒度最小,发生锁冲突的概率最低,并发度最高。会发生在:InnoDB 存储引擎。

  • 页级锁:开销和加锁时间界于表锁和行锁之间;会出现死锁;锁定粒度界于表锁和行锁之间,并发度一般。会发生在:BDB 存储引擎。

三种级别的锁分别对应存储引擎关系如下图所示。

注意:MySQL 中的表锁包括读锁和写锁。只需记住这个表锁模式兼容矩阵即可。

InnoDB 中的锁

在 MySQL InnoDB 存储引擎中,锁分为行锁和表锁。其中行锁包括两种锁。

  • 共享锁(S):多个事务可以一起读,共享锁之间不互斥,共享锁会阻塞排它锁。

  • 排他锁(X):允许获得排他锁的事务更新数据,阻止其他事务取得相同数据集的共享读锁和排他写锁。

另外,为了允许行锁和表锁共存,实现多粒度锁机制,InnoDB 还有两种内部使用的意向锁(Intention Locks),这两种意向锁都是表锁。表锁又分为三种。

  • 意向共享锁(IS):事务计划给数据行加行共享锁,事务在给一个数据行加共享锁前必须先取得该表的 IS 锁。

  • 意向排他锁(IX):事务打算给数据行加行排他锁,事务在给一个数据行加排他锁前必须先取得该表的 IX 锁。

  • 自增锁(AUTO-INC Locks):特殊表锁,自增长计数器通过该"锁"来获得子增长计数器最大的计数值。

在加行锁之前必须先获得表级意向锁,否则等待 innodb_lock_wait_timeout 超时后根据innodb_rollback_on_timeout 决定是否回滚事务。

InnoDB 自增锁

在 MySQL InnoDB 存储引擎中,我们在设计表结构的时候,通常会建议添加一列作为自增主键。这里就会涉及一个特殊的锁:自增锁(即:AUTO-INC Locks),它属于表锁的一种,在 INSERT 结束后立即释放。我们可以执行 show engine innodb status\G 来查看自增锁的状态信息。

在自增锁的使用过程中,有一个核心参数,需要关注,即 innodb_autoinc_lock_mode,它有0、1、2 三个值。保持默认值就行。具体的含义可以参考官方文档,这里不再赘述,如下图所示。

InnoDB 锁关系矩阵如下图所示,其中:+ 表示兼容,- 表示不兼容。

InnoDB 行锁

InnoDB 行锁是通过对索引数据页上的记录(record)加锁实现的。主要实现算法有 3 种:Record Lock、Gap Lock 和 Next-key Lock。

  • Record Lock 锁:单个行记录的锁(锁数据,不锁 Gap)。

  • Gap Lock 锁:间隙锁,锁定一个范围,不包括记录本身(不锁数据,仅仅锁数据前面的Gap)。

  • Next-key Lock 锁:同时锁住数据,并且锁住数据前面的 Gap。

排查 InnoDB 锁问题

排查 InnoDB 锁问题通常有 2 种方法。

  • 打开 innodb_lock_monitor 表,注意使用后记得关闭,否则会影响性能。

  • 在 MySQL 5.5 版本之后,可以通过查看 information_schema 库下面的 innodb_locks、innodb_lock_waits、innodb_trx 三个视图排查 InnoDB 的锁问题。

InnoDB 加锁行为

下面举一些例子分析 InnoDB 不同索引的加锁行为。分析锁时需要跟隔离级别联系起来,我们以 RR 为例,主要是从四个场景分析。

  • 主键 + RR。

  • 唯一键 + RR。

  • 非唯一键 + RR。

  • 无索引 + RR。

下面讲解第一种情况:主键 + RR,如下图所示。

假设条件是:

  • update t1 set name='XX' where id=10。

  • id 为主键索引。

加锁行为:仅在 id=10 的主键索引记录上加 X锁。

第二种情况:唯一键 + RR,如下图所示。

假设条件是:

  • update t1 set name='XX' where id=10。

  • id 为唯一索引。

加锁行为:

  • 先在唯一索引 id 上加 id=10 的 X 锁。

  • 再在 id=10 的主键索引记录上加 X 锁,若 id=10 记录不存在,那么加间隙锁。

第三种情况:非唯一键 + RR,如下图所示。

假设条件是:

  • update t1 set name='XX' where id=10。

  • id 为非唯一索引。

加锁行为:

  • 先通过 id=10 在 key(id) 上定位到第一个满足的记录,对该记录加 X 锁,而且要在 (6,c)~(10,b) 之间加上 Gap lock,为了防止幻读。然后在主键索引 name 上加对应记录的X 锁;

  • 再通过 id=10 在 key(id) 上定位到第二个满足的记录,对该记录加 X 锁,而且要在(10,b)~(10,d)之间加上 Gap lock,为了防止幻读。然后在主键索引 name 上加对应记录的X 锁;

  • 最后直到 id=11 发现没有满足的记录了,此时不需要加 X 锁,但要再加一个 Gap lock: (10,d)~(11,f)。

第四种情况:无索引 + RR,如下图所示。

假设条件是:

  • update t1 set name='XX' where id=10。

  • id 列无索引。

加锁行为:

  • 表里所有行和间隙均加 X 锁。

至此,我们分析了四种索引在 RR 隔离级别下的加锁行为,那么在 RC 隔离级别下的加锁行为又是怎样的呢?这个问题留给你自己去思考,答案将在下一节课中给出。

在前文中,我们有提到分析锁问题的三个视图,在实际的使用中,可以在数据库发生阻塞的时候,将这三个视图做联合查询来帮助获取详细的锁信息,帮助快速定位找出造成死锁的元凶和被害者,以及具体的事务。

InnoDB 死锁

在 MySQL 中死锁不会发生在 MyISAM 存储引擎中,但会发生在 InnoDB 存储引擎中,因为 InnoDB 是逐行加锁的,极容易产生死锁。那么死锁产生的四个条件是什么呢?

  • 互斥条件:一个资源每次只能被一个进程使用;

  • 请求与保持条件:一个进程因请求资源而阻塞时,对已获得的资源保持不放;

  • 不剥夺条件:进程已获得的资源,在没使用完之前,不能强行剥夺;

  • 循环等待条件:多个进程之间形成的一种互相循环等待资源的关系。

在发生死锁时,InnoDB 存储引擎会自动检测,并且会自动回滚代价较小的事务来解决死锁问题。但很多时候一旦发生死锁,InnoDB 存储引擎的处理的效率是很低下的或者有时候根本解决不了问题,需要人为手动去解决。

既然死锁问题会导致严重的后果,那么在开发或者使用数据库的过程中,如何避免死锁的产生呢?这里给出一些建议:

  • 加锁顺序一致;

  • 尽量基于 primary 或 unique key 更新数据。

  • 单次操作数据量不宜过多,涉及表尽量少。

  • 减少表上索引,减少锁定资源。

  • 相关工具:pt-deadlock-logger。

资源争用

下面分享一个基于资源争用导致死锁的情况,如下图所示。

session1 首先拿到 id=1 的锁,session2 同期拿到了 id=5 的锁后,两者分别想拿到对方持有的锁,于是产生死锁。

元数据锁

下面分享一个 Metadata lock(即元数据锁)导致的死锁的情况,如下图所示。

session1 和 session2 都在抢占 id=1 和 id=6 的元数据的资源,产生死锁。

查看 MySQL 数据库中死锁的相关信息,可以执行 show engine innodb status\G 来进行查看,重点关注 "LATEST DETECTED DEADLOCK" 部分。

给大家一些开发建议来避免线上业务因死锁造成的不必要的影响。

  • 更新 SQL 的 where 条件时尽量用索引;

  • 加锁索引准确,缩小锁定范围;

  • 减少范围更新,尤其非主键/非唯一索引上的范围更新。

  • 控制事务大小,减少锁定数据量和锁定时间长度 (innodb_row_lock_time_avg)。

  • 加锁顺序一致,尽可能一次性锁定所有所需的数据行。

本课时到这里就全部结束了,今天主要讲了 MySQL 的事务及其特性、并发事务带来的问题、事务的隔离级别、多版本并发控制 MVCC、InnoDB 锁分类、InnoDB 锁算法、InnoDB 死锁及其优化建议。