并发控制
多用户数据库系统是指允许多个用户同时使用的数据库系统。其特点是在同一时刻并发运行的事务数可达数百上千个,多用户数据库系统涉及并行控制。例如:飞机订票数据库系统、银行数据库系统等。
多事务执行方式
- 事务串行执行:每个时刻只有一个事务运行,其他事务必须等到这个事务结束以后方能运行,不能充分利用系统资源,发挥数据库共享资源的特点。执行方式如图:
- 交叉并发方式:在单处理机系统中,事务的并行执行是这些并行事务的并行操作轮流交叉运行,单处理机系统中的并行事务并没有真正的并行运行,但能够减少处理机的空闲时间,提高系统地效率。执行方式如图:
- 同时并发方式:多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行。
本章数据库系统并发控制技术是以单处理机系统为基础。
并发控制概述
事务是并发控制的基本单位,并发控制机制的任务是:
- 对并发操作进行正确调度。
- 保证事务的隔离性。
- 保证数据库的一致性。
并发操作带来数据的不一致性实例。
【例】飞机订票系统中的一个活动序列。
- 甲售票点(事务 T1)读出某航班的机票余额 A,设 A = 16;
- 乙售票点(事务 T1)读出同一航班的机票余额 A,也为 16;
- 甲售票点卖出一张机票,修改余额 A
A-1,所以 A 为 15,把 A 写回数据库; - 乙售票点也卖出一张机票,修改余额 A
A-1,所以 A 为 15,把 A 写回数据库。 结果明明卖出两张机票,数据库中机票余额只减少 1.
【说明】
以上情况称为数据库的不一致性,是由并发操作引起的,在并发操作情况下,对 T1、T2 两个事务的操作序列的调度是随机的。
若按上面的调度序列执行,T1 事务的修改就被丢失。因为第 4 步中 T2事务修改 A 并写回后覆盖了 T1 事务的修改。
并发操作带来的数据不一致性包括丢失修改、不可重复读、读“脏”数据。
用记号 R(x)表示读数据 x,W(x)表示写数据 x。
丢失修改
两个事务 T1 和 T2 读如同一数据并修改,T2 的提交结果破坏了 T1 提交的结果,导致 T1 的修改被丢失。上面飞机订票例子就属于此类。
不可重复读
不可重复读是指事务 T1 读取数据后,事务 T2 执行更新操作,使 T1 无法再现前一次读取结果。
不可重复读包括三种情况:
事务 T1 读取某一数据后,事务 T2 对其做了修改,当事务 T1 再次读该数据时,得到与前一次不同的值。
T1 读取 B = 100 进行运算。 T2 读取同一数据 B,对其进行修改后将 B = 200 写回数据库。 T1 为了对读取值校对重读 B,B 为 200,与第一次读取值不一致。
事务 T1 按一定条件从数据库中读取了某些数据记录后,事务 T2 删除了其中部分记录,当 T1 再次按相同条件读取数据时,发现某些记录神秘地消失了。
事务 T1 按一定条件从数据库中读取某些数据记录后,事务 T2 插入了一些记录,当 T1 再次按相同条件读取数据时,发现多了一些记录。
后两种不可重复读有时也称为幻影现象。
读“脏”数据
读“脏”数据是指读到不正确的数据。
【例】
事务 T1 修改某一数据,并将其写回磁盘。
事务 T2 读取同一数据后,T1 由于某种原因被撤销。
这时 T1 已修改过的数据恢复原值,T2 读到的数据就与数据库中的数据不一致。
T2 读到的数据就为“脏”数据,即不正确的数据。
T1 将 C 值修改为 200,T2 读到 C 为 200.
T1 由于某种原因撤销,其修改作废,C 恢复原值 100.
这时 T2 读到 C 为 200,与数据库内容不一致,就是“脏”数据。
上面三种数据不一致的情况主要是因为并发操作破坏了事务的隔离性,
并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性。对数据库的应用有时允许某些不一致性。
并发控制的主要技术:封锁(Locking)、时间戳(Timestamp)、乐观控制法(Optimistic Scheduler)、多版本并发控制(MVCC)。
封锁
什么是封锁
封锁是事务 T 对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁。加锁后事务 T 就对该数据对象有了一定的控制,在事务 T 释放它的锁之前,其他的事务不能更新此数据对象。
封锁是实现并发控制的一个非常重要的技术。
基本封锁类型
一个事务对某个数据对象加锁后究竟拥有什么样的控制由封锁的类型决定。
基本封锁类型:排他锁(Exclusive Locks,简记为 X 锁)、共享锁(Share Locks,简记为 S 锁)。
- 排他锁:排他锁又称写锁,若事务 T 对数据对象 A 加上 X 锁,则只允许 T 读取和修改 A,其他任何事务都不能再对 A 加任何类型的锁,直到 T 释放 A 上的锁,保证其他事务在 T 释放 A 上的锁之前不能再读取和修改 A。
- 共享锁:共享锁又称为读锁,若事务 T 对数据对象 A 加上 S 锁,则事务 T 可以读 A 但不能修改 A,其他事务只能再对 A 加 S 锁,而不能加 X 锁,直到 T 释放 A 上的 S 锁。保证其他事务可以读 A,但再 T 释放 A 上的 S 锁之前不能对 A 做任何修改。
【说明】
在锁的相容矩阵中:
- 最左边一列表示事务 T1 已经获得的数据对象上的锁的类型,其中横线表示没有加锁。
- 最上面一行表示另一事务 T2 对同一数据对象发出封锁请求。
- T2 的封锁请求能否被满足用矩阵中的 Y 和 N 表示。
Y 表示事务 T2 的封锁要求与 T1 已持有的锁相容,封锁请求可以满足。
N 表示 T2 的封锁请求与 T1 已持有的锁冲突,T2 的请求被拒绝。
封锁协议
封锁协议是指在运用 X 锁和 S 锁对数据对象加锁时,需要约定一些规则,这些规则为封锁协议(Locking Protocol),例如何时申请 X 锁或 S 锁、持续时间、何时释放等。
对封锁方式规定不同的规则,就形成了各种不同的封锁协议,它们分别在不同的程度上为并发操作的正确调度提供一定的保证。这里主要介绍三级封锁协议。
一级封锁协议
一级封锁协议是指事务 T 在修改数据 R 之前必须先对其加 X 锁,直到数据结束才释放;事务结束包括正常结束(COMMIT)和非正常结束(ROLLBACK)。
一级封锁协议作用:
- 一级封锁协议可防止丢失修改,并保证事务 T 可恢复。
- 在一级封锁协议中,如果仅仅是读数据不对其进行修改,是不需要加锁的,所以它不能保证可重复读和不读“脏”数据。
解决丢失修改问题:
- 事务 T1 在读 A 进行修改之前先对 A 加 X 锁。
- T2 请求对 A 加 X 锁被拒绝。
- T2 只能等待 T1 释放 A 上的锁后获得对 A 的 X 锁。
- 这时 T2 读到的 A 已经是 T1 更新过的值 15。
- T2 按新的 A 值进行运算,并将结果值 A = 14 写回到磁盘。避免了丢失 T1 的更新。
二级封锁协议
二级封锁协议是一级封锁协议加上事务 T 在读取数据 R 之前必须先对其加 S 锁,读完后即可释放 S 锁。
二级封锁协议作用:
- 二级封锁协议可以防止丢失修改和读“脏”数据。
- 在二级封锁协议中,由于读完数据后即可释放 S 锁,所以它不能保证可重复读。
解决读“脏”数据问题:
- 事务 T1 对 C 进行修改之前,先对 C 加 X 锁,修改后写回磁盘。
- T2 请求在 C 上加 S 锁,因已在 C 上加了 X 锁,T2 只能等待。
- T1 因某种原因被撤销,C 恢复为原值 100。
- T1 释放 C 上的 X 锁后 T2 获得 C 上的 S 锁,读 C = 100。避免了 T2 读“脏”数据。
三级封锁协议
三级封锁协议是一级封锁协议加上事务 T 在读取数据 R 之前必须先对其加 S 锁,直到事务结束才释放。
三级封锁协议作用:
- 三级封锁协议可以防止丢失数据、读“脏”数据和不可重复读。
解决不可重复读问题:
- 事务 T1 在读 A、B 之前,先对 A、B 加 S 锁。
- 其他事务只能对 A、B 加 S 锁,而不能加 X 锁,即其他事务只能读 A、B,而不能修改。
- T2 修改 B 而申请对 B 的 X 锁时被拒绝需等待 T1 释放 B 上的锁。
- T1 为验算再读 A、B,这时读出的 B 仍是 100,求和结果仍为 150,即可重复读。
- T1 结束释放 A、B 上的 S 锁, T2 才获得对 B 的 X 锁。
三级协议说明
- 三级协议的主要区别是说明操作需要申请封锁以及何时释放锁(即持锁时间)。
- 不同的封锁协议使事务达到的一致性级别不同,封锁协议级别越高,一致性程度越高。
X 锁 | S 锁 | 一致性保证 | |||||
操作结束释放 | 事务结束释放 | 操作结束释放 | 事务结束释放 | 不丢失修改 | 不读“脏”数据 | 可重复读 | |
一级封锁协议 | √ | √ | |||||
二级封锁协议 | √ | √ | √ | √ | |||
三级封锁协议 | √ | √ | √ | √ | √ |
活锁和死锁
活锁
【例】以下事务的执行是活锁的情形。
事务 T1,封锁了数据 R。
事务 T2,又请求封锁 R,于是 T2 等待。
T3 也请求封锁 R,当 T1 释放了 R 上的封锁之后系统首先批准了 T3 的请求,T2 仍然等待。
T4 又请求封锁 R,当 T3 释放了 R 上的封锁之后系统又批准了 T4 的请求……。
T2 有可能永远等待,这就是活锁的情形。
避免活锁:采用先来先服务的策略。当多个事务请求封锁同一数据对象时按请求封锁的先后次序对这些事务排队,该数据对象上的锁一旦释放,首先批准申请队列中第一个事务获得锁。
死锁
【例】以下事务的执行是死锁的情形。
事务 T1 封锁了数据 R1。
T2 封锁了数据 R2。
T1 请求封锁 R2,因 T2 已封锁了 R2,于是 T1 等待 T2 释放 R2 的锁。
接着 T2 又申请封锁 R1,因 T1 已封锁了 R1,T2 等待 T1 释放 R1 的锁。
这样 T1 在等待 T2,而 T2 又再等待 T1,T1 和 T2 两个事务永远不能结束,形成死锁。
解决死锁的方法: 死锁的预防和死锁的诊断与解除。
死锁的预防
产生死锁的原因是两个或多个事务都已封锁了一些数据对象,然后又都请求对已为其他事务封锁的数据对象加锁,从而出现死锁等待。
预防死锁的发生就是要破坏产生死锁的条件,主要的方法有一次封锁法和顺序封锁法。
一次封锁法:要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行。
存在的问题:
- 降低系统并发度。
- 难于事先精确确定封锁对象。
顺序封锁法:预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。
存在的问题:
- 维护成本高:数据库系统中封锁的数据对象多,且随数据的插入、删除等操作而不断变化,维护这样的资源的封锁顺序非常困难,成本很高。
- 难以实现:事务的封锁请求可以随着事务的执行而动态地决定,很难事先确定每一个事务要封锁哪些对象,因此也就很难按规定的顺序去施加封锁。
【结论】
- 在操作系统中广为采用的预防死锁的策略并不太适合数据库的特点。
- 数据库管理系统在解决死锁的问题上更普遍采用的是诊断并解除死锁的方法。
死锁的诊断和接触
死锁诊断的方法主要有超时法和等待图法。
超时法:如果事务的等待时间超过了规定的时限,就认为发生了死锁。
优点:实现简单。
缺点:一是有可能误判死锁;二是时限若设置的太长,死锁发生后不能及时发现。
等待图法:用事务等待图动态反映所有事务的等待情况。
事务等待图是一个有向图 G =(T, U),其中:
T 为结点的集合,每个结点表示正在运行的事务。
U 为边的集合,每条边表示事务等待的情况。
若 T1 等待 T2,则 T1,T2 之间划一条有向边,从 T1 指向 T2。
【例】
图(a)中,事务 T1 等待 T2,T2 等待 T1,产生了死锁。
图(b)中,事务 T1 等待 T2,T2 等待 T3,T3 等待 T4,T4 等待 T1,产生了死锁。
图(b)中,事务 T3 可能还等待 T2,在大回路中又有小的回路。
【说明】
- 并发控制子系统周期性(比如每隔数秒)生成事务等待图检测事务。如果发现图中存在回路,则表示系统中出现了死锁。
- 解除死锁的方法是选择一个处理死锁代价最小的事务,将其撤销,释放此事务持有的所有的锁,使其他事务能继续运行下去。
并发调度的可串行性
数据库管理系统对并发事务不同的调度会产生不同的结果,什么样的调度是正确的?
串行调度是正确的,执行结果等价于串行调度的调度也是正确的,称为可串行化调度。
可串行化调度
可串行化调度:多个事务并发执行是正确的,当且仅当其结果与按某一次序串行地执行这些事务时地结果相同。
可串行性:是并发事务正确调度的准则,按照这个准则,一个给定的并发调度,当且仅当它是可串行化的,才认为是正确调度。
【例】现在有两个事务,分别包含下列操作:
事务 T1:读 B;A = B+1;写回 A。
事务 T2:读 A;B = A+1;写回 B。
这两个事务的不同调度策略如下图:
调度策略 1:
假设 A、B 的初值均为 2.
按 T1
T2 次序执行结果为 A = 3,B = 4. 串行调度策略,正确的调度。
调度策略 2:
假设 A、B 的初值均为 2.
按 T2
T1 次序执行结果为 A = 4,B = 3. 串行调度策略,正确的调度。
调度策略 3:
执行结果与 1、2 结果都不同,是错误的调度。
调度策略 4:
执行结果与串行调度 1 的执行结果相同,是正确的调度。
冲突可串行化调度
冲突操作:是指不同事务对同一数据的读写操作和写写操作。
Ri(x) 与 Wj(x) /*事务 Ti 读 x,Tj 写 x,其中 i
Wi(x) 与 Wj(x) /*事务 Ti 写 x,Tj 写 x,其中 i
【说明】
- 除读写操作和写写操作外,其他操作是不冲突操作。
- 不同事务的冲突操作和同一事务的两个操作是不能交换的。
Ri(x) 与 Wj(x) 改变执行次序,则 Ti 读 x 的数据将发生变化。
Wi(x) 与 Wj(x) 改变执行次序,则 x 的数据由等于 Tj 的结果,变为了 Ti 的结果。
一个调度 Sc 在保证冲突操作的次序不变的情况下,通过交换两个事务不冲突操作的次序得到另一个调度 Sc’,如果 Sc’是串行的,称调度 Sc 是冲突可串行化的调度。
若一个调度是冲突可串行化,则一定是可串行化的调度,可用这种方法判断一个调度是否是冲突可串行化的。
【例】今有调度
把
与 交换,得到:
再把
与 交换,得到:
等价于串行调度 , ,所以 为冲突可串行化的调度。
冲突可串行化调度是可串行化调度的充分条件,但不是必要条件。还有不满足冲突可串行化条件的可串行化条件。
【例】有 3 个事务
, , 调度
是一个串行调度。 调度
不满足冲突可串行化。但是调度 是可串行化的,因为 执行的结果与调度 相同, 的值都等于 的值, 的值都等于 的值。
两段锁协议
数据库管理系统普遍采用两段锁封锁协议的方法实现并发调度的可串行性,从而保证调度的正确性。
两段锁协议定义:是指所有事务必须分两个阶段对数据项加锁和解锁。即在对任何数据进行读、写操作之前,事务首先要获得对该数据的封锁;在释放一个封锁之后,事务不再申请和获得任何其他封锁。
两段锁的含义:事务分为两个阶段。
第一阶段是获得封锁,也称为扩展阶段。事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁。
第二阶段是释放封锁,也称为收缩阶段。事务可以释放任何数据项上的任何类型的锁,但是不能再申请任何锁。
【例】事务 Ti 遵守两段锁协议,其封锁序列是:
事务 Tj 不遵守两段锁协议,其封锁序列是:
如图的调度遵守两段锁协议,因此一定是一个可串行化调度,如何验证?
【验证】忽略图中加锁操作和解锁操作,按照时间先后次序得到如下调度:
先把
交换的:
再把
与 交换的:
【说明】
- 事务遵守两段锁协议是可串行化调度的充分条件,而不是必要条件。
- 若并发事务都遵守两段锁协议,则对这些事务的任何并发调度策略都是可串行化的。
- 若并发事务的一个调度是可串行化的,不一定所有事务都符合两段锁协议。
两段锁协议与防止死锁的一次封锁法的异同:
- 一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行。因此一次封锁法遵守两段锁协议。
- 两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁,因此遵守两段锁协议的事务可能发生死锁。
封锁的粒度
封锁对象的大小称为封锁粒度(Granularity)。
封锁的对象:逻辑单元,物理单元。
逻辑单元:属性值、属性值的集合、元组、关系、索引项、整个索引直至整个数据库。
物理单元:页(数据页或索引页)、物理记录等。
【说明】
- 封锁粒度与系统的并发度和并发控制的开销密切相关。
- 封锁的粒度越大,数据库所能够封锁的数据单元就越少,并发度就越小,系统开销也越小。
- 封锁的粒度越小,并发度较高,但系统开销也就越大。
【例】
若封锁粒度是数据页:事务 T1 需要修改元组 L1 , 则 T1 必须对包含 L1 的整个数据页 A 加锁。若 T1 对 A 加锁后事务 T2 要修改 A 中的元组 L2,则 T2 被迫等待,直到 T1 释放 A 上的锁。
若封锁粒度是元组:则 T1 需和 T2 可以同时对 L1和 L2加锁,不需要互相等待,从而提高了系统的并行度。又如,事务 T 需要读取整个表,若封锁粒度是元组,T 必须对表中的每一个元组加锁,显然开销极大。
多粒度封锁
多粒度封锁 是指在一个系统中同时支持多种封锁粒度供不同的事务选择。
选择封锁粒度的原则——考虑封锁开销和并发度两个因素,具体为:
- 处理多个关系的大量元组的事务:以数据库为封锁粒度。
- 处理大量元组的事务:以关系为封锁粒度。
- 处理少量元组的用户事务:以元组为封锁粒度。
多粒度树:以树形结构来表示多级封锁粒度,根结点是整个数据库,表示最大的数据粒度,叶结点表示最小的数据粒度。
【例】三级粒度树根结点为数据库,数据库的子结点为关系,关系的子结点为元组。
多粒度封锁协议
允许多粒度树中的每个结点被独立地加锁。对一个结点加锁意味着这个结点的所有后裔结点也被加以同样类型的锁。
多粒度封锁中一个数据对象可能以两种方式封锁:显式封锁和隐式封锁。
- 显式封锁是应事务的要求直接加到数据对象上的锁。
- 隐式封锁是该数据对象没有被独立加锁,是由于其上级结点加锁而使该数据对象加上了锁。
显式封锁和隐式封锁的效果是一样的,因此系统检查封锁冲突时不仅要检查显式封锁还要检查隐式封锁。
【例】事务 T 要对关系
加 X 锁 系统必须搜索其上级结点数据库、关系
,还要搜索 的下级结点,即 中的每一个元组,如果其中某一个数据对象已经加了不相容锁,则 T 必须等待。 【说明】
对某个数据对象加锁,系统要检查:
该数据对象:有无显式封锁与之冲突。
所有上级结点:检查本事务的显式封锁是否与该数据对象上的隐式封锁(由于上级结点已加的封锁造成的)冲突。
所有下级结点:看上面的显式封锁是否与本事务的隐式封锁(将加到下级结点的封锁)冲突。
意向锁
引进意向锁的目的:提高对某个数据对象加锁时系统的检查效率。
意向锁的含义:如果对一个结点加意向锁,则说明该结点的下层结点正在被加锁;对任一结点加锁时,必须先对它的上层结点加意向锁。
【例】对任一元组加锁时,必须先对它所在的数据库和关系加意向锁。
常用的意向锁:
- 意向共享锁(Intent Share Lock,IS 锁)
- 意向排他锁(Intent Exclusive Lock,IX 锁)
- 共享意向排他锁(Share Intent Exclusive Lock,SIX 锁)
- IS 锁:如果对一个数据对象加 IS 锁,表示它的后裔结点拟(意向)加 S 锁。 【例】事务 T1 要对 R1 中某个元组加 S 锁,则要首先对关系 R1 和数据库加 IS 锁。
- IX 锁:如果对一个数据对象加 IX 锁,表示它的后裔结点拟(意向)加 X 锁。 【例】事务 T1 要对 R1 中某个元组加 X 锁,则要首先对关系 R1 和数据库加 IX 锁。
- SIX 锁:如果对一个数据对象加 SIX 锁,表示对它加 S 锁,再加 IX 锁,即 SIX = S+IX。 【例】对某个表加 SIX 锁,则表示该事务要读整个表(所以要对该表加 S 锁), 同时会更新个别元组(所以要对该表加 IX 锁)。
意向锁的相容矩阵如下表:
S | X | IS | IX | SIX | - | |
---|---|---|---|---|---|---|
S | Y | N | Y | N | N | Y |
X | N | N | N | N | N | Y |
IS | Y | N | Y | Y | Y | Y |
IX | N | N | Y | Y | N | Y |
SIX | N | N | Y | N | N | Y |
- | Y | Y | Y | Y | Y | Y |
锁的强度:是指它对其他锁的排斥程度,一个事务在申请封锁时以强锁代替弱锁是安全的,反之则不然。
具有意向锁的多粒度封锁方法:
任何事务 T 要对一个数据对象加锁,申请封锁时应该按自上而下的次序进行,释放封锁时则应该按自下而上的次序进行。
【例】事务 T1 要对关系 R1 加 S 锁。
- 则要首先对数据库加 IS 锁。
- 检查数据库和 R1 是否已加了不相容的锁(X 或 IX)。
- 不再需要搜索和检查 R1 中的元组是否加了不相容的锁(X 锁)。
其他并发控制机制
时间戳方法
给每一个事务盖上一个时标,即事务开始执行的时间。
控制机制:
- 每个事务具有唯一的时间戳,并按照这个时间戳来解决事务的冲突操作。
- 如果发生冲突操作,回滚具有较早时间戳的事务,以保证其他事务的正常执行。
- 被回滚的事务被赋予新的时间戳并从头开始执行。
乐观控制法
又称验证方法,乐观控制法认为事务执行时很少发生冲突,因此不对事务进行特殊的管制。
控制机制:
- 不对事务进行特殊的管制, 让它自由执行,事务提交前再进行正确性检查。
- 如果检查后发现该事务执行中出现过冲突并影响了可串行性,则拒绝提交并回滚该事务。
多版本并发控制
- 多版本并发控制(MVCC):是指在数据库中通过维护数据对象的多个版本信息来实现高效并发控制的一种策略。
- 版本的定义:是指数据库中数据对象的一个快照,记录了数据对象某个时刻的状态。
计算机系统存储设备价格的不断降低,可以考虑为数据库系统的数据对象保留多个版本,以提高系统的并发操作程度。
【例】有一个数据对象 A 有两个事务,其中 T1 是写事务,T2 是读事务。封锁方法和多版本并发控制方法对比如下:
多版本并发控制协议
每个 write(Q)创建一个新版本 Qm,形成一个版本序列 Q1,Q2,Q3,……,Qm。
每个版本 Qk 包括三个数据:
- 版本值
- 创建 Qk 事务的时间戳 W-timestamp(Qk)。
- 成功读取 Qk 事务的最大时间戳 R-timestamp(Qk)。
W-timestamp(Q)表示数据项 Q 上成功执行 Write(Q) 操作的所有事务中的最大时间戳。
R-timestamp(Q)表示数据项 Q 上成功执行 Read(Q) 操作的所有事务中的最大时间戳。
用 TS(T) 表示事务 T 的时间戳,TS(Ti)< TS(Tj)表示事务 Ti 在事务 Tj 之前开始执行。
协议描述如下:
假设版本 Qk 具有小于或等于 TS(T)的最大时间截。
若事务 T 发出 read(Q),则返回版本 Qk 的内容。
若事务 T 发出 write(Q),则判断:
- 当 TS(T) < R-timestamp(Qk )时,回滚 T;
- 当 TS(T) = W-timestamp(Qk )时,覆盖 Qk 的内容。
否则,创建 Q 的新版本。
若一个数据对象的两个版本 Qk 和 Qi,其 W-timestamp 都小于系统中最老的事务的时间戳,则删除 Qk 和 Qi 中旧的那个版本。
【说明】
- MVCC 和封锁机制相比,消除了数据库中数据对象读和写操作的冲突,有效地提高了系统的性能。
- MVCC 会产生大量的无效版本,而且在事务结束时刻,其所影响的元组的有效性不能马上确定。
改进的多版本并发控制
改进多版本并发控制:将事务分为只读事务和更新事务。
MV2PL 协议
- 只读事务发生冲突的可能性很小,可以采用多版本时间戳。
- 对于更新事务,采用较保守的两阶段封锁(2PL)协议。
验证锁(C 锁):除了传统的读锁(共享锁)和写锁(排他锁)外,引进一个新的封锁类型,称为验证锁(certify-lock, 或 C 锁)。封锁的相容矩阵如下表:
R-Lock W-Lock C-Lock R-Lock Y Y N W-Lock Y N N C-Lock N N N
【说明】
- 在该方法中,读锁和写镇变得是相容的了,写形成新的版本,读则读旧 版本。
- 写事务要提交的时候,首先获得验证锁。获得验证锁后系统就可以丢掉旧值。
- MV2PL 的好处在于读锁和写锁不冲突,有效提高系统的并发性。