现在的位置: 首页 > 数据库 > MySQL > 正文
MySQL的事务和隔离级别
2013年09月23日 MySQL ⁄ 共 4000字 暂无评论 ⁄ 被围观 4,836 views+

一、什么是事务?

数据库的事物,是指将一系列的操作作为一个逻辑单元来执行,即加入由十条SQL语句组成的一个事物,则要么则十条都执行成功,要么都不执行!事务处理可以确保除非事务性单元内的所有操作都成功完成,否则不会永久更新面向数据的资源。一个逻辑工作单元要成为事务,必须满足所谓的ACID(原子性、一致性、隔离性和持久性)属性。

为什么要用事务?

假想一下,没有事务的情况会发生什么情况:你通过网银向别人转的账户转钱,结果执行到一半,出现故障(如服务器宕机),你的钱被减少了,而你转账的对方账户钱却没有加上去!钱消失了!

如果有事务会是怎么样的?当执行到一半出错,那已经执行的也会被撤销,保障ACID!

二、事务的ACID属性:

原子性(atomicity)

事务必须是原子工作单元;对于其数据修改,要么全都执行,要么全都不执行。通常,与某个事务关联的操作具有共同的目标,并且是相互依赖的。如果系统只执行这些操作的一个子集,则可能会破坏事务的总体目标。原子性消除了系统处理操作子集的可能性。

一致性(consistency)

事务在完成时,必须使所有的数据都保持一致状态。在相关数据库中,所有规则都必须应用于事务的修改,以保持所有数据的完整性。事务结束时,所有的内部数据结构(如 B 树索引或双向链表)都必须是正确的。某些维护一致性的责任由应用程序开发人员承担,他们必须确保应用程序已强制所有已知的完整性约束。例如,当开发用于转帐的应用程序时,应避免在转帐过程中任意移动小数点。

隔离性(isolation)

由并发事务所作的修改必须与任何其它并发事务所作的修改隔离。事务查看数据时数据所处的状态,要么是另一并发事务修改它之前的状态,要么是另一事务修改它之后的状态,事务不会查看中间状态的数据。这称为隔离性,因为它能够重新装载起始数据,并且重播一系列事务,以使数据结束时的状态与原始事务执行的状态相同。当事务可序列化时将获得最高的隔离级别。在此级别上,从一组可并行执行的事务获得的结果与通过连续运行每个事务所获得的结果相同。由于高度隔离会限制可并行执行的事务数,所以一些应用程序降低隔离级别以换取更大的吞吐量。

持久性(durability)

事务完成之后,它对于系统的影响是永久性的。该修改即使出现致命的系统故障也将一直保持。保证事务的持久性,主要通过如下方式完成:

  • 事务提交之前就已经写入数据至持久性存储;
  • 通过事务日志协助完成(事务日志使用连续IO,因此写入非常快)

三、MySQL对事务的支持情况:

MySQL数据库中,只有使用InnoDB 和 BDB存储引擎才支持事务,而其他存储引擎(如常用的MyISAM引擎)是不支持事务的,这点特别需要注意。

四、事务的隔离级别详解

SQL标准定义了4类隔离级别,包括了一些具体规则,用来限定事务内外的哪些改变是可见的,哪些是不可见的。低级别的隔离级一般支持更高的并发处理,并拥有更低的系统开销。

Read Uncommitted(读取未提交内容)

在该隔离级别,所有事务都可以看到其他未提交事务的执行结果。本隔离级别很少用于实际应用,因为它的性能也不比其他级别好多少。读取未提交的数据,也被称之为脏读(Dirty Read)。

Read Committed(读取提交内容)

这是大多数数据库系统的默认隔离级别(但不是MySQL默认的)。它满足了隔离的简单定义:一个事务只能看见已经提交事务所做的改变。这种隔离级别 也支持所谓的不可重复读(Nonrepeatable Read),因为同一事务的其他实例在该实例处理其间可能会有新的commit,所以同一select可能返回不同结果。

Repeatable Read(可重读)

这是MySQL的默认事务隔离级别,它确保同一事务的多个实例在并发读取数据时,会看到同样的数据行。不过理论上,这会导致另一个棘手的问题:幻读 (Phantom Read)。简单的说,幻读指当用户读取某一范围的数据行时,另一个事务又在该范围内插入了新行,当用户再读取该范围的数据行时,会发现有新的“幻影” 行。InnoDB和Falcon存储引擎通过多版本并发控制(MVCC,Multiversion Concurrency Control)机制解决了该问题。

Serializable(可串行化)

这是最高的隔离级别,它通过强制事务排序,使之不可能相互冲突,从而解决幻读问题。简言之,它是在每个读的数据行上加上共享锁。在这个级别,可能导致大量的超时现象和锁竞争。

这四种隔离级别采取不同的锁类型来实现,若读取的是同一个数据的话,就容易发生问题。例如:

   脏读(Drity Read):某个事务已更新一份数据,另一个事务在此时读取了同一份数据,由于某些原因,前一个RollBack了操作,则后一个事务所读取的数据就会是不正确的。

不可重复读(Non-repeatable read):在一个事务的两次查询之中数据不一致,这可能是两次查询过程中间插入了一个事务更新的原有的数据。

幻读(Phantom Read):在一个事务的两次查询中数据笔数不一致,例如有一个事务查询了几列(Row)数据,而另一个事务却在此时插入了新的几列数据,先前的事务在接下来的查询中,就会发现有几列数据是它先前所没有的。

在MySQL中,实现了这四种隔离级别,分别有可能产生问题如下所示:

下面,将利用MySQL的客户端程序,分别测试几种隔离级别。测试数据库为test,表为tx;表结构:

id                       int

num                   int

两个命令行客户端分别为A,B;不断改变A的隔离级别,在B端修改数据。

(一)、将A的隔离级别设置为read uncommitted(未提交读)

在B未更新数据之前:

客户端A:

B更新数据:

客户端B:

客户端A:

经过上面的实验可以得出结论,事务B更新了一条记录,但是没有提交,此时事务A可以查询出未提交记录。造成脏读现象。未提交读是最低的隔离级别。

(二)、将客户端A的事务隔离级别设置为read committed(已提交读)

在B未更新数据之前:

客户端A:

B更新数据:

客户端B:

客户端A:

       经过上面的实验可以得出结论,已提交读隔离级别解决了脏读的问题,但是出现了不可重复读的问题,即事务A在两次查询的数据不一致,因为在两次查询之间事务B更新了一条数据。已提交读只允许读取已提交的记录,但不要求可重复读。

(三)、将A的隔离级别设置为repeatable read(可重复读)

在B未更新数据之前:

客户端A:

B更新数据:

客户端B:

客户端A:

B插入数据:

客户端B:

客户端A:

       由以上的实验可以得出结论,可重复读隔离级别只允许读取已提交记录,而且在一个事务两次读取一个记录期间,其他事务部的更新该记录。但该事务不要求与其他事务可串行化。例如,当一个事务可以找到由一个已提交事务更新的记录,但是可能产生幻读问题(注意是可能,因为数据库对隔离级别的实现有所差别)。像以上的实验,就没有出现数据幻读的问题。

(四)、将A的隔离级别设置为 可串行化 (Serializable)

A端打开事务,B端插入一条记录

事务A端:

事务B端:

因为此时事务A的隔离级别设置为serializable,开始事务后,并没有提交,所以事务B只能等待。

事务A提交事务:

事务A端

事务B端

serializable完全锁定字段,若一个事务来查询同一份数据就必须等待,直到前一个事务完成并解除锁定为止 。是完整的隔离级别,会锁定对应的数据表格,因而会有效率的问题。

五、事务的其他说明:

5.1 事务的状态:

事务包括如下几种状态:

  • 活动的:正在执行
  • 部分提交的:最后一条语句执行后
  • 失败的:
  • 终止的:
  • 提交的:已经提交成功的

几种状态的转换情况见下图:

事务状态

 

5.2 事务的其他知识点:

事务并发执行的好处:提高吞吐量和资源利用率、减少等待时间。

事务调度的分类:可恢复调度、无级联调度。

并发控制依赖的技术手段:锁、时间戳、多版本和快照隔离

   锁:读锁(共享锁)、写锁(独占锁、排查锁)

   锁粒度:从大到小,Mysql服务器只支持表级锁,行锁需要有存储引擎完成;

 

5.3 事务的控制命令:

START TANSACTION:启动
    SQL语句
    ……

ROLLBACK: 回滚
COMMIT: 提交

事务流程如下:

mysql事务执行流程

需要注意的是,事务的回滚需要在提交之前,如果已经提交了,就无法回滚了。

另外在Mysql下,如果没有明确启动事务,且autocommit变量设置为1,就会实现自动提交,每一个操作都直接提交

查看当前autocommit设置:

mysql> SELECT @@autocommit;
+--------------+
| @@autocommit |
+--------------+
|            1         |
+--------------+
1 row in set (0.01 sec)

在MySQL的InnoDB存储引擎下,为了保障数据的持久性,默认将autocommit置为1,以实现自动提交事务。但为了数据的安全性,建议明确使用事务

 

5.4 事务的保存点:

在一个事务中,如果包含的语句较多,如一个事务要执行100条SQL语句,如果执行到99条的时候,发现95条出现了错误,需要回退,莫非只能全部回滚?

为了防止这样的情况发生,引入了保存点(SAVEPOINT)的概念。加入还是上述的100条语句,如果每十条语句建立一个保存点,那么则只需回滚至第90条即可,极大的提高了效率。

具体命令和流程如下:

START TANSACTION:启动
    SQL
    ……

    SAVEPOINT sid_one   :创建保存点
    SQL

    ……

    SAVEPOINT sid_two    :创建保存点

    ……

ROLLBACK TO sid   :回滚到指定保存点
COMMIT: 提交

给我留言

留言无头像?


×