解锁MySQL备份恢复的4种正确姿势

冯帅 2017-06-05 14:35:12

本文根据DBAplus社群第104期线上分享整理而成。

讲师介绍

冯帅

点融网高级DBA

获有Oracle OCM、MySQL OCP；
目前从事MySQL相关的运维和架构工作，擅长异构数据库交互。

分享大纲：

mysqldump
mysqlbackup
mysqlhotcopy
xtrabackup/innobackupex

备份高于一切，今天汇总一下常用的几种备份方法，以及恢复的步骤。

一、mysqldump

在日常工作中，我们会使用mysqldump命令创建SQL格式的转储文件来备份数据库。或者我们把数据导出后做数据迁移，主备搭建等操作。mysqldump是一个逻辑备份工具,复制原始的数据库对象定义和表数据产生一组可执行的SQL语句。默认情况下,生成insert语句，也能生成其它分隔符的输出或XML格式的文件。

shell> mysqldump [arguments] > file_name

我们简单来看一下日常的用法：

备份所有的数据库：

shell> mysqldump --all-databases > dump.sql (不包含INFORMATION_SCHEMA,performance_schema,sys，如果想要导出的话还要结合--skip-lock-tables和--database一起用)

备份指定的数据库：

shell> mysqldump --databases db1 db2 db3 > dump.sql

当我们只备份一个数据的时候可以省去 --databases 直接写成：mysqldump test > dump.sql 不过有一些细微的差别，如果不加的话，数据库转储输出不包含创建数据库和use语句，所以可以不加这个参数直接导入到其它名字的数据库里。

当然我们也可以只备份某个表：

mysqldump --user [username] --password=[password] [database name] [table name] table_name.sql

了解了简单的一些用法后我们再着重看一下几个参数：

master-data 获取备份数据的Binlog位置和Binlog文件名，用于通过备份恢复的实例之间建立复制关系时使用，该参数会默认开启。
dump-slave 用于在slave上dump数据，建立新的slave。因为我们在使用mysqldump时会锁表，所以大多数情况下，我们的导出操作一般会在只读备库上做，为了获取主库的Relay_Master_Log_File和Exec_Master_Log_Pos，需要用到这个参数，不过这个参数只有在5.7以后的才会有
no-data, -d 不导出任何数据，只导出数据库表结构

刚刚我们说过在使用mysqldump的时候会锁表，我们来详细看一下它的锁机制。

我们开两个窗口，在第一个里面执行mysqldump -uroot -pxxxxx --master-data=2 --databases dbname > /tmp/dbnamedate +%F.sql 然后第二个窗口登陆进去，使用show process的命令可以看到目前dump的session正在执行。

SELECT /!40001 SQL_NO_CACHE / * FROM table_name; 可以看到这条SQL正在以no_cache的模式查询数据。

然后我们在同样的表上执行一下select，发现被阻塞了。光标一直不返回。

一般遇到这种文件，我们会想是不是有锁呢？为了验证我们查看一下锁的信息，可以发现dump的进程实际上是加了锁的。

我们把具体的general_log打开，然后看一下当时的操作：

4101044 Query FLUSH /!40101 LOCAL / TABLES

4101044 Query FLUSH TABLES WITH READ LOCK

（关闭所有打开的表，同时对于所有数据库中的表都加一个读锁，直到显示地执行unlock tables，该操作常常用于数据备份的时候。）

4101044 Query SHOW MASTER STATUS

（这是因为我用了--master-data=2）

所以这个时候表就会被锁住。

如果我不加--master-data参数(mysqldump -uroot -pxx --databases db > /tmp/dbnamedate +%F.sql) mysql会显示的对每一张要备份的表执行 LOCK TABLES table_name1 READ,LOCK TABLES table_name2 READ ，并且也不会有读的阻塞。

那有没有不锁的方法，其实也是有的，就是使用--single-transaction把备份的操作放在一个事务里去进行。

带上--single-transaction参数的mysqldump备份过程：

如果是5.6版本的MySQL

在备份之间同样的先FLUSH TABLES WITH READ LOCK，然后设置事务级别SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ，然后开启一个事务START TRANSACTION进行备份，这个时候备份的过程就很意思，它先创建了一个savepoint，然后把数据库里的表依次的进行备份，备份完成了之后又回滚到了之前的savepoint，来保证数据的一致性。

如果是5.7版本的MySQL

备份前的操作相同，只是没有了savepoint。

不过不管是哪个版本，只有InnoDB表是在一个一致性的状态。其它的任何MyISAM表或内存表是没有用的。 mysqldump的优势是可以查看或者编辑十分方便，它也可以灵活性的恢复之前的数据。它也不关心底层的存储引擎，既适用于支持事务的，也适用于不支持事务的表。不过它不能作为一个快速备份大量的数据或可伸缩的解决方案。如果数据库过大,即使备份步骤需要的时间不算太久,但有可能恢复数据的速度也会非常慢,因为它涉及的SQL语句插入磁盘I/O,创建索引等等。对于大规模的备份和恢复,更合适的做法是物理备份,复制其原始格式的数据文件,可以快速恢复:如果你的表主要是InnoDB表,或者如果你有一个InnoDB和MyISAM表,可以考虑使用MySQL的mysqlbackup命令备份。

恢复操作：

先看一下当前的数据：

dbadmin@test 11:10:34>select * from t;

+-------+

| id |

+-------+

| 1 |

+-------+

1 row in set (0.00 sec)

备份；

mysqldump -uroot -proot@1234 --master-data=1 test >test.sql

模拟增量操作：

dbadmin@test 11:15:17>insert into t values (2);

Query OK, 1 row affected (0.00 sec)

dbadmin@test 11:15:36>select * from t; +------+ | id | +------+ | 1 | | 2 | +------+ 2 rows in set (0.00 sec)

模拟误操作：

dbadmin@test 11:15:41>truncate table t;

Query OK, 0 rows affected (0.01 sec)

dbadmin@test 11:16:14>select * from t;

Empty set (0.00 sec)

模拟恢复操作：

step 1：找到误操作的log position

dbadmin@test 11:20:57>show master logs;

dbadmin@(none) 11:21:37>show binlog events in 'mysql-bin.000004';

查看可以看到是444。

step 2：恢复到备份

dbadmin@test 11:16:25>source test.sql

dbadmin@test 11:17:26>select from t;

+-------+

| id |

+-------+

| 1 |

+-------+

1 row in set (0.00 sec)

step 3: 因为我们在备份的时候使用了master-data的参数，所以可以直接看到备份时候的最后位置，然后应用中间的log。查看可以看到是187。

我们使用mysqlbinlog得到这一段时间的操作，其实我们也可以用这个工具得到操作后使用sed进行undo的操作。

mysqlbinlog --start-position=187 --stop-position=444 mysql-bin.000004 > increment.sql

dbadmin@test 11:44:37>source /u01/my3307/log/increment.sql dbadmin@test 11:44:50>select from t; +------+ | id | +------+ | 1 | | 2 | +------+

至此数据恢复。

二、mysqlbackup

mysqlbackup是Oracle公司提供的针对企业的备份软件，全名叫做MySQL Enterprise Backup，是一个收费的软件。

下载地址：https://www.mysql.com/products/enterprise/backup.html ，可以试用下载。

我们简单来看一下这个工具的使用。

查看所有的帮助：

我这里只是截取了一小部分，这个帮助很长，参数很多，功能很全，是oracle官方主推的备份方式。

全量备份

mysqlbackup --user=root --password=ucjmh --databases='t1' --encrypt-password=1 --with-timestamp --backup-dir=/u01/backup/ backup

解释一下参数：

databases 要备份的数据库
with-timestamp 产生一个当前时间的备份目录。mysqlbackup这个工具要求一个空目录才能做备份。所以这个会常用。
backup-dir 备份的目录。
compress：压缩备份这个提供了多种压缩方法和压缩级别。1--9,压缩比依次递增。

backup 是备份的方式，一共有如下几种方式，我会在一个恢复案例里把常用的几个都用到。

Backup operations: backup, backup-and-apply-log, backup-to-image

Update operations: apply-log, apply-incremental-backup

Restore operations: copy-back, copy-back-and-apply-log

Validation operation: validate

Single-file backup operations: image-to-backup-dir, backup-dir-to-image, list-image, extract

其实，在大多数情况下,单个文件备份,使用backup-to-image命令创建,性能优于backup。buckup这个命令只执行一个完整的备份过程的初始阶段。需要通过再次运行mysqlbackup运用apply-log 命令，使备份一致。

mysqlbackup --user=root --password=ucjmh --databases='t1' --encrypt-password=1 --with-timestamp --backup-dir=/u01/backup/2017-04-28_12-49-35/ apply-log

当然你可以直接用backup-and-apply-log 不过这个时候的备份将不能用于增量了。

增量备份：

mysqlbackup --user=root --password=ucjmh --databases='t1' --encrypt-password=1 --with-timestamp --backup-dir=/u01/backup/ --incremental --incremental-base=dir:/u01/backup/2017-04-28_12-49-35 --incremental-backup-dir=/u01/backup/incremental backup

这个是基于上次的备份做的备份，当然也可以基于某一个log position之后做。

--incremental：代表增量备份；

--incremental-base：上次全备的目录；

--incremental-backup-dir：增量备份的保存的目录

再多说一点关于image的备份:

使用如下命令可以进行备份：

mysqlbackup --user=root --password=ucjmh --databases='t1' --encrypt-password=1 --with-timestamp --backup-dir=/u01/backup/ --backup-image=all.mbi backup-to-image

备份之后可以很清楚的发现这个比backup要节省很多空间，把所有的文件都以二进制的方式放在了all.mbi这个文件里，可以使用list-image来查看具体内容。

mysqlbackup --backup-image=/u01/backup/2017-04-28_14-50-17/all.mbi list-image

同样的也可以使用 mysqlbackup --backup-image=/u01/backup/2017-04-28_14-50-17/all.mbi extract 来解压出来具体的内容。

因为这是一个Oracle出的工具，有很深的rman的影子在，0级，1级备份，加密，异构机器还原等特性。

更多的参数可以参看online help：

https://dev.mysql.com/doc/mysql-enterprise-backup/4.1/en/backup-commands-single-file.html

恢复操作：

查看当前数据

dbadmin@test 11:51:32>select * from t;

+-------+

| id |

+-------+

| 1 |

+-------+

1 row in set (0.01 sec)

全量备份

mysqlbackup --user=root --password=root@1234 --databases='test' --with-timestamp --backup-dir=/data/backup/ backup

模拟增量操作：

dbadmin@test 11:54:04>select * from t;

+-------+

| id |

+-------+

| 1 |

| 2 |

+-------+

2 rows in set (0.00 sec)

增量备份：

mysqlbackup --user=root --password=root@1234 --databases='test' --with-timestamp --backup-dir=/data/backup/ --incremental --incremental-base=dir:/data/backup/2017-04-29_11-53-20 --incremental-backup-dir=/data/backup/incremental backup

模拟无备份操作：

dbadmin@test 11:57:10>select * from t;

+-------+

| id |

+-------+

| 1 |

| 2 |

| 3 |

+-------+

3 rows in set (0.00 sec)

模拟误操作：

dbadmin@test 11:57:17>truncate table t; Query OK, 0 rows affected (0.01 sec)

模拟恢复操作：

step 1：找到误操作的log position

dbadmin@test 11:58:06>show master logs;

dbadmin@test 11:58:18>show binlog events in 'mysql-bin.000001';

1333

step 2：恢复全量

检测并应用日志：

mysqlbackup --backup-dir=/data/backup/2017-04-29_11-53-20 apply-log

step 3：应用增量

mysqlbackup --backup-dir=/data/backup/2017-04-29_11-53-20 --incremental-backup-dir=/data/backup/incremental/2017-04-29_11-55-54 apply-incremental-backup

step 4：物理文件复制还原

mysqlbackup --backup-dir=/data/backup/2017-04-29_11-53-20 copy-back

数据恢复到备份的时候：

dbadmin@test 12:09:49>select * from t;

+-------+

| id |

+-------+

| 1 |

| 2 |

+-------+

2 rows in set (0.00 sec)

恢复完成之后，data目录下会生成backup_variables.txt的文件（其实在备份的时候就已经有这些文件的），找到备份的时候的log position，然后从binlog恢复无备份的数据。

binlog_position=mysql-bin.000001:1076 mysqlbinlog mysql-bin.000001 --start-position=1076 --stop-position=1333 -vv >increment.sql

dbadmin@test 12:14:07>source /u01/my3307/log/increment.sql dbadmin@test 12:14:16>select * from t;

+-------+

| id |

+-------+

| 1 |

| 2 |

| 3 |

+-------+

3 rows in set (0.00 sec)

至此数据恢复。

大致梳理一下操作步骤，来了解一下恢复的原理：

首先检测并应用全备事务日志文件（这里是因为我备份的时候用的是backup而不是backup-and-apply-log），然后基于全备去应用增量的log。这个时候如果有多次增量备份也可以（基于LSN点向后应用）。所有的都应用完成之后就是一个可以直接cp的数据库了。

个人感觉这个工具比xtrabackup好用，但是xtrabackup是开源的，所以市场占有量才会大，才会更有名，更多人用吧。

三、mysqlhotcopy

mysqlhotcopy使用lock tables、flush tables和cp或scp来快速备份数据库.它是备份数据库或单个表最快的途径,完全属于物理备份,但只能用于备份MyISAM存储引擎和ARCHIVE引擎，并且是一个服务器命令，只能运行在数据库目录所在的机器上.与mysqldump备份不同,mysqldump属于逻辑备份,备份时是执行的sql语句.使用mysqlhotcopy命令前需要要安装相应的软件依赖包. 因为这个功能很弱，我们只简单的介绍一个怎么用：

备份一个库

mysqlhotcopy db_name [/path/to/new_directory]

备份一张表

mysqlhotcopy db_name./table_name/ /path/to/new_directory

更详细的使用可以使用perldoc mysqlhotcopy查看。

四、xtrabackup/innobackupex

Percona XtraBackup是一款基于MySQL的热备份的开源实用程序，它可以备份5.1到5.7版本上InnoDB,XtraDB,MyISAM存储引擎的表， Xtrabackup有两个主要的工具：xtrabackup、innobackupex 。

（1）xtrabackup只能备份InnoDB和XtraDB两种数据表，而不能备份MyISAM数据表　　

（2）innobackupex则封装了xtrabackup，是一个脚本封装，所以能同时备份处理innodb和myisam，但在处理myisam时需要加一个读锁。

首先我们先来简单的了解一下xtrabackup是怎么工作的。xtrabackup基于innodb的crash-recovery（实例恢复）功能，先copy innodb的物理文件（这个时候数据的一致性是无法满足的），然后进行基于redo log进行恢复，达到数据的一致性。

详细的信息可以参数https://www.percona.com/doc/percona-xtrabackup/LATEST/how_xtrabackup_works.html 我就不翻译了。

我们还是简单来看一下日常工作中具体的使用：

全备：

xtrabackup --backup --target-dir=/data/backup/base

可以先看到

在备份过程中,可以看到很多输出显示数据文件被复制,以及日志文件线程反复扫描日志文件和复制。

同样的，它也输出了当前的binlog filename和position，如果有gtid(同样也会输出) 可以用于搭建主从。最后一行一定会是你的lsn被copy的信息。这是因为每次启动备份，都会记录170429 12:54:10 >> log scanned up to (1676085)），然后开始拷贝文件，一般来讲数据库越大拷贝文件是要花费越长的时间，所以说这期间一般情况都会有新的操作，所以说所有文件也可能记录的并不是一个时间点的数据，为了解决数据这个问题，XtraBackup 就会启动一个后台进程来每秒1次的观测mysql的事务日志，直到备份结束。而且把事务日志中的改变记录下来。我们知道事物日志是会重用的（redo log）,所以这个进程会把redolog写到自己的日志文件xtrabackup_log，这个后台监控进程会记录所有的事务日志的改变，用于保证数据一致性所。

增量备份：

当我们做过全量备份以后会在目录下产生xtrabackup_checkpoints的文件这里面记录了lsn和备份方式，我们可以基于这次的全量做增量的备份。

$cat xtrabackup_checkpoints

backup_type = full-backuped

from_lsn = 0

to_lsn = 1676085

last_lsn = 1676085

compact = 0

recover_binlog_info = 0

xtrabackup --backup --target-dir=/data/backup/inc1 --incremental-basedir=/data/backup/base

这个时候xtrabackup也是去打开了xtrabackup_checkpoints文件进行上一次备份的信息查看。这个时候去查看增量备份的xtrabackup_checkpoints也记录了这些信息。

$cat xtrabackup_checkpoints

backup_type = incremental

from_lsn = 1676085

to_lsn = 1676085

last_lsn = 1676085

compact = 0

recover_binlog_info = 0

这也意味着你可以在增量的备份上继续增量的备份。

同样的，xtrabackup也支持压缩（--compress）、加密（--encrypt）、并行(--parallel)等操作，但是和mysqlbackup不同的是这个没有同时的备份binlog,而mysqlbackup是备份了binlog的。

我们来模拟一个恢复的过程深入的了解一下原理。

查看当前数据：

dbadmin@test 03:04:33>select from t;

+-------+

| id |

+-------+

| 1 |

+-------+

1 row in set (0.00 sec)

全量备份

$xtrabackup --backup --target-dir=/data/backup/base

模拟增量数据

dbadmin@test 03:07:16>select from t;

+-------+

| id |

+-------+

| 1 |

| 2 |

+-------+

2 rows in set (0.00 sec)

进行增量备份：

$xtrabackup --backup --target-dir=/data/backup/inc1 --incremental-basedir=/data/backup/base

模拟无备份操作：

dbadmin@test 03:09:42>select * from t;

+-------+

| id |

+-------+

| 1 |

| 2 |

| 3 |

+-------+

3 rows in set (0.00 sec)

模拟误操作：

dbadmin@test 03:09:45>truncate table t; Query OK, 0 rows affected (0.00 sec)

模拟恢复操作：

step 1：找到误操作的log position

dbadmin@test 03:10:19>show master logs;

dbadmin@test 03:10:47>show binlog events in 'mysql-bin.000001';

1333

我们需要分别对全量、增量备份各做一次prepare操作。

xtrabackup --prepare --apply-log-only --target-dir=/data/backup/base

增量

xtrabackup --prepare --apply-log-only --target-dir=/data/backup/base \ --incremental-dir=/data/backup/inc1

如果我们使用它自带的还原命令的时候就要先把data目录给清空。不然就会报如下的错误

$innobackupex --copy-back /data/backup/base/

170429 15:37:19 innobackupex: Starting the copy-back operation

IMPORTANT: Please check that the copy-back run completes successfully.

At the end of a successful copy-back run innobackupex prints "completed OK!".

innobackupex version 2.4.6 based on MySQL server 5.7.13 Linux (x86_64) (revision id: 8ec05b7) Original data directory /u01/my3307/data is not empty!

当然我们大多数据时候是不会在原来的实例上做操作的，都会把相应的备份在奇他的实例上进行恢复，然后再导出导入到误操作的实例。这里我们直接清掉目录，然后再次运行，查看恢复后的数据：

dbadmin@test 03:41:56>select * from t;

+-------+

| id |

+-------+

| 1 |

| 2 |

+-------+

2 rows in set (0.00 sec)

同样的被恢复的目录里会多出来两个文件，一个是xtrabackup_binlog_pos_innodb，一个是xtrabackup_info。在这两个文件中都可以看到你最后的log,pos。在info里还可以看到lsn。我们基于这个pos再进行binlog的重演，恢复在binlog没有被备份的数据。

1076

$mysqlbinlog mysql-bin.000001 --start-position=1076 --stop-position=1333 -vv >increment.sql

dbadmin@test 03:51:25>source /u01/my3307/log/increment.sql dbadmin@test 03:51:34>select * from t;

+-------+

| id |

+-------+

| 1 |

| 2 |

| 3 |

+-------+

3 rows in set (0.00 sec)

至此数据恢复完成。

https://www.percona.com/doc/percona-xtrabackup/LATEST/backup_scenarios/full_backup.html

五、直接复制整个数据库目录

MySQL还有一种非常简单的备份方法，就是将MySQL中的数据库文件直接复制出来。这是最简单，速度最快的方法。不过在此之前，要先将服务器停止，这样才可以保证在复制期间数据库的数据不会发生变化。如果在复制数据库的过程中还有数据写入，就会造成数据不一致。这种情况在开发环境可以，但是在生产环境中很难允许备份服务器。

注意：这种方法不适用于InnoDB存储引擎的表，而对于MyISAM存储引擎的表很方便。同时，还原时MySQL的版本最好相同。只所以提这一点是因为当有停机窗口时，搭建主从的时候，这个往往是最快的。

一般生产环境的备份都会用percona-xtrabackup或者mysqlbackup，结合自己的情况，选择合适的备份策略，适时拿出来验证备份的有效性。

Q&A

Q1：用innobackupex备份MySQL5.5版本的数据，恢复的时候用backu5.6恢复，出现ibdata1找不到，这是什么原因呢？

A1：跨版本恢复以后，恢复出来的数据的元信息还是以前低版本的，在起动服务器之前需要先执行一下mysql_upgrade。这其实也是一个升级的问题，我们当然可以采用innobackupex来做升级操作了，同样的mysqlbackup也是可以的。因为有些时候我们的库太大了，不适合导入导出来升级的操作。

Q2：你讲的方法适合集群吗？如果不适合集群的话，用什么方法？

A2：当然，其实都是一样的。原理只是对数据库的数据进行复制，主从、PXC、MHA等多种环境都是有在用的。

Q3：生产环境，1T数据量用什么备份好？

A3：我的建议是你可以使用mysqlbackup，比较下来，这个速度算是很快的，不过当你的数据量达到一个T时，也应该去考虑如何分库分表，当做到这一点的时候，也是化整为零，可以把备份和正常的负载都分摊到多台服务器上。

直播链接

如需回听直播，请戳：

https://m.qlchat.com/topic/260000366578461.htm?isGuide=Y

密码：222

解锁MySQL备份恢复的4种正确姿势

降本的Kubernetes何时成了“成本刺客”？

YouTube如何利用MySQL支撑24.9亿用户？

人肉运维100次后，年底出了P0级故障……

关于国产数据库我不得不说

分库分表，可能真的要退出历史舞台了！