MySQL备份与恢复功能将进入新时代
由于数据库通常保存着应用的核心数据,数据备份与恢复功能是必不可少的,大多数成熟的数据库管理系统都提供高性能的在线数据备份与定点(Point-in-time)恢复功能。但作为最流行的开源数据库产品,MySQL在这方面的功能是比较弱的,即使与另一个知名开源数据库PostgreSQL相比也远远不足。一直以来,MySQL只提供一个mysqldump工具来进行数据备份。这是个与数据库核心完全独立外围工具,简单说起来就是对要备份的表执行"SELECT *"语句,选出每条记录然后存储成INSERT语句或CSV格式。这种方式容易实现但显然性能不佳,尤其是恢复时需要导入数据,如果有大量数据将是一个非常慢的过程,一但发生故障,系统将长时间不能提供服务。不过,等到今年底MySQL 6.0发布之后(我估计会跳票),这一现象将完全改观。
MySQL 6.0中将计划引入全新的在线备份与恢复功能,届时备份与恢复功能将由各存储引擎提供的本地驱动(Native Driver)提供。各存储引擎可以以最方便高效的形式提供数据备份功能,前提是备份所得数据要对应于某个时间点数据库的一致状态(即备份包含且只包含当时所有已经提交事务(对于非事务存储引擎是所有已经完成的操作)修改的数据。这一时间点有两种选择,可以是备份刚开始的时间,也可以是备份刚刚结束时的时间。一个备份可能涉及到多个存储引擎(这也是MySQL实现在线备份功能的难点,目前MySQL备份功能不佳估计就与MySQL支持多个存储引擎的特性的关),但只要每个存储引擎都能提供对应于备份刚开始或刚结束时的一致数据,MySQL就能保证备份数据的全局一致性。这一点容易做到,MySQL会要求那些提供备份结束点一致性数据的存储引擎先进行备份,等到这些存储引擎备份完成后,再短暂的停止数据库写操作,然后启动那些提供备份起始点一致性数据的存储引擎的备份过程。
这样,MySQL上层只是把各个存储引擎备份的数据打个包(同时也提供备份数据压缩和加密功能),最关键的就是各存储引擎本地驱动的实现。由于备份与恢复功能由本地驱动提供,理论上可以提供比mysqldump好得多的备份与恢复性能,并且实现联机备份。以MyISAM存储引擎为例,原来要想对MyISAM类型的表作一个一致性备份,就并且锁定这个表,备份期间不能进行写操作,影响到系统服务。在将来的MySQL 6.0中,据开发人员的设想,MyISAM存储引擎的本地驱动将按如下方式进行数据备份:启动备份后,开启日志记录功能,记录备份过程中对被备份表的数据修改操作,然后拷贝.MYD和.MYI文件,最后拷贝备份期间的日志。这样备份将由.MYD/MYI文件和备份期间的更新日志构成,恢复时先恢复数据,再回放这些日志,就能将数据恢复到备份刚结束时的状态。并且由于这些日志是由MyISAM本地驱动提供的物理日志,不是逻辑的binlog,恢复性能会有很大提高。
如果一个存储引擎没有提供本地备份与恢复驱动,也可能进行联机一致性备份,方法是提供一致性快照读取功能,也就是使得MySQL上层可以通过原有的存储引擎API获得数据库某时间点的一致数据。通常这一功能只有采用多版本并发控制的事务型存储引擎才可以提供,如MySQL中最常用的存储引擎InnoDB和MySQL 6.0中将要推出的Falcon就满足这一条件。因此,这些存储引擎不作任何修改就能提供联机备份功能。不过这时备份的格式只能是独立与存储引擎内部数据存储格式的CSV等格式,备份与恢复速度都会比较差。因此,虽然Falcon可以通过一致性快照读取免费提供联机备份功能,MySQL还是计划开发Falcon的本地备份驱动程序。
如果一个存储引擎即没有提供本地驱动,也不提供一致性快照读取功能,这并不表示这个存储引擎的数据将不能参与备份。只不过这时为了保证备份数据的一致性,在备份期间对使用这些存储引擎的表的写操作将会被禁止。
根据MySQL的规划,MySQL将逐步为大部分常用的存储引擎都将提供本地驱动。这时MySQL备份与恢复的性能和系统可用性将跨上一个新台阶。并且备份与恢复的操作也会更简单,届时备份恢复只需要用以下的SQL命令即可:
BACKUP DATABASE databasename1, databasename2 TO "filename.backup";
RESTORE FROM "filename.backup";
唯一美中不足的是InnoDB很可能不会提供本地驱动。这主要是因为InnoDB实际上已经有了一个联机备份工具Hot-Backup,而且这个工具是要卖钱的。不过MySQL 6.0提供新的备份机制之后,InnoDB类型的表仍然可以用这个备份工具来备份,并且由于这两个组件都可以提供一致的数据,很容易结合起来提供一个全局一致的备份。