MySQL中GTID的几个限制和解决方案

现在我看待一个技术,总是会换一种角度来看,在他能实现什么的基础上,我更喜欢看他不能做什么,为什么不能这么做。

比如MySQL GTID在5.6试水,5.7已经发展完善,但是还是有一些场景是受限的。比如下面的两个。

一个是create table xxx as select 的模式,另外一个是临时表相关的。

今天我们就来简单说说这两个场景。

GTID中create 语句限制的解法

create table xxx as select的语句,其实会被拆分为两部分,create语句和insert语句,但是如果想一次搞定,MySQL会抛出如下的错误。

mysql> create table test_new as select *from test;

ERROR 1786 (HY000): Statement violates GTID consistency: CREATE TABLE ... SELECT.

这种语句其实目标明确,复制表结构,复制数据,insert的部分好解决,难点就在于create table的部分,如果一个表的列有100个,那么拼出这么一个语句来就是一个工程了。

我们也巧学巧用,看看MySQL有什么特别的方法来处理。

除了规规矩矩的拼出建表语句之外,还有一个方法是MySQL特有的用法 like。

create table xxx as select 的方式会被拆分成两部分。

create table xxxx like data_mgr;

insert into xxxx select *from data_mgr;

临时表的限制和考虑

另外一个看起来就有些蹊跷了,看着文档就是没有什么好说的,记住了就好,其实不然。

如果在事务中有临时表的变动,很可能会导致数据不一致,这在MySQL的5.5版本中有相应的bug,可以参见https://bugs.mysql.com/bug.php?id=76940

如果需要复现,可以在找一套5.5的环境来模拟一下,分分钟出效果。

我们创建两个表t1,t2,然后建立两个表之间的外键关联,作为 后续测试所用。

create table t1(c1 int primary key) engine=innodb;

insert into t1 values(1),(2),(3),(4),(5);

create table t2 (c1 int, c2 int, foreign key(c2) references t1(c1)) engine=innodb;

insert into t2 values(1,1),(2,2),(5,5);

创建临时表

> create temporary table tmp as select * from t1;

Query OK, 5 rows affected (0.01 sec)

Records: 5 Duplicates: 0 Warnings: 0

模拟这个bug,开启事务。

> begin;

> drop temporary table if exists tmp;

Query OK, 0 rows affected (0.00 sec)

> delete from t1 where c1 > 2;

ERROR 1451 (23000): Cannot delete or update a parent row: a fore;

Query OK, 0 rows affected (0.00 sec)

然后使用mysqlbinlog来查看一下里面的信息。可以看到除了上面的临时表操作,后面的delete也会写入binlog

use `test`/*!*/;

SET TIMESTAMP=1499784283/*!*/;

DROP TEMPORARY TABLE IF EXISTS `tmp` /* generated by server */

/*!*/;

# at 300

# at 341

#170711 22:44:46 server id 13386 end_log_pos 341 Table_map: `test`.`t1` mapped to number 207

#170711 22:44:46 server id 13386 end_log_pos 380 Delete_rows: table id 207 flags: STMT_END_F

BINLOG \'

XuRkWRNKNAAAKQAAAFUBAAAAAM8AAAAAAAEABHRlc3QAAnQxAAEDAAA=

XuRkWRlKNAAAJwAAAHwBAAAAAM8AAAAAAAEAAf/ AwAAAP4EAAAA

\'/*!*/;

###DELETE FROM test.t1

### WHERE

### @1=3 /* INT meta=0 nullable=0 is_null=0 */

### DELETE FROM test.t1

### WHERE

### @1=4 /* INT meta=0 nullable=0 is_null=0 */

# at 380

#170711 22:44:49 server id 13386 end_log_pos 449 Query thread_id=176 exec_time=0 error_code=0

SET TIMESTAMP=1499784289/*!*/;

COMMIT

通过这个可以清晰的看到尽管已经做了事务回滚,但是binlog还是会记录下回滚的变更,这在某些场景中会触发主从数据不一致。

而在GTID中,已经做了这个检查,归根结底,还是cache里面的机制,大体来说,binlog有两个cache来缓存事务的binlog:

binlog_cache_data stmt_cache; //存放非事务表和临时表binlog

binlog_cache_data trx_cache; //存放事务表binlog

此处参考了https://www.kancloud.cn/taobaomysql/monthly/67044

所以说两个概念性的知识点如果稍一扩展就会有很多可行的方案来。

文/杨建荣

本文来源:https://m.sohu.com/a/156348008_505857


如果给你带来帮助,欢迎微信或支付宝扫一扫,赞一下。