PostgreSQL逻辑复制解密原理解析-数据库

逻辑复制，是基于复制标识复制数据及其变化的一种方法，区别于物理复制对页面操作的描述，逻辑复制是对事务及数据元组的一种描述，这篇文章主要介绍了PostgreSQL逻辑复制解密原理解析,需要的朋友可以参考下

在数字化时代的今天，我们都认同数据会创造价值。为了最大化数据的价值，我们不停的建立着数据迁移的管道，从同构到异构，从关系型到非关系型，从云下到云上，从数仓到数据湖，试图在各种场景挖掘数据的价值。而在这纵横交错的数据网络中，逻辑复制扮演着及其重要的角色。让我们将视角从复杂的网络拉回其中的一个端点，从PostgreSQL出发，对其逻辑复制的原理进行解密。

在数字化时代的今天，我们都认同数据会创造价值。为了最大化数据的价值，我们不停的建立着数据迁移的管道，从同构到异构，从关系型到非关系型，从云下到云上，从数仓到数据湖，试图在各种场景挖掘数据的价值。而在这纵横交错的数据网络中，逻辑复制扮演着及其重要的角色。

让我们将视角从复杂的网络拉回其中的一个端点，从PostgreSQL出发，对其逻辑复制的原理进行解密。

1 概念与原理

逻辑复制，是基于复制标识复制数据及其变化的一种方法。区别于物理复制对页面操作的描述，逻辑复制是对事务及数据元组的一种描述。

图-WAL数据流示例

如图所示，物理复制的数据流是对tablespace/database/filenode文件的块进行操作，而逻辑复制的内容是对元组进行描述。

接下来我们来看逻辑复制中的几个概念：

复制槽

复制槽是记录复制状态的一组信息。由于WAL（预写式日志）文件在数据真正落盘后会删除，复制槽会防止过早清理逻辑复制解析所需的WAL日志。在逻辑复制中，每个插槽从单个数据库流式传输一系列更改，创建复制槽需要指定其使用的输出插件，同时创建复制槽时会提供一个快照。

输出插件

输出插件负责将WAL日志解码为可读的格式，常用的插件用test_decoding(多用来测试)，pgoutput（默认使用），wal2json（输出为json）。PostgreSQL定义了一系列回调函数，我们除了使用上述插件，可以通过回调函数编写自己的输出插件。

图-复制槽数据流

复制协议与消息

通过复制协议，我们可以从源端获取WAL数据流。例如通过PSQL工具建议复制连接

psql "dbname=postgres replication=database"

开启流式传输WAL

START_REPLICATION[ SLOT slot_name] [ PHYSICAL] XXX/XXX[ TIMELINE tli]

无论是物理复制，还是逻辑复制，使用PostgreSQL的发布订阅或者pg_basebackup搭建流复制，都是通过复制协议与定义的消息进行交互（物理复制和逻辑复制数据流内容不同）

图- WAL数据流消息类型

图-逻辑复制中的XLogData消息

工作流程

当我们了解了概念之后，来看一下整个解析的工作流程。由于WAL文件里一个事务的内容并不一定是连续的，所以需要通过Reorder后放在buffer中，根据事务ID组织成一条消息，COMMIT后发送给输出插件，输出插件解析后将消息流发送给目标端。

图-逻辑解析工作流程

2 问题与演进

当我们掌握了逻辑复制的原理，计划使用其构建我们的数据迁移应用之前，我们还有一些问题并没有解决。让我们来一起看看是什么亟待解决的问题，以及我们如何进行处理。

问题一：Failover slot

为了高可用性，数据库至少会存在一主一备的架构，当主库故障进行高可用切换时，备库却没有相应的复制槽信息，也就是缺少failover slot。这是由于保存slot信息的物理文件，未同步至备库。那么我们如何手动创建一个faliover slot呢？

1. 主库创建复制槽，检查备库wal文件是否连续

2. 复制包含slot信息的物理文件至备库，在pg_repslot目录下

3. 备库重启，重启后才可以看到复制槽信息，原因是读取slot物理文件的函数StartupReplicationSlots只会在postmaster进程启动时调用。

4. 定期查询主库slot状态，使用pg_replication_slot_advance函数推进备库复制槽

自此，我们在备库上也有了相应的信息，手动实现了failover slot。PostgreSQL生态中著名的高可用软件Patroni也是以这种方式进行了实现，区别只是在Patroni查询主库slot状态时将信息写入了DCS中，备库拿到DCS中的位点信息进行推进。

问题二：DDL同步

原生的逻辑复制不支持解析DDL语句，我们可以使用事件触发器来进行处理。

1. 使用事件触发器感知表结构变更，记录到DDL_RECORD表中，并将该表通过逻辑复制进行发布。

2. 接收端获取到该表的数据变更，即可处理为相应DDL语句进行执行。

图-事件触发器实现DDL同步

问题三：双向同步

当数据迁移涉及双向同步的管道时，例如想实现双主双写，对数据库同一对象进行操作，就会出现WAL循环。

图-相同表双向同步导致数据循环

部分DTS应用为了解决这个问题会创建辅助表，在事务中先对辅助表进行操作，通过解析到对辅助表的操作而得知该记录是又DTS应用插入，从而过滤该事务，不再循环解析。PostgreSQL对事务提供了Origin记录，无须辅助表，通过pg_replication_origin_session_setup函数或者发布订阅中的replorigin_create即可指定Origin ID。

指定Origin ID后，我们除了可以解析后通过DTS应用进行过滤，还也可以通过解析插件中的FilterByOriginCB回调函数在解析过程中过滤，这种方式减少了数据传输，效率更高。