PostgreSQL 流复制与逻辑复制的区别

在本文中，我们将介绍 PostgreSQL 数据库中流复制（Stream Replication）与逻辑复制（Logical Replication）的区别。这两种复制方式都是常用的实现数据库复制和高可用性的方法，但它们在复制的原理和应用场景上存在一些差异。

阅读更多：PostgreSQL 教程

流复制

流复制是 PostgreSQL 提供的一种物理复制方法，它通过复制主数据库的所有事务日志（WAL）记录到从数据库，实现数据的实时同步。流复制的原理是主数据库将 WAL 日志流发送给从数据库，从数据库根据这些 WAL 日志进行重放，以获得与主数据库完全一致的副本。

流复制是基于流式传输的，因此它的实时性较高。当主数据库上的数据发生变化时，WAL 日志会立即传输给从数据库，并进行重放。流复制还支持异步模式，在这种模式下，主数据库只需将 WAL 日志发送给从数据库，而无需等待从数据库确认接收。这种模式可以极大地提高主数据库的性能，但是会导致在出现故障时可能丢失少量的数据。

流复制适用于大部分的数据库复制场景，特别是那些对数据同步性和高可用性要求较高的场景。然而，由于流复制是物理复制，复制的粒度是整个数据库实例，因此无法实现一些更细粒度的需求，例如只复制某个表或某些特定的数据。

下面是流复制的配置示例：

-- 主数据库配置
wal_level = replica
max_wal_senders = 5
wal_keep_segments = 32

-- 从数据库配置
hot_standby = on

逻辑复制

逻辑复制是 PostgreSQL 10 及以上版本引入的一项新功能，它提供了更灵活的数据库复制方法。逻辑复制的原理是通过解析主数据库的 WAL 日志来获取逻辑变更，并将这些变更应用到从数据库。与流复制只复制二进制日志不同，逻辑复制复制的是数据库更改的逻辑表示。

逻辑复制支持指定复制的对象，例如表、视图等，并可以选择复制的字段。这使得逻辑复制非常适用于需要复制特定表或特定数据的场景。此外，逻辑复制还支持跨版本、跨操作系统复制，因为它复制的是逻辑表示，而不是底层的二进制数据。

逻辑复制需要在主数据库和从数据库上分别创建发布者（Publisher）和订阅者（Subscriber），并通过逻辑槽（Replication Slot）进行数据交换。主数据库负责发布变更，从数据库通过订阅者将这些变更应用到自己的数据库中。

下面是逻辑复制的配置示例：

-- 主数据库配置
wal_level = logical
max_replication_slots = 2
max_wal_senders = 2

-- 从数据库配置
max_replication_slots = 2

流复制与逻辑复制的对比

流复制和逻辑复制都是 PostgreSQL 实现数据库复制和高可用性的有效方法，下面是它们之间的一些主要区别：

数据复制粒度：流复制复制的是整个主数据库的 WAL 日志，复制的粒度很粗，因而无法实现细粒度的复制需求。而逻辑复制支持指定复制的对象和字段，可以实现更细粒度的复制。
数据类型和版本兼容性：流复制复制的是二进制数据，因此对数据类型和版本兼容性要求较高。而逻辑复制复制的是逻辑表示，可以实现跨版本、跨操作系统的复制。
复制的灵活性：流复制只提供同步模式，复制的延迟较低，适用于那些要求数据同步性和高可用性的场景。而逻辑复制可以选择同步模式或异步模式，可以根据业务需求进行灵活配置。
复制的性能开销：流复制需要实时传输 WAL 日志，对网络和磁盘的压力较大，可能影响主数据库的性能。而逻辑复制只需要通过逻辑槽传输增量变更，相对于流复制开销较小。

因此，我们需要综合考虑实际需求来选择流复制还是逻辑复制。如果需要实时同步整个数据库的数据，可以选择流复制；如果需要复制特定表或特定数据，并且对跨版本、跨操作系统有需求，可以选择逻辑复制。