跳到主要内容

从 PostgreSQL 迁移至 Zilliz Cloud

本文档说明从 PostgreSQL 迁移时,Zilliz Cloud 如何处理数据类型映射、Collection 命名规则及注意事项。

开始前

开始离线迁移前需满足:

PostgreSQL 侧要求

要求项

详细说明

网络访问

源集群必须可通过公网访问

数据库权限

需提供有效的数据库 Endpoint、用户名及密码(具备必要权限)

pgvector 扩展

必须启用 pgvector 扩展存储向量数据

向量字段要求

每个源表需包含至少一个向量字段,且向量字段禁止为空值

数据可用性

源表必须包含数据,空表无法迁移

Zilliz Cloud 侧要求

要求项

详细说明

用户权限

需具备组织管理员或项目管理员角色

目标集群容量

需预留足够 CU 容纳源数据(使用 CU 计算器预估容量)

网络连通性

如果有网络限制,请确保已将 Zilliz Cloud IP 加入白名单

数据类型映射

下表总结了 PostgreSQL 字段类型如何映射到 Zilliz Cloud 字段类型,并对各类型做了详细说明。

PostgreSQL 字段类型

Zilliz Cloud 字段类型

描述

主键

主键 / Auto ID

  • 单字段主键:直接映射为目标 Collection 的主键。

  • 无主键:如果源表没有主键字段,目标 Collection 将启用 Auto ID 功能。

  • 复合主键:默认启用 Auto ID 功能;复合主键将作为普通标量字段处理。

    在数据迁移时,您可以选择启用 Auto ID 功能;但请注意,启用后源表中的原始主键值将会被舍弃。

vector

FLOAT_VECTOR

向量维度保持不变。

text/varchar/date/time

VARCHAR

以字符串存储。

bigint

INT64

-

integer

INT32

-

smallint

INT16

-

double precision

DOUBLE

-

real

FLOAT

-

boolean

BOOL

-

array

ARRAY

-

json

JSON

-

PostgreSQL 特殊处理规则

Collection 命名规则

PostgreSQL 索引名称将按以下规则迁移至 Zilliz Cloud:

场景

影响

解决方案

默认命名

Collection 名称与源索引名称完全一致

保留原始名称

名称冲突

目标 Database 存在同名 Collection 时无法提交迁移任务

删除现有 Collection / 选择其他目标 Database / 迁移配置时重命名 Collection

名称修改

迁移过程支持重命名

可在迁移配置阶段修改 Collection 名称

迁移注意事项

从 PostgreSQL 迁移时需注意以下事项:

限制项

影响

替代方案

动态字段转固定字段

无法将现有动态字段转换为固定类型

字段保持原始动态特性

迁移过程中添加新字段

仅迁移 Elasticsearch 已有字段

无法在迁移时新增字段