跳到主要内容

从腾讯云向量数据库迁移至 Zilliz Cloud

本文档说明腾讯云向量数据库迁移过程中 Zilliz Cloud 的数据类型映射规则、JSON 字段转换机制及 Collection 命名规范。

开始前

开始离线迁移前需满足:

腾讯云侧要求

要求项

详细说明

网络访问

源集群必须可通过公网访问

API 访问权限

需提供有效的实例 URL 及具备必要权限的 API 密钥

数据可用性

源 Collection 必须包含数据,空 Collection 无法迁移

Zilliz Cloud 侧要求

要求项

详细说明

用户权限

需具备组织管理员或项目管理员角色

目标集群容量

需预留足够 CU 容纳源数据(使用 CU 计算器预估容量)

网络连通性

如果有网络限制,请确保已将 Zilliz Cloud IP 加入白名单

数据类型映射

下表总结了腾讯云向量数据库字段类型如何映射到 Zilliz Cloud 字段类型,并对各类型做了详细说明。

腾讯云字段类型

Zilliz Cloud 字段类型

描述

主键

主键

腾讯云向量数据库的主键字段会自动映射为 Zilliz Cloud 中的主键。

在数据迁移时,您可以选择启用 Auto ID 功能;但请注意,启用后源 Collection 中的原始主键值将会被舍弃。

稠密向量

FLOAT_VECTOR

稠密向量字段会直接转换为 FLOAT_VECTOR,无需进行任何修改。

JSON

Dynamic field

默认情况下,腾讯云向量数据库的 JSON 字段会映射为 Zilliz Cloud 中的 Dynamic Field。有关详细信息,请参阅 Dynamic Field

在迁移数据时,如果您希望对某些动态字段使用固定数据类型并优化索引配置,建议将动态字段转换为固定字段。

JSON 字段转换说明

📘说明

Zilliz Cloud 采样 100 行数据检测 JSON 数据结构,必要时可手动添加字段。

腾讯云 JSON 字段默认映射为 Zilliz Cloud 的 Dynamic Field 以实现最大灵活性,转换为固定字段可带来:

  • 强数据类型校验:强制字段类型约束

  • 优化查询性能:建立专用索引

  • 结构化数据管理:统一数据规范

腾讯云字段类型

Zilliz Cloud 字段类型

描述

string

VARCHAR

如果 JSON 中的字段类型为 string,当转换为固定字段后,该字段将变为 VARCHAR 类型。

注意:该字段的最大长度固定为 65,535 字节且不可修改,容量计算以实际字段长度为准。

uint64

INT32

如果 JSON 中的字段类型为 uint64,当转换为固定字段后,该字段将变为 INT32 类型。

double

DOUBLE

如果 JSON 中的字段类型为 double,当转换为固定字段后,该字段将变为 DOUBLE 类型。

array

ARRAY

如果 JSON 中的字段类型为 array,当转换为固定字段后,该字段将变为 ARRAY 类型。

转换为固定字段后,可配置以下属性:

  • Nullable:决定字段是否接受空值(默认启用),详见 Nullable 属性

  • 默认值:设置数据缺失时的回退值,详见默认值

  • Partition Key:可将 INT64/VARCHAR 字段指定为 Partition Key(注意:每个 Collection 支持一个 Partition Key,且该字段不可为空),详见 使用 Partition Key

腾讯云特殊处理规则

Collection 命名规则

腾讯云 Collection 名称将按以下规则迁移至 Zilliz Cloud:

场景

影响

解决方案

默认命名

目标 Collection 名称默认与源 Collection 完全一致

保留原始名称

名称冲突

目标 Database 存在同名 Collection 时无法提交迁移任务

删除现有 Collection / 选择其他目标 Database / 迁移配置时重命名 Collection

特殊字符

需符合 Zilliz Cloud 命名规范

迁移前请检查 Collection 名称合法性