从腾讯云向量数据库迁移至 Zilliz Cloud
本文档说明腾讯云向量数据库迁移过程中 Zilliz Cloud 的数据类型映射规则、JSON 字段转换机制及 Collection 命名规范。
开始前
开始离线迁移前需满足:
腾讯云侧要求
要求项 | 详细说明 |
---|---|
网络访问 | 源集群必须可通过公网访问 |
API 访问权限 | 需提供有效的实例 URL 及具备必要权限的 API 密钥 |
数据可用性 | 源 Collection 必须包含数据,空 Collection 无法迁移 |
Zilliz Cloud 侧要求
要求项 | 详细说明 |
---|---|
用户权限 | 需具备组织管理员或项目管理员角色 |
目标集群容量 | 需预留足够 CU 容纳源数据(使用 CU 计算器预估容量) |
网络连通性 | 如果有网络限制,请确保已将 Zilliz Cloud IP 加入白名单 |
数据类型映射
下表总结了腾讯云向量数据库字段类型如何映射到 Zilliz Cloud 字段类型,并对各类型做了详细说明。
腾讯云字段类型 | Zilliz Cloud 字段类型 | 描述 |
---|---|---|
主键 | 主键 | 腾讯云向量数据库的主键字段会自动映射为 Zilliz Cloud 中的主键。 在数据迁移时,您可以选择启用 Auto ID 功能;但请注意,启用后源 Collection 中的原始主键值将会被舍弃。 |
稠密向量 | FLOAT_VECTOR | 稠密向量字段会直接转换为 FLOAT_VECTOR,无需进行任何修改。 |
JSON | Dynamic field | 默认情况下,腾讯云向量数据库的 JSON 字段会映射为 Zilliz Cloud 中的 Dynamic Field。有关详细信息,请参阅 Dynamic Field。 在迁移数据时,如果您希望对某些动态字段使用固定数据类型并优化索引配置,建议将动态字段转换为固定字段。 |
JSON 字段转换说明
Zilliz Cloud 采样 100 行数据检测 JSON 数据结构,必要时可手动添加字段。
腾讯云 JSON 字段默认映射为 Zilliz Cloud 的 Dynamic Field 以实现最大灵活性,转换为固定字段可带来:
-
强数据类型校验:强制字段类型约束
-
优化查询性能:建立专用索引
-
结构化数据管理:统一数据规范
腾讯云字段类型 | Zilliz Cloud 字段类型 | 描述 |
---|---|---|
string | VARCHAR | 如果 JSON 中的字段类型为 string,当转换为固定字段后,该字段将变为 VARCHAR 类型。 注意:该字段的最大长度固定为 65,535 字节且不可修改,容量计算以实际字段长度为准。 |
uint64 | INT32 | 如果 JSON 中的字段类型为 uint64,当转换为固定字段后,该字段将变为 INT32 类型。 |
double | DOUBLE | 如果 JSON 中的字段类型为 double,当转换为固定字段后,该字段将变为 DOUBLE 类型。 |
array | ARRAY | 如果 JSON 中的字段类型为 array,当转换为固定字段后,该字段将变为 ARRAY 类型。 |
转换为固定字段后,可配置以下属性:
-
Nullable:决定字段是否接受空值(默认启用),详见 Nullable 属性。
-
默认值:设置数据缺失时的回退值,详见默认值。
-
Partition Key:可将 INT64/VARCHAR 字段指定为 Partition Key(注意:每个 Collection 支持一个 Partition Key,且该字段不可为空),详见 使用 Partition Key。
腾讯云特殊处理规则
Collection 命名规则
腾讯云 Collection 名称将按以下规则迁移至 Zilliz Cloud:
场景 | 影响 | 解决方案 |
---|---|---|
默认命名 | 目标 Collection 名称默认与源 Collection 完全一致 | 保留原始名称 |
名称冲突 | 目标 Database 存在同名 Collection 时无法提交迁移任务 | 删除现有 Collection / 选择其他目标 Database / 迁移配置时重命名 Collection |
特殊字符 | 需符合 Zilliz Cloud 命名规范 | 迁移前请检查 Collection 名称合法性 |