跳到主要内容

从腾讯云 VectorDB 迁移至 Zilliz Cloud

腾讯云 VectorDB 是一款专为相似性搜索设计的向量数据库解决方案。将数据从腾讯云 VectorDB 迁移到 Zilliz Cloud,可以帮助您利用 Zilliz Cloud 在向量分析和可扩展数据管理方面的增强功能。

本指南将帮助您将数据从腾讯云 VectorDB 迁移到 Zilliz Cloud,包括建立连接、配置数据映射,以及排查潜在问题。

注意事项

  • 当您将数据从腾讯云 VectorDB 迁移到 Zilliz Cloud 时,向量字段会直接迁移,而腾讯云 VectorDB 的标量字段将以 JSON 格式存储在 Zilliz Cloud 的动态字段中。有关动态字段功能的详细信息,请参阅开启动态字段

  • 为确保兼容性,目标 Collection 中的 Auto ID 将被禁用,且无法修改。

  • 每个迁移任务仅限于一个源腾讯云 VectorDB 实例。如果您在多个源集群中有数据,可以为每个集群设置单独的迁移任务。

开始前

  • 源腾讯云 VectorDB 实例可以通过公共互联网访问。

  • 您已获取源集群的必要连接凭证:实例 URL 和 API 密钥。

  • 已在 Zilliz Cloud 中获得组织管理员或项目管理员权限。如果您没有相关权限,请联系您的 Zilliz Cloud 管理员。

从腾讯云 VectorDB 迁移至 Zilliz Cloud

zh_migrate_from_vectordb

您可以将源数据迁移到任何版本类型的 Zilliz Cloud 集群,只要其计算单元(CU)大小能够满足源数据的存储需求。

  1. 登录 Zilliz Cloud 控制台

  2. 进入目标项目,选择数据迁移 > Tencent Cloud VectorDB

  3. 连接数据源步骤中,输入实例 URLAPI Key,然后点击下一步

    📘说明

    连接先决条件可以指导您如何获取所需的连接信息。

  4. 选择迁移来源和目标步骤中,配置源腾讯云 VectorBD 和 Zilliz Cloud 集群设置,点击下一步

    📘说明

    每个从腾讯云 VectorBD 迁移的源 Collection 必须包含一个向量字段。

  5. 配置 Schema 步骤中:

    1. Schema 预览中,确认腾讯云 VectorBD 的源 Collection 与 Zilliz Cloud Collection 之间的字段映射。

      📘说明
      • Auto ID 禁用且无法修改。

      • 腾讯云 VectorBD 的记录 ID 将映射为 Zilliz Cloud 中的主键字段,数据类型为 VARCHAR,最大长度为 1 至 65,535 字节。在插入或 Upsert 数据时,确保 VARCHAR 字段长度在此取值范围内。

      • 您可以重命名字段,但不支持修改字段的数据类型。

    2. 高级设置中,确认动态列Partition Key 的设置:

      • 动态列:默认启用且不可修改。它用于存储源 Collection 的标量字段数据。

      • Partition Key:默认禁用且不可修改。由于源 Collection 的标量字段数据以 JSON 形式存储在动态列中,无法作为 Partition Key 使用。在 Zilliz Cloud 中,只有在 Schema 中明确定义的标量字段可用作 Partition Key。

    3. 目标 Collection 名称和描述中,自定义目标 Collection 的名称和描述。Collection 名称在每个集群中必须唯一。如果名称与现有 Collection 重复,请重命名 Collection。

  6. 点击迁移

查看迁移进度

生成迁移任务后,您可前往任务中心查看任务状态和进度。如果迁移任务的状态从进行中变更为成功,则代表迁移成功。

📘说明

迁移完成后,请验证目标集群中的 collection 和 entity 数量是否与数据源一致。如果发现不一致,请删除缺失 entity 的 collection 并重新进行迁移。

view_migration_progress_cn

取消迁移任务

如果迁移过程遇到任何问题,您可以采取以下步骤进行故障排除并恢复迁移:

  1. 任务中心页面,取消失败的迁移任务。

  2. 操作列点击查看详情以访问日志信息。