跳到主要内容

通过备份文件从 Milvus 迁移至 Zilliz Cloud

Zilliz Cloud 提供基于 Milvus 的完全托管的向量数据库解决方案,适合希望使用 Milvus 向量数据库但不想自己管理基础设施的用户。为了实现顺利的数据迁移,您可以通过以下方式将数据从 Milvus 迁移到 Zilliz Cloud:通过 Milvus 服务器地址连接到源数据库或直接上传备份文件。

本文介绍如何通过备份文件从 Milvus 进行数据迁移。有关如何通过 Endpoint 迁移信息,请参阅通过 Endpoint 从 Milvus 迁移至 Zilliz Cloud

开始前

  • 您已根据迁移方法做好必要的迁移准备:

    • 从本地文件:提前准备本地备份文件。有关如何准备备份文件的信息,请参阅准备迁移数据

    • 从对象存储:Milvus 对象存储的公共 URL 和访问凭据。您可以选择长期或临时凭据。

  • 您需要拥有组织管理员或项目管理员的角色。如果您没有相应的权限,请联系您的 Zilliz Cloud 管理员。

准备迁移数据

Zilliz Cloud 支持从 Milvus 2.x 和更高版本迁移数据。要从 Milvus 2.x 迁移数据,请按如下准备数据:

  1. 下载 milvus-backup。推荐下载最新版本。

  2. 在下载的二进制文件所在的同级目录下,创建 configs 文件夹,然后将 backup.yaml 保存到 configs

    此步骤完成后,文件夹的结构应如下所示:

    workspace
    ├── milvus-backup
    └── configs
    └── backup.yaml
  3. 自定义 backup.yaml 配置。

    一般情况下,您不需要自定义该文件。 在下一步前,您可以检查以下配置项是否正确:

    📘说明

    如果 Milvus 实例是通过 Docker Compose 安装,minio.bucketName 默认为 a-bucketrootPath 默认为 files

    如果 Milvus 实例是通过 Kubernetes 安装,minio.bucketName 默认为 milvus-bucketrootPath 默认为 file

  4. 创建 Milvus 的安装备份。

./milvus-backup --config backup.yaml create -n my_backup
  1. 获取备份文件。
./milvus-backup --config backup.yaml get -n my_backup
  1. 检查备份文件。

    • 如果您将 minio.addressminio.port 设置为 OSS 存储,则您的备份文件已在 OSS 存储中。

    • 如果您将 minio.addressminio.port 设置为 MinIO 存储,则可以通过 MinIO 控制台或 mc 客户端下载备份文件。

      • 如果从 MinIO 控制台下载,请先登录 MinIO 控制台,找到 minio.address 中指定的存储桶,选择存储桶中的文件,然后开始下载。

      • 如果使用 mc 客户端,则执行以下命令:

      # 配置 Minio 主机
      mc alias set my_minio https://<minio_endpoint> <accessKey> <secretKey>

      # 查询当前桶列表
      mc ls my_minio

      # 从桶中下载文件
      mc cp --recursive my_minio/<your-bucket-path> <local_dir_path>
  2. 解压下载的文件,然后将备份文件夹下的子文件夹上传到 Zilliz Cloud。

backup
└── my_backup <= 上传此文件夹

将数据迁移到 Zilliz Cloud

zh_migrate_from_milvus_via_backup_file

  1. 登录 Zilliz Cloud 控制台

  2. 进入目标项目,选择数据迁移 > Milvus > 通过备份文件

  3. 从 Milvus 迁移数据页面上,

    • 如果您的数据在本地文件中:

      • 选择本地文件,上传包含您数据的文件夹,并选择目标集群。
    • 如果您的数据在对象存储中:

      • 选择对象存储,选择服务(例如 S3、Azure Blob、GCP),输入您数据的对象 URL 或 S3 URI,提供必要的凭据,并选择目标集群。

      • 通过指定适当的凭据类型提供必要的凭据:

        • 长期:使用此选项以持久访问资源,无需频繁重新认证。

        • Session:选择此选项以获取有效期有限的临时凭据,适合在特定用户会话期间进行短期访问。

  4. 单击迁移

查看迁移进度

生成迁移任务后,您可前往任务中心查看任务状态和进度。如果迁移任务的状态从进行中变更为成功,则代表迁移成功。

📘说明

迁移完成后,请验证目标集群中的 collection 和 entity 数量是否与数据源一致。如果发现不一致,请删除缺失 entity 的 collection 并重新进行迁移。

view_migration_progress_cn

Zilliz Cloud 仅支持 AUTOINDEXAUTOINDEX 是一种优化的索引算法,Zilliz Cloud 将使用此算法为您迁移的 Collection 自动创建索引。

Collection 加载后,您可以自行连接和管理 Collection。

取消迁移任务

如果迁移过程遇到任何问题,您可以采取以下步骤进行故障排除并恢复迁移:

  1. 任务中心页面,取消失败的迁移任务。

  2. 操作列点击查看详情以访问日志信息。