跳到主要内容

管理 Collection (控制台)

本教程将介绍如何通过 Zilliz Cloud 控制台创建和管理 Collection。您也可以通过 SDK 管理 Collection

创建 Collection

Zilliz Cloud 提供 3 种创建 Collection 的方式以满足不同需求。

  • 使用您自己的数据: 适合需要自定义 Collection 配置的用户。您可以根据自己的数据集或需求自定义 Collection Schema 和索引参数。

  • 使用示例数据集: 适合 Zilliz Cloud 新手用户。Zilliz Cloud 提供示例数据集,并为您根据示例数据集自动定义 Schema。您无需额外修改 Collection 配置即可一键创建 Collection。

  • 复制现有 Collection: 适合需要在当前集群中快速复制现有 Collection 的用户。

方法 1: 使用您自己的数据

如需使用您自己的数据创建 Collection,请遵循以下步骤:

cn-create-custom-collection

  1. 在创建 Collection 页面,定义 Collection Schema。

    • Auto ID:开启 Auto ID 后将自动生成主键列。因此导入数据时,您无需上传 ID 字段。

    • 主键字段:可用类型为 Int64VarChar。当字段类型设置为 VarChar 时,需要为字段指定最大长度 Max Length。如果启用了 Auto ID,则无需配置主键字段。

    • 向量字段:collection 中的向量字段。对于已升级到 Beta 版本的 Zilliz Cloud 集群,可以向 collection 中添加一个或多个向量字段,每个 collection 最多可以有 4 个向量字段。使用多个向量字段时,可以为这些字段设置相同或不同的数据类型。例如,可以在同一个 collection 中组合使用 FLOAT_VECTORBFLOAT16_VECTOR (Beta) 向量字段。有关向量字段类型的更多信息,请参考相似性度量AUTOINDEX

      • Dimension:向量字段的维度值。维度值的要求因向量字段类型而异:

        • FLOAT_VECTORFLOAT16_VECTORBFLOAT16_VECTOR:维度值必须是整数,范围为 2 到 32,768。

        • SPARSE_FLOAT_VECTOR:不需要指定维度。

        • BINARY_VECTOR:维度必须是 8 的倍数,范围为 8 到 32,768 * 8。

      • 索引参数:索引类型默认设置为 AUTOINDEX,支持的度量类型有 CosineIPL2JACCARD (Beta)HAMMING (Beta)。详情请参见相似性度量AUTOINDEX

    • 其他字段:点击 + 新增字段以添加更多标量字段。更多详情,请参考 Schema

  2. (可选) 在高级设置中,您可以选择开启动态列或 Partition key。

    • 动态列: 开启后,您可以灵活将带有新字段的 Entity 插入到 Collection 中。更多详情,请参考开启动态字段

    • Partition Key: Partition Key 根据数据的指定键值将数据存入不同的 Partition 中。相比传统的过滤查询方式,启用该特性后可以极大地提升查询性能。更多详情,请参考使用 Partition Key

  3. 点击创建 Collection。创建完成后,您可以在 Collection 中插入数据

方法 2: 使用示例数据集

打开目标集群,在 Collection 页签中点击创建示例 Collection。 检查示例 Collection 信息,点击创建

📘说明

创建示例 Collection 时,Zilliz Cloud 会自动帮您完成所有 Collection 配置,您无需调整任何配置。

cn-create-sample-collection

方法 3:复制现有 Collection

  1. 操作下拉菜单中选择复制 Collection。

  2. 设置新 Collection 名称和描述并选择复制范围。您仅可以在当前集群中复制 Collection。复制范围可以选择仅复制 Collection Schema 或同时复制 Collection Schema 和数据。

  3. 点击复制

    cn-copy-collection

  4. Zilliz Cloud 将生成一条复制 Collection 任务。您可前往任务中心查看任务状态和进度。如果迁移任务的状态从进行中变更为成功,则代表复制 Collection 成功。

    📘说明

    仅当您选择复制 Collection Schema 及数据时,会生成复制任务。如果您选择了仅复制 Collection Schema,Zilliz Cloud 将立刻在当前集群中创建一个相同 Schema 的 Collection,而不会生成任务。

查看 Collections

您可以查看集群中所有的 Collection。点击 Collection 名称可以查看 Collection 详情。

cn-view-collection-list

加载和释放 Collection

在 Zilliz Cloud 中,所有搜索和查询操作都在内存中进行。因此,您需要在搜索和查询前将 Collection 加载到内存中,也就是将 Collection 数据写入内存中。相反,如果无需搜索和查询数据,您可以从内存中释放 Collection。

cn-load-and-release-collection

删除 Collection

删除 Collection 会删除与其相关的所有信息,包括插入数据、元数据和索引。该操作可以有效帮助节省资源。

🚧警告

删除操作不可逆,请谨慎执行本操作。

cn-drop-collection

Collection 限制

集群类型

Collection 最大数量

描述

Free

5

您最多可创建 5 个 Collection。

Serverless

100

您最多可创建 100 个 Collection。

Dedicated

每 CU:<= 64

每集群:<= 4096

在企业版集群中,每个计算单元(CU)可创建最多 64 个 Collection,并且集群中的 Collection 总数不能超过 4096。

除了对集群中 Collection 数量的限制外,Zilliz Cloud 还有容量资源相关的限制。具体见下表。

CU 数量

容量

1-8 CU

<= 4,096

12 CU 及以上

Min(512 x CU 数, 65536)

如需了解如何计算集群的已使用容量和通用容量,请查看使用限制