管理 Collection (控制台)
本教程将介绍如何通过 Zilliz Cloud 控制台创建和管理 Collection。您也可以通过 SDK 管理 Collection。
创建 Collection
Zilliz Cloud 提供 3 种创建 Collection 的方式以满足不同需求。
-
使用您自己的数据: 适合需要自定义 Collection 配置的用户。您可以根据自己的数据集或需求自定义 Collection Schema 和索引参数。
-
使用示例数据集: 适合 Zilliz Cloud 新手用户。Zilliz Cloud 提供示例数据集,并为您根据示例数据集自动定义 Schema。您无需额外修改 Collection 配置即可一键创建 Collection。
-
复制现有 Collection: 适合需要在当前集群中快速复制现有 Collection 的用户。
方法 1: 使用您自己的数据
如需使用您自己的数据创建 Collection,请遵循以下步骤:
-
在创建 Collection 页面,定义 Collection Schema。
配置项
描述
字段名称
字段的名称。每个 Collection 都有唯一的主键和至少一个向量字段(最多4个)。
在默认设置中,Zilliz Cloud 保留了主字段(
primary_key
)和一个浮点向量(vector
)。您可以根据需要自定义它们的设置。字段类型
字段的数据类型。Zilliz Cloud 支持的字段主要分为以下几类:主键、向量字段和标量字段。不同字段的数据类型根据字段类型而异。
主键:
INT64
,VARCHAR
向量字段:
FLOAT_VECTOR
,BINARY_VECTOR
,FLOAT16_VECTOR
,BFLOAT16_VECTOR
,SPARSE_FLOAT_VECTOR
.标量字段:
INT64
,VARCHAR
,INT8
,INT16
,INT32
,FLOAT
,DOUBLE
,BOOL
,JSON
,ARRAY
.详情请参见了解 Schema。
索引
是否为字段建立索引以提高搜索性能。一旦启用,Zilliz Cloud 将为您的字段创建一个 AUTOINDEX。
相似度类型
用于测量向量之间相似性的度量类型。此参数仅可为向量字段配置。详情请参见相似度类型。
默认值
是否为字段设置默认值。此参数仅可为标量字段配置(不包括主字段)。详情请参见 Nullable 和默认值。
支持 Null 值
是否允许字段为空值。此参数仅可为标量字段配置(不包括主字段)。详情请参见 Nullable 和默认值。
Mmap
是否启用 MMAP。此参数仅可为标量字段配置(不包括主字段)。详情请参见使用 mmap。
描述
可选。字段的描述信息。
Auto ID
是否为主字段启用自动 ID。一旦启用,Zilliz Cloud 会自动为主键生成唯一 ID,无需在数据插入过程中手动分配或管理它们。
-
(可选) 在高级设置中,您可以选择开启动态列或 Partition key。
-
动态列: 开启后,您可以灵活将带有新字段的 Entity 插入到 Collection 中。更多详情,请参考Dynamic Field。
-
Partition Key: Partition Key 根据数据的指定键值将数据存入不同的 Partition 中。相比传统的过滤查询方式,启用该特性后可以极大地提升查询性能。更多详情,请参考使用 Partition Key。
-
-
点击创建 Collection。创建完成后,您可以在 Collection 中插入数据。
方法 2: 使用示例数据集
打开目标集群,在 Collection 页签中点击创建示例 Collection。 检查示例 Collection 信息,点击创建。
创建示例 Collection 时,Zilliz Cloud 会自动帮您完成所有 Collection 配置,您无需调整任何配置。
方法 3:复制现有 Collection
-
在操作下拉菜单中选择复制 Collection。
-
设置新 Collection 名称和描述并选择复制范围。您仅可以在当前集群中复制 Collection。复制范围可以选择仅复制 Collection Schema 或同时复制 Collection Schema 和数据。
-
点击复制。
-
Zilliz Cloud 将生成一条复制 Collection 任务。您可前往任务中心查看任务状态和进度。如果迁移任务的状态从进行中变更为成功,则代表复制 Collection 成功。
📘说明仅当您选择复制 Collection Schema 及数据时,会生成复制任务。如果您选择了仅复制 Collection Schema,Zilliz Cloud 将立刻在当前集群中创建一个相同 Schema 的 Collection,而不会生成任务。
查看 Collections
您可以查看集群中所有的 Collection。点击 Collection 名称可以查看 Collection 详情。
加载和释放 Collection
在 Zilliz Cloud 中,所有搜索和查询操作都在内存中进行。因此,您需要在搜索和查询前将 Collection 加载到内存中,也就是将 Collection 数据写入内存中。相反,如果无需搜索和查询数据,您可以从内存中释放 Collection。
将 Collection 移动到其他 Database
您可以将 Collection 从一个 Database 移动到另一个 Database 中。
删除 Collection
删除 Collection 会删除与其相关的所有信息,包括插入数据、元数据和索引。该操作可以有效帮助节省资源。
删除操作不可逆,请谨慎执行本操作。
Collection 限制
集群类型 | Collection 最大数量 | 描述 |
---|---|---|
Free | 5 | 您最多可创建 5 个 Collection。 |
Serverless | 100 | 您最多可创建 100 个 Collection。 |
Dedicated | 每 CU:<= 64 每集群:<= 4096 | 在企业版集群中,每个计算单元(CU)可创建最多 64 个 Collection,并且集群中的 Collection 总数不能超过 4096。 |
除了对集群中 Collection 数量的限制外,Zilliz Cloud 还有容量资源相关的限制。具体见下表。
CU 数量 | 容量 |
---|---|
1-8 CU | <= 4,096 |
12 CU 及以上 | Min(512 x CU 数, 65536) |
如需了解如何计算集群的已使用容量和通用容量,请查看使用限制。