使用限制
本文介绍了 Zilliz Cloud 平台和集群的使用限制信息。如需了解更多限制信息,可向我们提交请求。
组织、项目和成员
下表展示了单个用户可加入的最大组织和项目数。
内容 | 最大数量 | 描述 |
---|---|---|
组织 | 1 | Zilliz Cloud 账号注册成功后,系统会自动创建 1 个组织。如需更多组织,请提交工单。 1 名用户可以加入多个组织。 |
项目 | 100 | 每个用户在每个组织中最多可以创建 100 个项目。 |
用户与角色
下表展示了 Zilliz Cloud 中用用户与角色的数量限制。
内容 | 最大数量 | 描述 |
---|---|---|
组织用户 | 100 | 每个组织中最多可容纳 100 名组织用户。 |
集群用户 | 100 | 每个集群中最多可容纳 100 名集群用户。 |
集群自定义角色 | 20 | 每个集群中最多可创建 20 个自定义角色。如需取消此限制,请联系我们。 |
API 密钥
内容 | 最大数量 | 描述 |
---|---|---|
API 密钥 | 100 | 每个组织中可创建最多 100 个自定义 API 密钥。 |
集群
集群数量
集群数量的限制取决于您的支付方式和订阅版本。
-
未绑定有效支付方式
集群版本
最大数量
描述
Free
1
不论是否绑定有效支付方式,最多只可创建一个 Free 版集群。如需创建新的 Free 版集群,请先删除现有的 Free 集群。
Serverless 或 Dedicated
1
未绑定有效支付方式,最多可免费试用一个付费集群。如需更多付费集群,请添加支付方式。
-
已绑定有效支付方式
集群版本
最大数量
描述
Free
1
不论是否绑定有效支付方式,最多只可创建一个 Free 版集群。如需创建新的 Free 版集群,请先删除现有的 Free 集群。
Serverless
无
无
Dedicated
CU 规格总和 < 320
每个组织中的 Dedicated 集群数量上线取决于集群的 CU 规格。组织中所有集群的 CU 规格总和不得超过 320 CU。
CU
计算单元(CU)是指用于提供向量检索、分析服务的一组硬件资源。CU 提供了并行数据处理的基础计算资源,不同类型的 CU 结合了各异的 CPU、内存和存储配置。CU 的概念仅针对 Dedicated 集群。
集群版本 | 限制 | 描述 |
---|---|---|
Dedicated | CU 规格 * Replica 数量 <=256 | 在自助操作时,单个集群最多使用 256 个 CU。如果创建了 Replica,CU 规格与 Replica 数量的乘积不得超过 256。 |
如需创建超过 256 个 CU 规格的集群,请联系我们。
vCU
vCU 是用于衡量读取(如 search、query)和写入操作(如 insert、upsert、delete)所消耗资源的基本单位。vCU 的概念仅针对 Free 和 Serverless 集群。
集群版本 | 限制 |
---|---|
Free | 每月 250 万 vCU |
Serverless | 无 |
容量
集群版本 | 限制 |
---|---|
Free | 每个集群 5 GB(相当于每个集群可容纳 100 万个 768 维向量)。 |
Serverless | 每个 Partition 可容纳 1 亿个 768 维向量。 |
Dedicated | Zilliz Cloud Dedicated 集群无硬性容量限制。以下为不同 CU 类型的 Dedicated 集群容量参考。如需更大容量,您可以扩容集群。详情请参考集群扩缩容。
|
Database
-
仅 Dedicated 集群支持创建 Database。
-
每个 Dedicated 集群中最多可创建 1024 个 Database。
-
默认的 Default Database 不可删除。
Replica
如需添加 Replica,集群规格需要为 8 CU 或以上。此外,Replica 功能还具有以下限制
内容 | 限制 | 描述 |
---|---|---|
Replica 数量 | 10 | 每个集群最多可添加 10 个 Replica。 |
Replica 数量 * CU 规格 | <= 256 | CU 规格与 Replica 数量的乘积不得超过 256。 |
Pipeline
Pipeline
下表展示了项目中不同类型的 Pipeline 的相关限制。
Pipeline 类型 | 最大数量(每个项目) |
---|---|
Ingestion Pipeline | 100 |
Deletion Pipeline | 100 |
Search Pipeline | 100 |
Ingestion
下表展示了每个 Embedding 模型可自定义的切片大小范围。
Embedding 模型 | 切片大小范围 (Tokens) |
---|---|
zilliz/bge-base-en-v1.5 | 20-500 |
zilliz/bge-base-zh-v1.5 | 20-500 |
下表展示了 Ingestion Pipeline 的 PRESERVE Function 生成的元数据字段限制。
最大数量 | |
---|---|
元数据字段 | 50 |
字符串类型字段的最大长度 | 4,000 |
下表展示了每次运行 Ingestion Pipeline 时切片数量限制。
Embedding 模型 | 每次运行 Ingestion 的最大切片数量 |
---|---|
zilliz/bge-base-en-v1.5 | 3,500 |
zilliz/bge-base-zh-v1.5 | 3,500 |
Pipelines 用量
用量上限 | |
---|---|
每个组织 | ¥140/月 |
Collection
类型 | 最大数量 | 描述 |
---|---|---|
Free 版集群 | 5 | 在 Free 版集群中,最多可创建 5 个 Collection。 |
Serverless 版集群 | 100 | 在 Serverless 版集群中,最多可创建 100 个 Collection。 |
Dedicated 版集群 | 每 CU:<= 64 每集群:<= 4096 | 在 Dedicated 版集群中,每个计算单元(CU)可创建最多 64 个 Collection,并且集群中的 Collection 总数不能超过 4096。 |
除了对集群中 Collection 数量的限制外,Zilliz Cloud 还有容量资源相关的限制。具体来说,Zilliz Cloud 会根据集群使用的 CU 大小来计算集群的通用容量,集群当前已使用容量须小于或等于其通用容量。
集群通用容量 = 512 x CU 大小
为了便于理解,下文演示了 Zilliz Cloud 如何计算集群的已使用容量和通用容量。
- 计算集群的已使用容量
假设一个集群含有 50 个 Collection。前 20 个 Collection 中,每个 Collection 含有 20 个Partition,剩下的 30 个 Collection 分别含有 10 个 Partition。因此,可以按照以下方式计算集群的已使用容量:
20 (collections) x 20 (partitions) + 30 (collections) x 10 (partitions) = 400 + 300 = 700
基于以上等式,Zilliz Cloud 将该集群的已使用容量设定为 700。
- 计算集群的通用容量
可以使用以下公式计算集群的通用容量:
<= 512 x CU 数
例如:
在一个 2 CU 的 Dedicated 集群中,最多可创建 128 个 Collection,通用容量最大为 1,024。
在一个 12 CU 的 Dedicated 集群中,最多可创建 768 个 Collection,通用容量最大为 6144。
在一个 32 CU 的 Dedicated 集群中,最多可创建 2,048 个 Collection,通用容量最大为 16,384。
此外,Zilliz Cloud 针对 Serverless 和 Dedicated 集群中的 Collection 操作(包括创建、加载、释放、删除)还具有速率限制。
Rate limits | |
---|---|
Collection 操作(创建、加载、释放、删除) | 每个集群 5 req/s。 |
Partition
类型 | 最大数量(每个 Collection) | 描述 |
---|---|---|
Free 版集群 | 1,024 | 在 Free 版集群中,您可以为每个 Collection 创建最多 1,024 个 Partition。 |
Serverless 版集群 | 1,024 | 在 Serverless 版集群中,您可以为每个 Collection 创建最多 1,024 个 Partition。 |
Dedicated 版集群 | 1,024 | 在 Dedicated 版集群中,您可以为每个 Collection 创建最多 1,024 个 Partition。 |
在计算已使用容量和通用容量时,请参考 Collection 部分的说明。此外,每个集群创建 Partition 的速率限制为每秒 1 个 Partition。
字段
内容 | 最大数量 | 描述 |
---|---|---|
所有字段(每个 Collection) | 64 | N/A |
向量字段(每个 Collection) | 4 | 即将支持多向量功能,敬请期待。 |
关于字段的其他限制:
-
任何字段类型都不支持空值。
-
某些字段(如 VarChar 或 JSON)使用的内存超出预期,可能导致集群空间耗尽。
向量维度
向量字段的最大维度数为 32768。
数据操作
下文将介绍 Zilliz Cloud 集群中常见数据操作的速率限制。
Insert
每个插入请求/响应的大小不应超过 64 MB。
速率限制根据集群类型和 CU 数量而有所不同。以下表格列出了插入操作的速率限制。
Insert 最大速率限制 | |
---|---|
Free 版集群 | 2 MB/s |
Serverless 版集群 | 10 MB/s |
Dedicated 版集群 1-2 CU | 8 MB/s |
Dedicated 版集群 4-8 CU | 12 MB/s |
Dedicated 版集群 12-20 CU | 16 MB/s |
Dedicated 版集群 [24 CU, 64 CU) | 24 MB/s |
Dedicated 版集群 [64CU, 128 CU) | 36 MB/s |
Dedicated 版集群 [128 CU, 256 CU) | 48 MB/s |
Dedicated 版集群 >= 256 CU | 64 MB/s |
在插入数据时,请确保包含所有在 Schema 中已定义的字段。如果 Collection 启用了 AutoID,则排除主键。
为了使插入的数据能够立即被检索到,建议将搜索或查询请求中的一致性级别更改为 Strong。详细信息,请参阅一致性水平。
Upsert
每个 Upsert 请求/响应的大小不应超过 64 MB。
速率限制根据集群类型和 CU 数量而有所不同。以下表格列出了 Upsert 操作的速率限制。
Upsert 最大速率限制 | |
---|---|
Free 版集群 | 2 MB/s |
Serverless 版集群 | 10 MB/s |
Dedicated 版集群 1-2 CU | 8 MB/s |
Dedicated 版集群 4-8 CU | 12 MB/s |
Dedicated 版集群 12-20 CU | 16 MB/s |
Dedicated 版集群 [24 CU, 64 CU) | 24 MB/s |
Dedicated 版集群 [64CU, 128 CU) | 36 MB/s |
Dedicated 版集群 [128 CU, 256 CU) | 48 MB/s |
Dedicated 版集群 >= 256 CU | 64 MB/s |
在 Upsert 数据时,请确保包含所有在 Schema 中已定义的字段。
为了使 Upsert 的数据能够立即被检索到,建议将搜索或查询请求中的一致性级别更改为 Strong。详细信息,请参阅一致性水平。
Index
不同字段类型对应不同类型的索引。以下表格列出了可索引的字段类型及其对应的索引类型。
字段类型 | 索引类型 | 度量类型 |
---|---|---|
向量字段 | AUTOINDEX | L2, IP, 和 COSINE |
VarChar 字段 | TRIE | N/A |
Int8/16/32/64 | STL_SORT | N/A |
Float32/64 | STL_SORT | N/A |
Flush
每个集群的 Flush 请求速率限制为每秒 0.1 个请求,该限制具体适用于以下集群类型:
-
兼容 Milvus 2.4.x 或更高版本的 Serverless 集群;
-
升级到 Beta 版本的 Dedicated 集群,该集群类型兼容 Milvus 2.4.x 或更高版本。
不建议您手动执行 Flush 操作。Zilliz Cloud 会自动优雅地处理数据 Flush 操作。
Load
每个集群的加载请求速率限制为每秒 5 个请求。
对于已加载的 Collection,即使有新数据插入,您无需重复执行加载操作。
Search
每个搜索请求/响应的大小不应超过 64 MB。
根据集群版本,每个搜索请求携带的查询向量(nq)上限有所不同:
-
Free 和 Serverless 集群:nq 不超过 10
-
Dedicated 集群:nq 不超过 16384
根据集群版本,每个搜索响应返回的 Entity 数量(topK)上限有所不同:
-
Free 和 Serverless 集群:topK 不超过 1024
-
Dedicated 集群:topK 不超过 16384
Query
每个查询请求/响应的大小不应超过 64 MB。
每个查询响应返回的 Entity 数量(topK)不超过 16384 个。
Delete Entity
每个删除请求/响应的大小不应超过 64 MB。
每个集群的删除请求速率限制为每秒 0.5 MB。
Drop Collection
每个集群的删除请求速率限制为每秒 5 个请求。
Data Import
单 Collection 支持最多 10 个正在运行或待运行的数据导入任务。
此外,Zilliz Cloud 还对导入的文件大小有以下限制。
文件类型 | 本地导入 | 对象存储导入 |
---|---|---|
JSON | 1 GB | 1 GB |
Numpy | 暂不支持 | 文件夹的最大大小为 100 GB,每个子文件夹的最大大小为 15 GB。 |
Parquet | 暂不支持 | 10 GB |
数据备份(控制台)
手动创建的备份会永久保留。
自动创建的备份可最多保存 30 天。
数据恢复(控制台)
您可以从快照中恢复 Zilliz Cloud 集群。恢复的集群和原集群应属于同一地域,并使用相同的 CU 类型。
IP 白名单
内容 | 最大数量 | 描述 |
---|---|---|
IP 地址 (CIDR) | 20 | IP 白名单中最多可添加 20 个 IP 地址。 |