跳到主要内容

使用限制

本文介绍了 Zilliz Cloud 平台和集群的使用限制信息。如需了解更多限制信息,可向我们提交请求

组织、项目和成员

下表展示了单个用户可加入的最大组织和项目数。

内容

最大数量

描述

组织

1

Zilliz Cloud 账号注册成功后,系统会自动创建 1 个组织。如需更多组织,请提交工单

1 名用户可以加入多个组织。

项目

10

每个用户在每个组织中最多可以创建 10 个项目。

组织及项目成员

100

组织和项目成员数量总和不得超过 100 名。

API 密钥

内容

最大数量

描述

API 密钥

10

每个组织中可创建最多 10 个自定义 API 密钥。

集群和 CU

集群和 CU 数量的限制取决于您的支付方式和订阅版本。

  • 未绑定有效支付方式

    类型

    最大数量

    描述

    Free 版集群

    1

    不论是否绑定有效支付方式,最多只可创建一个 Free 版集群。如需创建新的 Free 版集群,请先删除现有的 Free 集群。

    Serverless 版或 Dedicated 版集群

    1

    未绑定有效支付方式,最多可免费试用一个付费集群。如需更多付费集群,请添加支付方式。

  • 已绑定有效支付方式

    类型

    限制

    描述

    Free 版集群

    1

    不论是否绑定有效支付方式,最多只可创建一个 Free 版集群。如需创建新的 Free 版集群,请先删除现有的 Free 集群。

    Serverless 版集群

    Dedicated 版集群

    CU 规格 * Replica 数量 <=256

    在自助操作时,单个集群最多使用 256 个 CU。如果创建了 Replica,CU 规格与 Replica 数量的乘积不得超过 256。

如需创建超过 256 个 CU 规格的集群,请联系我们

Replica

如需添加 Replica,集群规格需要为 8 CU 或以上。此外,Replica 功能还具有以下限制

内容

限制

描述

Replica 数量

10

每个集群最多可添加 10 个 Replica。

Replica 数量 * CU 规格

<= 256

CU 规格与 Replica 数量的乘积不得超过 256。

Pipeline

Pipeline

下表展示了项目中不同类型的 Pipeline 的相关限制。

Pipeline 类型

最大数量(每个项目)

Ingestion Pipeline

100

Deletion Pipeline

100

Search Pipeline

100

Ingestion

下表展示了每个 Embedding 模型可自定义的切片大小范围。

Embedding 模型

切片大小范围 (Tokens)

zilliz/bge-base-en-v1.5

20-500

zilliz/bge-base-zh-v1.5

20-500

下表展示了 Ingestion Pipeline 的 PRESERVE Function 生成的元数据字段限制。

最大数量

元数据字段

50

字符串类型字段的最大长度

4,000

下表展示了每次运行 Ingestion Pipeline 时切片数量限制。

Embedding 模型

每次运行 Ingestion 的最大切片数量

zilliz/bge-base-en-v1.5

3,500

zilliz/bge-base-zh-v1.5

3,500

Pipelines 用量

用量上限

每个组织

¥140/月

Collection

类型

最大数量

描述

Free 版集群

5

在 Free 版集群中,最多可创建 5 个 Collection。

Serverless 版集群

100

在 Serverless 版集群中,最多可创建 100 个 Collection。

Dedicated 版集群

每 CU:<= 64

每集群:<= 4096

在 Dedicated 版集群中,每个计算单元(CU)可创建最多 64 个 Collection,并且集群中的 Collection 总数不能超过 4096。

除了对集群中 Collection 数量的限制外,Zilliz Cloud 还有容量资源相关的限制。具体来说,Zilliz Cloud 会根据集群使用的 CU 大小来计算集群的通用容量,集群当前已使用容量须小于或等于其通用容量。

集群通用容量 = 512 x CU 大小
📘说明

为了便于理解,下文演示了 Zilliz Cloud 如何计算集群的已使用容量和通用容量。

  • 计算集群的已使用容量

假设一个集群含有 50 个 Collection。前 20 个 Collection 中,每个 Collection 含有 20 个Partition,剩下的 30 个 Collection 分别含有 10 个 Partition。因此,可以按照以下方式计算集群的已使用容量

20 (collections) x 20 (partitions) + 30 (collections) x 10 (partitions) = 400 + 300 = 700

基于以上等式,Zilliz Cloud 将该集群的已使用容量设定为 700。

  • 计算集群的通用容量

可以使用以下公式计算集群的通用容量:

<= 512 x CU 数

例如:

在一个 2 CU 的 Dedicated 集群中,最多可创建 128 个 Collection,通用容量最大为 1,024。

在一个 12 CU 的 Dedicated 集群中,最多可创建 768 个 Collection,通用容量最大为 6144。

在一个 32 CU 的 Dedicated 集群中,最多可创建 4096 个 Collection,通用容量最大为 16,384。

此外,Zilliz Cloud 针对 Serverless 和 Dedicated 集群中的 Collection 操作(包括创建、加载、释放、删除)还具有速率限制。

Rate limits

Collection 操作(创建、加载、释放、删除)

每个集群 5 req/s。

Partition

类型

最大数量(每个 Collection)

描述

Free 版集群

1,024

在 Free 版集群中,您可以为每个 Collection 创建最多 1,024 个 Partition。

Serverless 版集群

1,024

在 Serverless 版集群中,您可以为每个 Collection 创建最多 1,024 个 Partition。

Dedicated 版集群

1,024

在 Dedicated 版集群中,您可以为每个 Collection 创建最多 1,024 个 Partition。

在计算已使用容量和通用容量时,请参考 Collection 部分的说明。此外,每个集群创建 Partition 的速率限制为每秒 1 个 Partition。

字段

内容

最大数量

描述

所有字段(每个 Collection)

64

N/A

向量字段(每个 Collection)

4

即将支持多向量功能,敬请期待。

关于字段的其他限制:

  • 任何字段类型都不支持空值。

  • 某些字段(如 VarChar 或 JSON)使用的内存超出预期,可能导致集群空间耗尽。

向量维度

向量字段的最大维度数为 32768。

数据操作

下文将介绍 Zilliz Cloud 集群中常见数据操作的速率限制。

Insert

每个插入请求/响应的大小不应超过 64 MB。

速率限制根据集群类型和 CU 数量而有所不同。以下表格列出了插入操作的速率限制。

Insert rate limits

Free 版集群

2 MB/s

Serverless 版集群

10 MB/s

Dedicated 版集群(1-2 CU)

4 MB/s

Dedicated 版集群(4-8 CU)

6 MB/s

Dedicated 版集群(12-20 CU)

8 MB/s

Dedicated 版集群(>= 24 CU)

12 MB/s

在插入数据时,请确保包含所有在 Schema 中已定义的字段。如果 Collection 启用了 AutoID,则排除主键。

为了使插入的数据能够立即被检索到,建议将搜索或查询请求中的一致性级别更改为 Strong。详细信息,请参阅一致性水平

Upsert

每个 Upsert 请求/响应的大小不应超过 64 MB。

速率限制根据集群类型和 CU 数量而有所不同。以下表格列出了 Upsert 操作的速率限制。

Insert rate limits

Free 版集群

2 MB/s

Serverless 版集群

100 MB/s

Dedicated 版集群(1-2 CU)

4 MB/s

Dedicated 版集群(4-8 CU)

6 MB/s

Dedicated 版集群(12-20 CU)

8 MB/s

Dedicated 版集群(>= 24 CU)

12 MB/s

在 Upsert 数据时,请确保包含所有在 Schema 中已定义的字段。

为了使 Upsert 的数据能够立即被检索到,建议将搜索或查询请求中的一致性级别更改为 Strong。详细信息,请参阅一致性水平

Index

不同字段类型对应不同类型的索引。以下表格列出了可索引的字段类型及其对应的索引类型。

字段类型

索引类型

度量类型

向量字段

AUTOINDEX

L2, IP, 和 COSINE

VarChar 字段

TRIE

N/A

Int8/16/32/64

STL_SORT

N/A

Float32/64

STL_SORT

N/A

Flush

每个集群的 Flush 请求速率限制为每秒 0.1 个请求,该限制具体适用于以下集群类型:

  • 兼容 Milvus 2.4.x 或更高版本的 Serverless 集群;

  • 升级到 Beta 版本的 Dedicated 集群,该集群类型兼容 Milvus 2.4.x 或更高版本。

📘说明

不建议您手动执行 Flush 操作。Zilliz Cloud 会自动优雅地处理数据 Flush 操作。

Load

每个集群的加载请求速率限制为每秒 5 个请求。

📘说明

对于已加载的 Collection,即使有新数据插入,您无需重复执行加载操作。

每个搜索请求/响应的大小不应超过 64 MB。

根据集群版本,每个搜索请求携带的查询向量(nq)上限有所不同:

  • Free 和 Serverless 集群:nq 不超过 10

  • Dedicated 集群:nq 不超过 16384

根据集群版本,每个搜索响应返回的 Entity 数量(topK)上限有所不同:

  • Free 和 Serverless 集群:topK 不超过 1024

  • Dedicated 集群:topK 不超过 16384

Query

每个查询请求/响应的大小不应超过 64 MB。

每个查询响应返回的 Entity 数量(topK)不超过 16384 个。

Delete Entity

每个删除请求/响应的大小不应超过 64 MB。

每个集群的删除请求速率限制为每秒 0.5 MB。

Drop Collection

每个集群的删除请求速率限制为每秒 5 个请求。

Data Import

单 Collection 支持最多 10 个正在运行或待运行的数据导入任务。

此外,Zilliz Cloud 还对导入的文件大小有以下限制。

文件类型

本地导入

对象存储导入

JSON

1 GB

1 GB

Numpy

暂不支持

文件夹的最大大小为 100 GB,每个子文件夹的最大大小为 15 GB。

Parquet

暂不支持

10 GB

请参阅准备导入数据了解更多。

数据备份(控制台)

手动创建的备份会永久保留。

自动创建的备份可最多保存 30 天。

数据恢复(控制台)

您可以从快照中恢复 Zilliz Cloud 集群。恢复的集群和原集群应属于同一地域,并使用相同的 CU 类型。

IP 白名单

内容

最大数量

描述

IP 地址 (CIDR)

20

IP 白名单中最多可添加 20 个 IP 地址。