选择合适的 CU 类型

在 Zilliz Cloud 中，为集群选择合适的计算单元（CU）是一个关键步骤。CU 提供了并行数据处理的基础计算资源，不同类型的 CU 结合了各异的 CPU、内存和存储配置。

了解 CU 类型

Zilliz Cloud 提供以下 CU 类型：性能型 CU、容量型 CU、存储扩展型 CU。

下表从多个方面快速对比三种 CU 类型之间的差异。如需查看不同 CU 类型的具体容量和性能对比，请参考选择最优的 CU 类型。

CU 类型	搜索 QPS	搜索延时	每 CU 容量	每百万向量费用
性能型	500~1500	毫秒级	150 万 768 维向量	每月￥504 起
容量型	100~300	十毫秒级	500 万 768 维向量	每月￥151 起
存储扩展型	5~20	百毫秒级	2000 万 768 维向量	每月￥75 起

如需选择存储扩展型 CU，集群规格需至少为 4 CU。

在选定 CU 类型时，应综合考虑数据体量、性能要求和预算因素。向量数据的大小，包括向量数量和维度，是决定集群资源配置的关键。

以下表格根据向量维度和总向量数，展示了各种 CU 类型的处理容量。

向量维度	性能型 CU（每 CU可容纳最大向量数）	容量型 CU（每 CU可容纳最大向量数）	存储扩展型 CU （（每 CU可容纳最大向量数）
128	750 万	2500 万	1 亿
256	450 万	1500 万	6000 万
512	225 万	750 万	3000 万
768	150 万	500 万	2000 万
1024	112.5 万	375 万	1500 万

📘说明

上面的数据基于仅考虑主键和向量的测试。如果您的数据集包含其他标量字段（如 id、标签、关键词），实际的容量可能会有所不同。因此，建议进行个性化测试以获得更精确的评估。

性能指标，尤其是时延和每秒查询数（QPS），非常关键。性能型 CU 在时延和吞吐量方面显著超越其他类型，特别是在标准的 top-k 值（10 至 250）范围内。

下表显示了每种 CU 类型在 QPS 方面的测试结果。

下表显示了每种 CU 类型在时延方面的测试结果。

设想您正在开发一个含有 800 万张图片的图像推荐应用程序。图库中的每张图像均由一个 768 维 Embedding 向量代表。您的目标是能迅速处理每秒 1000 次的推荐请求，并在 30 毫秒内返回前 100 张推荐图片。

为了选出符合此需求的适宜 CU，请按以下步骤操作：

时延评估：性能型 CU 是唯一能满足 30 毫秒时延需求的类型。
容量考量：单个性能型 CU 能处理 150 万个 768 维向量。为容纳全部 800 万向量，您需配置至少 6 个此类 CU。
吞吐量检验：在 top-k 设置为100的情况下，性能型 CU 的每秒查询量（QPS）为 440。为维持 1000 QPS 的持续性能，需要将副本数量增加 3 倍。综上所述，针对这一应用场景，选择性能型 CU 是最合适的。建议配置 3 套副本，每套包含 6 个 CU，以确保应用运行的完美性能。