版本：BYOC 开发指南

选择合适的集群类型

在 Zilliz Cloud 中，为集群选择合适的类型是一个关键步骤。Query CU 提供了并行数据处理的基础计算资源，不同类型的集群结合了各异的 CPU、内存和存储配置。

了解集群类型

Zilliz Cloud 提供以下集群类型：性能型、容量型、分层存储型。

下表从多个方面快速对比三种类型之间的差异。如需查看不同集群类型的具体容量和性能对比，请参考选择最优的集群类型。

集群类型	搜索 QPS	搜索延时	每 Query CU 容量	每百万向量费用
性能型	500-1500	10 毫秒	200 万 768 维向量	每月￥378 起
容量型	100-300	50-100 毫秒	800 万 768 维向量	每月￥95 起
分层存储型	10-50	100-1000 毫秒	4000 万 768 维向量	每月￥28 起

在选定集群类型时，应综合考虑数据体量、性能要求和预算因素。向量数据的大小，包括向量数量和维度，是决定集群资源配置的关键。

以下表格根据向量维度和总向量数，展示了各种集群类型的处理容量。

向量维度	性能型集群（每 Query CU可容纳最大向量数）	容量型集群（每 Query CU 可容纳最大向量数）	存储扩展型集群（（每 Query CU 可容纳最大向量数）
128	750 万	2500 万	1 亿
256	450 万	1500 万	6000 万
512	225 万	750 万	3000 万
768	150 万	500 万	2000 万
1024	112.5 万	375 万	1500 万

📘说明

上面的数据基于仅考虑主键和向量的测试。如果您的数据集包含其他标量字段（如 id、标签、关键词），实际的容量可能会有所不同。因此，建议进行个性化测试以获得更精确的评估。

性能指标，尤其是时延和每秒查询数（QPS），非常关键。性能型集群在时延和吞吐量方面显著超越其他类型，特别是在标准的 top-k 值（10 至 250）范围内。

下表显示了每种集群类型在 QPS 方面的测试结果。

下表显示了每种集群类型在时延方面的测试结果。

设想您正在开发一个含有 800 万张图片的图像推荐应用程序。图库中的每张图像均由一个 768 维 Embedding 向量代表。您的目标是能迅速处理每秒 1000 次的推荐请求，并在 30 毫秒内返回前 100 张推荐图片。

为了选出符合此需求的适宜的集群类型和 Query CU 数量，请按以下步骤操作：

时延评估：性能型集群是唯一能满足 30 毫秒时延需求的类型。
容量考量：单个性能型集群 Query CU 能处理 200 万个 768 维向量。为容纳全部 800 万向量，您需配置至少 4 个此类 Query CU。
吞吐量检验：在 top-k 设置为100的情况下，性能型集群的每秒查询量（QPS）为 440。为维持 1000 QPS 的持续性能，需要将副本数量增加 3 倍。

总体而言，对于这种情况，性能型的集群是您的最佳选择。配置 3 个副本，每个副本包含 4 个 Query CU，应该能完全满足您的需求。