指标与告警快速参考
在本手册中,您可以快速找到 Zilliz Cloud 集群监控指标的相 关描述,并了解组织和项目级别的告警项。
集群指标
Zilliz Cloud 控制台中的指标页签展示了各类集群指标图表。
下表描述了各指标的具体含义以及当您的集群资源使用超过阈值时建议执行的操作。
指标名称 | 单位 | 描述 | 推荐操作 |
---|---|---|---|
资源 | |||
Read vCUs | vCU | Search 和 Query 操作消耗的 vCU 用量。 该指标仅适用于 Free 或 Serverless 集群。有关更多集群类型信息,请参阅 Zilliz Cloud 版本类型。 | - |
Write vCUs | vCU | Insert、Delete 和 Upsert 操作消耗的 vCU 用量。 该指标仅适用于 Free 或 Serverless 集群。有关更多集群类型信息,请参阅 Zilliz Cloud 版本类型。 | - |
CU 计算资源 | % | 相对于 CU 总计算能力的已使用计算能力的度量。 该指标仅适用于 Dedicated 或 BYOC 集群。有关更多集群类型信息,请参阅 Zilliz Cloud 版本类型。 | 70%-80%:检查服务状态并准备扩容。 > 90%:立即扩容,以避免服务中断。 |
CU 加载容量 | % | 相对于 CU 总容量的已使用 容量的度量。 该指标仅适用于 Free, Dedicated 或 BYOC 集群。有关更多集群类型信息,请参阅 Zilliz Cloud 版本类型。 | 70%-80%:检查服务状态并准备扩容。 > 90%:立即扩容,以避免服务中断。 100%:当 CU 加载容量达到 100% 时,您将无法向集群写入数据。请立即扩容,以避免服务中断。 |
存储用量 | GB | 数据和索引消耗的持久存储总量。 | 配置监控告警,以了解存储用量情况。 |
性能 | |||
读请求 QPS/VPS | QPS/VPS | QPS:每秒读取请求(search 和 query)的数量。 VPS:每秒向量读取请求(search)的数量。VPS 不适用于 query 请求,因为 query 操作不涉及向量。 | 有关系统性能监控,请参阅向量数据库性能测试工具。 |
写请求 QPS/VPS | QPS/VPS | QPS:每秒写入请求(insert、bulk insert、upsert 和 delete)的数量。 VPS:每秒向量写入请求(insert、bulk insert、upsert 和 delete)的数量。 | 有关系统性能监控,请参阅向量数据库性能测试工具。 |
读请求延时(Latency) | 毫秒 | 客户端向服务器发起读请求(search 和 query)到客户端收到响应之间的时间差。 在右侧扩展的下拉菜单中选择平均值或 P99 将显示对应的平均延时或 P99 延时。 | - |
写请求延时(Latency) | 毫秒 | 客户端向服务器发起写请求(insert、upsert 和 delete)到客户端收到响应之间的时间差。 在右侧扩展的下拉菜单中选择平均值或 P99 将显示对应的平均延时或 P99 延时。 | - |
读请求失败率 | % | 失败读请求(search 和 query)在每秒所有读请求中所占的百分比。 | 配置告警以监控读请求失败率。 |
写请求失败率 | % | 失败写请求(insert、bulk insert、upsert 和 delete)在每秒所有写请求中所占的百分比。 | 配置告警以监控写请求失败率。 |
慢查询数量 | 次/分钟 | 统计慢查询数量,包括 search 和 query 请求数。默认情况下,查询延时超过 5 秒的查询被视为慢查询。 该指标仅适用于 Dedicated 或 BYOC 集群。有关更多集群类型信息,请参阅 Zilliz Cloud 版本类型。 | 通过适当调整集群配置,可以识别存在问题的查询并优化性能。 |
集群写入性能使用率 | % | 集群的 insert/upsert 操作存在相应的速率限制。当前写入速率与限制的比值即为集群的写入性 能利用率。 该指标仅适用于 Dedicated 或 BYOC 集群。有关更多集群类型信息,请参阅 Zilliz Cloud 版本类型。 | 如果该利用率过高(建议超过 80%),建议您降低写入速率。 |
Flush 次数 | 次/分钟 | 统计对集群操作的 flush 次数。 该指标仅适用于 Dedicated 或 BYOC 集群。有关更多集群类型信息,请参阅 Zilliz Cloud 版本类型。 | 过于频繁的 flush 操作会影响集群的整体性能。有关 flush 操作的相关限制,请参阅使用限制。 |
数据 | |||
Collection 数量 | 个 | 集群中已创建的 Collection 数量。 | - |
Entity 数量 | 个 | 集群中已插入的 Entity 总数。 在右侧扩展的下拉菜单中选择指定的 collection,将显示该 collection 中已插入的 entity 数量。 | - |
已加载 Entity 数量 | 个 | 集群中已加载的 Entity 数量。 在右侧扩展的下拉菜单中选择指定的 collection,将显示该 collection 中已加载的 entity 数量。 该指标仅适用于 Dedicated 或 BYOC 集群。有关更多集群类型信息,请参阅 Zilliz Cloud 版本类型。 | - |
未加载的 Collection 数量 | 个 | 统计集群中未加载的 collection 数量。 该指标仅适用于 Dedicated 或 BYOC 集群。有关更多集群类型信息,请参阅 Zilliz Cloud 版本类型。 | 可凭借该指标判断是否需要清理数据或继续加载 collection。 |
组织告警
组织告警用于提醒您账单相关的重要信息,如信用卡到期提醒、免费额度使用情况、现金余额警示以及用量金额相关的告警通知。
告警项 | 单位 | 描述 | 推荐操作 | 默认告警条件 |
---|---|---|---|---|
免费额度 | ¥ | 跟踪免费额度的余额,当额度低时提醒用户及时充值。 | 充值以维持账户功能。 | 免费额度余额小于 ¥10 时触发警告告警。 |
免费额度有效期 | 天 | 监控免费额度的剩余有效期,鼓励用户使用或延期。 | 延长有效期或在额度过期前使用。 | 免费额度有效期小于 0 天时触发警告告警。 |
现金余额 | ¥ | 监控预付款余额,当余额低时提醒用户以防服务中断。 | 为预付款余额增加资金以避免服务中断。 | 现金余额小于 ¥100 时触发紧急告警。 |
用量金额 | ¥ | 跟踪使用金额,当超过设定阈值时通知用户,建议监控和管理。 | 监控和管理使用以保持在预算限额内。 | 用量金额大于 ¥100 时触发警告告警。 |