跳到主要内容

管理项目告警

Zilliz Cloud 针对资源监控提供了两类告警:一是针对账单相关的组织告警,二是针对特定项目中集群性能的项目告警。更多详细信息,请参阅指标与告警快速参考

本文将介绍如何查看及管理项目告警。

概览

下表展示了各项目告警的默认配置。

当告警处于开启状态时,一旦满足告警条件,指定的接收者将收到告警通知。您可以编辑告警以更改其状态。

如需了解集群资源使用超过阈值时建议执行的操作,请参阅集群指标

告警项

单位

默认告警条件

CU 计算资源

%

警告:CU 计算资源用量大于 70% 且持续时间超过 10 分钟时触发告警。

紧急:CU 计算资源用量大于 90% 且持续时间超过 10 分钟时触发告警。

CU 加载容量

%

警告:CU 加载容量大于 70% 且持续时间超过 10 分钟时触发告警。

紧急:CU 加载容量大于 90% 且持续时间超过 10 分钟时触发告警。

Search(QPS)

QPS

Search 类型请求数大于 50 QPS 且持续时间超过 10 分钟时触发警告告警。

Query(QPS)

QPS

Query 类型请求数大于 50 QPS 且持续时间超过 10 分钟时触发警告告警。

Search 延时(P99)

ms

Search 类型 P99 请求延时大于 1000 ms 且持续时间超过 10 分钟时触发警告告警。

Query 延时(P99)

ms

Query 类型 P99 请求延时大于 1000 ms 且持续时间超过 10 分钟时触发警告告警。

权限

  • 查看:组织管理员、项目管理员或成员可以查看项目告警。

  • 配置:只有组织管理员或项目管理员可以配置集群告警。

  • 接收告警通知:如果被管理员指定,任何组织成员都可以接收告警通知。

要了解用户角色的详细说明,请参阅用户角色

查看项目告警

项目告警页面,查看各种集群相关的告警。

告警的组成部分

  • 告警项:由 Zilliz Cloud 预设的触发条件和严重程度。

  • 状态:显示告警是否处于开启状态。

  • 触发条件:触发告警的条件。对于每个项目级别的告警项,触发条件包括必须满足的阈值和持续时间。触发条件可以使用为以下任一运算符:>、>=、<、<=、=。阈值可以是数值,如 Search 延时、Query QPS、Search QPS、CU 加载容量或 CU 计算资源等指标的数值。持续时间是指指标超过阈值的持续时长,最短可设置为 1 分钟,最长为 30 分钟。

  • 告警等级:分为警告紧急

  • 告警接收:接收通知的指定角色、电子邮箱地址或电话号码。

zh-view-project-alert

创建项目告警

除了默认告警外,您还可以点击 + 告警来创建项目告警。您可以自定义告警项、严重级别、告警条件和告警通知接收人。

有关支持自定义的告警项,请参阅指标与告警快速参考

zh-create-project-alert

编辑项目告警

  • 自定义设置:修改告警触发条件、更新通知接收人以及更改告警状态。

  • 限制:暂不支持修改告警项和告警等级。

📘说明

要快速开启或关闭一个告警,您可以在操作栏中选择开启关闭

开启或关闭项目告警

要快速开启或关闭一个告警,在操作栏中选择开启关闭

📘说明

告警关闭后,您无法再接收到任何告警通知。

删除项目告警

您可以删除不需要的项目告警。

🚧警告

告警删除后,您无法再接收到任何告警通知。

查看告警历史

告警历史页签,查看已触发的告警历史列表。您可以根据告警项、告警等级和告警时间范围筛选满足条件的告警。

zh-view-alert-history

配置告警接收设置

告警接收设置功能使项目管理员能够创建和管理告警模板,以系统化的方式处理项目中的各类告警通知。

在项目的告警设置页面中,配置告警接收设置。

zh_alert-receiver-settings