管理项目告警
Zilliz Cloud 针对资源监控提供了两类告警:一是针对账单相关的组织告警,二是针对特定项目中集群性能的项目告警。更多详细信息,请参阅指标与告警快速参考。
本文将介绍如何查看及管理项目告警。
概览
下表展示了各项目告警的默认配置。
当告警处于开启状态时,一旦满足告警条件,指定的接收者将收到告警通知。您可以编辑告警以更改其状态。
如需了解集群资源使用超过阈值时建议执行的操作,请参阅集群指标。
告警项 | 单位 | 默认告警条件 |
---|---|---|
CU 计算资源 | % | 警告:CU 计算资源用量大于 70% 且持续时间超过 10 分钟时触发告警。 紧急:CU 计算资源用量大于 90% 且持续时间超过 10 分钟时触发告警。 |
CU 加载容量 | % | 警告:CU 加载容量大于 70% 且持续时间超过 10 分钟时触发告警。 紧急:CU 加载容量大于 90% 且持续时间超过 10 分钟时触发告警。 |
Search(QPS) | QPS | Search 类型请求数大于 50 QPS 且持续时间超过 10 分钟时触发警告告警。 |
Query(QPS) | QPS | Query 类型请求数大于 50 QPS 且持续时间超过 10 分钟时触发警告告警。 |
Search 延时(P99) | ms | Search 类型 P99 请求延时大于 1000 ms 且持续时间超过 10 分钟时触发警告告警。 |
Query 延时(P99) | ms | Query 类型 P99 请求延时大于 1000 ms 且持续时间超过 10 分钟时触发警告告警。 |
权限:
-
查看:组织管理员、项目管理员或成员可以查看项目告警。
-
配置:只有组织管理员或项目管理员可以配置集群告警。
-
接收告警通知:如果被管理员指定,任何组织成员都可以接收告警通知。
要了解用户角色的详细说明,请参阅用户角色。
查看项目告警
在项目告警页面,查看各种集群相关的告警。
告警的组成部分:
-
告警项:由 Zilliz Cloud 预设的触发条件和严重程度。
-
状态:显示告警是否处于开启状态。
-
触发条件:触发告警的条件。对于每个项目级别的告警项,触发条件包括必须满足的阈值和持续时间。触发条件可以使用为以下任一运算符:>、>=、<、<=、=。阈值可以是数值,如 Search 延时、Query QPS、Search QPS、CU 加载容量或 CU 计算资源等指标的数值。持续时间是指指标超过阈值的持续时长,最短可设置为 1 分钟,最长为 30 分钟。
-
告警等级:分为警告或紧急。
-
告警接收:接收通知的指定角色、电子邮箱地址或电话号码。
创建项目告警
除了默认告警外,您还可以点击 + 告警来创建项目告警。您可以自定义告警项、严重级别、告警条件和告警通知接收人。
有关支持自定义的告警项,请参阅指标与告警快速参考。
编辑项目告警
-
自定义设置:修改告警触发条件、更新通知接收人以及更改告警状态。
-
限制:暂不支持修改告警项和告警等级。
要快速开启或关闭一个告警,您可以在操作栏中选择开启或关闭。
开启或关闭项目告警
要快速开启或关闭一个告警,在操作栏中选择开启或关闭。
告警关闭后,您无法再接收到任何告警通知。
删除项目告警
您可以删除不需要的项目告警。
告警删除后,您无法再接收到任何告警通知。
查看告警历史
在告警历史页签,查看已触发的告警历史列表。您可以根据告警项、告警等级和告警时间范围筛选满足条件的告警。
配置告警接收设置
告警接收设置功能使项目管理员能够创建和管理告警模板,以系统化的方式处理项目中的各类告警通知。
在项目的告警设置页面中,配置告警接收设置。