1 huangsijun17 9 小时 0 分钟前 1. null 值处理问题。 2. 能不能调低采集维度? 3. 告警按照时间段设置? |
2 Vraw5 OP @huangsijun17 #1 获取数据的操作是阿里云那边做的,我们只能配置监控报警规则的阈值,所以 1 和 2 都做不了。3 告警时间可以配置。 主要问题还是无法覆盖真实的 key miss 的情况,因为无 qps 会弄脏统计结果 |
![]() | 3 opengps 8 小时 22 分钟前 计算公式里本身就藏着这么个问题,无访问时候的 qps 写成 0%或者 100%都有副作用。这时候确实得考虑写个定时循环每秒读取 1 次 |
4 Vraw5 OP @opengps #3 我是这么想的。如果设置成 100%时,监控上出现 100%,要么没有 QPS 要么都命中了,业务上是没出现问题的,不需要告警。即使会拉高命中率,也可以通过拉高报警规则的阈值或者降低周期去配置。如果设置成 0 ,完全无法区分到底是因为没有 QPS 造成还是因为 misses 过多造成的命中率低。 所以我难以理解为啥阿里云会变更这个规则 |
7 spritecn 3 小时 50 分钟前 写个 job,每秒写个随机值进去读一下 |