


1 huangsijun17 62 天前 1. null 值处理问题。 2. 能不能调低采集维度? 3. 告警按照时间段设置? |
2 Vraw5 OP @huangsijun17 #1 获取数据的操作是阿里云那边做的,我们只能配置监控报警规则的阈值,所以 1 和 2 都做不了。3 告警时间可以配置。 主要问题还是无法覆盖真实的 key miss 的情况,因为无 qps 会弄脏统计结果 |
3 opengps 62 天前 计算公式里本身就藏着这么个问题,无访问时候的 qps 写成 0%或者 100%都有副作用。这时候确实得考虑写个定时循环每秒读取 1 次 |
4 Vraw5 OP @opengps #3 我是这么想的。如果设置成 100%时,监控上出现 100%,要么没有 QPS 要么都命中了,业务上是没出现问题的,不需要告警。即使会拉高命中率,也可以通过拉高报警规则的阈值或者降低周期去配置。如果设置成 0 ,完全无法区分到底是因为没有 QPS 造成还是因为 misses 过多造成的命中率低。 所以我难以理解为啥阿里云会变更这个规则 |
7 spritecn 62 天前 写个 job,每秒写个随机值进去读一下 |
9 BenHunDun 61 天前 不知道有没有统计请求量, 感觉这个监控预警是不是应该要有一个最低请求量限制. 即其实在某个请求量下, 其实未命中 key , 访问数据库对业务方是能够接受. 不会对系统造成危害. 通过降低提示等级到 warn, info 提示用户. |