对于类互联网后端服务而言,监控系统的重要性不言而喻。一般大厂都会有专门的团队结合自身业务打造一套专属的监控系统(或者说可观测系统)集成数据埋点、上报、指标计算、可视化展示、告警、归因等一系列功能。
但是对于中小厂而言,专门养一个这样的团队,ROI 可能不高,因此可能会使用一些开源方案、或者云厂商提供的服务,想了解一下,有此类经验的同学,是否在使用这些系统、服务时有什么痛点问题。
1 Hieast 64 天前 专门招人来做 SRE 最好,不然永远有做不完的需求和技术债 |
![]() | 2 SethShi 64 天前 可以看看阿里云的 ARMS, 支持上百种标准协议接入, 囊括硬件层, 网关层, 应用层, 数据收集用的 opentelemetry 协议收集 => 存储到 SLS => 指标计算使用 ARMS, 可以看到 p99, 超时错误等等 ==> 价格太高的话把保存天数设置为 7 天就行 |
![]() | 3 SethShi 64 天前 |
4 guanyujia5444 64 天前 ARMS 很好用,该花钱花钱 |
![]() | 5 zfyp 64 天前 小公司最主要是不重视,没钱做或者不想花钱 |
6 salmon5 64 天前 ARMS ,养一个这样的团队?弄一地鸡毛? |
7 kiraskyler 64 天前 做深入的性能观测的门槛很高,只是基础的话开源工具就可用,比如普罗米修斯这种。 |
8 nickyadance23 64 天前 @salmon5 #6 我经历过的 500 人小厂,增长期招大厂 infra 进来一顿折腾包括监控、框架和中间件等,上市无望后全部裁掉真正的一地鸡毛。最经典的是接口返回码得从 0 改成 200 ,说是对齐 http~~ |
![]() | 9 pc10201 64 天前 有很多公司在用夜莺监控系统了,不过夜莺公司也没有赚到很多钱 |
![]() | 10 mengdodo 64 天前 小公司建议还是多把心思花在业务上,整天研究自己的员工算哪门子事 |
12 dawee2y 64 天前 直接用开源的,比如 skywalking 这种 |
15 salmon5 63 天前 |
![]() | 16 Desdemor 63 天前 需求没那么大, 普罗米修斯+阿里云的 log 已经满足大部分场景了 |
17 julyclyde 63 天前 小厂的好处就是没那么多多余的人去创造新项目 尽量跟随主流/标准就行了 |
![]() | 18 abcbuzhiming 62 天前 小厂最大的问题就是没钱没人,监控这东西做的够好是要投入钱和人的,小厂要做这个,就只能做个样子货 |
![]() | 19 tianshiyeben 61 天前 看看 www.wgstart.com 监控 工单 日志都有了 |