
目前找到的版本实现是 1.13pod-gpu-metrics-exporter,寻求支持 1.12 的采集的开源方案。我好菜,别喷我^_^。
1 richzhu 2019-06-20 10:26:40 +08:00 via iPhone 高级,我用的 Prometheus 省事 |
3 choury 2019-06-20 10:41:11 +08:00 via Android 用 cadvisor |
4 vaniot OP @choury 我用了 cadvisor 的得到 mertic:`container_accelerator_memory_used_bytes`,每一个的 value 都是一样的数据,目前只有一个 node 上有 nvidia gpu,这是统计总的信息? |
9 choury 2019-06-20 11:13:38 +08:00 via Android @vaniot 怎么分配的呢? mps ? grid ?当前的监控都只能做到卡的粒度,如果你只有一张卡那看到的都是这改卡的使用率 |
11 menyakun 2019-06-20 11:49:52 +08:00 NVIDA 官方提供的 exporter 没有的话,应该也不会有了吧。你用的是 NVIDA GRID ?我记得是要买许可的吧,不知道会不会有闭源的解决方案。 |