项目地址:
https://github.com/swananan/ghostscope大家感兴趣可以看 README 的演示,我目前可以拿来跟踪 nginx 进程,用的还是蛮顺手的,这个工具我想了好久了,特别是 TUI 操作的时候,加上了我喜欢的 cgdb 、tmux 、vim 甚至还有 emacs 等工具的一些操作风格和按键习惯。所以,我在开发的时候,还是蛮开心的。
想做这个工具,主要是我以前排查问题的时候,总是觉得日志不够用,但是线上服务,又不能随便发版本,各种红线和变更要求,条条框框卡的很死。我好久以前尝试拿着 systemtap ,根据调试信息去抓线上我想看的信息,属于强行死马当活马医(问题如果拖着不查,后面暴雷了也是一个死)。记得,我当时测试机跑宕机了两次,我才敢拿着 systemtap 脚本去小流量机器偷偷抓信息。现在 eBPF + uprobe 的抓取方式,至少安全性是靠谱的。
不过目前项目还在启动阶段,有蛮多的限制,具体文档有写。我这边简单提两句,对 c 语言支持比较好(有点废话的意思),至于 C++、Rust 的话,目前只简单支持了 mangled 查找,各种高级语言特性完全不支持。另外,对于编译器开了高优化的程序,探测能力还有待后续增强,各种内联,调试信息 DWARF 复杂好多,搞得我头大。
大家有什么想法,欢迎开 issue 或者在帖子留言,我还在疯狂迭代,准备先让自己觉得好用,后面再看下一步迭代方向。