Go 实现的模型推理和 API 部署框架 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
The Go Programming Language
http://golang.org/
Go Playground
Go Projects
Revel Web Framework
jack139
V2EX    Go 编程语言

Go 实现的模型推理和 API 部署框架

  •  
  •   jack139
    jack139 2022-07-27 17:31:47 +08:00 2719 次点击
    这是一个创建于 1220 天前的主题,其中的信息可能已经有所发展或是发生改变。

    推销一下 :)

    https://github.com/jack139/go-infer

    深度学习模型在部署时通常以云方式部署,通过 API 对外体提供推理服务。这个框架提供了部署 API 时的基本架构组件,实现了几个目标:

    • API 处理模块与模型推理模块解耦,降低高并发造成的网络和计算阻塞风险
    • API 处理模块与模型推理模块可进行分布式部署,均可实现横向扩展
    • 使用 Go 语言实现,提高执行效率,简化部署和运维
    • 业务逻辑使用 callback 方式调用,隐藏通用逻辑,开发时只需关注业务逻辑

    其他功能:

    • 服务端配置使用 Yaml ,分布式部署时可进行针对性配置
    • API 验签支持 SHA256 和 SM2 算法
    • 模型示例
      • BERT 模型推理示例
      • CNN 模型推理示例
      • Tensorflow 模型权重转换示例
      • Keras 模型权重转换示例
    4 条回复    2022-07-28 09:14:20 +08:00
    Zhao70
        1
    Zhao70  
       2022-07-27 17:59:33 +08:00   2
    楼主做的这个东西和我工作领域有一些重合度,star 一下。

    不过有几个问题需要注意:
    1. tensorflow 版本有些低,是 1.15.4 ,貌似不支持 avx, avx2, fma 指令集,建议升级下,大概可以提升 20%的 CPU 打分性能。
    2. bert 算法使用了 github.com/buckhx/gobert 这个算法库,这个库在生产环境 Wordpiece Tokenize 存在字符串分片不会被 gc 的问题,再就是对于特殊 query 导致死循环,服务 OOM
    Juszoe
        2
    Juszoe  
       2022-07-27 18:32:45 +08:00
    看起来不错,有兼容 pytorch 或者 onnx 的打算吗
    jack139
        3
    jack139  
    OP
       2022-07-28 09:11:11 +08:00
    @Juszoe 已在 todo list 里,不过对 onnx 不熟,先要学习一下。好像也有 go torch 的路线,也可以尝试。
    jack139
        4
    jack139  
    OP
       2022-07-28 09:14:20 +08:00
    @Zhao70 1. 不好意思,因我的环境都还没升到 tf2 ,所以对 1.15 比较熟悉一些。2. 这个也是临时抓来的库做例子,还没有深究。我的生产还在用 py ,目标是要改 go ,所以才搞了这个项目。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2302 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 21ms UTC 00:52 PVG 08:52 LAX 16:52 JFK 19:52
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86