
tldr: https://github.com/mayocream/koharu
文字检测模型用了基于 YOLOv5 和 DBNet 的 comic-text-detector ,OCR 模型用了基于 transformers 的 manga-ocr 。
程序用 Rust 和 Tauri 编写,界面用的是 React + Konva.js + TypeScript ;更详细可以看仓库的 README 。

程序支持兼容 OpenAI API 的任何后端,比如 LM Studio ,使用时注意打开 CORS 。
准备加上 segment 和 inpaint 功能,还在施工中……
刚学 Rust 三个月,写出来的第一个程序,还望轻喷 orz
1 loveqianool 2025 年 4 月 22 日 |
2 yidinghe 2025 年 4 月 22 日 via Android 以后直接用多模态 LLM ,因为多模态 LLM 不仅能识别文字内容,还会根据漫画内容来推断其真实意思。 |
3 RedNax 2025 年 4 月 22 日 好赞! 等多模态彻底成熟了是不是能直接修图嵌字…… |
4 ovtfkw 2025 年 4 月 22 日 via iPhone 哪里有汉化 |
5 neteroster 2025 年 4 月 22 日 via Android |
6 cijianzy 2025 年 4 月 22 日 这个不错。 |
7 qinghuazs 2025 年 4 月 22 日 |
8 9yu OP @yidinghe 现在手动把漫画图片喂给 ChatGPT / Claude 也可以达到这个效果,不过我暂时还没尝试集成进程序里;感觉可以试试!就是 API 费用可能有点贵。 |
9 9yu OP @neteroster @RedNax 1L 分享的 manga-image-translator 这个项目其实可以全自动化,但是是 Python 写的,但是思路是差不多的: Detection / segment -> OCR -> LLM translate -> SD inpaint Koharu 还差 inpaint ,我打算这周加上去。 Python 的程序感觉不太容易分发,Rust 写的不需要其他任何依赖,方便一些。 |
11 xzaf 2025 年 4 月 22 日 厉害了,赞赞赞! |
12 lizhenda 2025 年 4 月 24 日 不错哦,如果能直接改图就更好了。 |