开源高性能语音识别服务器 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
Acorns
V2EX    程序员

开源高性能语音识别服务器

  •  
  •   Acorns 330 天前 2922 次点击
    这是一个创建于 330 天前的主题,其中的信息可能已经有所发展或是发生改变。

    SpeakSense ASR Server: 高性能语音识别服务器实现

    大家好!今天给大家介绍一个基于 OpenAI Whisper 的高性能语音识别服务器实现 - SpeakSense ASR Server 。这是一个使用 Rust 开发的完整解决方案,支持多平台部署,并提供了灵活的 API 接入方式。 项目地址:GitHub - Whisper ASR Server

    主要特性

    1. 双模式 API 支持

    • gRPC 服务:支持流式语音识别,适合实时转写场景
    • REST API:提供完整的任务管理接口,包括:
      • 任务创建(支持 URL 和本地文件)
      • 任务状态查询
      • API 密钥管理

    2. 强大的任务调度系统

    • 自动音频文件下载
    • 异步转写处理
    • HTTP 回调通知
    • 完整的任务生命周期管理

    3. 全平台支持

    • MacOS ( Metal 加速)
    • Linux ( CUDA 加速)
    • Windows ( CUDA 加速)

    4. 企业级特性

    • 内置身份认证系统
    • 可配置的任务队列
    • 灵活的存储方案
    • 支持微服务架构

    为什么选择 Whisper ASR Server ?

    1. 高性能

      • 使用 Rust 语言开发,确保最佳性能
      • 支持硬件加速( CUDA/Metal )
      • 优化的任务调度系统
    2. 易于部署

      • 提供 Docker 支持
      • 简单的环境变量配置
      • 详细的部署文档
    3. 开发者友好

      • 完整的 API 文档
      • 提供客户端示例
      • 支持多种接入方式
    4. 生产环境可用

      • 内置认证机制
      • 可靠的错误处理
      • 支持横向扩展

    快速开始

    只需几个简单步骤即可部署:

    # 1. 克隆仓库 git clone https://github.com/yourusername/whisper-asr-server.git # 2. 下载模型 ./script/download-ggml-model.sh # 3. 构建项目(支持多种模式) cargo build --release # 标准版本 cargo build --release --features cuda # CUDA 支持版本 cargo build --release --features metal # Metal 支持版本( MacOS ) 

    应用场景

    • 音视频内容自动字幕生成
    • 会议记录自动转写
    • 语音指令识别
    • 实时语音转写服务
    • 音频内容分析

    开源贡献

    项目采用 Apache License 2.0 开源协议,欢迎社区贡献!无论是提交 PR 、报告问题还是提供建议,我们都非常欢迎。

    结语

    如果你正在寻找一个可靠的、高性能的语音识别解决方案,Whisper ASR Server 绝对值得一试。项目正在积极维护中,欢迎大家 Star 和 Fork !

    项目地址:GitHub - Whisper ASR Server

    如果觉得项目对你有帮助,别忘了给个 Star !

    #语音识别 #Rust #OpenAI #Whisper #ASR #开源项目

    第 1 条附言    330 天前
    非常抱歉,第一次发 V2EX ,由于使用 AI 帮忙生成了文章部分内容,没有检查 GitHub 地址,这里跟补充地址: https://github.com/bean-du/SpeakSense
    15 条回复    2024-11-16 15:09:41 +08:00
    icefrogisgreat
        1
    icefrogisgreat  
       330 天前
    GitHub 地址应该是填错了,显示 404
    RockShake
        2
    RockShake  
       330 天前
    用 AI 生成的文案都没改就复制过来了: https://github.com/yourusername/whisper-asr-server
    alexsz
        3
    alexsz  
       330 天前
    yourusername
    dismantle
        4
    dismantle  
       330 天前
    文案太走心了, 甚至仓库都是错的
        5
    qiayue  
    PRO
       330 天前
    qiayue
    hanguofu
        6
    hanguofu  
       330 天前
    能支持 armv8 ( AArch64 ) 吗 ?
    Metatron7
        7
    Metatron7  
       330 天前
    .DS_Store 也搞进来了,有点搞笑
    Acorns
        8
    Acorns  
    OP
       330 天前
    @icefrogisgreat 不好意思已经修改,地址: https://github.com/bean-du/SpeakSense
    Acorns
        9
    Acorns  
    OP
       330 天前
    不好意思,已经修复了,地址: https://github.com/bean-du/SpeakSense
    Acorns
        10
    Acorns  
    OP
       330 天前
    @RockShake 被你发现了
    humbass
        11
    humbass  
       330 天前
    这么牛逼的吗,收藏支持!!!
    kkk9
        12
    kkk9  
       330 天前
    一定要 CUDA 吗……有没有办法 CPU 跑
    Acorns
        13
    Acorns  
    OP
       330 天前
    @kkk9 可以 CPU 跑,只是会慢一点儿,不过这个模型优化过也比原始的快很多,可以选小一些尺寸的模型,README.md 里面有介绍模型的下载地址
    Acorns
        14
    Acorns  
    OP
       330 天前
    @humbass 谢谢支持
    cooltechbs
        15
    cooltechbs  
       329 天前 via Android
    我记得 V2EX 禁止 GenAI 内容来着(
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     975 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 18:57 PVG 02:57 LAX 11:57 JFK 14:57
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86