求推荐实时语音转写文字,依赖免费的语音接口实现的 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
ALLROBOT
V2EX    Python

求推荐实时语音转写文字,依赖免费的语音接口实现的

  •  
  •   ALLROBOT 2021-05-12 18:27:07 +08:00 3405 次点击
    这是一个创建于 1666 天前的主题,其中的信息可能已经有所发展或是发生改变。

    百度提供免费的语音接口,想做个实时语音转写文字的 app,特此发帖求推荐哪些源码项目比较合适?

    想借鉴某些源码思路,写个字幕式的,效果和小米闻声 app 差不多吧

    可以求讯飞听见,小米闻声 app 类似的源码?

    我不知道小米闻声怎么做到实时转写文字的,我能想到的无非分割音频文件,每个音频 1s,转成 PCM 格式进行上传,等收到数据包提取转换后的文字再输出,但一句话说完,这句话的音频文件转换后的文字没法看。。。

    18 条回复    2022-02-15 08:46:22 +08:00
    ch2
        1
    ch2  
       2021-05-12 18:40:12 +08:00
    语音识别你分割了就丧失了前后文语境,肯定识别不出来的
    你想要实时的那就是本机实时预测,具体怎么做是人家的商业秘密,不可能让你白嫖的
    ALLROBOT
        2
    ALLROBOT  
    OP
       2021-05-12 18:45:07 +08:00
    @ch2 我也了解这情况的,我愿意花钱用付费接口嘛。。。
    ALLROBOT
        3
    ALLROBOT  
    OP
       2021-05-12 18:45:33 +08:00
    免费不行,就上付费的
    cutemurphy2888
        4
    cutemurphy2888  
       2021-05-12 19:24:56 +08:00
    腾讯的同声传译
    gainsurier
        5
    gainsurier  
       2021-05-12 19:48:40 +08:00
    苹果本地有 api 可以直接调用
    agoodob
        6
    agoodob  
       2021-05-12 21:48:12 +08:00
    实时? websocket 呗。
    如果不用实时的,而且手头有 .mp3 .aac 等音视频文件希望拖到一个程序里直接转文字,看一下: https://github.com/1c7/Translate-Subtitle-File
    inhzus
        7
    inhzus  
       2021-05-12 22:06:18 +08:00 via iPhone
    直接用现成的实时语音转文字,已经非常成熟了,别折腾自己。阿里云、腾讯等等都有,市场价 1-2 元每小时
    ethanlu
        8
    ethanlu  
       2021-05-12 22:12:58 +08:00
    ALLROBOT
        9
    ALLROBOT  
    OP
       2021-05-13 08:18:58 +08:00
    @inhzus 那怎么引入那些成熟的产品接口。。。?我想搞个 AR 版的语音转文字,类似电子游戏的字幕一句句浮现眼前的效果
    ALLROBOT
        10
    ALLROBOT  
    OP
       2021-05-13 08:19:24 +08:00
    @gainsurier 苹果没试过,可以去试试
    ALLROBOT
        11
    ALLROBOT  
    OP
       2021-05-13 08:20:03 +08:00
    @gainsurier 你这么一说,我想起了微软好像也有,我去瞧瞧
    inhzus
        12
    inhzus  
       2021-05-13 09:23:14 +08:00 via iPhone
    @ALLROBOT 直接去阿里云、腾讯云官网找 sdk 使用说明结合自己场景不就可以了。?
    ALLROBOT
        13
    ALLROBOT  
    OP
       2021-05-13 13:21:36 +08:00
    @inhzus https://ai.baidu.com/ai-doc/SPEECH/qk76b444d 已经在看百度语音的 sdk 手册了
    @agoodob 了解 websocket 了,语音识别我没怎么接触,第一次接触这方面的。。。抱歉哈,在看 sdk 手册了,如楼上所言,根据 sdk 进行开发吧
    muhuan
        14
    muhuan  
       2022-01-30 11:54:29 +08:00
    楼主最后选择的哪个?我也有一些 1h 左右的语音,想转化为文本
    ALLROBOT
        15
    ALLROBOT  
    OP
       2022-02-11 13:14:16 +08:00
    @muhuan 百度和讯飞
    muhuan
        16
    muhuan  
       2022-02-12 09:32:14 +08:00 via iPhone
    @ALLROBOT 这些是收费的
    ALLROBOT
        17
    ALLROBOT  
    OP
       2022-02-14 22:00:02 +08:00
    @muhuan 小米-无障碍-语音转写文字,无限时长、免费、讯飞引擎~~~搞定了通知我哈,我想白嫖小米
    muhuan
        18
    muhuan  
       2022-02-15 08:46:22 +08:00 via iPhone
    @ALLROBOT 赞赞赞
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1047 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 23:02 PVG 07:02 LAX 15:02 JFK 18:02
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86