Open AI 全家桶生成英语听力素材 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
netpi
V2EX    分享创造

Open AI 全家桶生成英语听力素材

  •  
  •   netpi
    netpi 2023-12-08 10:31:44 +08:00 3005 次点击
    这是一个创建于 679 天前的主题,其中的信息可能已经有所发展或是发生改变。

    网络上沉浸式英语听力素材有限。正好最近调试 OpenAI 的全家桶。

    就做个小系统: 100%用 OpenAI 的 API 生成英语听力素材。

    成品效果:

    Whisper 转录+ChatGPT4 润色+OpenAI TTS 生成英语听力素材(纯英语版)_哔哩哔哩_bilibili

    Whisper 转录+ChatGPT4 润色+OpenAI TTS 生成英语听力素材(含中文语音版)_哔哩哔哩_bilibili

    实现思路:

    1. pytube 下载 YouTube 视频,并转成音频
    2. 用 OpenAI 的 API 调用 Whisper ,把音频转成文本
    3. 用 OpenAI 的 API 调用 ChatGPT4 ,润色、翻译文本成理想格式
    4. 用 OpenAI 的 API 调用 TTS 生成语音
    5. 用 ffmpeg 将语音和文字合成最终视频

    这里分享我用的 prompt ,使用时将<输入的信息>替换成 Whisper 转录后的文本:

    prompt = """ 润色以下演讲稿, 注意生成讲故事风格, 不要遗漏细节, 不要遗漏包括提问、举例、交流以及互动等任何信息。忽视文尾的 Thank you 。确保:每句话 8 到 13 个单词,每句话独立成行,不分段,形成格式'英文|中文': 例如: 输入: All right, I'd like you to take a moment, think about a time when you were recently sick. Try specifically to think of a time when, even though you weren't feeling all that great, you still felt well enough to get up out of bed, go about your day. The language I'm speaking right now is on its way to becoming the world's universal language, for better or for worse. Let's face it. It's the language of the internet, it's the language of finance, Thank you. Thank you. 错误的输出: All right, take a moment and think back. | 好的,请花一点时间回想一下。 Remember a time when you were sick. | 回忆一下你最近生病的时候。 Recall feeling just well enough for your day. | 回想你虽然感觉不太好,但还能起床过日子。 The language I'm speaking right now is on its way to global dominance. | 我正在说的这种语言正在成为全球通用语言。 It's the language of international domains. | 它是互联网、金融、和其他领域的语言。 Thank you. | 谢谢你们 正确输出: All right, take a moment and think back. | 好的,请花一点时间回想一下。 Remember a time when you were sick. | 回忆一下你最近生病的时候。 Recall feeling just well enough for your day. | 回想你虽然感觉不太好,但还能起床过日子。 The language I'm speaking right now is on its way to global dominance. | 我正在说的这种语言正在成为全球通用语言。 It's the language of international domains. | 它是互联网、金融、和其他领域的语言。 开始: <输入的信息> """ 

    最后生成 7 个多小时的视频花了 5.7 刀,这还包括了我日常 GPT4 的使用,实际花费估计 5 刀左右。

    10 条回复    2023-12-13 10:19:06 +08:00
    sorcerer
        1
    sorcerer  
       2023-12-08 18:11:10 +08:00 via Android
    不错啊,我也想试试.
    akaken
        2
    akaken  
       2023-12-08 22:41:12 +08:00
    可以,我去试试,正好在学英语哈。对了,楼主可以试试这个网站降低成本: https://orisound.cn ,这里直连 openAI 所有最新模型,api ,价格低,可以试试诶,我直接用最新的 4 的 128k 写代码的。
    netpi
        3
    netpi  
    OP
       2023-12-10 01:23:24 +08:00 via iPhone
    @akaken 可以试试
    JackCkei
        4
    JackCkei  
       2023-12-11 08:36:48 +08:00
    @akaken 我也试试
    JackCkei
        5
    JackCkei  
       2023-12-11 08:41:24 +08:00
    @akaken 不过老哥我有个问题,APIkey 调用和直接网页用 gpt4 效果一样吗,我之前看有人说 api 调用的 4 更傻一些,网页版有自己的一些优化设置,求回复
    netpi
        6
    netpi  
    OP
       2023-12-11 10:36:25 +08:00 via iPhone
    @JackCkei 很难测试 只凭感觉 我没感觉 API 更傻
    akaken
        7
    akaken  
       2023-12-11 14:02:17 +08:00
    @JackCkei 我看外网讨论是说,网页版 gpt 模型是和 API 的一样的,只不过网页版单独内置了一些 prompt ,对 c 端用户相对更友好一些
    zgpgzhangpeng
        8
    zgpgzhangpeng  
       2023-12-11 15:04:20 +08:00
    感谢分享
    JackCkei
        9
    JackCkei  
       2023-12-12 14:52:01 +08:00
    @akaken 我也是看到的这个消息,应该就是多个 prompt ,多了一个调教
    allen9009
        10
    allen9009  
       2023-12-13 10:19:06 +08:00
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3765 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 31ms UTC 10:15 PVG 18:15 LAX 03:15 JFK 06:15
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86