
例如有一个音频文件,把歌手的声音和乐器分开
得到两个音轨:一个是人声音轨,另一个是乐器部分
1 8eacekeep 2023 年 1 月 12 日 乐器一般占高低频,以前就是直接抠。现在人工智的话,大概是分析人声特征吧,不过不论哪一种效果都不咋地,都抠不干净的 |
2 Xymmh 2023 年 1 月 12 日 利用人声在左右声道里相位相同的原理吧,记得几百块钱的电子琴都有这个功能,还是实时的 |
3 n0099 2023 年 1 月 12 日 |
4 moondark 2023 年 1 月 12 日 这种叫做 声伴 分离技术,用机器学习训练的 最新算法目前对于流行歌曲抠的还可以,对于 RAP 类的不太行 |
5 zhuangzhuang1988 2023 年 1 月 12 日 可以看下吴恩达的 机器学习,无监督学习 下面链接直接定位到了 那个 DEMO https://www.bilibili.com/video/BV164411b7dx?t=393.7&p=4 PS: 都是数学 |
6 noe132 2023 年 1 月 12 日 最简单就是看声相位置,通常鼓和人声都在声场中间,其他乐器通常在侧位,可以直接分离出来,但是这种看歌曲,而且很多时候效果并不好,还会把鼓点也都移除掉了。以前用 Audition 操作过,很简单只需要按几下按钮就能搞定。 复杂的就不太了解了 |
8 Yadomin 2023 年 1 月 12 日 |
9 zeni123 2023 年 1 月 12 日 和人工智能抠图后背景还在那种场景差不多 |
12 shakoon 2023 年 1 月 12 日 模拟电路里,这是一个滤波器,可以把特定频率的声波减弱,几十年前的卡拉 OK 功放机就有这个功能,当然,效果是有限的,因为有很多伴奏也在人声的这个范围。实际上三十年前的卡拉 OK VCD 是将已经用上面方式去掉人声的伴奏作为一个声道,完整的歌曲作为另一个声道,这样极大方便了使用,也降低了对设备的要求。 |
13 fengleiyidao 2023 年 1 月 12 日 估计,最简单粗暴的方法就是,直接在频域把人声最强的那个频段清零,或幅度压低。 |
14 fengleiyidao 2023 年 1 月 12 日 @shakoon Bandstop filter |
15 xuanbg 2023 年 1 月 12 日 没有什么信号是傅立叶变换滤不出来的。。。 |
16 youxiachai 2023 年 1 月 12 日 团子 AI 这块做得蛮好的...如果有需求的话,可以充值一下.. |
17 billlee 2023 年 1 月 12 日 @fengleiyidao 但流行音乐伴奏的频率和人声是一样的啊 |
18 edis0n0 2023 年 1 月 12 日 |
19 fengleiyidao 2023 年 1 月 12 日 @billlee 人声应该是主要集中在一个很窄的频段里,比音乐窄多了。 |
20 MMMMMMMMMMMMMMMM 2023 年 1 月 13 日 bass 低频,vocal 中频,drum 根据 bpm 间隔性剥离,AI 火起来之前是这么干的 现在流行 AI 炼丹了,对抗生成什么的 |