
我先来抛砖引玉。我这笔最大支出可能听起来有点偏门大疆麦克风 dji mini ( 500 左右)。

虽然它是个收音设备,但在现在的 AI 时代,简直是生产力外挂。现在的语音识别准确率太恐怖了,我把它配合微信的全局语音输入,日常基本已经彻底告别手敲键盘。
我知道大家可能觉得办公室讲话打字很奇怪,但是这个是领夹麦,讲悄悄话都能识别出来,我做了两年多 ASR 接入,对于麦克风还是有点研究的,识别效果差基本上是因为声源太远或者有噪音。
最爽的是配合 Vibe Coding 。以前遇到问题,用键盘打字描述很容易卡壳,甚至打着打着就丢失了上下文的逻辑。但现在直接用嘴输出,语音能把脑子里的想法非常顺滑地串联起来,遇到什么问题就直接“说”掉,思路完全不会被打断。
不知道大家的“最大支出”是订阅了各种 API 、买了算力显卡,大家可以交流借鉴一下
1 sillydaddy 6 天前 之前看 v 友的分享,买了 DJI Mic Mini ( 150 块钱左右),初测效果不错,后面不知道为啥不行了,就退货了。距离稍远些就识别不出来,或者环境稍嘈杂,而相同距离相同环境下,MacBook 自身的拾音效果还能保持不错。 |
2 LucasMartine 6 天前 花了 1.4w 买了这个域名 https://sendflare.com 不过我这个不算 AI 时代,但是算我整个出海的过程中, 花费最贵的一笔 |
3 VitaminC1989 6 天前 花 200 大洋买了域名 https://vibe-coding.to/ |
4 NeonMike 6 天前 打字输出的过程,包含思考的过程 直接语音输出,会有问题的 |
5 lifei6671 6 天前 每月 20 刀订阅了 plus 。 |
6 cairnechen 6 天前 我用 yyf 淘宝店的镇店之宝 SM-008 未尝不能与你一战 |
7 wu67 6 天前 100 刀包了 copilot 一年 |
8 iorilu 6 天前 我买了个绿联台式麦克风, 感觉不错 usb 的插上就用 |
9 redoccheng 6 天前 请问在办公室,有同事发表讲话,会影响识别怎么办?有这种支持音色锁定的 mic 吗? |
10 cvbnt 6 天前 openrouter 充了 10 刀 |
11 PerFectTime 6 天前 之前风控不严的时候买了 cc 20x |
12 qazwsxkevin 6 天前 真巧,我刚想找一个带 PTT 按钮,又能无线蓝牙连接的麦克风,真找不到。。。 |
13 andforce 6 天前 via iPhone 陆陆续续,买了大约 1000 刀 Cursor 会员,疯狂撸私活 |
14 tigerZhang 6 天前 中英文混合输入时,语音识别的准确度如何? |
15 samzong 6 天前 应该就是自费 token 打工人来 |
16 hoky 6 天前 楼主那个充电盒有必要吗?我买了这个 1 拖 1 ,没有要充电盒。359 元。 |
17 vowers 6 天前 每月 100$的订阅 |
18 Gilfoyle26 6 天前 最大的支出就是 chatget 了,每个月 20 美金 |
19 qwwuyu 6 天前 google pro 99$ |
20 f165af34d4830eeb 6 天前 飞到美国开了个 checking 账户和信用卡 |
21 importmeta 6 天前 买 AI 股票。 |
22 dobelee 6 天前 via iPhone mbp 3w 。三年各种订阅数万。 | /tr>
23 hellodigua 6 天前 这个拼多多二手的一百多,但是是 dji mic mini ,不知道是否一样 |
24 iorilu 6 天前 @hellodigua 不一样的, 这个一拖二的 |
25 gigishy 6 天前 via iPhone 最大的支出还在等待中…… 想买 512g ram 的 M5 max 以上 Mac ,暂时没有卖的…… |
26 xshell 5 天前 token |
27 yokon 5 天前 glm coding plan |
28 CoderGeek 5 天前 自己 nuc 的电费 - - |
29 312ybj OP @redoccheng 领夹麦的拾音范围本来就小,挂在领口,别人声音再大也收不进去,所以基本没影响。另外,‘音色锁定’应该是‘说话人识别’。这个功能是在 ASR 之后进行的,属于后置算法计算。现在成熟的方案,都是靠后置提取声音特征来区分具体是谁在说话的,我现在用的是微信自带的全局语音输入,没有这个功能 |
30 312ybj OP @qazwsxkevin 我这边有一个科大讯飞的鼠标,它有 ASR 功能,也有 PPT 功能,上下翻页,甚至还有激光灯功能。但是不好的一点就是你讲话,你不可能把鼠标放在嘴巴讲话,怪怪的,我就不怎么用了 |
31 312ybj OP @tigerZhang 我用的就是微信自带的全局语音输入,微信的识别怎么样,它就怎么样 |
33 312ybj OP @gigishy 我之前买过一台 32G 的 M2 max,不过后来卖了,单个小模型的推理速度的话,其实还行,跟 4090 差的不是那么多,但是生图生视频就差很多, 我这边还有一台 amd 395 128G 的小主机,但是带宽不够,推理速度还是慢 |
34 frank1256 5 天前 给 nas 升级了 2 手电源 500,加一块酷狼 4t ,800. 之前给龙虾玩 gemini api ,超了赠金,花费 50hk 。 模型白嫖的一年学生 Google pro ,openai 闲鱼上的 team2 天挂了退款了,现在薅的 plus 月卡。目前花费 0 元。 |
35 CherryGods PRO 给公司所有人提供无限量的 codex |
36 coconutwater 5 天前 @cvbnt #10 同充 10 刀,目前还剩 9.6 刀 。另外闲鱼 geminipro 学生认证花费 20+元 [已封] ,闲鱼 9.9 元 openai team 账号一个月 |
37 kelvinaltajiin 5 天前 via Android @312ybj 有没有 Windows 下除了微信的语音输入方案,很多外部软件公司不让装。。。 |
38 goodboy95 5 天前 via Android 1900 ,一张 2080ti |
39 312ybj OP @kelvinaltajiin 我试了智谱的语音输入法,半天没找到使用入口;搜狗的输入法,广告太多;后来发现微信自带全局语音输入,就一直用这个, 更多-设置-快捷键-控制范围(调整为全局即可),然后就可以 ctrl+win 进行语音输入了 |