
1 wangxiaoaer 2020-10-01 19:32:38 +08:00 via iPhone 善用搜索,这都快成了日经问题。 简单说 唤醒指令是本地持续实时监听,你说的是对的,但一般不用上传。唤醒后就不一定了。 |
2 Girls 2020-10-01 19:33:15 +08:00 也可以是 Siri 哈哈 |
3 yujincheng08 2020-10-01 19:35:45 +08:00 手机上的 app 也可以实时监听(利用陀螺仪),建议没事手机就关机 |
4 villivateur 2020-10-01 19:36:13 +08:00 via Android 你不如担心一下自己的手机,它了解你的信息可比一个天猫精灵多多了 |
5 ThinkMan 2020-10-01 19:54:23 +08:00 via iPhone AI 语音行业人士,天猫精灵用了我们的一些技术,过来聊两句。 语音技术框架是: 1 、mic 录音(本地,持续运行) 2 、语音信号处理:语音降噪、Beaforming 等(本地,持续运行) 3 、判断是否为唤醒信号(本地,持续运行)。若为唤醒醒号,执行第 4 步。若不是,继续循环 1,2,3 步。 4 、开始上传音频,云端语音识别。且开始 VAD 检测,判断时候说话结束 故: 1 、在唤醒之前,是不会有任何语言数据上传的。 2 、唤醒之后的语音数据,基本都有上传(主要用作云端 ASR )。但是这部分数据有没有被保存留作它用,就看厂家的良心了。 |
6 Travers 2020-10-01 20:19:01 +08:00 via Android 按照 @ThinkMan 的流程,其中最大的问题就是误触发。而 Apple 都因为聘用外包人员对误触发 Siri 语音进行分析而广遭诟病,对国内厂商实在无法给予更多信任。 |
7 felixcode 2020-10-01 20:21:03 +08:00 via Android iphone 的 siri 怎么办 |
9 Phant0m 2020-10-01 20:37:37 +08:00 via iPhone iPhone 的 Siri 可以关闭,改用按键触发。 重要的事情说三遍:不要信任国产软件,不要信任国产软件,不要信任国产软件。 |
10 memecoin OP @ThinkMan #5 首先,“唤醒信号”并不只是叫一声“天猫精灵”吧。 而且唤醒的方式也不一定是客户端自身,功能上可以做到从服务端发动唤醒指令。 当然,从节能的角度上说,我也相信没有厂商会一直上传和保留所有人的语音数据。 我担心的只是:当它们想要监听特定人群的时候,他们是完完全全有能力可以做得到的。 |
11 jerryrib 2020-10-01 20:48:18 +08:00 via Android 有没有上传不知道 参考李开复之前说过的一句话 新工场董事长兼 CEO 李开复在 HICOOL 全球创业者峰会上表示,曾在早期帮助旷视科技公司找了包括美图和蚂蚁金服等合作伙伴,让他们拿到了大量的人脸数据,并在随后的摸索过程中找到了几个有价值的商业化方向。 |
12 Illusionary 2020-10-01 20:48:54 +08:00 我这个天猫精灵偶尔会半夜自己说话,吓人,直接断电了 |
13 lihua 2020-10-01 20:53:12 +08:00 via Android 之前有新闻说播放催眠曲的时候,播放了鬼片的音乐。。。。 |
14 crclz 2020-10-01 21:00:05 +08:00 你说的每一句话它都会进入它的内存,但是不一定储存、上传。 |
15 66450146 2020-10-01 21:08:00 +08:00 纯技术上来说,手机就有足够的硬件能力来监听你了,而且还知道监听的时候你在哪里 |
17 TypeError 2020-10-01 21:18:59 +08:00 via Android 隐私无小事,现在是实名制时代,你不能确认它联网上传后数据经过了几手(比如隐私协议中有什么数据归 xx 关 9 公司所有,对合作伙伴开放) 一旦被精准定位了,那就要小心诈骗盗刷贷款了 |
18 hoyixi 2020-10-01 21:19:58 +08:00 买个这么个玩意放家里,我是不能理解 |
21 Takuron 2020-10-01 21:24:59 +08:00 说到底还是个信任问题,技术人员也不用喊冤了 我是不会买的 |
22 hzfyjgw 2020-10-01 21:32:26 +08:00 adguard home 能否拦截特定域名 |
23 FFLY 2020-10-01 22:00:17 +08:00 未来的世界语音交互是大势所趋,天天被害妄想何必呢?又不是搞谍战,我是不觉得商业产品持续监控上传有任何的价值。凡事都有成本,对每一个用户持续监控,除非哪天实现本地化识别分析。只要是云端识别的,你那些无聊的家长里短毫无价值,从商业角度说,毫无性价比,资本家又不是傻子。算力和带宽都是要钱的! |
24 ericwood067 2020-10-01 22:24:53 +08:00 曾经公司给每个员工都发了一个自己公司的智能音箱,用了两天突然感觉有点不太对,就耗光了电再也没开过机了。 当然,大概率不会有问题,但是公司发的还是有点害怕。我觉得我之所以跟楼主一样有这种想法,可能跟中国人受到阴谋论的教育太多了有关系 |
25 ashong 2020-10-01 22:28:58 +08:00 肯定守听啊, 不然怎么知道你叫它 |
26 natashahollyz 2020-10-02 00:58:40 +08:00 via iPhone 害怕就不用 这东西有什么用吗? |
30 fstab 2020-10-02 04:05:32 +08:00 via Android |
31 LxExExl 2020-10-02 06:19:41 +08:00 @Travers #6 我不是 ThinkMan 家 /Apple 的,不过也在做相关的。 为了解决 ASR 的准确度,人工打标是必须的。不过外包人员会签保密协议,给外包听的 audio clip 也是只有语音,没有其他用于识别身份的信息。ML 的 labeling 总是需要打标,只能寄希望于厂家过程合规,PM/程序员重视隐私数据处理了。 |
32 junyee 2020-10-02 07:08:59 +08:00 via iPhone 阿里最大的价值就是数据,精灵可以名正言顺地收集你的语音数据,你真的期望它会安份守己? 臭鱼后台监听对话精准投放广告已经很恶心了! |
33 junyee 2020-10-02 07:12:16 +08:00 via iPhone @futandrew 我的看法是国内 App 一概不能信任,野鸡 app 是真 小人,大厂则是伪君子,国外即使好点但也要存疑。 |
34 zitengdu 2020-10-02 07:40:06 +08:00 五楼说的没毛病。 我想再补充下,云端语音引擎的工作需要对已有的标注数据训练声学模型,这种数据通常 1 到 10 万小时不等。云端的音频保存应该很多都是用作提升识别引擎性能,因为单买经授权的语音标注数据很贵,至于各厂商有没有这么做,请看看隐私协议,就拿我手头的小爱音箱 app 举例,隐私协议明确写了用作语音唤醒识别模型的优化。 |
35 redtea 2020-10-02 07:47:23 +08:00 via iPhone 用人不疑,疑人不用。 |
36 XsterreX 2020-10-02 08:15:44 +08:00 via iPad Google Amazon Apple 以及国内一票上传肯定是上传的 但是,上传后内容是否对自己造成后果影响 我还是选择海外三家,我一个国人他们拿我数据我也不慌啊 国内上传了,鬼知道会发生什么,万一来个秋后算账吃不消 |
37 ifxo 2020-10-02 08:34:20 +08:00 你说的每句话都实时转文字上传服务器,傻冒才上传音频 |
38 ftu 2020-10-02 08:37:48 +08:00 在这个论坛:Made in China 是原罪,懂王表示喜闻乐见。 |
40 0v0kun 2020-10-02 09:29:57 +08:00 商业公司的东西都不值得信任 |
41 noparking188 2020-10-02 10:33:09 +08:00 @ftu 不过大家自己基本也都是 made in china,希望不要想不开 |
42 cmdOptionKana 2020-10-02 11:31:47 +08:00 via Android @weitch 你的第一个问题是 “如果天猫精灵不时实的窃听,那它如何知道你在叫“天猫精灵”?” 上面已经有专业人士回答,唤醒完全可以本地做,不需要上传。 你的第二个问题是 “当我知道只要它想要做坏事它就能做得到时,这让我感到十分不安” 这个想法很正常,有一部分人选择 iPhone 不选择安卓也有这个因素。 但从理智上看,也没必要过分担忧, |
43 FFLY 2020-10-02 12:00:45 +08:00 |
44 ccvip 2020-10-02 12:08:50 +08:00 我实在没想到我有什么东西值得被偷听。 信得过就买,信不过就别买,这有啥好纠结的,就是个哄孩子的玩具而已。 |
45 so898 2020-10-02 12:10:09 +08:00 楼主家庭的问题,楼主并做不了主,家庭地位堪忧啊 |
48 HankAviator 2020-10-02 16:11:45 +08:00 不响应语音的就不会窃听了吗?所有带麦克风的理论上都可以一直“窃听” 各种电器,关机就是真的关机了吗?说不定就是不给显示屏加电,不响应开机外的指令而已? 拔了电源,说不定有内置电池呢?有电池的,拔了电池只是触发假关机事件呢? 看得见的有电器,看不见的会不会搬来之前就装了窃听设备? 就算不用任何电器,隔壁邻居会不会总是趴着墙听你说话? (狗头) |
49 ScepterZ 2020-10-02 16:18:04 +08:00 唤醒是离线的,唤醒之后要做精确的 asr 才需要上传音频 一直上传吃不消的 |
50 mightofcode 2020-10-02 16:26:15 +08:00 中国互联网企业没有隐私可言 |
51 zhouweiluan 2020-10-02 18:13:11 +08:00 楼主这样生活得多累。。。。 |
52 guansixu 2020-10-02 18:43:33 +08:00 歪个楼,“时实” 应该是 “实时” |
53 franc3567 2020-10-02 19:17:53 +08:00 国产软件。 |