如果天猫精灵不时实的窃听,那它如何知道你在叫“天猫精灵”? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
memecoin
V2EX    问与答

如果天猫精灵不时实的窃听,那它如何知道你在叫“天猫精灵”?

  •  
  •   memecoin 2020-10-01 19:25:00 +08:00 11682 次点击
    这是一个创建于 1885 天前的主题,其中的信息可能已经有所发展或是发生改变。
    孩子要求买天猫精灵,于是可以确定家里多了一个窃听器,每次我要说话都会下意识的把它的电源拔了(还是不放心,我都怀疑它会不会有备用电池),老婆说我多虑了。
    唉,很简单,“如果天猫精灵不时实的窃听,那它如何知道你在叫“天猫精灵”?”。

    也许,它现在对我毫无所图,又或许我值不得它对我有所图。
    但是我知道,它有能力做到对我有所图,当我知道只要它想要做坏事它就能做得到时,这让我感到十分不安。
    53 条回复    2020-10-02 19:17:53 +08:00
    wangxiaoaer
        1
    wangxiaoaer  
       2020-10-01 19:32:38 +08:00 via iPhone   2
    善用搜索,这都快成了日经问题。

    简单说 唤醒指令是本地持续实时监听,你说的是对的,但一般不用上传。唤醒后就不一定了。
    Girls
        2
    Girls  
       2020-10-01 19:33:15 +08:00
    也可以是 Siri 哈哈
    yujincheng08
        3
    yujincheng08  
       2020-10-01 19:35:45 +08:00
    手机上的 app 也可以实时监听(利用陀螺仪),建议没事手机就关机
    villivateur
        4
    villivateur  
       2020-10-01 19:36:13 +08:00 via Android   4
    你不如担心一下自己的手机,它了解你的信息可比一个天猫精灵多多了
    ThinkMan
        5
    ThinkMan  
       2020-10-01 19:54:23 +08:00 via iPhone   13
    AI 语音行业人士,天猫精灵用了我们的一些技术,过来聊两句。

    语音技术框架是:
    1 、mic 录音(本地,持续运行)
    2 、语音信号处理:语音降噪、Beaforming 等(本地,持续运行)
    3 、判断是否为唤醒信号(本地,持续运行)。若为唤醒醒号,执行第 4 步。若不是,继续循环 1,2,3 步。
    4 、开始上传音频,云端语音识别。且开始 VAD 检测,判断时候说话结束

    故:
    1 、在唤醒之前,是不会有任何语言数据上传的。
    2 、唤醒之后的语音数据,基本都有上传(主要用作云端 ASR )。但是这部分数据有没有被保存留作它用,就看厂家的良心了。
    Travers
        6
    Travers  
       2020-10-01 20:19:01 +08:00 via Android
    按照 @ThinkMan 的流程,其中最大的问题就是误触发。而 Apple 都因为聘用外包人员对误触发 Siri 语音进行分析而广遭诟病,对国内厂商实在无法给予更多信任。
    felixcode
        7
    felixcode  
       2020-10-01 20:21:03 +08:00 via Android
    iphone 的 siri 怎么办
    shequ2046
        8
    shequ2046  
       2020-10-01 20:33:26 +08:00
    @felixcode 可以关闭的。
    Phant0m
        9
    Phant0m  
       2020-10-01 20:37:37 +08:00 via iPhone   3
    iPhone 的 Siri 可以关闭,改用按键触发。
    重要的事情说三遍:不要信任国产软件,不要信任国产软件,不要信任国产软件。
    memecoin
        10
    memecoin  
    OP
       2020-10-01 20:39:40 +08:00
    @ThinkMan #5
    首先,“唤醒信号”并不只是叫一声“天猫精灵”吧。
    而且唤醒的方式也不一定是客户端自身,功能上可以做到从服务端发动唤醒指令。

    当然,从节能的角度上说,我也相信没有厂商会一直上传和保留所有人的语音数据。
    我担心的只是:当它们想要监听特定人群的时候,他们是完完全全有能力可以做得到的。
    jerryrib
        11
    jerryrib  
       2020-10-01 20:48:18 +08:00 via Android
    有没有上传不知道 参考李开复之前说过的一句话

    新工场董事长兼 CEO 李开复在 HICOOL 全球创业者峰会上表示,曾在早期帮助旷视科技公司找了包括美图和蚂蚁金服等合作伙伴,让他们拿到了大量的人脸数据,并在随后的摸索过程中找到了几个有价值的商业化方向。
    Illusionary
        12
    Illusionary  
       2020-10-01 20:48:54 +08:00
    我这个天猫精灵偶尔会半夜自己说话,吓人,直接断电了
    lihua
        13
    lihua  
       2020-10-01 20:53:12 +08:00 via Android
    之前有新闻说播放催眠曲的时候,播放了鬼片的音乐。。。。
    crclz
        14
    crclz  
       2020-10-01 21:00:05 +08:00
    你说的每一句话它都会进入它的内存,但是不一定储存、上传。
    66450146
        15
    66450146  
       2020-10-01 21:08:00 +08:00
    纯技术上来说,手机就有足够的硬件能力来监听你了,而且还知道监听的时候你在哪里
    ioriwong
        16
    ioriwong  
       2020-10-01 21:11:51 +08:00 via iPhone
    @ThinkMan 就怕除了“天猫精灵”,还有别的触发词,特别是政治词语
    TypeError
        17
    TypeError  
       2020-10-01 21:18:59 +08:00 via Android
    隐私无小事,现在是实名制时代,你不能确认它联网上传后数据经过了几手(比如隐私协议中有什么数据归 xx 关 9 公司所有,对合作伙伴开放)

    一旦被精准定位了,那就要小心诈骗盗刷贷款了
    hoyixi
        18
    hoyixi  
       2020-10-01 21:19:58 +08:00
    买个这么个玩意放家里,我是不能理解
    tetora
        19
    tetora  
       2020-10-01 21:20:58 +08:00 via Android
    @ioriwong 过于小众我觉得不会投入资金搞这个
    memecoin
        20
    memecoin  
    OP
       2020-10-01 21:22:37 +08:00
    @hoyixi #18
    没办法,小孩耍赖要买。
    可能真如李彦宏说的“隐私换便利吧”。
    Takuron
        21
    Takuron  
       2020-10-01 21:24:59 +08:00
    说到底还是个信任问题,技术人员也不用喊冤了
    我是不会买的
    hzfyjgw
        22
    hzfyjgw  
       2020-10-01 21:32:26 +08:00
    adguard home 能否拦截特定域名
    FFLY
        23
    FFLY  
       2020-10-01 22:00:17 +08:00   3
    未来的世界语音交互是大势所趋,天天被害妄想何必呢?又不是搞谍战,我是不觉得商业产品持续监控上传有任何的价值。凡事都有成本,对每一个用户持续监控,除非哪天实现本地化识别分析。只要是云端识别的,你那些无聊的家长里短毫无价值,从商业角度说,毫无性价比,资本家又不是傻子。算力和带宽都是要钱的!
    ericwood067
        24
    ericwood067  
       2020-10-01 22:24:53 +08:00
    曾经公司给每个员工都发了一个自己公司的智能音箱,用了两天突然感觉有点不太对,就耗光了电再也没开过机了。
    当然,大概率不会有问题,但是公司发的还是有点害怕。我觉得我之所以跟楼主一样有这种想法,可能跟中国人受到阴谋论的教育太多了有关系
    ashong
        25
    ashong  
       2020-10-01 22:28:58 +08:00
    肯定守听啊, 不然怎么知道你叫它
    natashahollyz
        26
    natashahollyz  
       2020-10-02 00:58:40 +08:00 via iPhone
    害怕就不用
    这东西有什么用吗?
    futandrew
        27
    futandrew  
       2020-10-02 01:22:42 +08:00 via iPhone
    @Phant0m 就信任外国软件和公司咯?
    NilChan
        28
    NilChan  
       2020-10-02 01:52:07 +08:00 via Android   1
    @futandrew 这也能扛?不能一起不信任吗?
    philipjf
        29
    philipjf  
       2020-10-02 03:52:52 +08:00 via iPhone
    @FFLY 唤醒信号就是本地识别的,敏感词也可以是唤醒信号
    fstab
        30
    fstab  
       2020-10-02 04:05:32 +08:00 via Android
    @ioriwong 怕什么,它敢拿出来定罪么。
    如果商业公司承认,那以后就别卖产品了。
    如果商业公司不承认,法院拿什么当证据定罪?
    当然非要定个寻恤滋事罪,这个不需要什么证据。
    LxExExl
        31
    LxExExl  
       2020-10-02 06:19:41 +08:00   1
    @Travers #6 我不是 ThinkMan 家 /Apple 的,不过也在做相关的。

    为了解决 ASR 的准确度,人工打标是必须的。不过外包人员会签保密协议,给外包听的 audio clip 也是只有语音,没有其他用于识别身份的信息。ML 的 labeling 总是需要打标,只能寄希望于厂家过程合规,PM/程序员重视隐私数据处理了。
    junyee
        32
    junyee  
       2020-10-02 07:08:59 +08:00 via iPhone   1
    阿里最大的价值就是数据,精灵可以名正言顺地收集你的语音数据,你真的期望它会安份守己?

    臭鱼后台监听对话精准投放广告已经很恶心了!
    junyee
        33
    junyee  
       2020-10-02 07:12:16 +08:00 via iPhone
    @futandrew
    我的看法是国内 App 一概不能信任,野鸡 app 是真 小人,大厂则是伪君子,国外即使好点但也要存疑。
    zitengdu
        34
    zitengdu  
       2020-10-02 07:40:06 +08:00
    五楼说的没毛病。
    我想再补充下,云端语音引擎的工作需要对已有的标注数据训练声学模型,这种数据通常 1 到 10 万小时不等。云端的音频保存应该很多都是用作提升识别引擎性能,因为单买经授权的语音标注数据很贵,至于各厂商有没有这么做,请看看隐私协议,就拿我手头的小爱音箱 app 举例,隐私协议明确写了用作语音唤醒识别模型的优化。
    redtea
        35
    redtea  
       2020-10-02 07:47:23 +08:00 via iPhone
    用人不疑,疑人不用。
    XsterreX
        36
    XsterreX  
       2020-10-02 08:15:44 +08:00 via iPad
    Google Amazon Apple 以及国内一票上传肯定是上传的
    但是,上传后内容是否对自己造成后果影响

    我还是选择海外三家,我一个国人他们拿我数据我也不慌啊
    国内上传了,鬼知道会发生什么,万一来个秋后算账吃不消
    ifxo
        37
    ifxo  
       2020-10-02 08:34:20 +08:00   1
    你说的每句话都实时转文字上传服务器,傻冒才上传音频
    ftu
        38
    ftu  
       2020-10-02 08:37:48 +08:00   5
    在这个论坛:Made in China 是原罪,懂王表示喜闻乐见。
    sugarsalt
        39
    sugarsalt  
       2020-10-02 09:25:27 +08:00
    @ftu #38 大帽子扣起来~
    0v0kun
        40
    0v0kun  
       2020-10-02 09:29:57 +08:00
    商业公司的东西都不值得信任
    noparking188
        41
    noparking188  
       2020-10-02 10:33:09 +08:00
    @ftu 不过大家自己基本也都是 made in china,希望不要想不开
    cmdOptionKana
        42
    cmdOptionKana  
       2020-10-02 11:31:47 +08:00 via Android
    @weitch 你的第一个问题是 “如果天猫精灵不时实的窃听,那它如何知道你在叫“天猫精灵”?”

    上面已经有专业人士回答,唤醒完全可以本地做,不需要上传。

    你的第二个问题是 “当我知道只要它想要做坏事它就能做得到时,这让我感到十分不安”

    这个想法很正常,有一部分人选择 iPhone 不选择安卓也有这个因素。

    但从理智上看,也没必要过分担忧,
    FFLY
        43
    FFLY  
       2020-10-02 12:00:45 +08:00
    @philipjf 是不是对智能音箱本身的性能有什么误解?你觉得他可以本地化多少关键词?
    @ifxo 你就是傻冒呀! V2 现在综合水平越来越低,完全不懂技术的喷子到处都是。
    ccvip
        44
    ccvip  
       2020-10-02 12:08:50 +08:00
    我实在没想到我有什么东西值得被偷听。

    信得过就买,信不过就别买,这有啥好纠结的,就是个哄孩子的玩具而已。
    so898
        45
    so898  
       2020-10-02 12:10:09 +08:00
    楼主家庭的问题,楼主并做不了主,家庭地位堪忧啊
    memecoin
        46
    memecoin  
    OP
       2020-10-02 13:16:20 +08:00
    @so898 #45
    骚年,这都能让你看出我的苦衷,可以啊,你可以当侦探了!
    thetbw
        47
    thetbw  
       2020-10-02 16:01:56 +08:00 via Android
    @ioriwong 这个就恐怖了,精准喝茶
    HankAviator
        48
    HankAviator  
       2020-10-02 16:11:45 +08:00
    不响应语音的就不会窃听了吗?所有带麦克风的理论上都可以一直“窃听”
    各种电器,关机就是真的关机了吗?说不定就是不给显示屏加电,不响应开机外的指令而已?
    拔了电源,说不定有内置电池呢?有电池的,拔了电池只是触发假关机事件呢?
    看得见的有电器,看不见的会不会搬来之前就装了窃听设备?
    就算不用任何电器,隔壁邻居会不会总是趴着墙听你说话?
    (狗头)
    ScepterZ
        49
    ScepterZ  
       2020-10-02 16:18:04 +08:00
    唤醒是离线的,唤醒之后要做精确的 asr 才需要上传音频
    一直上传吃不消的
    mightofcode
        50
    mightofcode  
       2020-10-02 16:26:15 +08:00
    中国互联网企业没有隐私可言
    zhouweiluan
        51
    zhouweiluan  
       2020-10-02 18:13:11 +08:00
    楼主这样生活得多累。。。。
    guansixu
        52
    guansixu  
       2020-10-02 18:43:33 +08:00
    歪个楼,“时实” 应该是 “实时”
    franc3567
        53
    franc3567  
       2020-10-02 19:17:53 +08:00
    国产软件。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2594 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 03:06 PVG 11:06 LAX 19:06 JFK 22:06
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86