如何用大数据查询接触过的人? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
miaeLKK
V2EX    问与答

如何用大数据查询接触过的人?

  •  
  •   miaeLKK 2020-01-28 22:12:20 +08:00 via Android 6909 次点击
    这是一个创建于 2121 天前的主题,其中的信息可能已经有所发展或是发生改变。

    刚才看新闻上直播,李兰娟院士说:“有个患者说他没有接触过武汉的人,但是我们用大数据一查,发现他接触过 3 个。”(原话大概是这样)

    有人知道怎么回事吗?我想最多就是查这个人乘坐公共交通路线吧,比如火车飞机什么需要身份证的,或者根据他的车牌号查询去过哪里。但是也不好确认接触的人吧?

    突然想到明朝那些事儿里魏忠贤控制下的锦衣卫发现地下室 4 人聚餐抓人那段…

    可能我深度不够,没觉得大数据有什么特别神奇的…我觉得它好像被过度神话了,我觉得就跟我们项目里数据库里的数据形式上差不多

    37 条回复    2020-01-30 18:47:35 +08:00
    d5
        1
    d5  
       2020-01-28 22:17:40 +08:00
    刚正巧也看了这个采访,恕我无知,私以为做不到,或者是根据火车、飞机、城市公共交通等数据进行十分粗略的分析的。

    或者是三大运营商可以精准绘制用户的轨迹,根据一定的算法计算统计?
    d5
        2
    d5  
       2020-01-28 22:20:07 +08:00
    仅在浙江范围,根据
    全部的地铁闸机、公交刷卡机数据 + 全国范围内的火车飞机数据,理论上应该是可以查到同在一个车厢内的密切接触人吧。
    miaeLKK
        3
    miaeLKK  
    OP
       2020-01-28 22:25:28 +08:00 via Android
    声明,此贴并没有泼冷水的意思,只是对科技的求知欲促使我问的。闲着也是闲着,大家探讨,也许能有新的发现
    miaeLKK
        4
    miaeLKK  
    OP
       2020-01-28 22:29:20 +08:00 via Android
    @d5 我突然觉得是不是根据手机定位,根据轨迹找交汇判断的?关键是个人的位置信息是否已知,那就好像牵扯出一些隐私的问题…不过权衡利弊,现在应该是战胜疫情更重要些?
    binux
        5
    binux  
       2020-01-28 22:29:52 +08:00 via Android   6
    查不到就有人说穿睡衣都能挂出来,火车实名了都查不到同乘者。
    查到了又有人说锦衣卫。

    合着都被您们包圆了!
    d5
        6
    d5  
       2020-01-28 22:32:28 +08:00
    根据运营商基站数据计算出来的误差太大了,咸鱼人很多的,几乎没什么价值。

    个人感觉还是根据需要买票的交通工具计算出密切接触者,更进一步可以是浙江城市大脑 /天眼提供的数据。


    @miaeLKK
    Buges
        7
    Buges  
       2020-01-28 22:36:40 +08:00 via Android
    大数据配合无处不在附带人脸识别的摄像头,基本上你任何时间在什么地方见了谁干了什么都能无微不至的显示出来。
    imn1
        8
    imn1  
       2020-01-28 22:38:43 +08:00
    数据足够的话,可以
    银行卡的线下(非网络)消费
    手机的信号定位
    ……

    其实,你对这句话理解最大的误区你知道是什么吗?你理解为:从这个患者去找武汉人
    但实际上这句话是:收治的、接受观察的武汉人中有 3 个和这个患者有关,这才是正确的理解
    sugarsalt
        9
    sugarsalt  
       2020-01-28 23:04:41 +08:00   3
    @binux #5 穿睡衣的能挂出来,是不该查的乱查;火车实名了查不到,是该发挥作用的时候抓瞎。
    allanzhuo
        10
    allanzhuo  
       2020-01-28 23:07:30 +08:00 via Android
    有同事在 ga,输入身份证可以查到你所有的行为,人脸识别各种实名买票
    binux
        11
    binux  
       2020-01-29 00:02:56 +08:00 via Android
    #9 那现在查了,又是什么说辞了?
    miaeLKK
        12
    miaeLKK  
    OP
       2020-01-29 01:30:19 +08:00 via Android
    @allanzhuo 所有行为怎么理解?
    miaeLKK
        13
    miaeLKK  
    OP
       2020-01-29 01:35:06 +08:00 via Android
    @allanzhuo 吃喝拉撒都能监控?
    zhy0216
        14
    zhy0216  
       2020-01-29 02:17:29 +08:00 via Android
    应该是查有摄像头的地方 基本上公共场所都有摄像头 而在家里的话就是和家人接触。 录像应该都有存 然后拿这些录像找到这个人 分析出现的地方都和什么人接触。 也可能摄像头在录的时候就已经分析了这些数据
    s1th
        15
    s1th  
       2020-01-29 04:10:33 +08:00 via iPhone
    摄像头录像的时候就可以分析出本人姓名性别住址关系圈活动轨迹。
    allanzhuo
        16
    allanzhuo  
       2020-01-29 07:03:34 +08:00 via Android
    @miaeLKK 有市政摄像头就能查到
    txlty
        17
    txlty  
       2020-01-29 07:51:10 +08:00   2
    大数据很神奇,但要以重度牺牲隐私为代价。大数据的能发挥的作用,愿意和牺牲的隐私成正比。

    如果允许无限牺牲隐私的话,那么可以这么做:
    1.尽可能多的 拿到确诊病例的 手机定位轨迹。筛选出和定位轨迹有过重合的人群,主要为同一时间出现在同一商场、饭店、车站、交通工具的人群。这部分人为“疑似有接触人群”。
    2.获取百度、搜狗、等搜索引擎的关键词数据,如果频繁搜索过类似“发烧 xxx 度是不是新型肺炎”等关键词的,这部人筛选出来,为“疑似有症状人群”。

    ①疑似接触人群。如果已在疑似病例中,可以优先安排床位及隔离。
    ①疑似接触人群、②疑似有症状人群,二者重合,即可高度怀疑为“未就医”的潜在感染病例。然后动用基层公安力量逐一上门排查隔离。
    Hoshizora
        18
    Hoshizora  
       2020-01-29 08:40:42 +08:00 via Android
    可以看看 疑犯追踪 这剧,里面的机器就是利用的大数据。如果数据量足够多足够详细(隐私侵犯的也更多)那能起的作用也越大。
    DT27
        19
    DT27  
       2020-01-29 08:51:57 +08:00   1
    媒体逼问领导,领导逼问院士,院士逼问程序员。。。
    程序员只好。。。
    gamexg
        20
    gamexg  
       2020-01-29 09:50:44 +08:00 via Android
    只能查询到部分

    例如火车车票信息找到同车厢的,
    支付信息找到在同一超市的,
    人脸识别找到在同一摄像头下的,
    手机基站轨迹相同找到部分同乘一辆通交车的。
    clives
        21
    clives  
       2020-01-29 11:28:03 +08:00
    @DT27 武汉的人员基本都有登记,按时间查交叉点
    IsA26hN4DcQDS7Z9
        22
    IsA26hN4DcQDS7Z9  
       2020-01-29 11:51:08 +08:00
    GA 系统早就升级了。。你们不知道吗
    taobibi
        23
    taobibi  
       2020-01-29 12:06:03 +08:00
    最大可能是常用 APP 汇总的各种位置数据,比如共享单车,外面,物流等等 APP 经常需要获取位置信息,这些位置信息被集中保存和汇总。通过位置信息,时间信息的演算。已经微信,支付宝等各种关系,推断是否有接触更准确。人脸识别其实有些局限性,1 是现在口罩的情况,口罩很大程度上干扰了人脸识别,只有眼睛的打点数据,只能是与 XXX 相似度; 2 是人脸识别效果好的,都是新安装的,高度较低的摄像机,如果你在路上看到高度很低的,非车辆收费摄像机,90%以上概率是人脸识别,因为摄像机安装过高,照的一半图像是人的头顶,就算分辨率 1080+,打点不够也并不容易识别
    taobibi
        24
    taobibi  
       2020-01-29 12:08:12 +08:00
    @Raynard 升级什么了?各个 app 的位置信息汇总?
    taobibi
        25
    taobibi  
       2020-01-29 12:11:38 +08:00
    @gamexg 公交车目前有更准确的方案,很多城市都用上了,凡是提供公交 wifi 的,都自带车辆定位,两个数据汇总在一起,车上的人都能找到,因为就算没有连接公共 wifi,很多软件也会探测和记录 wifi 的名称和 mac 信息,然后发送给后台,判断比基站准很多
    taobibi
        26
    taobibi  
       2020-01-29 12:13:49 +08:00
    @gamexg 公交车大数据定位方案目前唯一的局限就是如果这个人的手机默认关了 wifi,完全是自己浏览,没有任何 wifi 交互,就无法记录了。
    gamexg
        27
    gamexg  
       2020-01-29 12:17:10 +08:00
    @taobibi #26 我记得新版本 android 开始随机 mac 地址了,ios 更早吧。
    winglight2016
        28
    winglight2016  
       2020-01-29 14:39:18 +08:00
    大数据这个概念的外延太大了,超过一百条记录就能叫大数据了,结果什么锅都让大数据背了。

    这个新闻据我猜测,应该是摄像头拍到了患者和武汉人同框出现,其他逻辑链较长的推理都不靠谱,至于摄像头怎么识别到这个患者以及怎么判断“是不是武汉人”,都是有现成解决方案的。这里面公民面部特征和监控视频是属于大数据,算法属于机器学习,涉及到个人隐私等等,现在都被“大数据”代表了。
    taobibi
        29
    taobibi  
       2020-01-29 14:48:34 +08:00   1
    @winglight2016 摄像头拍摄的话,我觉得只能基于大规模带口罩之前,去年底我们公司物流到进出全新上线的海康人脸识别出入系统,在目前口罩情况下全 over 了,不得不临时回复到原来刷卡和保安复检的方式进出。海康和大华应该算是安防行业的佼佼者了,口罩情况下识别不出只有几百人的员工人脸
    wangxiaoaer
        30
    wangxiaoaer  
       2020-01-29 14:52:11 +08:00 via Android
    @miaeLKK 没这么夸张,但你各种买买买的订单是裸奔的。
    wangxiaoaer
        31
    wangxiaoaer  
       2020-01-29 14:53:54 +08:00 via Android   1
    @taobibi 戴口罩能识别的话,我会认为这个识别系统是瞎捷豹运行的。
    augustheart
        32
    augustheart  
       2020-01-29 16:37:23 +08:00
    上面都想太多,有三个武汉人和他有相同路程,只要行程交叉就命中,就是这么简单的判断。
    比如在车厢里,你坐头他坐尾,你怎么知道车尾那个是武汉人?所以患者不知道他接触过武汉人,武汉人也不知道接触过他,但是病毒和交通部门都知道。
    opengps
        33
    opengps  
       2020-01-29 18:43:34 +08:00 via Android
    所有分析都得基于数据,有些数据某些部门可以合法拿到,从而分析
    miyuki
        34
    miyuki  
       2020-01-29 18:59:35 +08:00
    就是类似 NSA 收集的 Medatada 啊
    yankebupt
        35
    yankebupt  
       2020-01-29 20:57:55 +08:00
    @miaeLKK 楼主实在不放心的话,把蓝牙和 Wifi 探针禁了吧,也别买 5G 手机了,那个有点对点探针+组网,也别买新的苹果手机了,那个有毫米波频段防盗连环 ping......这些都是测接触轻而易举的手段
    其实一般不插卡不用国内 SDK 的 APP/ROM 就可以大部分检测不到了,100%防测不可能,这没办法的事
    miaeLKK
        36
    miaeLKK  
    OP
       2020-01-29 23:45:28 +08:00 via Android
    @yankebupt 没说不放心啥的呀,我不是说了只想知道他们怎么获得的数据吗?再说,不放心?估计隐私早就被泄露一百八十回了。而且如果真能通过这些隐私换取这种强制手段的有效性,我觉得也算做了些好事…
    yankebupt
        37
    yankebupt  
       2020-01-30 18:47:35 +08:00
    参考外宾们怎么喷 facebook 的隐私策略的就行
    国内研究怎么获得的完全没必要,不给权限不启动早就已经明确告诉你了,就是明抢。在意怎么获得的话不要用是最好的

    个人的话研究怎么获得的已经完全没有意义了,如果十几年前可能还有点意义,那时还不怎么时兴客户端 /浏览器指纹,代码动态加载,两三天一次的热更新,运营商直接授权给某些特殊 APP 的通过 IP 直查宽带固话号 /手机号 /身份证号的 API,各类跟踪精确到你 30 秒前干了什么的 tracker 和用户完全不知情的 peer 间通讯……SNS 上吼一声 XX 公司在卖个人信息获利并贴上证据还有人回应两声

    隐私协议不好好读的话用着全境外 APP 照样被跟踪到人的情况也非常正常
    这就是 2020 的现状
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5861 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 40ms UTC 02:36 PVG 10:36 LAX 18:36 JFK 21:36
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86