360的微信自媒体是怎么抓到数据的,微信似乎没有相关接口啊? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
guiquba
V2EX    问与答

360的微信自媒体是怎么抓到数据的,微信似乎没有相关接口啊?

  •  
  •   guiquba 2013-07-19 16:38:13 +08:00 8222 次点击
    这是一个创建于 4468 天前的主题,其中的信息可能已经有所发展或是发生改变。
    http://wemedia.so.com/index.html 聚合的内容很不错,不知道怎么拿到链接的,有相关接口吗?
    21 条回复    1970-01-01 08:00:00 +08:00
    vontio
        1
    vontio  
       2013-07-19 16:39:41 +08:00
    你怎么知道不是人工编辑的
    guiquba
        2
    guiquba  
    OP
       2013-07-19 16:45:58 +08:00
    vontio
        3
    vontio  
       2013-07-19 16:49:23 +08:00
    @guiquba 微信编辑模式-》图文编辑,你弄一个试试
    guiquba
        4
    guiquba  
    OP
       2013-07-19 16:51:36 +08:00
    @vontio 恩,微信正文页里能得到链接。不过,他们不会真是人工提取的链接吧?当然,他们也确实可以这么做。。。
    alexzhan
        5
    alexzhan  
       2013-07-19 16:55:19 +08:00
    notedit
        6
    notedit  
       2013-07-19 16:56:18 +08:00
    我想到一个方法 没试过 你注册一个公共账号 然后把所有的自媒体都关注 当对方给你发消息的时候 你可以通过api解析对方给你发的内容 得到内容的url
    laskuma
        7
    laskuma  
       2013-07-19 17:09:00 +08:00
    @alexzhan -_- 360是抓的你这的吗?
    alexzhan
        8
    alexzhan  
       2013-07-19 17:14:31 +08:00
    @laskuma 从这里抓不到任何微信原始文章的链接。昨天我还发现网页上还有链接的,不过发现之后马上堵死了。
    guiquba
        9
    guiquba  
    OP
       2013-07-19 17:19:47 +08:00
    @notedit 不是很明白。。公共帐号能关注其他帐号?
    ryon
        10
    ryon  
       2013-07-19 17:23:44 +08:00
    模拟登录抓取的,微信官方天天换策略避开被抓。
    vontio
        11
    vontio  
       2013-07-19 17:29:44 +08:00
    @ryon 模拟登陆 + @notedit 说的方法,关注所有需要抓取的公共主页,模拟登陆,解析。。
    laskuma
        12
    laskuma  
       2013-07-19 17:36:16 +08:00
    @alexzhan 有联系方式吗。?我有个方法 不知道跟你用的是不是同一个
    guiquba
        13
    guiquba  
    OP
       2013-07-19 17:37:04 +08:00
    @vontio 模拟登陆不会。。。有开源相关代码不?
    alexzhan
        14
    alexzhan  
       2013-07-19 17:42:25 +08:00
    @laskuma 你在微博上跟我说过一次了。。。
    laskuma
        15
    laskuma  
       2013-07-19 17:46:42 +08:00
    @alexzhan 我以为你没看见啊
    alexzhan
        16
    alexzhan  
       2013-07-19 18:03:12 +08:00
    @laskuma 你可以按你的想法去实现一下。
    vontio
        17
    vontio  
       2013-07-19 18:11:06 +08:00
    @guiquba 一般的模拟登陆一搜一大堆,微信是二维码的
    vontio
        18
    vontio  
       2013-07-19 18:42:57 +08:00
    @guiquba 另外一个思路,浏览器先登陆进去,模拟浏览器点击,js抓取到内容后,post到自己的服务器
    tt0411
        19
    tt0411  
       2013-07-19 18:54:08 +08:00
    为什么要模拟登陆那么麻烦,开个android虚拟机,设个代理http服务器,想要什么有什么了
    imria
        20
    imria  
       2014-03-06 11:05:10 +08:00
    @tt0411 没那么简单,有移动端环境,还要对数据解密
    wendaoliu
        21
    wendaoliu  
       2014-04-17 16:48:10 +08:00
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5476 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 98ms UTC 08:33 PVG 16:33 LAX 01:33 JFK 04:33
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86