关于抓煎蛋网的妹子图 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
maxmin
V2EX    问与答

关于抓煎蛋网的妹子图

  •  
  •   maxmin 2017-12-19 17:21:48 +08:00 9556 次点击
    这是一个创建于 2859 天前的主题,其中的信息可能已经有所发展或是发生改变。

    问下各位大大,现在煎蛋网貌似都进行加密处理了。

    抓下来的一个图片 ID,一个 blank.gif 的下载 url,还有一个 hash 值。

    这三个值如何解码出来正常显示图片呢?

    抓到的个人认为的要素如下: 3648355 https://img.jandan.net/img/blank.gif" 01aexN/JQkzwK5MKgiyoaue8DQ9zMRZr4rz1KeCOQVq1EekJSnMbfNfGlKbm2CVqXaqpImm8PAuZ29rChMe2nUbuwx0Pv2UCiDll8p9rtOZwTd2O6IpXbw

    3648352 https://img.jandan.net/img/blank.gif" a4f5BIbDxuQq88bWJ+CVqW/cfY55/DidJsXn4+37ojvaAHzLf123VMLuIQuCM5ozRhAWmegBHNrnIjiem9Q0IzQAKHEz/RMkbCjaqZkdhqyxGHifpp0Kpg

    3648284 https://img.jandan.net/img/blank.gif" 44cecM9LLAGYeTYiqI9VDlkemzZBt+vsPtLkDrWtvrl8Oudu15MStxxbMH9Zf9kRce4Jwd8oeeoWp1wMMh1LDrJlifMf6rDbvYsbSGKA5JxXVUpUIo09dw

    3648265 https://img.jandan.net/img/blank.gif" 1ce8Fy73YNsQZRmpVYoAILPEUA3C/xKbMwxyB2uFGmGL/hITirtXNk+t12XZbiYeZdOj477fTB6CjcMcSuzfNaDUsDvquQJ2kYYl/hptSsoTMbklaZwkHg

    3648255 https://img.jandan.net/img/blank.gif" f9c3olrMbfJo4mQ1g9SVblXOg9HCSEXNKvbdVeXZu7ZnxCbqZgSqcfzQ6Ro1zoVk6m2MTIIZ9oJ2s0nhU4rspURiRrLOZuB4koOjhOOBz81lR5u3zZD8AA

    3648249 https://img.jandan.net/img/blank.gif" 978eHutjCethv14sXsm0c8+sLVWhFkDMOdmEs4MlLFZvyQyO0eU/jkqVRK7QU7C6qy5YZwptyEKAA9SOXQMLhz/SgT30/MaMoz3wiBeRYOoRFcM6ejLwgw

    28 条回复    2017-12-21 04:18:15 +08:00
    SourceMan
        1
    SourceMan  
       2017-12-19 17:22:40 +08:00
    煎蛋又要被爬挂了吗?
    jko123
        2
    jko123  
       2017-12-19 17:23:07 +08:00 via Android
    估计要被煎蛋粉喷
    mohoumk2
        3
    mohoumk2  
       2017-12-19 17:24:25 +08:00 via Android
    已拉黑楼主
    wekw
        4
    wekw  
       2017-12-19 17:28:21 +08:00
    @chen2016 我们叫“蛋友”
    maxmin
        5
    maxmin  
    OP
       2017-12-19 17:40:11 +08:00
    @mohoumk2 就抓一下而已,怎么就委屈的拉黑了呢。
    maxmin     6
    maxmin  
    OP
       2017-12-19 17:41:12 +08:00
    @SourceMan 抓某一个页面的几个数据,不会这么容易挂的,只是测试而已。

    现在抓下来的数据都是加密的,不知道怎么解密
    onsale
        7
    onsale  
       2017-12-19 17:47:50 +08:00 via Android
    换个 bat 的网站爬一爬
    airycanon
        8
    airycanon  
       2017-12-19 17:49:48 +08:00
    @maxmin 既然是测试,不需要解密吧?
    lingo
        9
    lingo  
       2017-12-19 18:00:33 +08:00
    心疼煎蛋。。。
    lalalakakaka
        10
    lalalakakaka  
       2017-12-19 18:07:52 +08:00
    煎蛋人家都发文求你们了,承认自己小破站,没钱买流量,也没有足够的技术能力和人力跟你们玩猫捉老鼠似的反爬虫。。。

    你知道你的这种行为给别人带来多少麻烦么
    013231
        11
    013231  
       2017-12-19 19:07:08 +08:00   1
    @lalalakakaka
    User-agent: *

    Disallow: /wp-admin/
    Disallow: /wp-content/
    Disallow: /wp-includes/
    Disallow: /trackback/
    Disallow: /xmlrpc.php
    Disallow: /category/
    Disallow: /author/
    Disallow: /feed/
    Disallow: /search/
    Disallow: /*?*

    Crawl-delay: 5
    Request-rate: 30/1m

    Sitemap: https://jandan.net/sitemap-index.xml

    User-agent: ia_archiver
    Disallow:

    User-agent: Mediapartners-Google
    Disallow:

    User-agent: Baiduspider
    Disallow:

    User-agent: YisouSpider
    Disallow: /

    User-agent: grapeshot
    Disallow: /

    User-agent: dotbot
    Disallow: /

    user-agent: AhrefsBot
    disallow: /

    User-agent: Exabot
    Disallow: /

    哪有声明不让爬妹子图?
    3dwelcome
        12
    3dwelcome  
       2017-12-19 20:43:27 +08:00 via iPhone
    @013231 管理员贴过爬虫流量图、表示流量太大、小网站耗不起。
    xmi
        13
    xmi  
       2017-12-19 22:44:39 +08:00
    还有人在爬..
    mengli
        14
    mengli  
       2017-12-19 22:51:30 +08:00
    以煎蛋无聊图为内容源的网站可不少,去爬他们把。
    onsale
        15
    onsale  
       2017-12-19 22:58:23 +08:00
    @013231 #11
    gyteng
        16
    gyteng  
       2017-12-19 23:41:33 +08:00
    为何大家都喜欢爬煎蛋,有没有其他类似煎蛋妹子图的网站可以爬呢?
    cxd44
        17
    cxd44  
       2017-12-20 00:03:01 +08:00 via Android
    @3dwelcome 耗不起就不要玩,关机啦
    jininij
        18
    jininij  
       2017-12-20 00:06:53 +08:00 via iPhone
    没用过煎蛋,记忆里煎蛋的图用的不是新浪的图床么。游客请求的页面,本体都该走的 cache。不是很能理解,一个人的爬虫能有多大的并发,能把网站弄垮。
    zhaojjxvi
        19
    zhaojjxvi  
       2017-12-20 00:07:46 +08:00 via iPhone
    豆瓣有个请不要害羞的小组,去爬那个吧,一般夜间有福利
    greatbody
        20
    greatbody  
       2017-12-20 00:10:22 +08:00
    @zhaojjxvi GitHub 上面有通用的美女图爬虫脚本,nodejs 写的通俗易懂好变更。
    xmcp
        21
    xmcp  
       2017-12-20 00:23:12 +08:00

    解密算法是 https://paste.ubuntu.com/26215944/
    看起来比较复杂,不过如果真想爬的话直接把代码丢到 NodeJS 里跑就行了。
    redmoonly
        22
    redmoonly  
       2017-12-20 08:03:34 +08:00 via Android
    @cxd44 为什么总有人这么没素质还理直气壮,人家办网站花你一分钱了么,爬虫爬的流量不是钱?总是搞得大家都没得玩了就开心了?
    maxmin
        23
    maxmin  
    OP
       2017-12-20 08:51:18 +08:00   2
    感谢各位的告知,决定不动煎蛋网~~
    也就是写一个玩玩,想后台加载加载进来,免去每次都要手动点击。

    学习了过程就是很重要的,至于结果或许真的不重要。
    jy02534655
        24
    jy02534655  
       2017-12-20 10:11:00 +08:00
    别玩煎蛋啦,蛋友都看不了图了,煎蛋真的又小又破的...
    coderluan
        25
    coderluan  
       2017-12-20 11:13:26 +08:00
    @mohoumk2 楼主只是不了解情况,了解之后已经做出了正确的行为#23,用信息差 block 别人并不好。

    @cxd44 希望你是说反话,“路上遇见流氓怎么办?耗不起就不要玩,自杀啦”。

    @maxmin 不想加载可以试试写个油猴脚本,下滑自动加载之类的。
    cxd44
        26
    cxd44  
       2017-12-20 19:16:47 +08:00 via Android
    @redmoonly 真的,没钱不要开网站,这么烧钱的流量,何不省点钱。
    cxd44
        27
    cxd44  
       2017-12-20 19:19:20 +08:00 via Android
    @coderluan 我也是为了站长好啊,玩不起就不要玩了,免得伤心啊。天天求爹求娘不要爬站了。
    NoahNye
        28
    NoahNye  
       2017-12-21 04:18:15 +08:00
    折腾了一个小时,终于受不了用关键字 img.jandan.net/img/blank.gif 百度,看到就 V2 一条结果,欣喜点进来......还是照 V 友说的去 qingbuyaohaixiu.com (请不要害羞)吧
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     940 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 22:42 PVG 06:42 LAX 15:42 JFK 18:42
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86