因为爬虫教程,一个网站似乎被 DDOS 了 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
favourstreet
V2EX    程序员

因为爬虫教程,一个网站似乎被 DDOS 了

  •  
  •   favourstreet 2020-06-11 20:48:21 +08:00 4691 次点击
    这是一个创建于 1977 天前的主题,其中的信息可能已经有所发展或是发生改变。

    不是我的网站。详情可见: https://mp.weixin.qq.com/s/ibmitCYw7Txu5xQYsECI-w

    爬虫教程以一个特定网站为目标,偏偏这目标是个人制作的,没那么多资源的小网站。实践教程的人一多,效果就成了 DDOS 。

    网站当然是挂了,但是能说人家是恶意攻击吗?我感觉完全无法从法律上维权,好像只能在技术上设置一些限制,让爬虫教程望而却步。可是这样一来,个人维护的小网站越来越难做了,如果不解决这类问题,互联网上的信息会进一步向资源雄厚的经营者集中。

    能有什么办法?买 DDOS 的商业保险?

    18 条回复    2020-06-13 10:11:22 +08:00
    misty8873
        1
    misty8873  
       2020-06-11 21:04:25 +08:00
    嗯 先买个便宜点的试试
    tanghongkai
        2
    tanghongkai  
       2020-06-11 21:11:50 +08:00
    cf 一套大部分没事找事的都走了,拿别人的网站写爬虫教程真是有够**的
    rayhy
        3
    rayhy  
       2020-06-11 21:13:08 +08:00 via Android
    煎蛋就经常被爬,很多爬虫贴拿它做例子。其实这种情况下只能在技术上加限制,一般加到需要用无头浏览器爬就好很多了,毕竟都是入门教程,上来就要配置无头浏览器很劝退。
    also24
        4
    also24  
       2020-06-11 21:21:48 +08:00
    大概翻了一下,爬虫教程的地址是:
    https://www.zhihu.com/people/1425827033

    目前已删除,在快照里还可以看到记录。

    根据这个爬虫教程的代码,加上大部分爬虫小白其实不会改代码的事实。
    我觉得站长应该可以通过设定简单的 nginx 策略来解决问题。
    另:在微博上看到站长的抱怨,感觉应该只是数据库负载太高,Web Server 应该还活着。


    部分代码:
    https://i.loli.net/2020/06/11/uyMcamsXoSUYCjD.png
    also24
        5
    also24  
       2020-06-11 21:25:44 +08:00
    also24
        6
    also24  
       2020-06-11 21:28:34 +08:00
    根据相应的代码,提一个简单的思路。

    在 WordPress 后台修改伪静态规则,将页面地址修改为:
    http://www.cbaigui.com/?biepale=1

    同时在 nginx 内匹配带有 ?page= 的请求,全部 deny


    这样可以在短时间内解决掉大部分只会复制粘贴代码的小白。
    crella
        7
    crella  
       2020-06-11 22:48:22 +08:00 via Android
    借楼,一个 211 大学的招生网站挂了一张 11MB 大小的图片,导致网页打开缓慢。恶意多次下载这张图片会导致服务器反应缓慢吗?那个服务器的描述是 Oracle iPlanet Server 7.0 。
    yujiang
        8
    yujiang  
       2020-06-11 22:56:10 +08:00
    @crella 你得看那个图是挂在图床上还是嵌在网站里,网站有没有 cdn 。。。另外怀疑你的动机
    tigerstudent
        9
    tigerstudent  
       2020-06-11 23:29:36 +08:00 via Android
    即使拿来做教程,影响也不会很大吧,站方禁掉 ip 或其他特征就好了。
    baiduyixia
        10
    baiduyixia  
       2020-06-12 00:11:56 +08:00
    heiheidewo
        11
    heiheidewo  
       2020-06-12 00:27:15 +08:00
    @tanghongkai 别人是备案网站,在国内,套 CF 不是减速么
    abcbuzhiming
        12
    abcbuzhiming  
       2020-06-12 09:13:48 +08:00
    @crella 会,多个下载连接把你的 IO 打满,和 ddos 的原理差不多的
    ccraohng
        13
    ccraohng  
       2020-06-12 09:16:14 +08:00 via Android
    @tigerstudent 不是几个人。。韭菜多顶不住啊
    CodeCodeStudy
        14
    CodeCodeStudy  
       2020-06-12 10:15:24 +08:00
    那么多人学他那个教程?
    sudoy
        15
    sudoy  
       2020-06-12 12:45:51 +08:00
    想做教程,为啥不自己搭个网站做试验呢?拿别人地网站不管个人还是公司都不合适
    qq7790586
        16
    qq7790586  
       2020-06-12 14:13:14 +08:00
    借楼问下各位大雕,哪里有买 ddos 滴。[狗头]
    tanghongkai
        17
    tanghongkai  
       2020-06-12 18:00:58 +08:00
    @heiheidewo 先保证能上再说,v2 也套的 cf 没见谁有意见嘛 www
    crella
        18
    crella  
       2020-06-13 10:11:22 +08:00 via Android
    cbaigui.com 网页已能正常打开,主要收集妖怪的信息,每页 15 个妖怪,共 110 页还多,也存了一些其他文章。

    爬这些有什么用处?想不懂
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2746 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 24ms UTC 14:18 PVG 22:18 LAX 06:18 JFK 09:18
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86