这个公司的 IP 一直恶意爬行我们的网站,如何找到对方的联系方式并警告? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
aaa0009
V2EX    问与答

这个公司的 IP 一直恶意爬行我们的网站,如何找到对方的联系方式并警告?

  •  
  •   aaa0009 2016-10-08 11:30:38 +08:00 5825 次点击
    这是一个创建于 3343 天前的主题,其中的信息可能已经有所发展或是发生改变。
    第 1 条附言    2016-10-08 20:39:50 +08:00
    感谢 @rhen , 提供最有效的信息: https://aws.amazon.com/forms/aws-china-report-abuse/

    反恶意访问我们也是有的,只要访问页面超过几百次,就拉黑三年。本来拉黑是 PHP 拉黑的,效率有点低,目前已升级成系统级拉黑了。不过投诉还是要的,本能让坏人这么嚣张。
    第 2 条附言    2016-10-09 16:21:25 +08:00
    联系了光华新网,对方回应:
    我公司对用户信息有义务进行保密,不方便将客户联系信息透漏给第三方公司,还请谅解。我公司为固定 IP ,如存在恶意攻击行为,还请贵司采取技术手段进行屏蔽。
    24 条回复    2016-10-15 11:10:17 +08:00
    bugmenein
        1
    bugmenein  
       2016-10-08 11:40:01 +08:00
    并卵,国内这种事情没法解决,只能你们自己 ban 了他们 IP 。
    greatghoul
        2
    greatghoul  
       2016-10-08 11:46:20 +08:00
    aaa0009
        3
    aaa0009  
    OP
       2016-10-08 12:14:54 +08:00
    @bugmenein IP 又程序 Ban ,不过对方 IP 实在多。
    aaa0009
        4
    aaa0009  
    OP
       2016-10-08 12:15:11 +08:00
    @aaa0009 IP 已经 Ban 了 ,不过对方 IP 实在多。
    Marfal
        5
    Marfal  
       2016-10-08 12:15:52 +08:00
    swen
        6
    swen  
       2016-10-08 13:08:59 +08:00
    给他脏数据
    aaa0009
        7
    aaa0009  
    OP
       2016-10-08 13:24:27 +08:00
    @swen 现在主要问题是对方 IP 太多,影响网站速度了。
    c0878
        8
    c0878  
       2016-10-08 13:36:37 +08:00
    反爬虫措施网上搜下很多的吧 警告对方甚至寄律师函基本都是无效 还是从技术手段上来解决
    yghack
        9
    yghack  
       2016-10-08 13:40:34 +08:00
    @aaa0009 爬都是有特征的,根据特征写个脚本自动封吧。
    上周就遇到这种情况,封了几千了 IP 。
    lbp0200
        10
    lbp0200  
       2016-10-08 13:44:18 +08:00
    也可能是光环新网的对外 ip ,就像长城宽带,全北京的长宽用户都是一个 IP 。
    qwer1234asdf
        11
    qwer1234asdf  
       2016-10-08 15:04:56 +08:00 via iPhone
    吓得赶紧看了下线上 server 的 ip
    lecher
        12
    lecher  
       2016-10-08 15:45:29 +08:00 via Android
    给服务器托管商发律师函,以他们托管的服务器存储有你们公司独家版权的内容要求对方下线这些内容。

    然后这个皮球就会被托管商乖乖踢给使用者,并且会把使用者的预留信息回复给你。
    beagle11
        13
    beagle11  
       2016-10-08 16:12:00 +08:00
    设定一个规则,加验证码
    Tony2ee
        14
    Tony2ee  
       2016-10-08 16:14:28 +08:00
    @lbp0200 全北京的长宽用户都是一个 IP ?天呐
    一个用户对百度做了不当行为全北京都被验证码?
    ytmsdy
        15
    ytmsdy  
       2016-10-08 16:38:01 +08:00
    我是这么干的:
    策略 1 :把访问 ip 丢到数据库里面。 1 小时清一次,如果一个小时里面的访问数量超过多少。就直接乱给脏数据(不报错,也不屏蔽)!
    策略 2 :很多爬虫都伪装成搜索引擎的 bot 来抓取,抽查一部分的搜索引擎的请求,查询访问的 ip 是否在搜索引擎的爬虫 ip 池里面,如果不在,还是给它脏数据!
    sunsol
        16
    sunsol  
       2016-10-08 16:44:25 +08:00
    如果是长宽反而不会有爬虫吧,好像长宽自己就有代理缓冲减少访问流量.
    lbp0200
        17
    lbp0200  
       2016-10-08 16:55:48 +08:00
    @Tony2ee 百度当然不可能用 ip 来区分用户
    rhen
        18
    rhen  
       2016-10-08 18:32:06 +08:00 via Android
    光环新网。。。这个不是 AWS 中国吗
    rhen
        19
    rhen  
       2016-10-08 18:32:48 +08:00 via Android   1
    应该是用亚马逊 AWS 中国的服务器搞的,去那边投诉试试
    rhen
        20
    rhen  
       2016-10-08 18:34:59 +08:00 via Android
    如果真的是 AWS 中国的话 去这里投诉滥用 https://aws.amazon.com/forms/aws-china-report-abuse/
    ik
        21
    ik  
       2016-10-08 18:51:26 +08:00 via iPhone
    吓屎我了,我还以为我司爬虫段被封了
    aaa0009
        22
    aaa0009  
    OP
       2016-10-08 20:44:09 +08:00
    @rhen 晕咯, AMS 说不是他家的 IP 。找 Guanghuan Xinwang 投诉?
    alect
        23
    alect  
       2016-10-08 21:51:11 +08:00
    光环新网的 ip ,很多 IDC 其实就是租用或者托管在他们的机房
    爬虫这个事儿,你封 IP 不就好了,反正没正常访客。
    kozora
        24
    kozora  
       2016-10-15 11:10:17 +08:00
    @rhen aws 的 ip 都是有反向记录的 我查了楼主这几个 都没有
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3159 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 11:35 PVG 19:35 LAX 03:35 JFK 06:35
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86