开源爬虫代码有法律风险吗?有无懂哥解惑? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Richard14
V2EX    问与答

开源爬虫代码有法律风险吗?有无懂哥解惑?

  •  
  •   Richard14 2021-07-20 11:03:03 +08:00 2719 次点击
    这是一个创建于 1595 天前的主题,其中的信息可能已经有所发展或是发生改变。

    个人想制作一个简单的爬虫项目(在未登录的情况下,以低频率爬取微博),是一个非常简单的代码,是教学向的,为了方便传播,为了方便传播,想要开源在 github 上,并且制作一期代码流程说明发布到 B 站。

    请问这种情况会被微博告吗?如果犯法的话会判多长时间?还是想要谨慎一点,请问有无懂哥介绍一下国内法律爬虫抓人的规矩,谢谢

    11 条回复    2021-07-21 16:22:28 +08:00
    mekingname
        1
    mekingname  
       2021-07-20 11:23:19 +08:00
    我自己做了一个新闻通用网站提取的开源项目,就把主动请求网页的功能取消了,只保留正文提取的功能,用户要用必须自行请求网页再把源代码传进来。这样就没有风险了。
    AoEiuV020
        2
    AoEiuV020  
       2021-07-20 11:26:42 +08:00
    有听说是,爬虫不能针对具体某个目标,
    不过具体还是应该律师才清楚了,
    InDom
        3
    InDom  
       2021-07-20 11:34:48 +08:00
    把被爬取网站的地址搞成配置文件,代码里如果没有被爬的网站地址,还有问题没?
    suotm
        4
    suotm  
       2021-07-20 11:55:50 +08:00
    你做一个 demo 网页就可以了嘛,
    或者用通用的框架搭一个,比如 wordpress 。
    mmdsun
        5
    mmdsun  
       2021-07-20 12:32:47 +08:00 via Android
    不会的。不放心可以放免责声明。

    我爬虫代码都会先搜索,要是 github 有现成就拿下来用了。那么多人上传。。法不责众
    westoy
        6
    westoy  
       2021-07-20 12:51:45 +08:00
    定向爬虫当然有问题了, 而且属于你发布出来危险更大

    免责声明就是骗骗自己的, 你只能赌自己不是被抽中儆猴的那只鸡

    大公司有的是办法, 非商用可以核损啊, 你玩得过对方法务团队么

    现在活着的像火车头那种做了十五六年的都是通用的, 出问题你去告卖用户规则的
    01802
        7
    01802  
       2021-07-20 14:12:28 +08:00 via Android
    腾讯告红包那个,不是有一条,增加了服务器非正常操作频率,也算侵权
    iyaozhen
        8
    iyaozhen  
       2021-07-20 14:25:57 +08:00
    应该是会 因为你太特定了,风险是肯定的
    HankLu
        9
    HankLu  
       2021-07-20 14:53:59 +08:00
    没有任何风险,放一百个心
    zhuxiaoxi
        10
    zhuxiaoxi  
       2021-07-20 21:48:43 +08:00
    https://weibo.com/robots.txt 按 robot.txt 协议爬,不会出问题
    galenzhao
        11
    galenzhao  
       2021-07-21 16:22:28 +08:00
    可以照着 pgp 来啊,
    代码出书, 属于言论自由
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2905 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 13:25 PVG 21:25 LAX 05:25 JFK 08:25
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86