
1 misaka19000 2017 年 5 月 4 日 via Android 这爬虫还把自己给暴露出来。。。神奇 |
2 woshinide300yuan 2017 年 5 月 4 日 这不是明显的该屏蔽的吗 - - |
3 billlee 2017 年 5 月 4 日 耿直的爬虫 |
4 notes 2017 年 5 月 4 日 via Android 目测新手,用的还是自带的 urllib |
5 bytenoob 2017 年 5 月 4 日 via Android 脚本小子 |
6 wspsxing 2017 年 5 月 4 日 UA 都不改一下,差评妥妥的。 |
7 ywgx 2017 年 5 月 4 日 留着过年? |
![]() | 8 LokiSharp 2017 年 5 月 4 日 估计故意的。。。看看有没有人处理 |
9 richardma 2017 年 5 月 5 日 猖狂的爬虫,23333 |
10 tonychow 2017 年 5 月 5 日 显然爬虫, 都不知道隐藏下 UA |
11 araraloren 2017 年 5 月 5 日 ~~ 再明显不过的爬虫了。。 封了 IP 呗 |
12 crackhopper 2017 年 5 月 5 日 666666 |
13 yanzixuan 2017 年 5 月 5 日 连 UA 都不知道改的,估计是新手。另外你们的网站不设置一个 Limiter,限制一下一天的总的访问次数么? 如果对方换 IP,你就限制下 1 分钟 /1 小时之内的访问次数吧。 |
14 tttty 2017 年 5 月 5 日 请问一下,如果遇到爬虫直接封 IP,这样不是会导致共用公网 IP 的用户误伤吗.. 比如校园网、网吧什么的? |
15 hard2reg 2017 年 5 月 5 日 via iPhone 弱弱的问下,requests 的默认 ua 是啥 |
16 jy02201949 2017 年 5 月 5 日 真是耿直啊,而且还在用 urllib,新手随便抄了网上哪个教程弄的爬虫吧 |
17 anexplore 2017 年 5 月 5 日 使用验证码机制啊 |
24 liuxu 2017 年 5 月 5 日 我虽然是个爬虫,但我行事坦荡,从不遮遮掩掩 |
25 fuxkcsdn 2017 年 5 月 5 日 @hard2reg >>> import requests >>> requests.get('http://httpbin.org/user-agent').text u'{\n "user-agent": "python-requests/2.12.3"\n}\n' |
26 hsmocc 2017 年 5 月 5 日 via iPhone 封 IP 显然是下策啊,一段时间内访问次数达到一个上限后出验证码吧 |
27 tianxiacangshen OP @hsmocc 这样的话 每一次访问都要查询(次数)+插入数据库,不是很占用资源吗 |
29 dsg001 2017 年 5 月 5 日 这种 UA 直接返回乱码数据呗 |
30 qinbingchen 2017 年 5 月 5 日 难道这是我? |
31 flyshu 2017 年 5 月 6 日 新手刚看了知乎的入门教程来练手了 |
32 dreamcountry 2017 年 7 月 16 日 我的网站也有大量的这种日志,这些人真是闲的蛋疼 |