这个网站一个账号查询的次数是不是有限制啊? 限制多少次?
是不是需要买 vip 账号爬?
![]() | 1 d5 2019-01-20 21:56:36 +08:00 via iPhone 做爬虫出生的公司,你要爬,阻力太多了 |
![]() | 2 zwl2012 2019-01-20 21:57:40 +08:00 via iPhone 接口加密了 密钥有效期 1 分钟 |
![]() | 3 FaustinaD 2019-01-20 21:58:06 +08:00 via iPhone 想多了。老老实实买接口吧,卖数据接口的网站会让你爬? |
![]() | 4 tomxin7 2019-01-20 22:00:28 +08:00 去年爬过,但是没有批量,cookie 过期好像时间还挺久的,可能我爬的比较少吧 |
![]() | 5 519718366 2019-01-20 22:57:12 +08:00 via iPhone 我这是找他们商务合作的 |
![]() | 6 guog 2019-01-20 23:03:52 +08:00 via Android 他们的数据也是从郭嘉企业信息网爬的吧,不如直接从源头入手 |
![]() | 7 locoz 2019-01-20 23:15:24 +08:00 via Android 只需要简单的信息就行可以直接爬工商局 |
![]() | 9 lhx2008 2019-01-20 23:30:23 +08:00 反爬虫很厉害的,无所不用其极,验证码也很难,爬几百个没问题,多了代理池都爬不下来。 天眼查最开始应该是自己爬的,后面为了数据合法找了个背景做靠山。 |
![]() | 10 OctopusGO 2019-01-21 00:15:42 +08:00 via Android 是需要买 vip,我公司现在是用 Java 爬的 |
![]() | 11 scriptB0y 2019-01-21 00:50:04 +08:00 ... 你去爬一个爬虫网站 |
![]() | 12 xiaotuzi 2019-01-21 01:33:27 +08:00 via iPhone 小心给你一个律师函 |
![]() | 13 izoabr 2019-01-21 01:38:11 +08:00 要不考虑一下行政渠道的爬虫? |
14 jssyxzy 2019-01-21 06:13:01 +08:00 以前爬过,应该可爬,可能需要上 phatomjs |
15 myhot21 2019-01-21 08:44:41 +08:00 via Android 自从要登录注册后,就基本不能爬了,给钱买数据吧。 |
16 supervipcard 2019-01-21 08:50:40 +08:00 如果已经有一个大的公司名列表,逐个搜索爬不难,把代理、cookie 池、验证码识别都弄上。 |
17 fenghuang 2019-01-21 09:02:57 +08:00 极验证就不好弄 |
20 Ewig OP @supervipcard 主要怕限制账号次数啊 |
![]() | 22 passerbytiny 2019-01-21 09:27:38 +08:00 总感觉爬数据这事,大公司做是废物利用地商业行为,个人爬就是抢数据地流氓行为:我脑袋到底哪里出问题了。 |
23 Ewig OP @supervipcard 关键很多说买 vip 爬不知道为啥 |
24 supervipcard 2019-01-21 10:08:18 +08:00 @Ewig 可能是因为单次搜索的页数限制吧 |
![]() | 26 guanhui07 2019-01-21 11:19:49 +08:00 他爬别人,你爬他,别人爬你 |
27 kevinle 2019-01-21 11:21:53 +08:00 via Android 脱裤更省事 |
![]() | 28 blueskea 2019-01-21 12:10:11 +08:00 via Android 爬过企查查,字体被替换过了,验证码搞不定,半自动爬的。 |
29 dezhou9 2019-01-21 13:50:16 +08:00 via Android 1.8 亿条你爬他干嘛 |
31 Ewig OP @supervipcard 比如我每次搜百度 腾讯 这种公司能搜多少次,普通的账号 |
![]() | 32 wisej 2019-01-21 16:36:17 +08:00 via Android |
![]() | 33 uuair 2019-01-21 17:03:30 +08:00 有这功夫,你不如应聘进去,内网直接往外倒腾。 |
![]() | 34 loser 2019-01-21 17:18:03 +08:00 牛逼,支持爬他!!! |
36 love9918 2019-01-21 19:10:33 +08:00 有想法就干 |
37 hgjhgjgjhgjg 2019-01-21 19:28:12 +08:00 https://www.lagou.com/jobs/1570819.html 反爬虫工程师 职位描述 参与公司网站数据反爬虫策略的制定和优化。 负责反爬虫功能模块的代码实现及测试工作。 监控网站异常访问并及时调整相关策略。 |
![]() | 38 andylsr 2019-01-21 19:49:03 +08:00 via Android 天眼查数据随便抓。。。 |
39 zhangsen1992 2019-01-21 20:14:42 +08:00 vip ip 白名单 随便调用接口 |
41 kzfile 2019-01-21 20:59:20 +08:00 爬一会整个网页开始部分字乱序,后面乱序的会越来越多 |