
1 cosmic 2017-04-05 19:57:45 +08:00 这是反爬策略吧 |
3 sleeperqp 2017-04-05 20:01:00 +08:00 你可以用 chromedrive 试试 如果还是不一样 那就说明确实有反爬的问题~ |
可能是页面异步获取了其他内容,所以直接抓取看不到,其中策略比较多 有问题可以加我们的群问,这样效率更高,这个群是一群工程师组建的面向初学者的 python Linux 学习群( qq 群号: 278529278 ) 非商业性质,拒绝广告,只接收真正想学这方面技术的朋友,交流学习,申请请说明来自 v2ex |
5 we3613040 2017-04-05 20:31:56 +08:00 好多异步请求 |
6 201341 OP 我也以为是异步,可是禁用 js 后的页面和我获取的页面还是不一样 |
9 googlebot 2017-04-05 22:04:32 +08:00 via Android Javascript , |
10 fffflyfish 2017-04-05 22:53:36 +08:00 直接抓现成的 json 包,伪装客户端发包 |
11 killerv 2017-04-06 10:09:13 +08:00 你说的原网页是指的网页源代码还是审查元素?审查元素的代码是经过 js 渲染过的,不一样是很正常的,这个要以网页源代码的为标准,如果网页源代码和爬虫爬的不一样,另说,有可能是防爬。 |