
1 OhmyCaptain 2014-02-13 00:15:04 +08:00 selenium? |
2 iloahz 2014-02-13 00:20:27 +08:00 貌似现在能模拟浏览器渲染的就只有1L说这个吧 |
3 txlty 2014-02-13 00:37:44 +08:00 phantomjs http://phantomjs.org/ |
4 est 2014-02-13 01:08:17 +08:00 IE可以。win32com |
5 otakustay 2014-02-13 01:36:02 +08:00 phantomjs和真chrome的差距还是有点的,真要抓就用selenium吧,除了效率低下外没啥缺点 |
6 manhere 2014-02-13 02:10:03 +08:00 如果是win平台的话,有个命令行版网页截图工具,很好用 |
7 zhouzm 2014-02-13 08:19:02 +08:00 cefpython |
8 simapple 2014-02-13 08:45:24 +08:00 python Qt webkit |
9 ksc010 2014-02-13 09:12:45 +08:00 phantomjs + casperjs |
10 PurpleSun 2014-02-13 10:10:32 +08:00 *nix平台:whhtmltopdf + pdfkit |
11 josephshen 2014-02-13 10:33:27 +08:00 http://cutycapt.sourceforge.net/ 然后自己再包装一个python接口就行 |
12 gonjay 2014-02-13 12:59:39 +08:00 用Chrome插件直接用js来抓取,再通过ajax给自己的数据库存起来? |
14 keven 2014-03-26 00:20:15 +08:00 python应该有相关的库或者可以直接利用的东西吧,我也在抓数据,八爪鱼采集器就是内置了一个浏览器,然后通过浏览器来进行采集的。所以ajax这些肯定是支持的。 |