
1 ufo22940268 2013-06-25 18:05:48 +08:00 http://www.crummy.com/software/BeautifulSoup/bs4/doc/ 我刚刚用这个做了一个爬虫系统,感觉良好 |
2 bravejoe 2013-06-25 18:22:51 +08:00 可以看下这个python的开源爬虫框架 http://scrapy.org/ |
3 xieren58 2013-06-25 20:19:17 +08:00 用node.js啦,异步,处理html可以用jquery。~~~~~~ |
5 gullon 2013-06-25 20:38:30 +08:00 @ufo22940268 Beautiful是用来解析网页的。。。怎么可以说用bs4做了个爬虫系统呢 |
6 ufo22940268 2013-06-25 20:41:11 +08:00 @gullon 我理解错了 |
9 acpp 2013-06-25 21:27:28 +08:00 @ufo22940268 能说下你说的那个效率怎么样吗 |
10 seraphimhj 2013-06-25 21:34:39 +08:00 nodeJS,以前用node.io写过一个爬房价的工具 |
11 ufo22940268 2013-06-25 22:44:02 +08:00 via iPhone @acpp 我只是觉得用起来顺手,开发快,还有我可能理解错了爬虫的意义了 |
12 duhastmich 2013-06-26 12:33:44 +08:00 |
13 duhastmich 2013-06-26 12:35:37 +08:00 @Ricepig 爬虫不异步或者多线程那效率也太低了吧。。 |
14 gullon 2013-06-26 13:56:12 +08:00 |