
1 hizoubin 2017 年 7 月 25 日 感觉搜索效果不如 biliworld |
2 yuedingwangji 2017 年 7 月 26 日 好像还蛮不错的 |
3 LINAICAI 2017 年 7 月 26 日 牛逼 |
4 asheshorse 2017 年 7 月 26 日 via Android 不算全,不过还不错 |
5 WildCat 2017 年 7 月 26 日 via iPhone 666 不过很想知道爬虫原理 |
6 shenyangno1 2017 年 7 月 26 日 via iPhone 搜索条件中包含:和 /会报 500 错。 |
7 ericbize 2017 年 7 月 26 日 专业的爬虫公司被你爬了 |
8 Fe1Fan 2017 年 7 月 26 日 好像真的很好玩 |
9 a494836960 2017 年 7 月 26 日 爬种子很好用 |
10 default7 2017 年 7 月 26 日 怎么弄的? |
11 Qiss 2017 年 7 月 26 日 速度好快啊,大神用的哪家服务器? |
12 believeitcould 2017 年 7 月 26 日 匹配模式可以选吗 搜出来的信息太多了 想完全匹配 |
13 Dvel 2017 年 7 月 26 日 速度贼快 |
14 1O 2017 年 7 月 26 日 |
15 frankkai 2017 年 7 月 26 日 可以可以,很强 |
16 jimyan 2017 年 7 月 26 日 牛逼 |
17 Hellofxq 2017 年 7 月 26 日 看起来很好玩的样子,我也想学 |
18 huangzitao OP |
19 nazor 2017 年 7 月 26 日 via iPhone 能不能采集有没有那种带密码的资源。 |
20 ericbize 2017 年 7 月 26 日 @huangzitao 凭自己本事浏览的网页,没什么不阳光的,有本事你 block 了 python requests 的 UA 啊。 |
21 beyoung 2017 年 7 月 26 日 各种链接不存在 |
22 mahone3297 2017 年 7 月 26 日 原理是? |
23 guodong110 2017 年 7 月 26 日 via Android http://www.fastsoso.cn 有失效检测 |
24 NAO 2017 年 7 月 26 日 同想完全匹配 |
25 upczww 2017 年 7 月 26 日 via iPhone 原理 site:pan.baidu.com |
26 ikeeper 2017 年 7 月 26 日 厉害了,求指导 |
27 cenyu 2017 年 7 月 26 日 很厉害,赞一个 |
28 gao117348222 2017 年 7 月 26 日 收藏了 |
30 v166ex 2017 年 7 月 26 日 @suliuyes site:pan.baidu.com 应该不是这个吧,我试了下 bd 没有啥显示 |
31 xmh51 2017 年 7 月 26 日 @huangzitao 现在还能爬吗?百度不在主页显示分享文件后? |
33 Adamla 2017 年 7 月 26 日 为啥我搜索“拳皇”就会出现错误页面呢。 |
34 sola97 2017 年 7 月 26 日 我平时用的胖次搜索,带失效检测,也能搜到不可告人的东西 |
35 Zioyi 2017 年 7 月 26 日 楼主后台用什么写的 |
37 iphantom 2017 年 7 月 26 日 这个速度很赞 结果也很棒 |
38 iShawnWang 2017 年 7 月 26 日 via iPhone 可以讲解下远离或者开源么... 希望能学习下代码... |
39 Antidictator 2017 年 7 月 26 日 via Android 借楼问谷歌用 site 语法没什么效果。是不是被屏蔽啦。 再借楼问原理 |
40 Antidictator 2017 年 7 月 26 日 via Android @upczww 经常在 Google 用这个语法,但是效果还不如一些类似楼主做的站呢 |
41 upczww 2017 年 7 月 26 日 @Antidictator 那是别人做了二次整理的,分好类的 |
42 huangzitao OP @xmh51 百度网盘前几天被人差评,现在封了很多,所以你懂得 @Adamla 用的第三方中文分词器,后台看了下,有 bug @Zioyi springboot 跟 lucene @iShawnWang 这个也没什么难度啊,无非是爬文件分享链接。 |
43 66kanfengjing 2017 年 7 月 26 日 搜索*会报 500O(∩_∩)O 哈!以前做 lucene 的时候就忘了考虑通配符的问题 |
44 huangzitao OP @66kanfengjing 什么都不写也 500 O(∩_∩)O 这程序不够健壮啊 |
45 66kanfengjing 2017 年 7 月 26 日 @huangzitao 我用 Lucene ( Version:3.5 )的时候用的 IK(Version:2012FF)分词器,目前还没有遇到分词器的 bug. |
46 Zioyi 2017 年 7 月 26 日 大佬 你是怎么爬下来的?百度云盘有 api ? |
47 huangzitao OP |
48 zyowe 2017 年 7 月 27 日 |
49 NullException 2017 年 7 月 27 日 666 |
50 hienchu 2017 年 7 月 27 日 via iPhone 不错 |
52 WEAlex 2017 年 7 月 27 日 有源码可以分享一下吗?最近刚把 springboot 和 docker 学习了. |
53 gao117348222 2017 年 7 月 27 日 @zyowe 稳 |
54 smartdie 2017 年 7 月 28 日 可以啊,这个引擎的速度非常可观。希望能分享下实现方式或者源码。 |
55 huangzitao OP |
56 Hugh123 2017 年 7 月 28 日 需要 66666666 |
57 Dwyanetalk 2017 年 7 月 28 日 贤者,我对这个名字来源感兴趣 |
58 huangzitao OP @Dwyanetalk 哈哈我朋友想的,感觉爆了 |
59 propc 2017 年 7 月 29 日 via Android 不错不错 |
60 mooncakejs 2017 年 7 月 29 日 @ericbize 偷偷爬不查你也就算了,show 出来就不行了,殊不知有 robots 协议。 |
61 syl371 2017 年 7 月 29 日 我还是觉得 www.biliworld.com 好用一点 |
62 1002149271 2017 年 7 月 30 日 写这个会不会被抓? |
63 wanglaihuai 2017 年 7 月 31 日 via Android 如果加上个按照时间排序就更好了大神。 |
64 wilonti 2017 年 7 月 31 日 但是我不知道用啥关键词搜...尴尬了 |
65 yuanfnadi 2017 年 8 月 3 日 |
66 huangzitao OP @yuanfnadi 好 |
67 jedihy 2017 年 8 月 8 日 via iPhone 爬 115 吧 |
68 omg21 2017 年 8 月 8 日 你是不是也建了一个数据库,把爬到的内容存进去,然后别人在你主页上搜的时候,再数据库里读取? |
69 aifang 2017 年 8 月 8 日 感觉好牛逼的样子,肯定比我牛逼, |
70 huangzitao OP |
71 weilongs 2017 年 8 月 11 日 上面那个搜私房不过瘾,http://wiseso.cc/search?keyword=DCIM |
72 aosp 2017 年 8 月 11 日 我也很好奇,现在只能抓分享动态了吗?那不是得关注很多人 |
73 mon3 2017 年 8 月 15 日 @huangzitao 分享列表已经关闭了,你现在是咋爬的百度云? |
75 weilongs 2017 年 8 月 16 日 @YoungBai http://www.fastsoso.cn/search 这个搜 私房,DCIM,我的照片,照片 过瘾 !! |
76 sunnyzhi 2017 年 8 月 25 日 还不错,谢谢 |
77 huangzitao OP @sunnyzhi 老哥,不用客气 |