
今天本来抱着试一试的心态刷一下面试,莫名其妙被 PASS
面试官:你介绍一下你自己
我:巴拉巴拉
面试官说:你用 python 还是 java 开发爬虫
我说: python
面试官:什么场景或有验证码
我:这个看业务方喜好,他们要喜欢什么时候都可以用
面试官:你识别过验证码吗?
我:我识别过字符和数字不复杂的
面试官:什么原理
我:用取字摸
面试官:实际实现过吗?
我:实现过,用 tesseract-ocr
面试官:你识别过其它的吗
我:我之前识别过 163 的,但是准确率太低
面试官:你认为什么叫高
我: 60%算及格,我只到 30%
面试官:你怎么知道哪里有验证码呢
我:没有特别好的办法,只能在表单附近找有没图片
面试官:你怎么得到验证码,是用浏览器方式吗?(我实在没明白什么是浏览器方式)
我:我直接解析 xpath ,得到路径下载二进制文件下来,然后本地识别就行了
面试官:我知道了(态度特别差)
感谢大家热情的回复,但是我补充一句
1 shakoon 2016-05-13 14:49:50 +08:00 我觉得是,你说的东西面试官不懂,他没法继续问你下去 |
2 zfyp 2016-05-13 14:51:38 +08:00 可能是你爬过他们的数据被发现了 |
3 Pastsong 2016-05-13 14:51:38 +08:00 via Android 这家公司专门做爬虫的吗 |
4 pierre1994 2016-05-13 14:57:58 +08:00 是什么部门的什么岗位啊?看不出来问题 |
5 SlipStupig OP |
6 bk201 2016-05-13 15:00:44 +08:00 你这回答没法深入问你啊。比如”什么时候用?这个看业务方喜好,他们要喜欢什么时候都可以用“就像问你喜欢吃什么,回答随便。 |
7 SlipStupig OP @bk201 没个范围啊,你说社交类网站哪里需要验证码,我可以告诉你,只问验证码什么需要,这个太广了,所有的网络协议都可以使用验证码啊!我该怎么回答呢? |
8 yuyang1110 2016-05-13 15:11:31 +08:00 话说, pass 不是说通过的意思么。。。=_= |
9 Tyrion 2016-05-13 15:13:11 +08:00 @SlipStupig 这时候要是举几个例子会好很多吧,比如举几个自己比较熟悉的使用验证码的场景,也顺带可以让面试官问下去。面试总要聊下去吧(逃,我去年的面试也特别失败 |
10 Kirscheis 2016-05-13 15:16:13 +08:00 via Android 面试官不是这方面或者没见过这方面的技术吧。。如果真按你这描述来看,面试官太菜 |
11 SlipStupig OP @Kirscheis 而且问的最匪夷所思的是怎么得到验证码这个问题,他还问我是浏览器方式还是别的办法,我心里就在想啊,浏览器是靠气功把图片读出来的吗?我说直接下载二进制文件,他还反复问了我两遍。 @yuyang1110 玩过 QQ 斗地主么?= = |
12 hitmanx 2016-05-13 15:29:44 +08:00 面试官被你打击了 |
13 fyooo 2016-05-13 15:53:11 +08:00 可能面试官本来就对你有一些成见了,这个看缘分的,楼主加油,再面试一下其他投缘的公司或者这家公司的其他岗位咯:) |
14 ayaseangle 2016-05-13 15:57:49 +08:00 via Android 人工打码平台 |
15 SlipStupig OP @fyooo 我很赞同,我感觉他怨气很重,应聘时个小公司,本来就是看 BOSS 产品的时候,有一个 HR 联系我,我觉得 HR 很 NICE 然后跟他们 CTO 聊聊,找工作我从来没担心过 |
16 lizhenda 2016-05-13 16:22:39 +08:00 小公司奇葩多,哈哈~ |
17 newghost 2016-05-13 16:38:04 +08:00 估计叫你过去了解一下技术上怎么实现 其实他也不懂 |
18 lebowsk1s 2016-05-13 16:43:47 +08:00 浏览器方式。。。。。。这位明显自己不懂,可能连 HTTP 请求响应是怎么回事都不懂,懂的就不会问出这样的问题 |
19 jarlyyn 2016-05-13 16:50:10 +08:00 via Android 的确可以通过浏览器方式抓取,这样能执行 js |
20 SlipStupig OP @lebowsk1s 第一次听说,可能是我不会气功吧! |
21 cxbig 2016-05-13 16:54:55 +08:00 LZ 想太多,面试失败别总想着是自己的问题 |
22 leassy 2016-05-13 16:55:15 +08:00 面试的觉得楼主对他是个威胁,所以决定不录用,我们公司就是这样的 |
23 SlipStupig OP @jarlyyn 请问浏览器抓取是通过气功还是 HTTP 协议?我发包和浏览器发包有什么区别? |
24 SlipStupig OP |
25 assassinpig 2016-05-13 16:57:56 +08:00 明显没有问出他想问的东西 又不愿意多透露具体应用场景 |
26 SlipStupig OP @assassinpig 没有场景我更不好回答了,图像处理这块我确实不是强项,但是他问的东西我觉得好业余 |
27 iphantom 2016-05-13 17:04:25 +08:00 根据我的经验 他问的就是他目前遇到的问题 把问题当面试题 他只是想通过面试 来解决他的问题 而不是招聘 |
28 SlipStupig OP @iphantom 如果是这样应该问更细致的东西啊,处理验证码又不是网上没教程,你要看不会我随便说两句,你也解决不了啊 |
29 ice00shark 2016-05-13 17:18:17 +08:00 我觉得他是想问你是怎么确定这个登录需要验证码的。 他们可能是需要智能的分析出何时需要解验证码。 |
30 jarlyyn 2016-05-13 17:23:36 +08:00 via Android |
31 SlipStupig OP @ice00shark 我说了怎么识别验证码出验证码, form 内看有没图片,其实还有其它办法,他不让我说,就反复问我怎么得到验证码,对我直接下载验证码这种方式我感觉他特别轻蔑 |
32 SlipStupig OP @jarlyyn 你直接用 webkit 或者 CEF 等获得验证码图片的数据,是用 JS 获得的,而不是不是靠协议? |
34 qqjt 2016-05-13 17:28:45 +08:00 ……一股找人解答疑难的气息 |
35 Felldeadbird 2016-05-13 17:28:47 +08:00 面试官不会带入面试者去他的问题,所以这个面试官不是个好得面试官。也就是说他的技术没楼主好。 |
36 SlipStupig OP @jarlyyn phantomjs 不需要网络请求就能得到远程 server 的数据? |
37 jarlyyn 2016-05-13 17:30:33 +08:00 via Android |
38 Ouyangan 2016-05-13 17:31:13 +08:00 面试官比较菜 |
39 cxshun 2016-05-13 17:39:01 +08:00 应该是面试官比较菜,不懂那些东西。 |
40 onion83 2016-05-13 17:47:00 +08:00 > 浏览器是靠气功把图片读出来的吗? 让一个手欠格式化硬盘丢一年数据的,沮丧一下午的人活过来了 :) |
41 chiu 2016-05-13 17:47:43 +08:00 没给面试官装逼的机会? |
42 learnshare 2016-05-13 17:54:54 +08:00 你怎么知道哪里有验证码呢? 这个问题是怎么问出来的 |
43 sumuu 2016-05-13 17:59:29 +08:00 哈哈~~你可能需要某些奇葩公司了. 昨天我一前同事,给我发了一组他们现在公司的招聘聊天的截图. 大致就是"搞不定的技术没有关系,叫 HR 发个高薪招聘,问一下来面试的就有方案了". 现在技术窃取手段真的很多,以前只有再段子上面的,现在已经使用了. |
44 windfarer 2016-05-13 18:09:45 +08:00 via Android 因为那个公司正在处理验证码方面的问题, 233 |
45 hyzjshwo 2016-05-13 18:19:55 +08:00 @sumuu 我还真遇到了。 技术聊了 3 个小时 然后 hr 过来说:要不今天先到这里,你要的待遇怎么和现在 double ? 我说:我在创业,都是降薪的,我想拿回之前的待遇 她说:我不管这些,我就看你现在的。我觉得你要的待遇和你能力不符 我说:那问题就简单了,你们能给多少? 她说:这个我需要和技术讨论一下,但是你要的太高了 ps :某知名大互联网公司,技术两轮面感觉没问题,面试官都觉得不错。 其实从面的时候就知道他们并不想花这个钱,第二也没有我合适的职位。 hr 说我要的待遇和能力不符,至少我技术面没有倒下,再说你说这句话那么你有个 range 吧? 之后我问那你觉得多少合适,居然说要和技术讨论,这不前后矛盾吗? 我为了掌握技术和提升自己,比别人多付出多少时间和精力 你在这里说这些完全是浪费我的时间。 |
46 peter999 2016-05-13 18:57:43 +08:00 不都是走打码平台吗 |
47 fzinfz 2016-05-13 20:04:09 +08:00 浏览器方式应该是指 selenium+firefox/chrome 那样的方式吧 |
48 pysama 2016-05-13 20:16:33 +08:00 @SlipStupig 话说气功是什么黑科技,求科普 |
49 josephshing 2016-05-13 21:11:22 +08:00 也有可能是面试官心情不好 很正常 |
50 alexapollo 2016-05-13 21:17:17 +08:00 面试本来就被很多人当作了答疑的过程。。 |
51 lebowskis span class="ago" title="2016-05-13 21:17:20 +08:00">2016-05-13 21:17:20 +08:00 @jarlyyn 验证码的地址就算是 JS 生成的也得走请求,说一千道一万,除了本地生成的不说,哪种方式的生成不用走请求? |
52 hanxiV2EX 2016-05-14 00:28:20 +08:00 via iPhone 估计面试官是想说用浏览器找出验证码在 DOM 的哪个节点位置 |
53 ihuotui 2016-05-14 01:42:12 +08:00 验证码识别技术很多,而且开始流行不是验证码了,换拖动滑块。。 |
54 SlipStupig OP @ihuotui 还是验证码,只是验证方式变了 |
55 ersic 2016-05-14 07:35:51 +08:00 程序员:「老板,遇到问题解决不了了怎么办?可以招人吗?」 老板:「这样啊,我去叫 HR 发邀请面试。」 程序员:「太好了,谢谢老板!」 老板:「恩,面试就由你来了,记得只面试,不要人,面试题挑你遇到的问题问。」 |
57 Heavytiger 2016-05-14 09:14:07 +08:00 via iPhone 从来不从自身找问题,总是怀疑别人妒忌我,抱着这样的心态,我干上了自由职业。 |
58 whatisnew 2016-05-14 09:34:33 +08:00 程序员:「老板,遇到问题解决不了了怎么办?可以招人吗?」 老板:「这样啊,我去叫 HR 发邀请面试。」 程序员:「太好了,谢谢老板!」 老板:「恩,面试就由你来了,记得只面试,不要人,面试题挑你遇到的问题问。」 |
59 chimingphang 2016-05-14 10:50:40 +08:00 同意楼上的 |
60 SlipStupig OP @pysama 超新星爆炸产生的中子,通过阴阳五行加上胡椒粉调制的一种神奇力量,史称“神速力”! |
61 yanyandenuonuo 2016-05-15 21:31:57 +08:00 @hyzjshwo 我也遇到这种问题了。。几个知名公司的 HR 最后都这样干了。。给不起工资何必开那么高呢,浪费双方的感情和时间。。。 |
62 cppgohan 2016-11-25 16:36:24 +08:00 楼主我来挖坟, 取字摸是什么意思? 能不能发个 url 科普一下, 另外, lz 有没有什么爬虫成果和心得, 分享分享:). 我只玩过很少量的网页数据分析, 自动下载. 验证码这块感觉很高级, 如果我的话, 估计直接考虑接入 api 了 |