[在上海]我们在寻找。。。别犹豫了就是你 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
包信息请发到 /go/outsourcing 节点。
不要把相同的信息发到不同的节点
lookhi
V2EX    酷工作

[在上海]我们在寻找。。。别犹豫了就是你

  •  
  •   lookhi 2013-05-24 17:02:47 +08:00 7131 次点击
    这是一个创建于 4526 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我们准备做什么:
    我们目的很简单 分析互联网上大家讨论的热点。咳咳,我们只关注商业上的应用,那么你可以放心了(希望你懂的)。
    比如微博/论坛等上面讨论了什么商品,什么活动,都讨论了什么方面,对此的好恶等等。

    我们的愿景:
    将我们普通消费者与商家联系起来,从而提供给我们消费者更好的服务和产品。

    我们是谁:
    我们不算是传统意义上的创业公司,但我们部门将会是一个创业氛围的团队。
    这也就意味着我们不会突然的挂掉,可以比较长的时间来做这件事情 :)
    创业是一个过程,而无论是否在于一个所谓的创业公司。你认为是,那他就是。

    我们打算怎么做:
    1. 从互联网上获取足够多的数据
    2. 启动各种分析计算过程
    3. 展示我们的各种分析结果

    需要的武艺:
    a) 存储,太多的互联网数据需要存储了。因此需有一套齐备的数据存储系统。
    了解分布式存储的基本做法,其实不了解也行。我们可以逐步来熟悉了解。
    熟悉现在的一些KV存储引擎系统(LevelDB,HBase,Bdb,ToykoCabinet...甚至sqlite也算的)
    存储将会是一个服务,因此网络编程是必须要的,当然也不用害怕,其实也就是那么回事。一个Network Daemon而已。
    熟练的掌握Java/Python,熟练使用/C++更好了。
    更多的期待你的展示。
    b) 计算,一大堆的分析都是计算的结果。一个稳定的计算平台不可缺少。
    现在的计算标配嘛,Hadoop.
    因此需要你对Hadoop非常熟悉,不再是只写mapreduce程序了。
    最好知晓如何编写mapreduce的各种自定义接口,阅读过源代码就更好了。
    我们的目标极度明确Hadoop计算框架 + 快速的脚本语言开发。
    更多的分析应用可以采用其他的快速语言来实现,比如python,bash等。
    我们推荐你最好也熟悉python。python将会是整个的粘合剂和分析主力语言。
    为啥是python,因为我们大多数人都对python熟悉。
    c) 分析,最终的分析的实现。
    按照我们的目标,文本分析必不可少啊。
    通常我们会希望您了解NLP(自然语言处理)相关点,简单点分词,复杂点语法分析,高深点语义分析。
    当然我们会逐步推进这些。
    同样的Text Mining的相关点(比如快速聚类等)也是需要的。
    你要是了解更多的社会科学相关知识就更妙了。
    d) 搜索
    结果展示的快速显示能力,这已经是一个标配了。不在累述。
    这里还需要您对中文分词有所了解以及对如何构建一个分布式的"廉价"搜索充满兴趣。
    e) 爬虫
    一个分布式的"廉价"爬虫体系也是需要的,您有任何想法也可以与我来交流。

    上述任一武艺,我们都欢迎。若您具备多种武艺,更是竭力欢迎。
    也欢迎您来我们这聊聊。

    对了,我们用Linux。发行版本不限,希望你也行。
    你可以选择ubuntu,ubuntu还是ubuntu.开玩笑,可随意选择版本。
    我个人用的是xubuntu。

    联系咨询:
    公司HR邮箱: hr-shanghai#(tensynchina.com)
    或者发到我的邮箱 lookhi#(foxmail.com) 代为转发
    有其他的需要了解的也可以找我了解。

    福利待遇:
    法规规定的都有。具体的待遇还是要您来当面来"切磋切磋"。

    地址:
    徐汇区虹桥路+番禹路
    18 条回复    1970-01-01 08:00:00 +08:00
    skywinger
        1
    skywinger  
       2013-05-24 17:10:23 +08:00
    很好很强大,如果能不止用于商业而是整个世界关键信息的搜索分析那就更好,比维基百科好。
    firsthym
        2
    firsthym  
       2013-05-24 17:41:08 +08:00
    明盘?
    yearsaaaa
        3
    yearsaaaa  
       2013-05-24 18:27:37 +08:00
    我做的工作和这个也很相似,基础平台的相关服务,我日常用的也是ubuntu,好吧,是个巧合,支持一下
    lookhi
        4
    lookhi  
    OP
       2013-05-24 22:36:12 +08:00   1
    @skywinger 只是商业应用 能做好这块就已经不错了 整个世界的任务还是google来吧
    @firsthym 明盘?你说的是薪水吗?这个没明盘,我们希望前来切磋的同学多有个认识自己价值的机会,你需求的不一定是最终的。可能有小惊喜也可能是小失落,挺好的。
    @yearsaaaa 欢迎欢迎欢迎同好啊。有空也欢迎来聊聊。
    best1a
        5
    a href="/member/best1a" class="dark">best1a  
       2013-05-24 22:41:00 +08:00
    再贴下和同学做的毕设

    你们的产品会不会包含这些方面的,求围观
    lookhi
        6
    lookhi  
    OP
       2013-05-24 22:50:09 +08:00
    @best1a 你的毕设算opinion reviews吧。类似的方法会用上,不过我们的产品形式可能不是这样。可以算最终产出的一个方面。
    best1a
        7
    best1a  
       2013-05-24 22:55:05 +08:00
    @lookhi 哦哦,到时可以来这宣传下,去围观
    bradlee
        8
    bradlee  
       2013-05-24 23:28:18 +08:00
    听上去不错,也做过NLP方面的毕设。。。不过好久不搞这方面了
    话说可以理解为贵司搞的这是舆情分析?
    lookhi
        9
    lookhi  
    OP
       2013-05-25 09:39:09 +08:00
    @bradlee 咳咳,我们只关注商业上的应用,那么你可以放心了(希望你懂的)。
    arthur8845
        10
    arthur8845  
       2013-05-26 10:09:23 +08:00
    都是我感兴趣的怎么办
    lookhi
        11
    lookhi  
    OP
       2013-05-26 22:36:32 +08:00
    @arthur8845 来嘛 聊聊 有些是有交叉的
    magicbrighter
        12
    magicbrighter  
       2013-05-28 00:02:53 +08:00
    楼主考虑过使用storm进行热点分析,就像twitter一样?
    lookhi
        13
    lookhi  
    OP
       2013-05-28 10:57:04 +08:00
    @magicbrighter 嗯 storm实时后面也要涉及的。先易后难,Hadoop先上,离线是必须要的。
    cacoo
        14
    cacoo  
       2013-05-28 11:09:34 +08:00
    看着挺靠谱的团队
    帮转发微博一下
    yehkevin
        15
    yehkevin  
       2013-05-28 11:22:04 +08:00
    我是Rubist的,这样的可以吗
    lookhi
        16
    lookhi  
    OP
       2013-05-28 13:53:38 +08:00
    @yehkevin 语言不是特别指定的。除了计算用的Hadoop必须上Java外。只要能达成目标,当然与现有团队间的配合可能还是会有些影响,统一语言协助会更好点。熟悉一们新语言也不是很难的事情,合适的地方选用合适的语言都OK的。
    revir
        17
    revir  
       2014-02-24 20:19:41 +08:00
    @lookhi
    今天下午去面试了贵公司, 面试风格很独特, 提的问题也很辛辣, 不瞒您说, 有几个问题真的将我问懵了。
    贵公司做的产品, 使用的技术真的很高精尖呀, 神马 Hadoop, NLP, 真的是一群牛人干的事呢, 期待能与这样的牛人共事!
    lookhi
        18
    lookhi  
    OP
       2014-02-27 10:01:19 +08:00
    @revir :)
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2978 人在线   span class="fade">最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 14:15 PVG 22:15 LAX 07:15 JFK 10:15
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86