微搜索专注提供站内搜索服务 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
yandy
V2EX    分享创造

微搜索专注提供站内搜索服务

  •  
  •   yandy
    yandy 2014-09-22 15:48:21 +08:00 9026 次点击
    这是一个创建于 4041 天前的主题,其中的信息可能已经有所发展或是发生改变。

    微搜索是什么

    大家建站的时候,到了搜索这一步,会不会很头疼呢?

    做站内搜索的时候,可以使用 Google 或百度的站内搜索,或者干脆自己写(自己搭)。但是 Google 和百度的体验显然不大好,自己写又很麻烦(要学习,要优化还要运维),这时候使用第三方的搜索引擎就很方便了。

    微搜索是托管的服务。最少只需要3步,就可以给自己的网站添加上搜索功能了:

    1. 创建搜索引擎
    2. 添加域名
    3. 安装

    嗯,是不是很简单?

    微搜索还有什么

    除此之外,微搜索还提供基于 API 的高级用法(包括索引,搜索,分析统计等)与可视化的数据分析界面。

    主要特性有:

    • 全文搜索,实时索引(包括对中文的优化)
    • 即输即搜,自动补全
    • 搜索分析与可视化
    • 快速,稳定,弹性

    详细请参见微搜索特性

    为什么要做微搜索

    我们是一个不大的团队,目前只有八个人。现在的每个人都是程序员,连行政都会参与coding。因此,我们创业的理念就是:让开发者的工作更简单!

    在之前的项目中,我们都碰到了"要提供搜索功能"的问题,用过 ElasticSearch。直到我们渐渐意识到,像这样的工作,就跟"服务监控","长连接推送","发邮件"等等一样,如果能有专门的团队提供服务,由他们去调试,去优化,去运维,而我们只要专注自己的产品核心的开发,该是一件多么有意义的事情。

    于是就这样,我们开始了"微搜索"这样一个项目。

    欢迎试用

    目前微搜索还处于内测阶段,需要注册码才能注册试用。想体验的朋友可以使用如下注册码:

    53e5864d316361008c010000

    招贤纳士

    此外,如果你对我们团队,对我们做的事情感兴趣,欢迎联系我们。

    我们长期 招募靠谱开发者

    同时我们也 招募美少女

    第 1 条附言    2014-09-22 16:21:14 +08:00
    ### 已有案例:

    * [暴走日报](http://baozouribao.com/)
    * [Teahour](http://teahour.fm/)

    欢迎体验
    17 条回复    2017-02-10 11:35:18 +08:00
    mornlight
        1
    mornlight  
       2014-09-22 16:01:16 +08:00
    如果网站只对内开放,需要账号才能浏览页面,你们有解决方案么
    yandy
        2
    yandy  
    OP
       2014-09-22 16:13:28 +08:00
    @mornlight 是否可以只有帐号,才能看到搜索框?或者通过 API 进行
    yandy
        3
    yandy  
    OP
       2014-09-22 16:20:48 +08:00
    ### 已有案例:

    * [暴走日报](http://baozouribao.com/)
    * [Teahour](http://teahour.fm/)

    欢迎体验
    binux
        4
    binux  
       2014-09-22 16:28:55 +08:00
    用拼音搜索,zidingyi 可以,zidingyisou 就不可以了
    yandy
        5
    yandy  
    OP
       2014-09-22 16:34:20 +08:00
    @binux 恩,这个和目前的拼音策略有关系,可以改进的。例如 zidingyi sou 是有的
    mornlight
        6
    mornlight  
       2014-09-22 16:42:28 +08:00
    @yandy 必须有账号才能搜索,所有内容都是对内。我刚才注册了一个,看起来你们是用爬虫自己去爬页面的。需要怎样的API?
    yandy
        7
    yandy  
    OP
       2014-09-22 17:06:18 +08:00
    @mornlight 是这样的,搜索的流程简单来说分为两部分:索引和搜索。所谓索引,就是将需要被搜索的内容push到搜索引擎。
    我们有两种方式实现索引:
    * [索引 API](http://doc.tinysou.com/v1/overview.html): 可以通过 API,主动地将需要搜索的内容 push 给我们。使用这种方式,可以建立自己的文档结构。
    * 爬虫: 如果不想通过 API 的方式,又有一个站点。那么可以依赖我们的爬虫去抓取。爬虫的本质也是 download 你的网页,抽取信息,通过"索引 API" push 给搜索引擎。
    mornlight
        8
    mornlight  
       2014-09-22 17:20:03 +08:00   1
    @yandy 明白了,大致是用户发表一个新帖子的时候,服务器就主动把帖子标题、内容等都push到你们那边。这样也可以。
    simapple
        9
    simapple  
       2014-09-22 17:56:39 +08:00
    用现成的不是sphinx或者其他的组件不是更简单,这个产品的优势是更加准确的语义分词? 还是足够庞大的机器学习 分词能力?
    jingwentian
        10
    jingwentian  
       2014-09-22 18:19:26 +08:00 via Android
    v2支持markdown了么,原文中的链接怎么发布的
    yandy
        11
    yandy  
    OP
       2014-09-22 18:22:32 +08:00
    @simapple 这样的,从功能上讲我们专注做搜索,无论是学习数据还是开发精力,我们肯定比自己搭要投入得多的多,这也就意味着我们的服务更有可能比自建搜索引擎来得准确、智能。其次我们提供的是服务型的产品,还有成本和运维上的意义。
    yandy
        12
    yandy  
    OP
       2014-09-22 18:24:16 +08:00
    @jingwentian 在发布的时候,右下角有个选项,得选择一下 markdown。不过坑爹的是,只有发布的时候可选,之后就没办法支持了。。。(见附言)
    laomo
        13
    laomo  
       2014-09-22 19:35:18 +08:00
    不错,和 Swiftype 很像
    https://swiftype.com/
    wgqzlj
        14
    wgqzlj  
       2014-09-23 13:42:45 +08:00
    阿里云也有类似的了 http://www.aliyun.com/product/opensearch
    yandy
        15
    yandy  
    OP
       2014-09-23 16:24:55 +08:00
    @wgqzlj 恩,阿里云的产品线很长,覆盖 ucloud, 又拍云,七牛,BAE,监控宝 等所有产品。。。。
    yandy
        16
    yandy  
    OP
       2014-09-29 01:11:43 +08:00
    注册码有更新了~ `c5b8f5e67291`
    kwklover
        17
    kwklover  
       2017-02-10 11:35:18 +08:00
    一直有关注,可惜网站已经打不开了,其实做云模式的站内搜索并不容易,数据结构,同步,数据量,搜索量,内外网,有特殊权限架构情况如何解决?

    所以我们一直致力于私有化部署的站内搜索产品--搜易站内搜索引擎,就是希望点点鼠标就能够配置好,完全无法写代码,当然也有局限性,比如无法部署到 LINUX 上。

    目前也有很多开源的产品,比如 ES , sphinx ,但是这些都需要有一定的安装门槛和开发能力才能搞定。有技术力量的话,当然是首选方案。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2957 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 13:46 PVG 21:46 LAX 06:46 JFK 09:46
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86