利用阿里云,有没有可能搭建一个媲美 baidu 的搜索平台。。 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
maxxfire
V2EX    奇思妙想

利用阿里云,有没有可能搭建一个媲美 baidu 的搜索平台。。

  •  
  •   maxxfire 2019-03-20 17:13:10 +08:00 809 次点击
    这是一个创建于 2449 天前的主题,其中的信息可能已经有所发展或是发生改变。
    如果可以,那就可以砸点钱做。如果不可以,为什么?
    64 条回复    2019-03-26 13:10:14 +08:00
    lscho
        1
    lscho  
       2019-03-20 17:17:05 +08:00
    有可能。

    砸多少钱是关键。

    200 亿起步吧。
    maxxfire
        2
    maxxfire  
    OP
       2019-03-20 17:19:39 +08:00
    @lscho 我说的是砸点钱,不能砸这么多,可以拉点投资。关键是非资金方面的可行性分析。
    c0878
        3
    c0878  
       2019-03-20 17:20:48 +08:00   3
    不考虑成本的话是可行的 实际上超大规模的计算集群使用自建数据中心比公有云划算
    lscho
        4
    lscho  
       2019-03-20 17:33:07 +08:00
    @c0878 资金也是可行性的一部分,成本你都承担不了,怎么继续分析。。。我是说真的,200 亿起步。可以听个响了。

    百度市值约 4000 亿,年营业额 1000 亿,员工一万多人。不知道你是哪里来的信心搭建一个“媲美 baidu 的搜索平台”。

    邓亚萍做搜索的 20 亿连个响都没听到。
    maxxfire
        5
    maxxfire  
    OP
       2019-03-20 17:35:02 +08:00
    @c0878 怎么会划算呢,阿里云有现在的负载均衡、防火墙、数据灾备、弹性云、大数据计算等等,都现成给你用的了。
    awesomes
        6
    awesomes  
       2019-03-20 17:35:41 +08:00
    那我想问问阿里要钱有钱,要技术有技术,为什么不搭一个搜索引擎出来呢?
    delyuan
        7
    delyuan  
       2019-03-20 17:38:41 +08:00
    看看搜狗和 360 搜索,你再想想如何媲美百度
    IanPeverell
        8
    IanPeverell  
       2019-03-20 17:41:17 +08:00
    即使不考虑前几年烧钱的事情,就想知道做出来之后的盈利方式。

    竞价排名?广告?中文搜索、易用性能比百度更好?

    不解决盈利模式花光钱就只有死,甚至最后可能就是做出来了一个差一些的百度。
    tadtung
        9
    tadtung  
       2019-03-20 17:41:58 +08:00 via Android
    可以,前几年我就记得有开源方案。
    但是关键是即使你捡起来了,要让人用,要推广。花的钱更多。
    另一个你也可以自己反代百度,剔除掉,推广及广告。重新打乱搜索结果排名。这也算是搜索引擎吧。这样做不更简单,但是会有多少人用你的呢?
    zsl199512101234
        10
    zsl199512101234  
       2019-03-20 17:44:51 +08:00
    @tadtung 这样做有没有违法呢
    pkoukk
        11
    pkoukk  
       2019-03-20 17:47:00 +08:00
    百度拿出来公关干掉你的钱可能都比你拉到的总投资多
    想全部用阿里云,那更是图样。我记得在 v 站看到过哪个公司和腾讯的合作破裂之后,被强制迁出腾讯云。
    把自己的小命全部交给一个可能会和你产生竞争的人,理智么
    AngryPanda
        12
    AngryPanda  
       2019-03-20 17:47:30 +08:00 via Android
    有可能阿里自己就搭了
    tadtung
        13
    tadtung  
       2019-03-20 17:48:27 +08:00 via Android
    @zsl199512101234 在国内,违不违法,你说了不算,我说了也不算。它们说的算。
    严格来说不算违法,因为你已经调整了搜索结果数据。我记得之前就有这样的网站。
    当年因为魏则西等事件,我自己搭建过一个,剔除了推广,广告等,供朋友用,不过都关站很久了。
    limuyan44
        14
    limuyan44  
       2019-03-20 18:17:19 +08:00 via Android
    百度一下?阿里一下?
    wanwaneryide
        15
    wanwaneryide  
       2019-03-20 18:18:01 +08:00
    看看去年春晚百度抢红包的,得多少的服务器和人员才能媲美百度
    Dragonish3600
        16
    Dragonish3600  
       2019-03-20 18:22:31 +08:00 via iPhone
    搜索引擎的数据来源是爬虫,越频繁流量越高。你想想阿里云光流量你就要出多少钱吧。你觉得钱不是问题,那为啥不自建机房?还能便宜很多
    x86
        17
    x86  
       2019-03-20 18:26:39 +08:00   1
    反代 Google&Bing,100%媲美
    kernel
        18
    kernel  
       2019-03-20 18:47:00 +08:00
    你们觉得百度很牛吗,搜索质量很一般吧, 比 Google 差得远了

    把 duckduckgo 的质量拿国内来用可能都会比百度好,人家才 55 个员工,楼上的 200 亿用不了吧
    dezhou9
        19
    dezhou9  
       2019-03-20 18:47:45 +08:00 via Android
    给我 10 亿这事我干
    andylsr
        20
    andylsr  
       2019-03-20 18:48:17 +08:00 via Android
    解决一个问题即刻~搜索引擎靠什么盈利~解决不了~砸多少都是一样的结果
    westoy
        21
    westoy  
       2019-03-20 18:53:25 +08:00
    强有力的入局者不会进入一个紧缩的市场
    yingfengi
        22
    yingfengi  
       2019-03-20 18:56:44 +08:00 via Android
    但是你没资质
    markmx
        23
    markmx  
       2019-03-20 19:01:21 +08:00
    能个香港服务器, 反向代理 百度和 GG ..
    cominghome
        24
    cominghome  
       2019-03-20 19:16:24 +08:00
    和阿里云有什么关系? 是我就在百度云做一个媲美百度的产品
    sanxidiot
        25
    sanxidiot  
       2019-03-20 19:19:07 +08:00 via Android
    为什么要用阿里云?都能媲美 baidu,难道不会自建机房么?
    fngtz
        26
    fngtz  
       2019-03-20 19:45:31 +08:00 via iPhone
    说句题外话。我感觉平时上网主要就是看十几个网站,加上各类产品的官网。

    搜索引擎的意义会越来越小的吧。
    brucewzp
        27
    brucewzp  
       2019-03-20 19:55:07 +08:00
    log4geek
        28
    log4geek  
       2019-03-20 23:36:58 +08:00
    软件就不说了,就说硬件。先计算下要存储百度这样规模的数据量,所需要购买的硬盘,你的钱存够了没?
    GeekShadow
        29
    GeekShadow  
       2019-03-20 23:37:25 +08:00 via iPhone
    @kernel 第一反应也是想到了 duckduckgo。但是没有怎么使用过,不好评价
    snoopy1024
        30
    snoopy1024  
       2019-03-21 00:25:23 +08:00 via iPhone
    @lscho 活久闻… 邓亚萍竟然做过搜索 卧槽
    swulling
        31
    swulling  
       2019-03-21 00:29:34 +08:00 via iPhone
    @maxxfire 因为阿里云要赚钱啊…没听说过一句话么

    没有中间商赚差价
    byfan
        32
    byfan  
       2019-03-21 00:36:24 +08:00
    可以在百度云上做干死百度的项目
    cpyhaha
        33
    cpyhaha  
       2019-03-21 00:56:13 +08:00 via Android
    startpage 不知道有没有人用过,就是谷歌搜索套个壳,我一直在用
    binux
        34
    binux  
       2019-03-21 03:03:16 +08:00
    你可以试试。
    不过当你有能力或者有资源的时候,你就不会想试试了。
    stiekel
        35
    stiekel  
       2019-03-21 06:53:58 +08:00
    @pkoukk 有这种事情,还有赶客户的?
    bokchoys
        36
    bokchoys  
       2019-03-21 08:08:00 +08:00 via iPhone
    我几个月前提了这个问题,没人搭理我
    kukumao
        37
    kukumao  
       2019-03-21 08:14:24 +08:00
    先采集 100 亿个网页内容才能提供足够的内容搜索

    当然前提还需要购买能容纳这些网页文件的硬盘和服务器,还要有能快速检索关键词的算法
    NaiveSimpleYoung
        38
    NaiveSimpleYoung  
       2019-03-21 08:24:02 +08:00 via Android
    @snoopy1024 这新闻当年很火的
    4DAX07B8Kle4Dm6T
        39
    4DAX07B8Kle4Dm6T  
       2019-03-21 08:25:25 +08:00 via iPhone
    可曾想想 google 是如何退出中国舞台的?
    qiutianaimeili
        40
    qiutianaimeili  
       2019-03-21 08:52:19 +08:00
    那腾讯咋不模仿个百度?百度咋不模仿个阿里巴巴?百度咋不模仿个腾讯?
    dajj
        41
    dajj  
       2019-03-21 08:59:27 +08:00
    1. 代理转发到别的搜索引擎
    2. 利用别的搜索引擎接口实现

    其实不就是一堵墙的距离吗
    entimm
        42
    entimm  
       2019-03-21 09:03:20 +08:00 via Android
    媲美这个词是不是用在百度身上非常不合适啊
    liangzimo
        43
    liangzimo  
       2019-03-21 09:08:41 +08:00
    mijisou.com 这个谁用过
    darmau
        44
    darmau  
       2019-03-21 09:19:46 +08:00 via iPhone
    程序员已到位,就差 200 亿了
    byteli
        45
    byteli  
       2019-03-21 09:27:54 +08:00 via Android   1
    程序员还是别好高骛远。实在的说,不以,做梦都做不到,价值观上可以嘲讽,但是技术上百度依然是国内技术最的公司之一,搜索质量在生活娱乐等各个方面都很均衡,依然是最好的中文搜索引擎。

    做工程不是做玩具,拿个开源就能跑,天天喊着 qps,一看都是 helloword。
    如果能拉到几十个百度高 T 做个几年我觉得倒是能凑合一下在某些方面的搜索精度媲美超越一下。
    gam2046
        46
    gam2046  
       2019-03-21 10:23:42 +08:00
    可以呀。为什么阿里自己不做?
    shuizhongyu10
        47
    shuizhongyu10  
       2019-03-21 10:27:09 +08:00   1
    一个搜索引擎涉及到的方面太多了,百度除了竞价排名和广告,我觉得做的已经很不错了,基本能满足除程序员外各个行业,各个水平人员的搜索基本要求了。
    我不知道百度的一万员工里目前有多少比例的人还在搜索引擎上面,猜想应该不高,而且大多应该是维护人员,因为搜索引擎目前好像并没有很大的进步空间。
    如果楼主想做一个完全针对程序员的搜索引擎,所有的标准,所有的设计完全针对程序员,把领域细化后,我觉得击败百度完全可以,甚至不难,效果如果很好,我甚至愿意付费使用。但如果想在全方面媲美百度,即便你耗费巨大人力物力做出来了,我又有什么理由去用你呢,毕竟你和百度只是相当,我百度谷歌已经用顺手了,用你还要花点学习成本,凭什么用你?
    chanxinguidao
        48
    chanxinguidao  
       2019-03-21 11:00:04 +08:00
    单纯搜索引擎来说 百度并不优秀。但是百度把贴吧,文库,网盘,等等都统一了。这样就形成了生态化,你在用他 ABCEF 产品的时候,对 D 产品的使用难度等其他因素就会降低,同比其他产品,就变成了目前的粘性。
    huclengyue
        49
    huclengyue  
       2019-03-21 12:52:19 +08:00
    自己搭建一个搜索引擎难度不小,但是元搜索引擎还是很容易的。比如 https://so.sb
    marsgt
        50
    marsgt  
       2019-03-21 13:24:28 +08:00
    1. 如何量化“媲美 baidu ”?看公司净值肯定是不行的,难不成要看搜索结果的一致性?那么以此倒推,是不是做个壳给它套上,就能完成“媲美”了?
    2. 一个池子,原本有 3 条鲸鱼(有一条不像,不过不要紧)、6~12 条鲨鱼,若干其它各种鱼,现在又扔了一条鲸鱼进去,其它鱼怎么看?
    3. 你怎么让用户发现这里还有一条鲸鱼?
    run2
        51
    run2  
       2019-03-21 13:39:26 +08:00
    lz 你先索引一个站比如 V2EX 试试需要多少钱。。。
    (做个只搜 V2EX 的搜索引擎---虽然有一个了)
    zealinux
        52
    zealinux  
       2019-03-21 14:00:07 +08:00
    你还别说,
    时邓亚萍做的人民搜索还挺好用的。尤其搜图片。
    可惜身边用这个人寥寥无几。
    很多人都不知道。只知道百度百度。

    ----------
    退一万步讲,谁做了个比百度还强悍的搜索引擎,但是没有人知道那也白搭。
    lekai63
        53
    lekai63  
       2019-03-21 14:07:31 +08:00
    http://www.chinaso.com/
    人民搜索了解下?中国搜索了解下?
    cooljs
        54
    cooljs  
       2019-03-21 14:10:19 +08:00
    再加上微信登录,BAT 集齐了
    Phariel
        55
    Phariel  
       2019-03-21 14:10:49 +08:00 via iPhone
    “你就做个小网站嘛 很简单的 跟淘宝天猫功能一样就够了”
    vanxy
        56
    vanxy  
       2019-03-21 14:21:04 +08:00
    @搜搜 @搜狗 @bing @360 @神马
    vanxy
        57
    vanxy  
       2019-03-21 14:22:11 +08:00
    @vanxy 就中文搜索体验来说,除了 Google, 百度一骑绝尘,
    leon0318
        58
    leon0318  
       2019-03-21 14:28:16 +08:00 via Android
    @vanxy google 的中文搜索并不怎么样,结果集不够丰富
    catalina
        59
    catalina  
       2019-03-21 15:18:52 +08:00 via Android
    首先,从梦中醒来。
    sdushn
        60
    sdushn  
       2019-03-21 16:33:19 +08:00
    还好没说媲美 google
    mooncakejs
        61
    mooncakejs  
       2019-03-22 09:39:18 +08:00 via iPhone
    搜索除了技术,还有词汇积累,搜索结果优化。 这里才是搜索引擎的核心竞争力。
    这部分需要积累大量的用户数据,也是各家要抢着去做输入法,浏览器的原因。
    mingyun
        62
    mingyun  
       2019-03-23 19:06:39 +08:00
    @huclengyue https://so.sb 这个用不了?
    accacc
        63
    accacc  
       2019-03-25 21:29:36 +08:00
    @kernel 他的中文搜索肯定无法媲美百度的
    cowap
        64
    cowap  
       2019-03-26 13:10:14 +08:00 via iPhone
    搜索已经不吃香了,看看现在各 app 都包含了许多内容,以后搜索引擎并不看好,在我看来百度起家的原因就是能帮用户找到需要的内容,而现在各家的内容都自己带搜索了,可以依据算法很便捷地找到,还可以根据你感兴趣的进行推荐。

    从出发点来自问,你为什么要用百度或者谷歌?百度自己不是内容的产生者,只是一个集合者。

    看看当年流行的论坛,全是内容沉淀,就是没有一个想到优化其内容数据,才让百度占了江山。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5596 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 39ms UTC 01:44 PVG 09:44 LAX 17:44 JFK 20:44
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86