来来来,我们聊聊国内不思进取的搜索引擎们! - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wwc
V2EX    互联网

来来来,我们聊聊国内不思进取的搜索引擎们!

  •  
  •   wwc 2017-05-07 09:40:02 +08:00 8110 次点击
    这是一个创建于 3157 天前的主题,其中的信息可能已经有所发展或是发生改变。

    同时在百度,谷歌,必应,360,搜狗,提交了一个 HTTPS 新站。 过两天查看,谷歌和必应已经收录首页,百度,360,搜狗别说收录了,连蜘蛛都没来。 并且国内这三家站长平台工具,也是对 HTTPS 各种不支持。 对此我很郁闷,在苹果强制 HTTPS,谷歌优待 HTTPS,运营商强插广告的情况下,国内网站可以说是掀起了 HTTPS 的大潮,可是为什么国内搜索引擎都那么不作为呢?尤其是百度,15 年就吹牛逼说支持 HTTPS,对 HTTPS 优待,旗下工具会陆续支持,可是尼玛现在还不是屎一样!! 到底是什么原因让国内搜索如此不思进取呢?国内搜索引擎只是为广告而生吗?

    56 条回复    2017-05-08 12:44:32 +08:00
    Antidictator
        1
    Antidictator  
       2017-05-07 09:42:10 +08:00 via Android   1
    我只想说知乎的搜索真的是烂到不能忍? power by sogou。真是呵呵了。
    haozi1986
        2
    haozi1986  
       2017-05-07 09:47:26 +08:00   1
    原因很简单啊,反正做的再烂,也没啥强有力的竞争对手,反正做的再烂,也还是有很多人用(虽然很多人是没有选择的余地),躺着赚钱,这种好事,全世界上哪里找?
    wentian
        3
    wentian  
       2017-05-07 09:55:18 +08:00 via Android
    有没有人觉得,这些搜索引擎,搜索出来的东西,全是垃圾,根本搜不到正常的东西
    qiayue
        4
    qiayue  
    PRO
       2017-05-07 09:57:25 +08:00
    百度对于新网站,不管是 http 还是 https 都有一个观察期,不是你提交了,就一定收录你的网站
    whileFalse
        5
    whileFalse  
       2017-05-07 09:59:09 +08:00
    反正我用 google,不方便翻墙的地方用 bing
    zjqzxc
        6
    zjqzxc  
       2017-05-07 09:59:58 +08:00
    提交两天后没来爬虫就说明国内都搜索引擎都不支持 https 了?
    这理由未免有点太牵强了吧

    事实上百度还是能搜到大量用了 https 的个人博客的(其他的懒得试了)

    最可能的原因是,你提交的请求优先级比较靠后
    wwc
        7
    wwc  
    OP
       2017-05-07 10:07:54 +08:00
    @wentian 就说百度,技术性的东西,都是一样的标题和内容,不一样的网址,全是采集的,我敢说百度要是敢治理采集,他的搜索数据库能节省一半的空间……
    wwc
        8
    wwc  
    OP
       2017-05-07 10:08:30 +08:00   1
    @haozi1986 也就我大中华局域网……
    popu111
        9
    popu111  
       2017-05-07 10:16:36 +08:00
    @wwc 现在这样原创小站还能在第二页混个位子,真治理只能是保留大站干小站,那就太不公平了。
    qcloud
        10
    qcloud  
       2017-05-07 10:19:07 +08:00 via iPhone
    @wentian 因为都去做 app 了,没人做站了
    taineric
        11
    taineric  
       2017-05-07 10:19:15 +08:00 via Android
    @Antidictator 没有引入搜狗搜索时更烂
    site:linuxtoy.org
    360 235 个 搜狗 39742 个 谷歌 7850 个 必应 9070 个 百度 5439 个 搜狗很神奇,怎么会那么多
    Antidictator
        12
    Antidictator  
       2017-05-07 10:26:11 +08:00 via Android
    @taineric 这就很好笑了。。。多出来的页面是什么。。
    wwc
        13
    wwc  
    OP
       2017-05-07 10:34:44 +08:00
    @whileFalse 作为用户,我也这样,关键是作为站长就不行了……得考虑到你的客户……
    iRiven
        14
    iRiven  
       2017-05-07 10:35:12 +08:00 via Android
    抓取 HTTPS 不难啊,感觉百度蜘蛛没谷歌多,不够用,没时间鸟你
    taineric
        15
    taineric  
       2017-05-07 10:42:54 +08:00 via Android
    @Antidictator 我也觉得非常奇怪,毕竟搜狗显然对这个站的新文章一个也没收录
    wy315700
        16
    wy315700  
       2017-05-07 10:49:51 +08:00
    策略不一样,
    Google 是先收录再排名。
    baidu 是会给你一个观察期,过了观察期才能收录。
    lwbjing
        17
    lwbjing  
       2017-05-07 10:56:00 +08:00
    以前做优化的时候,还会考虑你的域名,主机 IP 等是不是被别人用过并且有过黑历史等,
    这样的话,就会进入一个更漫长的缓冲期,,
    比正常网站的观察期还长的多。。
    levn
        18
    levn  
       2017-05-07 11:55:57 +08:00 via iPad
    到什么时候个人可以方便的拥有自己的搜索引擎?
    RqPS6rhmP3Nyn3Tm
        19
    RqPS6rhmP3Nyn3Tm  
       2017-05-07 12:45:37 +08:00 via iPad
    @levn 等每个人都有百亿资金的时候
    kn007
        20
    kn007  
       2017-05-07 12:48:29 +08:00
    因为 google 打不开。必应没人用。
    bluecrow
        21
    bluecrow  
       2017-05-07 12:57:31 +08:00
    @kn007 必应知名度太低?
    kn007
        22
    kn007  
       2017-05-07 12:59:54 +08:00
    @bluecrow 可能吧,我客户很多,即便大学里面,你说必应,也没多少人知道。。学校这些小年轻老师都不怎么知道,政府那些老爷们就更不懂了。
    bluecrow
        23
    bluecrow  
       2017-05-07 13:47:26 +08:00
    @kn007 可惜了,微软一些不知名的产品确实体验不错。
    Manchester
        24
    Manchester  
       2017-05-07 14:03:53 +08:00
    太上纲上线了吧,你递交 http 网站也不会理你的,百度不喜欢主动递交的网站,喜欢自己爬到的网站,这点常识都不懂就来喷,有点不好吧。
    wwc
        25
    wwc  
    OP
       2017-05-07 14:07:13 +08:00
    @bluecrow 是的,必应每天一壁纸,很漂亮。
    wwc
        26
    wwc  
    OP
       2017-05-07 14:09:11 +08:00
    @Manchester 你这话说到点子上了,百度收不收录是看他自己喜不喜欢,而国外搜索引擎是看用户喜不喜欢。
    54c3
        27
    54c3  
       2017-05-07 14:16:03 +08:00
    > 百度支持不支持 https 协议?
    > 百度目前只能收录少部分 https 网页,大部分 https 网页无法收录。网站首页和对所有用户都公开的内容页面,建议不要使用 https 协议,如果非用不可,尽量将首页和重要页面做个 http 可访问版,方面百度收录。

    共自百度官方的《百度搜索引擎优化指南 2.0 》 https://zhanzhang.baidu.com/college/documentinfo?id=193&page=6
    KirkZheng
        28
    KirkZheng  
       2017-05-07 14:24:07 +08:00
    @Antidictator 自从上个月破乎把我的账号永久封禁以后,再也不打算上了,除了偶尔被谷歌搜索到
    Shura
        29
    Shura  
      2017-05-07 14:39:49 +08:00 via Android
    我博客就是 https 的,搜索引擎均能正常收录。虽然没人看就是了。。。
    Domains
        30
    Domains  
       2017-05-07 15:16:25 +08:00
    @wwc 图样图森破,收录就等于你赢了? 不同策略而已,百度是不主动收录主动提交的网站,你要去有权重的网站留链接,引百度蜘蛛过来爬,比如是 v2ex,谷歌是马上收录,但只是收录到沙盒里,你 site:xxxx.com 的所谓收录是不显示到正常搜索结果去的,不是有没有排名,而是根本不列出,顶多列出个首页。
    通通都需要时间,通通都是先沙盒。百度也一样,百度是收录到沙盒也不显示,猜测是想推它的站长工具,因为百度会出现一直好多天都不收录,突然一夜间全收录的情况,无他,从沙盒放出来了。
    wangleineo
        31
    wangleineo  
       2017-05-07 16:18:55 +08:00
    能翻墙的时候用 Google,不能的时候用 Bing
    Les1ie
        32
    Les1ie  
       2017-05-07 16:35:35 +08:00
    我自己的博客,不过不是 https 的,是托管在 github 的,自己解析了域名过去。三个月前提交给 baidu 的站长收录,至今百度搜索没有找到,反倒是谷歌,没几天就能搜索到博客的内容了,但是我并没有主动给谷歌提交我的网站。再加上平时搜索问题的时候,csdn, cnblog, 51cto 在百度的权重太大了,这里面的东西基本都是抄过来抄过去,很无趣,所以现在不管是中文还是英文搜索,全部是谷歌了。
    wwc
        33
    wwc  
    OP
       2017-05-07 16:41:34 +08:00   1
    @Les1ie 谷歌给人的感觉是一视同仁,我不管你是多少年的老站,大战,名站,也不管你是刚成立几天的新站,只要你的内容好,我就给你排名,而且谷歌反抄袭反采集方面做的非常好。反观百度,只认钱,其次认大站,老站,名站,优质内容就算是你新站的原创的,被大战抄去了,你反而成盗版了,恶心至极!!
    xiaket
        34
    xiaket  
       2017-05-07 17:12:36 +08:00
    2010 年翻译了一篇文章, 算是半原创而且很小众的, 直接按标题搜索, 出现在第二页. 第一页第一条是转载我那篇文章的, 只能默默叹自己的 SEO 太差.
    Tunar
        35
    Tunar  
       2017-05-07 17:13:48 +08:00 via Android
    搜狗=辣鸡
    Mikewu
        36
    Mikewu  
       2017-05-07 17:49:01 +08:00 via Android div class="sep5">
    @Les1ie 我记得 github page 是拒绝百度蜘蛛访问的
    CruelMoon
        37
    CruelMoon  
       2017-05-07 18:32:46 +08:00
    360 对偶的博客收录最快,百度经常不收录(却会收录那种爬虫网站爬到的偶的文章)
    谷歌的收录速度感觉比百度快一些..不过能带来的流量比较小
    muyunyan
        38
    muyunyan  
       2017-05-07 19:07:15 +08:00
    不只是自己的广告……有机会你试试把你的站点镜像一个到百度云试试,一周之内必收录……
    rock6y
        39
    rock6y  
       2017-05-07 20:16:35 +08:00 via Android
    没人用 yandex 吗 不用翻墙啊
    tairan2006
        40
    tairan2006  
       2017-05-07 21:16:17 +08:00
    @Antidictator 知乎在没有 power by sogou 的时候,才是真的烂到不能忍
    vtoexshan
        41
    vtoexshan  
       2017-05-07 21:37:35 +08:00
    就没个良心搜索引擎吗
    vtoexshan
        42
    vtoexshan  
       2017-05-07 21:39:06 +08:00
    @wwc 百度对不同站加权了?
    wwc
        43
    wwc  
    OP
       2017-05-07 22:06:13 +08:00
    @vtoexshan 谷歌良心。
    BoBoy
        44
    BoBoy  
       2017-05-07 22:23:28 +08:00 via iPhone
    反正我只用 google
    ichubei
        45
    ichubei  
       2017-05-07 22:27:12 +08:00 via iPhone
    有没有发现谷歌搜索,好多搜出来的都是几年前的内容,有些东西反而不如百度搜出来的有用。
    vtoexshan
        46
    vtoexshan  
       2017-05-07 22:46:53 +08:00
    @wwc 但是,访问不方便啊,,,
    taineric
        47
    taineric  
       2017-05-07 22:51:48 +08:00 via Android
    @ichubei 搜索设置啊
    shuirong1997
        48
    shuirong1997  
       2017-05-07 23:11:38 +08:00
    @wentian 我是用 Google 之后,再也回不去了.
    wwc
        49
    wwc  
    OP
       2017-05-07 23:36:52 +08:00 via Android
    @ichubei 有没有发现技术性搜索百度搜出来的都是同一篇 N 年前的文章,被采集来复制去的。
    mornlight
        50
    mornlight  
       2017-05-08 01:36:21 +08:00
    @54c3 #27 你这篇不准,是很老的文档,百度现在官方宣称是支持 HTTPS 收录的 http://zhanzhang.baidu.com/wiki/392
    EricCartman
        51
    EricCartman  
       2017-05-08 01:43:32 +08:00 via Android
    知乎自带搜索能用?各种审查屏蔽,和太监一样
    uuair
        52
    uuair  
       2017-05-08 02:01:34 +08:00
    @BXIA 这个时代应该是量子物理的时代了,物理停滞了很多年没有新发现,我觉得快了。如果达到量子的时代,或许能突破这个瓶颈,发现新的物质或者方法,这就是下一场革命。那么按照现有理论,在无限不循环小数中存在一组数据,我们整个世界所有的东西都会出现在这个无限不循环小数的某一个组里面。现在我跟你说这些话,要打字,计算机要识别,而未来我只要输入一个键,然后再某个无限不循环小数中就可以找到这一大堆文字的编码,我只要输入位置你就收到了,又快,又省地方。那么理论上,整个互联网上的信息,也只是在这个小数的某一部分,只要输入坐标,每个人都能掌握这所有的数据,那么自己的搜索引擎就不是梦想了。想想,未来多美好啊。
    tt7
        53
    tt7  
       2017-05-08 03:20:56 +08:00
    百度搜食谱还是挺好用的啊
    minamike
        54
    minamike  
       2017-05-08 08:32:24 +08:00
    贵 V2er 不都只用 Google 么 那么在乎国内搜索引擎干啥(手动滑稽
    Les1ie
        55
    Les1ie  
       2017-05-08 12:43:33 +08:00
    @wwc 对... google 至少看起来没有 baidu 功利,baidu 广告低俗,无孔不入
    Les1ie
        56
    Les1ie  
       2017-05-08 12:44:32 +08:00
    @Mikewu 这个我就不清楚了,如果要是 github page 屏蔽了百度蜘蛛的话,百度站长那边没给我消息呢。。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2602 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 45ms UTC 06:27 PVG 14:27 LAX 22:27 JFK 01:27
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86