Dogedoge 中文搜索发布月余,目前搜索总量突破 100 万次。小结一下过去,也跟大家说说心中未来...[约 1200 字] - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
nicoljiang
V2EX    奇思妙想

Dogedoge 中文搜索发布月余,目前搜索总量突破 100 万次。小结一下过去,也跟大家说说心中未来...[约 1200 字]

  •  4
     
  •   nicoljiang
    PRO
    2019-07-22 20:00:12 +08:00 7524 次点击
    这是一个创建于 2274 天前的主题,其中的信息可能已经有所发展或是发生改变。

    一些数字

    data

    前情介绍

    38 天前,我在 V 站正式发布了 Dogedoge 搜索,初衷希望能让大家在百度之余和翻墙不便的情况下,有一个不错的备选( t/573950 ),是 V 站当时较热的帖子之一。

    Dogedoge 不仅得到了很多人的支持,还得到了大佬的推荐(一度造成宕机)。使用的数量超出了预期,于是紧急做了很多本来佛系排期的事情,以应付可能发生的突然问题:

    1. 内容安全;
    2. 网络攻击;
    3. 搜索结果面太窄;

    大家看起来跟发布时并没有两样,的确是所有的新特性开发都暂停了,因为安全问题超出了我的预期(出现许多我做梦都想不到的敏感词)。

    小结一下这 30 几天里发生的事情:

    1. 被十余个自媒体&知乎(超级感谢)推荐,其中动静最大的要属「阮一峰」在微博推荐: https://www.weibo.com/1400854834/HzjTGsNEM
    2. 经历了 8 次规模较大的 CC 攻击;
    3. 做了三次扩容(第一次是为了应付 阮一峰 推荐带来的流量暴增);
    4. 做了 12 次搜索结果优化;
    5. 做了 51 次搜索结果敏感内容处理(影响精力的最大头);
    6. 搭建流量统计系统(为了避免第三方 Cookies 的采集,没用任何第三方统计)。
    • 可以看到,这些几乎没有一件是能让用户直观感受到的事。对此我的想法是 既然是搜索,那么最最重要的永远只有两件事:搜索结果的合理性 & 随时快速响应的稳定性。

    关于未来

    。壹

    如大家所见,前端依旧使用 duckduckgo.com 的皮,Logo 也非常缺乏诚意。所以第一件事恐怕是要开始启动一些改版计划,但应该会慢慢来,习惯的延续很重要。是以,若有美术功底、前端技术很棒的同学对 Dogedoge 有兴趣的,欢迎联系我: [email protected] ,我们可以探讨如何合作,或者仅仅是天马行空的想法;

    。贰

    1. 通过 3 次扩容后,系统也已经能扛住一定的突发请求了。是以,在这里想恳请喜欢 Dogedoge 的同学,在自己的广播站中为 Dogedoge 推荐一波。博客、论坛、朋友圈、微博 都可以,不需要专门赞美,希望能说一些客观想法。发了微博的同学可以把链接跟到帖子里,无论是有 1 个人看,还是 100 个人看,Dogedoge 都会铭记于心。虽然眼下还难以做出实质性的回报,但已经有了一些相关的想法,下面会阐述;

    2. 通过 10 余次搜索结果优化,目前搜索结果在大部分情况下已经比较丰富合理了。所以对于有网址导航产品的同学( V 站居民应该人手一个吧),Dogedoge 也恳请大家可以领养一波https://www.dogedoge.com/results?q=%s 加入到搜索框中的引擎选项中:

      1. 名称为「多吉搜索」或「 Dogedoge 搜索」均可,Logo: https://www.dogedoge.com/assets/logo_header.v108.svg
      2. 若 7 日平均每天搜索量平均能高于 1,000,可以联系我定制结果页的 Logo
      3. 若 7 日平均每天搜索量能高于 10,000,则可以联系我定制结果页的 Logo、名称、子域名

    。叁

    Dogedoge 要成为真正实用的搜索引擎,势必要支持很多的即时结果( Instant Result )。目前仅仅支持 IP 查询、货币兑换查询。其实非常重要的还有:天气、万年历(假日)、各种微型工具。但一个人的精力着实非常有限,所以想集思广益,谁有很实用、美观的 JS 程序,欢迎跟我探讨接入,Dogedoge 会在工具旁加上你的主链接。前端达人们若有其他更好的方案,也可以在回帖中或通过 [email protected] 与我讨论。

    。肆

    1. 在年底之前,希望能搞定「网盘搜索、图片搜索、视频搜索、资讯搜索」等几个重要的板块;
    2. 希望能启动新的「中文 Wiki 计划」。

    。伍

    因为已经备案了,所以排查敏感内容必然也是长久的重中之重。Dogedoge 会自觉维护祖国的完整和声誉,希望做一个遵纪守法的搜索工具,以能够长久、稳定地为大家服务(若有漏网之鱼,还请大家千万告知)。

    关于收入

    有很多人朋友特别担心会坚持不下去。其实想想目前成本着实不低,所以是迟早需要开拓一些收入的。目前有三个想法,请大家来讨论和把关一下:

    1. 部分商品的搜索结果,接入一些电商的联盟 即「当用户搜索一些与商品相关的关键词时,通过商品的返利链接获得一些手」。如:搜索一些技术关键词时,右侧可以显示 3-6 个相关书籍的链接;
    2. 实现一些增值功能(但还没想好有一些什么样的增值功能);
    3. 针对开发者和小团队,推出更多更丰富更实惠的接口,例如:定制化的云搜索;
    4. 向广大用户乞讨(捐赠),以「资助者列表」的形式,在固定页面为大家的博客或产品放置一个带 icon 的链接;
    5. 还有别的好建议,欢迎回帖讨论。
    105 条回复    2019-10-05 10:32:15 +08:00
    1  2  
    noob1445
        1
    noob1445  
       2019-07-22 20:07:21 +08:00 via iPhone
    原来开发者就在 v 站,dalao
    Buges
        2
    Buges  
       2019-07-22 21:01:41 +08:00 via Android   32
    我来泼冷水了:你这玩意就别想“合法”的做下去。br />Google 当初退出中国可从来不是因为审查。
    “遵纪守法”完全就和一个搜索引擎,一个高效聚合索引信息的工具水火不容。
    这里的“合法”指的是“合规”,因为某国不是法制国家,也根本没有明确的法律条文告诉你什么能有,什么不能有。上面只会含含糊糊的一通电话,一个通知,让你自己“揣摩圣意”,根本没有明确的界限。这些内容太多又太含糊,你需要耗费大量精力也一定有漏网并且这个“度”还要你自己把握。
    当然了,你也可以屏蔽 gfwlist 的地址,甚至只索引 cn 的站点。这样一来,搜个剧 YouTube 本来该在置顶你没有,搜技术关键词没 wiki,如此种种,这算哪门子“实用的搜索引擎”?还不如去了广告的 baidu。
    至于「中文 wiki 计划」我不知道你指的什么,如果是类 Wikip.edia 那样的,那肯定不可能。因为 wiki 的核心理念,客观,中立,自由,在这里是“不合法”的。
    rogwan
        3
    rogwan  
       2019-07-22 21:03:31 +08:00 via Android
    干脆搞成付费搜索,每年 120 元这样的会员制,提供快照访问(快照更新要及时),专注提高搜索质量。如果搜索质量国内普遍比百度高,大约要多少会员量能覆盖住成本?
    yueye
        4
    yueye  
       2019-07-22 21:09:56 +08:00
    Personal Blocklist 和自定义搜索服务可以考虑成增值功能?

    搜索结果会增加按照时间排序的选项吗?
    nicoljiang
        5
    nicoljiang  
    OP
    PRO
       2019-07-22 21:53:26 +08:00
    @rogwan
    个人的 Blocklist 可以考虑的。按时间排序对于通用搜索的部分,短期内还做不太到(如果是资讯服务,这块儿上线之后是 OK 的);
    至于自定义搜索服务,你说的是可以索引自己文档的搜索么?这个我确实打算开放(就是云搜索服务);

    @rogwan
    每年 120 元的会员费,假设完全没有免费搜索,那么 3000 位左右的付费用户大概可以收支平衡(这部分用户应该是相对重度的用户),但这么高频的基础服务,其实是没法做严格的收费服务的(会损失基础便捷性,大量的搜索数据本身也是优化搜索结果的重要依据);那么假如同时提供哪怕最基础的用户,双方哪怕能到 1:9,那直接就是 10 倍啦(因为对收费的用户还需要提供更多的增值服务);所以,收费的用户可以没有广告,但对于免费的部分,依然要有其他的营收方式。

    @Buges 从「法」的定义上,很惭愧,目前的确还是立足于中国,即便是某个条款也得遵守。对于 wikip 这种,其实是有一些方法的(目前在筹备); YouTube 也可以做到,但可能需要收费维持(当然我说的并不是简单的 VPN 或代理的方案)。不过非常非常感谢你的警醒。
    sunny2580839896
        6
    sunny2580839896  
       2019-07-22 22:02:39 +08:00
    从发布我就关注了,反正我一直在用,手机电脑也在使用,但是频率不是太高
    Counter
        7
    Counter  
       2019-07-22 22:12:04 +08:00 via Android
    谢谢作者,你的作品很好用,希望走得长远
    yincheng
        8
    yincheng  
       2019-07-22 22:22:21 +08:00 via Android
    DuckDuckGo 有一个叹号搜索我觉得思路不错,不过他家做的感觉略微有点复杂。借鉴一下做成功能拓展应该不错。
    dezhou
        9
    dezhou  
       2019-07-22 22:41:25 +08:00 via Android
    给个建议,单纯的出于好奇是做不久的,看你的发展路线图,不如好好专研技术而不是做大而全的搜索,毕竟是个个人维护的,从技术角度出发反而可以做成一个有趣的事情。
    koodai
        10
    koodai  
       2019-07-22 22:56:52 +08:00 via Android
    翻看了一下原帖,天哪!交口称赞,楼主了不起,搜索试了一下,确实很出色。已替换默认搜索引擎,希望项目能长期健康发展。
    Exia
        11
    Exia  
       2019-07-22 23:33:54 +08:00
    自从楼主推荐了这个搜索,我就一直用了,挺好的,支持一下
    Yourshell
        12
    Yourshell  
       2019-07-23 00:08:57 +08:00 via iPhone   1
    先天太监与后天太监,不过狙击老太监百度我还是支持的
    gzdaijie
        13
    gzdaijie  
       2019-07-23 00:24:45 +08:00 via Android
    支持楼主!
    well666
        14
    well666  
       2019-07-23 00:45:20 +08:00 via iPhone
    对了,我刚才试了一下,有些结果虽然做了过滤,可是内容看起来还是挺讽刺的。
    香港还能搜到结果,虽然没什么特别敏感的,但是提到审查了。最近发生了那啥都懂的。hk01 还索引了真是...lz 专注非政治内容的话这些新闻媒体基本都是无关的,对于这个网站的目标人群来说也大都上不了,用 Google+duckduckgo+各种 news 基本上都能知道了,可以默认降权。或者参考后续那样的时间流,虽然来源换汤不换药但是好歹引用+时间线也算是尽力了(最喜欢看打脸,魔幻)。
    v2 都出国了.
    你这是铤而走险啊,希望能有个好结果吧。
    rogwan
        15
    rogwan  
       2019-07-23 00:46:54 +08:00 via Android
    @nicoljiang 如果只需要 3k 用户就能盈亏平衡,完全可以众筹一下开始啊。某度的搜索质量实在无法忍受了,基本都是 bing 和谷歌才能找到有效的结果,确实想要一个纯粹的搜索服务,我是愿意付这个会员费的。
    guiqiqi
        16
    guiqiqi  
       2019-07-23 00:48:09 +08:00 via iPhone
    支持大佬,下次在我的小破站里给大佬也做做宣传^_^
    AngryPanda
        17
    AngryPanda  
       2019-07-23 01:26:31 +08:00 via Android
    按照我的经验,要不了多久域名就会停止解析。
    xusp
        18
    xusp  
       2019-07-23 02:00:28 +08:00 via Android
    nicoljiang
        19
    nicoljiang  
    OP
    PRO
       2019-07-23 02:16:20 +08:00
    @well666 多谢多谢,刚刚已经处理了一波。
    @rogwan 你提的这个方向确实是点醒到我。但如果完全收费(登录后才可搜索),我倒不是担心付费用户够不够,而是搜索这一随时可能急用的功能本身的基础体验就会降低(试想万一随手想搜个东西还得登录一波,然后可能长期在桌面端记录的密码忽然不记得了)。所以上面帖子里我也说了,可能觉得最平衡的是:付费有部分增值服务+免广告,免费搜索的时候会有部分广告(例如:支持者名单)
    @dezhou 能否详细说一下,技术角度出发是怎么个思路?
    @yincheng 嗯,这个确实是值得参考,但 IR 也还是要做的(出发点不太一样)。
    @sunny2580839896 @Counter @gzdaijie @koodai 希望不辜负你们的喜爱,谢谢。
    @Yourshell 我觉得百度目前最大的问题不在于阉割敏感结果(毕竟大家都要活着才能提供服务嘛),主要的问题是搜索结果太不客观(百家号、贴吧、知道 等内容的权重远远高于他们应得的)
    @guiqiqi 谢谢你小老弟。
    nicoljiang
        20
    nicoljiang  
    OP
    PRO
       2019-07-23 02:17:02 +08:00
    @AngryPanda 你说的我都快哭了...
    MrGba2z
        21
    MrGba2z  
       2019-07-23 02:25:16 +08:00
    This site can ’ t be reached www.dogedoge.com ’ s server IP address could not be found.
    DNS_PROBE_FINISHED_NXDOMAIN
    kookpua
        22
    kookpua  
       2019-07-23 07:04:19 +08:00 via iPhone
    ios 的 safari 和 chrome 不能添加默认搜索引擎
    rogwan
        23
    rogwan  
       2019-07-23 07:11:26 +08:00 via Android
    @nicoljiang 从用户的角度看,只是希望有一个纯粹的高质量搜索服务,某度不是技术上做不到,而是被商业模式带歪了。狗搜索要可持续发展,无论会员还是广告,搜索服务的质量应该是优先商业模式的,会员服务比较纯粹,广告难免会影响搜索体验。

    登录影响搜索体验的问题很容易解决啊,免费未登录用户,按 IP 限制一下使用频率就可以了,搜索频率超过阙值跳登录框。

    1981
        24
    1981  
       2019-07-23 07:26:21 +08:00
    这个我还以为 DuckDuckGo,,,,
    welling
        25
    welling  
       2019-07-23 08:34:10 +08:00 via Android
    话说大佬是用业余时间搞,还是家里有矿
    xsdhy
        26
    xsdhy  
       2019-07-23 08:41:22 +08:00 via Android
    偶尔会用,有个建议,加上时间筛选,比如说一年内的
    chaorenry
        27
    chaorenry  
       2019-07-23 09:02:21 +08:00
    加油,即便失败了也比什么都不做好,顶多最后迫于压力关闭掉,但是很多人记忆种都会有你的作品,这也是一笔买不来的宝贵财富,互联网史里也会有你的一笔!
    Shazoo
        28
    Shazoo  
       2019-07-23 09:05:56 +08:00
    来个捐赠页面。这个必须要支持!
    amwyyyy
        29
    amwyyyy  
       2019-07-23 09:12:04 +08:00
    挺不错的, 已经设置为默认搜索
    atwoodSoInterest
        30
    atwoodSoInterest  
       2019-07-23 09:13:41 +08:00
    感觉“图片搜索、视频搜索、资讯搜索”这些不是很有必要,现在引入的用户应该大部分还是技术人员,对于这部分的需求不大吧?现在先活下来(有固定收入,内容审核),再丰富功能吧
    xiaotuzi
        31
    xiaotuzi  
       2019-07-23 09:29:24 +08:00 via iPhone
    已设置为默认搜索引擎,支持一下。
    担忧楼主收入问题以及合法性。
    我这里大胆做一个设想,也是我一直觉得也许可行的事情,或许可以降低一些成本(我个人认为)。

    设想:每人在搜索的时候都是用自己的电脑或者手机,会使用相关的软件这些,是否可以调用用户的设备处理器去处理相关搜索?这样就能分担一些服务器的压力。就是做成桌面软件,然后调用系统处理搜索功能。

    天马行空的想法啦,希望能有一些帮助。
    最后,希望楼主越办越好!
    xiaotuzi
        32
    xiaotuzi  
       2019-07-23 09:30:55 +08:00
    已设置为默认搜索引擎,支持一下。
    担忧楼主收入问题以及合法性。
    我这里大胆做一个设想,也是我一直觉得也许可行的事情,或许可以降低一些成本(我个人认为)。

    设想:每人在搜索的时候都是用自己的电脑或者手机,会使用相关的软件这些,是否可以调用用户的设备处理器去处理相关搜索?这样就能分担一些服务器的压力。就是做成桌面软件,然后调用系统处理搜索功能。

    天马行空的想法啦,希望能有一些帮助。
    最后,希望楼主越办越好!
    xiaotuzi
        33
    xiaotuzi  
       2019-07-23 09:42:15 +08:00
    已去 csdn 社区推送一波,只能帮助楼主到这里了!
    dazkarieh
        34
    dazkarieh  
       2019-07-23 09:46:11 +08:00
    用过一次就把 dogedoge 设置成 chrome 和 alfred 的默认中文搜索引擎,向周围的亲朋好友安利了一把,还顺手做了个简陋的 PopClip 扩展:
    https://github.com/bosconb/popclip-extension-for-dogedoge
    大佬能以一人之力做好这么大一个工程着实不易,感谢感恩,有困难吼一声。

    我赞同#30 的部分观点,图片视频先缓缓,活下来再说,印象中涉黄的很大部分都是图片视频。
    xusp
        35
    xusp  
       2019-07-23 09:47:52 +08:00 via Android
    @xiaotuzi 你的设想很外行啊。 搜索是个 io 密集操作,调用处理器做啥
    xiaotuzi
        36
    xiaotuzi  
       2019-07-23 09:52:46 +08:00 via iPhone
    @xusp 做个微型内置服务器处理搜索,类似 IDE,我们开发不是需要处理一些数据嘛,所以我觉得做成桌面应用可以直接使用电脑处理器处理。我确实不太懂搜索引擎如何开发,到我做本地 PHP 开发也是直接用 ide 完成执行程序的,不是吗?
    codespots
        37
    codespots  
       2019-07-23 09:54:36 +08:00
    据说大佬是个 PM,而不是 RD,佩服!
    pengbo37877
        38
    pengbo37877  
       2019-07-23 10:15:48 +08:00
    大佬联系我,可以投资
    zsl199512101234
        39
    zsl199512101234  
       2019-07-23 10:56:07 +08:00
    @rogwan 我选择 google
    xusp
        40
    xusp  
       2019-07-23 10:59:20 +08:00
    @xiaotuzi、、、、、、、我接下来说话有点难听了,但是,求求你不要秀你的见识了。
    nicoljiang
        41
    nicoljiang  
    OP
    PRO
       2019-07-23 11:14:37 +08:00   1
    @MrGba2z 看起来是解析有问题
    @kookpua Chrome 是可以的呀
    @rogwan 限制 IP 恐怕很难,ADSL 基本 IP 都在变的,然后移动基站 IP 又很集中,风险比较大
    @1981 嗯,两篇帖子都有提到,目前直接用了 duck 的皮。但我觉得哪怕只是把 Duck 像素级 Copy 得足够好,难度都很大,因为 Duck 是一个很优秀的搜索引擎
    @welling 搞了 1 年多的
    @xsdhy 多谢建议,后面会增加的。
    @chaorenry 感谢感谢,很燃,很有动力!
    @Shazoo 嘻嘻,近期上一下捐赠,多谢多谢
    @atwoodSoInterest 你说的有道理,这也是为什么迟迟没上的原因(资源消耗量大,安全成本很高)
    @xiaotuzi 超级感谢你帮忙推荐,虽然技术上可行性不太大,但这个想法脑洞很棒
    @dazkarieh 太棒了,希望多一些插件,顺便了解到一个军刀般的好工具
    @codespots 我相信若是一个专业的 RD,必然会做的更好
    @pengbo37877 竟然有金主爸爸垂青,您可以通过 [email protected] 联系我,或者留意下您的联系方式我来联系您
    Shazoo
        42
    Shazoo  
       2019-07-23 11:21:03 +08:00
    @nicoljiang 嗯。我也希望捐转股。嘿嘿
    wuhaoworld
        43
    wuhaoworld  
       2019-07-23 11:21:38 +08:00
    初期而言,「网盘搜索、图片搜索、视频搜索、资讯搜索」一点都不重要
    newworld
        44
    newworld  
       2019-07-23 11:24:20 +08:00 via iPhone
    黄赌毒不禁 活不久 一旦搞黑帽 SEO 的和菠菜的这些人知道了,你估计就快要 GG 了……搞菠菜的 百度都头痛的一波人
    bravecarrot
        45
    bravecarrot  
       2019-07-23 11:30:54 +08:00
    bug report:
    query=获奖 CG 短片
    结果页的 url 的 icon 都挂掉了。
    zkqiang
        46
    zkqiang  
       2019-07-23 11:40:49 +08:00
    希望能提供定向搜索,比如程序员工作中肯定希望搜到全是技术网站,而不会有其他干扰
    这种定向可以做成订阅付费的会员功能,至少我肯定会买的
    zkqiang
        47
    zkqiang  
       2019-07-23 11:42:10 +08:00
    毕竟有时候即使关键词很准确,但依然充斥着 广告文、营销文 等影响效率的页面
    nicoljiang
        48
    nicoljiang  
    OP
    PRO
       2019-07-23 12:49:43 +08:00
    @Shazoo 我也想过这种众包持股(因为其实想效仿 wiki )但法律好像不允许。
    @newworld 这个真是巨头疼,还有用 cn 域名搞的
    @bravecarrot 奇怪,我这儿看没挂呀...
    @wuhaoworld 明白,我会再权衡一下
    @zkqiang 嗯嗯,差不多就是垂直或行业内容搜索吧,后续的确考虑过作为高级功能来做。
    flowfire
        49
    flowfire  
       2019-07-23 13:09:14 +08:00 via iPhone
    我想知道敏感词是哪来的……有相关机构会给一张表吗,还是全靠自己猜……
    zkqiang
        50
    zkqiang  
       2019-07-23 13:35:38 +08:00
    @flowfire 文化局有敏感词库
    twor2
        51
    twor2  
       2019-07-23 14:10:31 +08:00   1
    初期而言,「网盘搜索、图片搜索、视频搜索、资讯搜索」一点都不重要 +1

    肯舍弃百度的转投的你这个搜索的,目前是哪些人?你的产品线路要照顾这些人,而不是对标百度
    haozes
        52
    haozes  
       2019-07-23 15:10:39 +08:00
    搜了下波多野结衣老师,LZ 的引擎搜出来的,不是我想看到的
    nicoljiang
        53
    nicoljiang  
    OP
    PRO
       2019-07-23 15:46:26 +08:00
    @flowfire 据我所知,没有官方词库,问过服务商也表示没有,不提供。靠网上资料+自己收集吧;
    @twor2 了解,有道理。
    @haozes 低俗内容方面,目前确实是短板,且短期内可能不是重点(没有政治资源护体,胆儿小)。
    melonzzz
        54
    melonzzz  
       2019-07-23 15:55:31 +08:00
    ![WX20190723-155334.png]( https://i.loli.net/2019/07/23/5d36bd363e72a28993.png)
    给大佬提个 bug
    melonzzz
        55
    melonzzz  
       2019-07-23 15:56:45 +08:00
    想知道大佬是如何实现的...真牛逼
    codingBug
        56
    codingBug  
       2019-07-23 16:00:55 +08:00
    加油,不过没有合适的变现途径的话,恐不长久。
    faketemp
        57
    faketemp  
       2019-07-23 16:05:56 +08:00 via iPhone
    广东 经常抽风 无法访问或者速度极慢 严重影响使用效果 如何破?
    iamalive2008
        58
    iamalive2008  
       2019-07-23 16:22:03 +08:00
    每天在用 支持一下
    rogwan
        59
    rogwan  
       2019-07-23 16:23:12 +08:00 via Android
    @nicoljiang 建议楼主做付费搜索服务,是因为你承诺不追踪用户行为,那你就失去了给用户精准画像的能力,推送广告你就做不好,保护用户隐私和精准推广告是相悖的。

    限制 IP 的方法怕误伤,随请求下发一个 session id 就可以了,放浏览器缓存,也可以用其他限制请求频率的方式。
    flowfire
        60
    flowfire  
       2019-07-23 16:45:16 +08:00
    @nicoljiang #53 讲道理,如果是我的话,我能接受在首页留个邮箱,然后注明, 可以用以 .gov.cn 结尾的邮箱发邮件来要求清除搜索结果和屏蔽关键词。
    但是如果是要我自己靠猜来自我阉割的话,那我还是呆在墙外吧
    nicoljiang
        61
    nicoljiang  
    OP
    PRO
       2019-07-23 17:11:34 +08:00
    @faketemp 可能是解析到国外的服务器(按理广东应该很快)。昨天换了新的 CDN 方案,不知道你今天感觉如何?
    @melonzzz 这个问题很奇怪,我总复现不了,你能帮忙看一下 http 请求吗(或者把微信发我邮箱 [email protected] 我加你)?
    @flowfire 有条件当然呆在墙外哦,不过你这似乎是个可行的办法。
    @codingBug 确实是现在需要考虑的事情了,尤其是搜索量起来之后。
    @iamalive2008 多谢多谢,愿能不负所望。
    faketemp
        62
    faketemp  
       2019-07-23 17:14:32 +08:00
    @nicoljiang 早上还行 十点以后到现在网站压根打不开 一直显示正在连接 或者无法显示该网站
    尝试了电信网络、移动 4G 都是一样问题
    faketemp
        63
    faketemp  
       2019-07-23 17:17:41 +08:00
    PING duckduckgo.com (69.171.237.26): 56 data bytes
    Request timeout for icmp_seq 0
    Request timeout for icmp_seq 1
    Request timeout for icmp_seq 2
    Request timeout for icmp_seq 3
    ……

    traceroute duckduckgo.com
    traceroute to duckduckgo.com (69.171.237.26), 64 hops max, 52 byte packets
    1 192.168.101.254 (192.168.101.254) 6.993 ms 1.196 ms 1.341 ms
    2 100.64.0.1 (100.64.0.1) 5.341 ms 3.673 ms 6.969 ms
    3 183.57.63.21 (183.57.63.21) 15.508 ms
    183.57.61.161 (183.57.61.161) 14.470 ms 30.643 ms
    4 97.96.128.219.broad.fs.gd.dynamic.163data.com.cn (219.128.96.97) 66.582 ms
    89.96.128.219.broad.fs.gd.dynamic.163data.com.cn (219.128.96.89) 14.527 ms
    183.57.62.1 (183.57.62.1) 8.885 ms
    5 * 202.97.94.122 (202.97.94.122) 31.916 ms
    202.97.94.126 (202.97.94.126) 11.475 ms
    6 * * *
    7 *
    faketemp
        64
    faketemp  
       2019-07-23 17:27:40 +08:00
    @nicoljiang 实测,域名被解析为国外 IP,而且该 IP 已经被和谐了 所以无法访问 原因未知

    打开那个那个之后,才可以流畅使用 呃 为什么广东访问会自动连接国外 CDN?……
    newworld
        65/div>
    newworld  
       2019-07-23 17:44:50 +08:00 via iPhone
    @nicoljiang #48 建议 迁移国外 更换域名 不然你的热血终将会被现实泼冷水
    mohoumk2
        66
    mohoumk2  
       2019-07-23 17:50:02 +08:00 via Android
    首先要把来自百度的 ip 拉入黑名单
    nicoljiang
        67
    nicoljiang  
    OP
    PRO
       2019-07-23 18:36:01 +08:00
    @faketemp 唔...那个...域名是 dogedoge.com ,不是 Duckduckgo 呀...( Duckduckgo 是我仰慕对象)
    @newworld 在国外太容易被屏蔽啦。希望通过遵纪守法,管控内容来安身~
    @mohoumk2 你是说百度公司嘛?哈哈哈,我群里已经有一个百度的同学啦~
    faketemp
        68
    faketemp  
       2019-07-23 18:45:42 +08:00 via iPhone
    @nicoljiang 哈哈哈 不好意思 是我乌龙了
    nicoljiang
        69
    nicoljiang  
    OP
    PRO
       2019-07-23 18:46:05 +08:00
    @faketemp Duckduckgo 在国内本身是被墙的。我想在国内做一个能赶超 Duckduckgo 的搜索服务。
    melonzzz
        70
    melonzzz  
       2019-07-23 19:06:16 +08:00
    @nicoljiang 发了
    kkkkkkkkkkkkk
        71
    kkkkkkkkkkkkk  
       2019-07-23 19:13:41 +08:00
    楼主真牛,这个是独立创业的项目吗? 需要人手的话,我可以考虑加入
    devtk
        72
    devtk  
       2019-07-23 19:31:53 +08:00
    做的真的很不错,点赞!
    yueye
        73
    yueye  
       2019-07-23 20:44:45 +08:00
    自定义搜索服务指的是 Google Custom Search。你误解成本地文档搜索了。。。
    Luzifer
        74
    Luzifer  
       2019-07-23 20:57:15 +08:00
    确实很好用
    nicoljiang
        75
    nicoljiang  
    OP
    PRO
       2019-07-23 22:34:18 +08:00
    @yueye 嗯嗯,我没有误解。我是指我是想着从这个角度出发来做自定义搜索。做一个百度现在已经做的很好的东西没有意义呀。
    @kios @Luzifer 很开心你们喜欢。
    @kkkkkkkkkkkkk 目前是 side 状态,你是做什么的呀?
    MyFaith
        76
    MyFaith  
       2019-07-23 23:23:47 +08:00
    https://myfaith-images.oss-cn-hongkong.aliyuncs.com/picgo/20190723232247-2019-7-23.png

    部分 favicon 有问题,不知道是不是我自己的问题
    MyFaith
        77
    MyFaith  
       2019-07-23 23:31:05 +08:00
    另外,没想到竟然有货币功能,其实用百度只是查汇率方便一些,其实也可以把计算器,长度转换这一类的做出来
    nicoljiang
        78
    nicoljiang  
    OP
    PRO
       2019-07-23 23:47:31 +08:00
    @MyFaith
    没错是有这些打算。货币方面,doge 的准确度理论上比百度高,并且货币种类更全( 167 个法币+6 个加密资产)、更实时。
    关于这个 icon 的问题,之前也有人遇到。但我始终复现不了,你能帮忙看一下「 F12 」里的情况吗?
    conver
        79
    conver  
       2019-07-24 00:08:00 +08:00 via iPhone
    貌似跟 Google 的搜索结果差不多,厉害了
    kkkkkkkkkkkkk
        80
    kkkkkkkkkkkkk  
       2019-07-24 12:11:49 +08:00
    @nicoljiang 我这边 Python、Java、前端项目以及基本的运维方面都没有问题,当然,都是互联网项目,没接触过搜索引擎相关的

    如果有需要的话,可以私聊,邮件我你的微信号到 doge # sbw.me
    kveln
        81
    kveln  
       2019-07-24 14:39:31 +08:00
    已设为浏览器默认搜索
    nicoljiang
        82
    nicoljiang  
    OP
    PRO
       2019-07-24 15:08:51 +08:00
    @conver
    @kveln 多谢喜欢,还有许多不足,但愿能尽快加强,不负期待。
    MyFaith
        83
    MyFaith  
       2019-07-24 16:45:23 +08:00
    @nicoljiang 晚上下班我回家看下,公司没有这个问题
    MyFaith
        84
    MyFaith  
       2019-07-24 21:08:54 +08:00
    @nicoljiang 家里已经正常了。。
    610915518
        85
    610915518  
       2019-07-25 08:00:36 +08:00 via iPhone
    备案就算了……
    jiumingzhu
        86
    jiumingzhu  
       2019-07-25 08:55:21 +08:00
    木秀于林,风必摧之,愿一帆风顺!
    公司不允许 FQ
    从正式发布就设为默认搜索了,好用~
    nicoljiang
        87
    nicoljiang  
    OP
    PRO
       2019-07-25 13:55:44 +08:00
    @MyFaith 好的。
    @610915518 没明白你的意思...
    @jiumingzhu 多谢支持~
    clownxiaoqiang
        88
    clownxiaoqiang  
       2019-07-26 10:09:28 +08:00
    做的挺不错的,日常在 google 和 doge 之间切换使用
    KamenReborn
        89
    KamenReborn  
       2019-07-27 19:28:26 +08:00
    搜索质量相当不错!
    yigemeirenyongde
        90
    yigemeirenyongde  
       2019-07-30 17:53:39 +08:00
    怎么感觉老哥你是采集 google 的?
    MyFaith
        91
    MyFaith  
       2019-08-03 13:02:21 +08:00
    提个 BUG,搜索结果页面,点击描述空白位置会打开很多个新标签页,三台机器都是这样
    zepto
        92
    zepto  
       2019-08-09 11:41:02 +08:00

    推荐已发,从你发布后不久就开始用了
    nicoljiang
        93
    nicoljiang  
    OP
    PRO
       2019-08-09 14:09:27 +08:00
    @zepto 感谢,并且记下了,努力不负所望
    @MyFaith 我排查一下这个问题,谢谢你反馈
    luckrill
        94
    luckrill  
       2019-08-10 22:32:08 +08:00
    因为对搜索引擎的不满意,我开发了 搜索引擎工具

    http://search.readmorejoy.com/

    欢迎大家看看,提些建议
    zepto
        95
    zepto  
       2019-08-19 19:36:24 +08:00
    杭州电信好像有点不稳定
    nicoljiang
        96
    nicoljiang  
    OP
    PRO
       2019-08-20 02:08:19 +08:00
    @zepto 这个黄色的应该是 Initial connection 过程。
    如果能稳定复现,麻烦你看一下请求的 IP 是哪个。(说不定解析到国外去了)
    koodai
        97
    koodai  
       2019-08-22 17:41:16 +08:00 via iPhone
    作者你好,我设为浏览器默认搜索有一阵子了,Chrome 最新版、win10 系统。之前搜索 OK 的,最近划词搜索总是跳到首页去。不知道是做了什么规则处理吗? 还有,经常性从搜索结果页跳第三方的时候速度很慢。

    期望你的改进
    nicoljiang
        98
    nicoljiang  
    OP
    PRO
       2019-08-23 00:53:59 +08:00
    @koodai 你好。Chrome 划词搜索会自动跳到首页一般都是关键词的变量设置错误。当监测到关键词为空的时候,就会自动跳转到首页。
    另外,跳入第三方慢的话,多半可能是那个网站较慢(因为多吉目前会对一些繁体、英语结果放行,这些网站很有可能服务器不在大陆,但拥有一些高质量的信息)。如果你确定是平时访问很快的大网站,不知道是否能做一些跟踪,比如告诉我是什么网站,什么关键词。
    可以随时跟我邮件沟通: [email protected]
    多谢喜欢~
    dezhou
        99
    dezhou  
       2019-08-23 03:03:02 +08:00 via Android
    @nicoljiang 从技术上做得更有特色一些,比如响应时间、存储格式、压缩比、多媒体、网络架构、检索的域名范围、分词算法、倒排,单纯的堆砌功能跟百度的几万人 PK 胜算为 0,但百度的弱点在于架构上很难改变,而这个就是从创新上可以打败大公司的一个方面
    nicoljiang
        100
    nicoljiang  
    OP
    PRO
       2019-08-23 11:35:56 +08:00
    @dezhou 说的有道理。不过难点也在这里,就算 pk 算力、算法,索引范围,规模,都很难跟百度相提并论。确实得保持一些自己的特色,然后在便利功能方面,尽量完善。
    1  2  
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     933 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 34ms UTC 22:37 PVG 06:37 LAX 15:37 JFK 18:37
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86