如果有一个网站,收录了国内几乎所有的网站并提供各行各业分类展示与快搜直达。请问这个网站是否合法合规,能否存活? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wjpdev
V2EX    问与答

如果有一个网站,收录了国内几乎所有的网站并提供各行各业分类展示与快搜直达。请问这个网站是否合法合规,能否存活?

  •  
  •   wjpdev 2020-12-30 09:20:20 +08:00 3804 次点击
    这是一个创建于 1746 天前的主题,其中的信息可能已经有所发展或是发生改变。

    几乎所有的网站定义: 包含所有网站,但违反法律法规的除外。

    32 条回复    2021-01-04 11:40:19 +08:00
    SmallTeddy
        1
    SmallTeddy  
       2020-12-30 09:23:38 +08:00
    这不就是列表网嘛
    ArJun
        2
    ArJun  
       2020-12-30 09:24:52 +08:00
    又来了
    natashahollyz
        3
    natashahollyz  
       2020-12-30 09:25:54 +08:00 via iPhone
    违反法律法规的除外,那还有啥不合规的?你说的不就是类似于 hao123?
    henryhu
        4
    henryhu  
       2020-12-30 09:37:51 +08:00
    问题:
    1. 新的网站、失效的网站每天都在变化,维护这样一个列表很困难,要进行分类更是难以做到。
    2. 搜索引擎之前的门户网站就是干这事的,谁来用这个分类展示?与搜索引擎相比有什么更好的地方?
    MinonHeart
        5
    MinonHeart  
       2020-12-30 09:41:27 +08:00
    早年的黄页。没生存空间,死掉了
    XPo
        6
    XPo  
       2020-12-30 10:12:54 +08:00
    hao123
    wjpdev
        7
    wjpdev  
    OP
       2020-12-30 10:35:01 +08:00
    hi, @natashahollyz

    和 hao123 、`这个网站`是我的一个 idea, 我想它和目前所见的各类导航网址差别还大的哈,主要区别先列这些:

    1. 它的网址库非常全,,但也非常专一,就只有网站,可以参考 producthunt.com 只有 product 。目前常见的导航来来去去也就国内经常访问的那些知名网站,数量仍然极少,想看点别的站点,只能靠搜索. 你再去看看 hao123, 已变形为信息流网站了

    2. 但现有的搜索引擎呢都是基于内容搜索,做的又大又通但不细不专,夹杂广告更难找到目标网站.

    3. 可以把它另定义为 网站 Dictionary, 我们通常情况自然用不到它,靠搜索就搞定。但又在某一时刻可以给用户提供极大的便例,我这举 3 个粟子:
    1. 一少部分人有好奇心,想访问一次他从来没访问过的网站,看看这些网站怎么样;有些无聊的网友也有一天想看看有没有什么好玩的网站
    2. 我想找一个地方的学校内部某学院官网,一般都是进到学校首页,或者再进一步,翻友情链接去查找,还不一定能找到.
    ...

    但`这个网站`,你给点关键字,啪,就很直白的给你列出来,会不会很方便?

    往里面挖掘还有很多可说的,就不讲了

    4. 这个世界上还有很多新鲜、有趣、实用、好玩的网站,一直都存在,但从来未露面。因为我看相当大部分人都走在一条大道上( baidu 搜索),`这个网站`就希望可以开僻小径,给这些人一个机会,也给那些很难露面的网站一些机会。

    5. 现在已经有各行各业细分领域内的垂直导航,特别是设计、前端、工具类尤其多,哈哈。在我眼里只能算小湖泊,但我希望 是大江大河呀

    现在世面上还并没有 `这个网站` ,难道就是因为死掉了吗
    wjpdev
        8
    wjpdev  
    OP
       2020-12-30 10:36:57 +08:00
    @henryhu
    1 确实有很多难点,哈哈,可以想办法解决
    2 上面讲了
    henryhu
        9
    henryhu  
       2020-12-30 10:53:43 +08:00
    细分领域,专业的人员有自己的常去的网站,自己的圈子信息能够发现新的网站。大而全的分类在细分领域是没有竞争力的。
    henryhu
        10
    henryhu  
       2020-12-30 10:57:37 +08:00
    我在做一个公众号平台,是给流量小的公众号一个展示的平台,哈哈,有类似的地方
    Xusually
        11
    Xusually  
       2020-12-30 11:00:13 +08:00
    Google 即可 只要你搜索的关键词准确
    百度就太烂了
    koor
        12
    koor  
       2020-12-30 11:06:04 +08:00
    合法,存活就不好说了。现在大部分人都是 app 小程序公众号,百度的日子都不好过
    DaRenCC
        13
    DaRenCC  
       2020-12-30 11:06:08 +08:00
    支持你,但除非你真的做到了包含所有行业的网站,不然我还是百度一下来得快
    natashahollyz
        14
    natashahollyz  
       2020-12-30 11:20:47 +08:00
    @wjpdev 看了下 producthunt, 这样的站肯定是没有法律风险的,你自己都说了违反法律法规的除外
    Jooooooooo
        15
    Jooooooooo  
       2020-12-30 11:31:56 +08:00
    给导航网站导航的网站?
    leibuting
        16
    leibuting  
       2020-12-30 11:43:22 +08:00
    看到你这个想法有点恍惚,好想一下被拉回到小学在朋友家里两个人挤在大头显示器前面他给我接受什么是浏览器,什么是主页,然后美滋滋的点开网页小游戏
    hoyixi
        17
    hoyixi  
       2020-12-30 12:09:39 +08:00
    曾经的 黄页,当年还没有搜索引擎,黄页充当了一个入口
    shansing
        18
    shansing  
       2020-12-30 12:22:43 +08:00
    十多年前我似乎看到哪里说互联网的入口是分类目录和搜索引擎,但我不知道“分类目录”是个啥。
    huayumo
        19
    huayumo  
       2020-12-30 13:12:52 +08:00
    但是现在网站几乎都没用户,垃圾内容太多了,没什么价值,别局限于网站
    wjpdev
        20
    wjpdev  
    OP
       2020-12-30 13:36:59 +08:00
    @koor 确实如此,哈哈
    wjpdev
        21
    wjpdev  
    OP
       2020-12-30 13:38:44 +08:00
    @Jooooooooo 必须的,网站导航的网站也是网站,哈哈
    wjpdev
        22
    wjpdev  
    OP
       2020-12-30 13:44:14 +08:00
    @hoyixi 赞同,本质就是一个 big 黄页,马云当年要做的一个东东
    wangrongli
        23
    wangrongli  
       2020-12-30 14:58:56 +08:00
    问题一,首先你如何搜集这些网站?要知道百度展现这些网站也是百度收录了的才予以展示,更多的网站百度是搜不到的,要直接输入网站的域名或者 ip 地址,因为有些网站没有绑定域名,你如何保证自己的爬虫比百度还牛 X 。

    问题二,如果问题一的你解决了,要知道很多人基于百度搜索是关键词模糊搜索,比如:感冒了吃什么药?然后进入到一个网站,然而这是一个内页,网站的首页或者网站的名称与感冒了吃什么药一点关系都没有。你如何保证用户的需求与你做的列表网站匹配,正是因为基于好奇,用户也肯定不知道自己要搜什么样的网站,你如何解决?
    wjpdev
        24
    wjpdev  
    OP
       2020-12-30 15:41:49 +08:00
    @wangrongli 谢谢,提的问题很好。我想肯定没有一个十全十美的解法,它应该是已经可以满足一些人的需求,但又挡掉了另一些人的需求,人与人之间对它的需求本身有大量的矛盾存在,`这个网站`的需求实现肯定也是,哈哈。

    1. 可以只考虑能通过域名访问的网站
    2. `这个网站` 并不 care 网站内容,这不是它要做的事情。它要做的事情很简单:1. 它是一个网站,2. 网站是活的, 可以访问.

    用户感冒了,他会搜医院、搜药店,`这个网站`会直接列出数量最全的国内各医院官方网址列表,列出线上卖药的网上官网列表,如果他知道常见感冒药的名字或厂商,`这个网站`能最快的送你到厂商的官网查看关于药的作用,或厂商的详细信息。
    常规通过百度搜索,大家都懂的,百度做的不够好,很容易带用户掉坑里去,也浪费用户的时间和金钱


    你提到的需求点: 用户也肯定不知道自己要搜什么样的网站
    方案 1: 开一个 page 展示各类最近新收录的网站,用户随意浏览. 万一有一个他就感兴趣了呢
    方案 2: 加个 vote 功能,通过大众用户投票选出各类 top rank 网站供用户选择

    我觉得时间久了,应该会在各类别中沉淀出一些优质的、实用的、好玩的、新奇的网站 rank
    FallenTy
        25
    FallenTy  
       2020-12-30 16:51:03 +08:00
    很多小网站,没用过之前只看名字页面根本不知道是干啥的,你怎么让用户能根据搜索进去呢
    huzy8002as
        26
    huzy8002as  
       2020-12-30 17:39:11 +08:00
    你这想法优化到最后,其实和搜索引擎也不会有太大的区别。单单只是搜索网站域名,没什么人会有兴趣的,你就得不断改进,改进到后面,发现模板就是搜索引擎。
    wuzhanggui
        27
    wuzhanggui  
       2020-12-31 08:36:22 +08:00
    站搜搜? https://www.zhansousou.com/mini
    可以搜索网站,一键直达
    lonewolfakela
        28
    lonewolfakela  
       2020-12-31 10:07:10 +08:00
    @shansing 说的就是 LZ 提的这种网站,最典型的代表是当年的雅虎……都是被时代淘汰的网站类型了,现在的人没听说过,以为自己又想出来什么新 idea 当大发现一样发出来……
    sillydaddy
        29
    sillydaddy  
       2020-12-31 13:29:38 +08:00
    需要再深入想想啊,因为我总感觉你是停留在表面的想象上,而没有深入分析。
    你举了几个例子,用来说明这个网站存在的必要性:
    1. 一少部分人有好奇心。。无聊的想看看好玩的网站
    2. 给个关键字,一下子找到学院官网
    4. 有很多新鲜、有趣、实用、好玩的网站,没被人发现
    5. 行业细分,细分领域有很多值得挖掘的

    1 和 4 很明显是重复的,其主要目的就是,让用户可以主动发现新鲜的网站,
    2 的话,搜索引擎会比这个网站差?
    5 的主要目的,深入想一下,会发现跟 1 和 4 是一样的网站细分不就是为了让人便于主动发现吗?

    所以,这个网站的意义就是:让人**主动发现**新鲜的东西。
    这里的**主动发现**,是指那些搜索引擎不能直接提供的,搜索引擎不能理解的,比如“推荐一些有趣的前端网站 /工具”。

    那么这种**主动发现**,如果要做成全领域各行业的,那得是多大的投入呢?
    . 收集的网站,总数得是亿万级别的吧;
    . 然后是分类分行业,光靠域名不行,还要分析网站的内容,这个靠人工?
    . 只分类也不行啊,因为想做的是找到新鲜有趣实用好玩的,所以要给它们排名,或者有推荐机制,越好的越靠前,否则一个分类下成千上万的网站怎么能行。比如独立博客的量级至少有几十万吧。

    当然,可以只做好收集和分类,然后把某个细分领域的所有网站列出来,留给用户自己去筛选。但即使是只关注某个细分领域( 比如你说的,发现“设计、前端、工具类”里面的新玩意儿) ,像前面说的“收集网站、分类”还是要做,而且靠程序不行,因为程序理解不了,还是要人工来做。。这个工作量。。一个细分领域尚且不能,谈何做各行各业呢?
    wjpdev
        30
    wjpdev  
    OP
       2021-01-04 10:46:03 +08:00
    @wuzhanggui 不错啊,和 idea 比较像了,UI 很棒
    wjpdev
        31
    wjpdev  
    OP
       2021-01-04 11:33:48 +08:00
    @lonewolfakela 哈哈,不要局限于过去 黄页 样子的旧思维模式,据我所观察到的,现在大部分的黄页和导航网站仍然停留在过去和今天的样子。我设想的 idea 里 `这个网站` 还是会有所不同:

    过去 装时代: 一个简单的静态 page, 按主要分类罗列了国内主流、大众经常访问的 website,总的算下来网站数量几十来个上百个,website 列表不会怎么变,转来转来就那一些。尤其是零几年那会著名的 hao123 导航,给国内普通网民带了方便,毕竟当年网站少,确实也就那么一些靠谱的,现在看就狭隘了,反而局限的大众的眼光,普通网民知道的还是当年的那一批 website 。

    现在 新衣时代 1: 仍然是一个简单的静态 page,UI 变好看了,page 顶部 嵌上了 Google\百度\搜狗 搜索功能,website 内容更丰富了,但是:website 数量仍然偏少,远不匹配目前井喷式的各类网站数量,相当相当多的网站是没有机会出现在导航里面的。另外 上面嵌入的各类搜索引擎,仍然是基于网站内容搜索,我想搜一个符合特征(比如高校)的网站,仍然逃不脱要在各种信息、知识、广告、内容的搜索结果中去靠自已进一步过滤掉不想的信息。

    我作为一个网民,核心要求很简单:我只想得到一个 target website, 我不想在那么多杂七乱八的内容信息里扒出那个 target website 。
    现在有吗?

    新衣时代 2(1+1): 做细分垂直类的网站导航,优点:把某一个专业下的出名的、很好的网站罗列出来了。比如工具类、设计类、产品类、资源素材类的细分导航。缺点:和新衣时代 1 差不多。

    上面共有的缺点:新网站、极少数优质的网站大部分网民仍然不知道它们的存在,它的出现只存在于某些人的知乎答案中,各种网文的网址推荐中。如果运气好,你可以看到它,访问后觉得:确实不错,是个好网站。

    未来 标签、智能时代 (`这个网站`):
    1. 很显然数量要比新衣时代上一个指数台阶,
    2. 收录的网站是什么类型,什么性质,什么特征,什么功能,什么属性,给它打上 n 种标签
    3. 如果未来人流量可以起来,基于大数据,`这个网站`知道了哪些网站是热门的、哪些是好的差的,哪些是大牌,哪些是小众,哪些是新生,提供给网民各种指标下的网站内容集合。我想信这可以给网民们带来一些价值。

    `这个网站` 要开刀的对象很简单:只 care 你是个网站,其它我不管。

    有人会说,那你不管,谁来管?

    交给网民来管怎样: 他访问了,觉得很烂,就用脚投票它,觉得很棒就大拇指。

    我举几个例子,有的网友可能会遇到:

    > 今天我手上有个 pdf 文件,想转成 doc, 上搜索引擎搜 pdf 转 doc 。 奶奶的,找了半天没一个好用的,有的还要钱?!
    > 我想找一个网站下载一个 4k 高清电影,上搜索引擎搜 4k 高清, 奶奶的,各种电商卖显示器、其它的内容...
    > 我想找一下能下载 磁力链接的网站,怎么这么难?
    > 考上大学了,我不知道湖北武汉科技大学有哪些学院,他们的官网我想看一下介绍. 靠百度? 还得您费时间在结果再找一找


    -------------------------------
    上面是我暂时想到的一些点,参考一下,哈哈。
    wjpdev
        32
    wjpdev  
    OP
       2021-01-04 11:40:19 +08:00
    @sillydaddy

    1 收集的网站,总数得是亿万级别的吧 ? <------- 这个我调研过,往大了点算,国内网站总数量也就百万个,不超过千万。
    > 据统计,截至 bai2017 年底,我国网站数量 du 达到 526.06 万个。从 zhi 地域分布看,我国网站 dao 发展情 zhuan 况与经济发达程度密切相 shu 关,总体呈现东部地区多、中西部地区少的发展格局,区域发展不协调、不平衡的问题较为突出。截至 2017 年底,东部地区网站占 68.91%,中西部地区占比分别为 18.49%和 12.61%。
    > 2018 年底中国有 500W 个网站 来源:卢松松博客
    这个量大吗?

    2. 像前面说的“收集网站、分类”还是要做,而且靠程序不行,因为程序理解不了,还是要人工来做。。这个工作量。。一个细分领域尚且不能,谈何做各行各业呢? <------ 对的,这个正是最难的部分,哈哈,所以挑战性在这儿。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     900 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 19:31 PVG 03:31 LAX 12:31 JFK 15:31
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86