笔记软件最重要的功能是搜索关于笔记工具的思考(上篇) - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
sillydaddy
5.49D
4.91D
V2EX    分享发现

笔记软件最重要的功能是搜索关于笔记工具的思考(上篇)

  •  1
     
  •   sillydaddy 2021 年 11 月 29 日 5775 次点击
    这是一个创建于 1504 天前的主题,其中的信息可能已经有所发展或是发生改变。
    帖子稍微有点长,但都是自己的系统思考和整理,可以看大纲了解结构,重点已用黑体标出。 

    这篇以笔记的搜索功能作为切入点,思考笔记软件应该怎么做,怎么用。希望对那些困惑于笔记方法,或者想用好「双向链接」软件的人有帮助。

    为什么重要的是搜索,而不是整理

    我觉得大家不得不承认,记笔记最困难的地方,在于将散乱无序的一“堆”笔记,整理为结构化且有序的笔记。

    有序化不难理解,就是把多个笔记的片段,打乱后再重组和加工的过程。比如多个关于内存管理的笔记片段,抽取其中所需部分,然后排序、抽象、按照逻辑组织起来。写文章的过程最能体现这点。

    而上述漫漫长路中的第一步,是要把「所需的相关材料罗列在一块儿」,这就必须要用到快速而准确的搜索功能

    同样,作为一个知识库,要能在其中随时搜索,找到所需的某个或某类素材,快速而准确的搜索功能同样是必须的。寻找某类素材,可能是为了上面所说的「有序化」,也可能是为了思考,将知识抽象升华为类似智慧的东西。这应该算是除了「随取随用」之外,笔记软件的「高阶功能」了。如果连素材都没有,其他就更别提了,而且不仅要能搜索到,还需要搜索得快速、准确。

    总结下来,我认为笔记软件的功能大概可以描述为:

    1. 快速搜索到所需信息,充当知识库;
    2. 缓存一些未经整理的事实和观点,为后续的思考和整理,提供必要的素材,并保存整理好的知识结构;

    这些都需要快速而准确的搜索功能

    搜索为什么很难

    一个例子

    “今天见了好友老张,在大排档吃了顿烤串,很高兴”

    搜索功能看起来不难实现,毕竟计算机运算速度如此之高。但我觉得做好它很难。 以上面的记日记的例子来说明(这个例子很典型,后面也会经常用它)。

    仅在这一句话中,就包含了至少 3 类信息:

    • 「社交活动」与老张聚会
    • 「饮食」吃烤串
    • 「心情」高兴

    想象一下,当你想要搜索出自己的社交活动时,这句话会提供给你「见了好友老张」这个信息,当你希望知道自己的饮食活动时,则是「吃烤串」,等等。

    这个例子并不是强调精确地「数字化自己的生活」,我想通过它强调的,主要是下面 2 点:

    1. 单条语句中,包含了多个视角(维度)的信息。
    2. 单条语句中,包含了多个视角(维度)的信息。

    「单条语句」困境

    第一要点,是单条语句

    它隐隐指向的是,想通过「标题」、「标签」等方式来涵盖一篇笔记内容的努力,是徒劳的。因为仅仅一句话就包含了这么多信息,何况整篇笔记。

    虽然一篇笔记的内容,一般能用笔记的标题概括我们也总是通过新闻标题来决定是不是点进去。但是,「整体不等于部分之和」,整体的概念与各个部分的概念是不同的。

    比如「人体的构成」这一抽象概念,并不包含「头」、「躯干」、「四肢」这些抽象概念。再比如这篇帖子,用「笔记软件的搜索功能最重要」来概括其内容很合适,但这篇帖子里面的内容,包括(consist of)了「笔记软件作为知识库」、「对知识进行整理、抽象、思考」这些其他的概念,是标题完全无法覆盖的。如果你感兴趣,甚至可以发现里面有「日记」、「数字化自己的生活」、「计算机运算速度」这样的东西。

    局部也有信息,而且与整体的信息往往并不相同。信息可以是多层次的。这点恰好与 RoamResearch 等笔记软件中「块」的概念不谋而合。既然局部包含了与整体很不相同的信息,那么让笔记的「标题」、「标签」来“代言”整篇笔记的所有信息,显然是不够的。

    「多个视角」困境

    再说第二个要点,也就是多个视角

    上面的日记例子中,一句话就能提供多个观察的视角,并不是一个偶然。因为一句话总是由多个词组成的,那么一个「知识点」也肯定是包含多个「知识要素」。

    比如一篇笔记,标题为「 Javascript 语言的内存管理机制」,姑且不谈笔记的内容,单单这个标题,就至少包含了「 Javascript 语言」和「内存管理」这 2 个要素。只谈「 Javascript 语言」或只谈「内存管理」都是不完整的。

    「一句话是由多个词组成的,一个知识点是由多个知识要素组成的」,这么直白的道理,会把我们引导到什么思考的方向呢?我想有 2 个:一个是树状结构的笔记。一个是标签。

    我看到过一些认真讨论笔记分类的文章,甚至借助于「中国图书馆分类法」,来试图将笔记分门别类。但根据上面的逻辑,会发现它面临的问题是多方面的,比如,

    • 「整体不等于部分之和」意味着,虽然整篇笔记可以归到某个类别,但并不意味着每个组成部分都可以归到该类别,只归类笔记的整体,就意味着内容部分的归类失败。
    • 「一个知识点是由多个知识要素组成的」意味着,仅仅根据标题,一篇笔记就足够归类到多个不同的类别了,更别提笔记中的内容了。树状的归类是先天不足的。

    于是又有了在树状结构分类的基础上,给笔记添加标签的尝试。这很好的回应了信息具有「多个视角」这点多个标签就是多个视角。但这些标签毕竟是添加在整篇笔记上的,不能完整反映笔记内部内容的信息「整体不等于部分之和」。

    「关键词搜索」的困境

    说完上述的「单条语句」和「多个视角」困境,再来讨论一下「关键词搜索」。

    「关键词搜索」,既可以精确定位到「单条语句」,同时配合多个关键词,还可以从「多个视角」筛选信息。看起来是完美的,但用过 Evernote 搜索功能的人,恐怕都不能满意吧。

    还是看上面的例子,「今天见了好友老张,在大排档吃了顿烤串,很高兴」,这句话体现出的 3 个视角,「社交活动」+「饮食」+「心情」,有哪个能通过关键字快速匹配到呢?这些词一个都没有出现在句子里。

    关键词搜索的弊端,是显而易见的,

    1. 匹配得太少,虽然句子中包含关键词都意思,但并没有出现关键词(如上例)。
    2. 匹配得太多,句子中出现了某个词,但这个词与句子的主要意思关系不大,这个词只是偶然出现。
    3. 以单个笔记为搜索单位,导致同一篇笔记的同一个关键词出现多次。
    4. 以单个笔记为搜索单位,导致使用多个关键词搜索时,匹配到的关键词可能在笔记中相距很远,没有明显的关联。比如搜索「 Javascript 」+「内存管理」,可能一篇笔记中 2 个地方分别提到了这 2 个词,但没有关联。
    5. 速度很慢。考虑到计算机运算速度和笔记的规模,这点倒不一定有大的影响。

    上述的弊端,导致使用关键词搜索时,总免不了最后走到“人眼过滤”这一步,低效,让人望而却步。

    其实不只是关键词搜索,基于树状分类、标签的过滤搜索,大概也免不了大量的“人眼过滤”,因为它们都不够精确。

    对搜索难的应对

    我不知道大家都是怎样应对“搜索难”的困境的,根据我的经验+猜测,大概就是:

    1. 逃避不用,或者偶尔搜索+“人眼过滤”。笔记基本不整理。
    2. 使用自己感觉好用的笔记分类,特别是只分大类不分小类。可能也会配合使用标签。

    但这些并没有解决前面提到的问题。尤其是对于想要构建自己知识库,并使用「高阶功能」的人来说。当然,有意无意忽视或绕过上述的问题,也是一种办法。比如,

    1. 降低对笔记软件的依赖,软件不是万能的,要时刻有个「好脑子」。
    2. 忽略知识间的关联,那些关联对我来说不重要,不去考虑那么复杂,无所谓。

    不过如果找到了问题,并能用工具解决,为啥不偷点懒呢?其实经过上面的思考,解决方案可以说已经呼之欲出:使用局部的多标签

    后面我会再发帖,讨论一下**使用局部的多标签**能不能解决问题,能解决到什么程度。还有它怎样在 RoamResearch 、Logseq 这些笔记软件中实现,我觉得这种局部标签才是「双向链接」的正确用法。还有就是,一般人理解的「双向链接」所形成的「关系图谱」可能有很大的问题,比如 Obsidian 和 Logseq 形成的关系图谱,(RoamResearch 的还没有用过)。我觉得**局部多标签**形成的网状结构才是真正的「关系图谱」。 
    第 1 条附言    2021 年 12 月 31 日
    14 条回复    2024-11-10 15:53:48 +08:00
    yuancoder
        1
    yuancoder  
       2021 年 11 月 29 日
    没啥用
    cairnechen
        2
    cairnechen  
       2021 年 11 月 29 日   2
    省流助手:搜索的本质是内容的组织,楼主下一篇会继续讲内容如何组织 [不建议阅读全文]
    ivyliner
        3
    ivyliner  
       2021 年 11 月 30 日
    个人很认同作者的观点, 记事本的核心功能是搜索, 不过信息其实不太需要整理, 就像你用 Google 搜索一样, 你不需要也无法整理 Web, 但是你还是能找到你想要的内容.

    我基本上通过 keyword + tag 就能满足我的需求, 效率的话其实就算出现作者说的人肉过滤其实也能接受啊, 找到之后加一下 tag 就好了, 一次性的成本.
    我目前用了 Evernote 写了有 3k+ 个笔记, 其它的再好用我也不可能折腾迁移一遍啊.

    想起一句笑话, 笔记工具太多, 不知道怎么记笔记了.
    估计我老了, 不在追求各种效率工具, 有时候感觉慢反而是一种快.
    sillydaddy
        4
    sillydaddy  
    OP
       2021 年 12 月 1 日
    @ivyliner > “。。记事本的核心功能是搜索, 不过信息其实不太需要整理。。”

    「整理」对于一些人是必须的:
    比如写博客(书)的人,成品需要大量的素材积累。
    还有知识的升级(如 DIKW 模型,数据->信息->知识->智慧),也是需要一个总结整理的过程。

    很多人对于知识的需求是「随用随查」,好用的搜索就够了。


    @cairnechen > “搜索的本质是内容的组织,楼主下一篇会继续讲内容如何组织[不建议阅读全文]”
    我觉得你这句话与其说是概括了这个主题,不如说更让人迷惑了,因为用了太多的抽象词。

    这篇帖子的大概逻辑是:为何搜索最重要 -> 为什么搜索很难 (当前的方案有哪些缺点) -> 解决之道

    我实在不知道你的[不建议阅读全文],是基于哪一点?说一些抽象的不知所云的话,总是很简单。
    ivyliner
        5
    ivyliner  
       2021 年 12 月 2 日
    @sillydaddy 嗯, 确实有些场景, 每个人的习惯不太一样.
    " 知识的升级(如 DIKW 模型,数据->信息->知识->智慧),也是需要一个总结整理的过程。 "
    这个模型我不是特别有感觉, 我一般都是先从知识开始, 然后在去找信息, 再去找数据来验证信息可靠性,
    所以可能更多是用的金字塔模型. 笔记也更多记得是知识和知识的推理过程. 其它的信息和数据基本上也是靠搜索出来, 所以对于我个人来说搜索是特别重要的, 整理反而很少.
    当然这个只是我个人的习惯.
    rpman
        6
    rpman  
       2021 年 12 月 2 日
    首先树状结构很蠢, 这个锤过很多次了
    rpman
        7
    rpman  
       2021 年 12 月 2 日
    然后无论是找链接还是找标签,本质都是搜索,只不过留下了一些路标罢了
    rpman
        8
    rpman  
       2021 年 12 月 2 日
    一直觉得知识的归纳属于额外心理负担。理想状态下应该由笔记软件自动挖掘和提示。
    sillydaddy
        9
    sillydaddy  
    OP
       2021 年 12 月 2 日
    @rpman
    > “。。无论链接还是标签。。本质都是搜索,只不过留下了一些路标罢了”
    > “。。理想状态下应该由笔记软件自动挖掘和提示”

    确实,如果能够靠人工智能自动挖掘最好了,但目前至少还没有实现。具体的困难在主题中的「搜索为什么很难」这节提到了。

    我的看法是,目前流行的「双向链接」,相当于是留一些「锚点」在关键的地方,而且使用时,反向链接会自动把这些「锚点」起出来。这样,挖掘和提示的工作都由软件做了。需要人工做的,就只剩下在记笔记时,随时埋一些「锚点」了。而这部分工作所造成的认知负担,我觉得算是很小了仅仅是用几个抽象的关键词概括一段话的意思。「锚点」本身也需要整理,比如合并、关联等,这部分工作量也不会大,毕竟抽象的关键词就那么一些。
    liuzhaowei55
        10
    liuzhaowei55  
       2021 年 12 月 16 日
    很赞同题主的观点,目前个人做法是吧笔记软件逐渐转换为了 DokuWiki 这个自搭的网站,搜索就是我看中它最重要的原因,知识点经过整理后再用语雀这种适合大众阅读的网站输出。
    sillydaddy
        11
    sillydaddy  
    OP
       2021 年 12 月 18 日
    @liuzhaowei55
    看了下 DokuWiki 的搜索功能: https://www.dokuwiki.org/zh:search
    确实比较丰富。

    但是我感觉,还是会遇到全文搜索的种种问题:匹配不上、匹配过多,等等等等,具体可以看主题中的分析。
    后面的续篇,我会写一下我认为怎样做搜索比较好,并给出实际的例子,欢迎再讨论。应该就是这两天吧。
    guozhaohui628
        12
    guozhaohui628  
       2022 年 4 月 15 日
    文章中看到很多赞同的观点,我也做个回复。

    为了做内容需要,我也会把玩各种笔记软件,但我完全不推荐大部分人把时间陷进去,折腾这些所谓的生产力工具。一定一定要明白自己的需求是什么样的,选个差不多的就行了,没那么完美的软件。

    这是我的要求,最后我还是继续用印象笔记(别笑...),只不过用的是 2015 年的老版本。

    1 、尽量功能简洁、朴素,少折腾,要踏实的用上工具本质功能,别搞得每天在调整功能、配置参数、搞美观,注意力全被花里胡哨吸引
    2 、本地要有数据,不要第三方软件保存我的数据,也就是文章、素材、知识、图片,保存在电脑本地,同时自己找云平台同步
    3 、搜索、搜索、搜索,本地搜索能力一定要强大,可以检索本地内容( PDF 、Txt 、Markdown 、Html 、图片)
    4 、可以剪藏网页,截图和复制粘贴阅读体验并不是很好,剪藏功能很重要

    上面内容有点偏题,接着聊。

    [少分类 多搜索] ,这是我非常赞同的,有时刷到一些打造知识库的视频或者文章,看到将笔记做了看似很完美的分类,什么生活、流量、赚钱、软件、Windows 之类,我心里都会嘀咕,"还是笔记记少了"。

    少分类,一定要少分类,分类意味着做选择,选择就需要耗费脑力。分类还有个弊端,存入困难,取出来也困难。这样说你就懂了,如果你有一个 [其他] 分类,我猜测,这个文件夹会成为你知识库的电子垃圾堆,我相信半年乃至两三年,里面的文章你不会瞧一眼。

    上面是我赞同的,不赞同的是整理笔记,我觉得这很重要。

    做笔记最重要的不是这条笔记怎么写,这个笔记怎么来,这个笔记怎么排版好看。
    做笔记最重要的是存入这条笔记时,以后模糊了,需要时怎么找到它。

    怎么找到呢?完全靠工具的功能,我觉得是不太靠谱的,所以在存笔记和取笔记中间,我觉得需要一个处理的过程,也就是整理笔记。

    摸鱼太久,要干活了,下次聊。

    ---
    刚顺手去我博客搜知识管理,发现断断续续分享了很多文章,贴个小尾巴 https://short.guozh.net/k
    s524256521
        13
    s524256521  
       2024 年 11 月 9 日
    不知道 OP 现在想法改变没有,我觉得笔记只是笔记而已,重要的不是搜索,而是整理内化成自己的知识体系,没有整理的知识只不过是一堆数据库而已,人的生理结构就决定了,神经元之间的联系必须要反复的建立才能变强,没有这个锤炼的过程,一切都是徒劳。
    sillydaddy
        14
    sillydaddy  
    OP
       2024 年 11 月 10 日
    @s524256521 你所说的整理内化,肯定是做笔记的一个非常重要的目标。实现这个目标,需要的时间长短是不一定的,有时可能仅仅需要 1 天,有时需要几年。在时间跨度长的情况下,人脑的记忆是会一直衰减的,不可能一直记得内化完成之前的所有东西,所以快速灵敏的搜索功能就是必须的,为的是把所有相关的素材快速唤起。而且即使内化过后的知识也是会衰减的,需要笔记来存储,必要时快速找到。另外,有些知识其实不需要内化,只需要能够快速唤起,比如你只记得过去拆了 MacBook 的一个键帽,但是忘记具体怎么拆了。
    无论上面哪一种情况,都需要快速准确的搜索。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1297 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 30ms UTC 17:06 PVG 01:06 LAX 09:06 JFK 12:06
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86