如何做才可以让思源具有语义功能?这是有了大量笔记后再利用的关键。(内含建议思路)

请教大佬们:如何做才可以用语义搜索思源的笔记呀?

需求理由:

我虽然是一个外行,但我是一个几十年一直使用各种笔记学习的人,我相信我的需要也是那些真正学习者的需求。

这觉得笔记基本功能稳定后,这是最重要的了。否则积累了大量笔记后无法找到自己想到找到的资料,因为我们不可能总是准确地记住那些关键字,比如找“快乐”就可能找不到“高兴、愉快“等的资料,但其实我是想把这类资料都找到,我也不可能每次搜索时都穷尽近义词,这是我一直头痛的问题。

他人之石:

现在有专门搭设具有 RAG 功能的 AI 大模型的方法。但我不具备这种条件。

即便能搭设,思源笔记的专用格式也不一定能适用。

能实现的理由及思路:

思路一:因为思源笔记的结构有一套固定的标准,且很大程度上非常接近文本文件格式,应该容易处理成可以用来语义搜索的资料。

思路二:不依赖任何其他软件,不用增加复杂的功能,只有改变一下搜索策略就可以拥有一个由使用者自己维护的类似语义搜索功能。具体思路如下:

1.首先增加一个语义搜索库,里面可以增加任意语义定义。如,可以增加一行:”快乐 高兴 愉快......“等。

可由使用者来增加。

2.搜索时可提供两种方式,一种是现在用的搜索方式,称为精确搜索;另一种为自定义的近义搜索。

当使用自定义的近义搜索时,用户只需要提供一个关键字,如”快乐“,搜索引擎自动会在语义搜索库里找到这个关键字”快乐“所在的这一组,然后把这一组中的各个字词以”或“的关系组成正式的搜索关键字,如”快乐 or 高兴 or 愉快 or ......",这样就可以达到一种近似语义搜索的功能,虽然可能本质上不同,但却可以实实在在地解决我的难题。

而且这样做的好处是可以做到现在语义搜索所达不到的功能,就是用户自己认为的哪些不同的词可以算是同一语义范围,其实这个也很有用,有时软件强制的语义不一定完全包括用户的认知。

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    19756 引用 • 75587 回帖 • 2 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 是的。

    你说的我都认可,AI 只适合一些粗粒度的搜索,比如一些定义明确的定义、定理之类的,

    但是它的复杂推论都是不太可信的。

    至于你想要的,我感觉似乎是在找一种方法用自己的笔记作为语料训练出一个 AI 来,

    貌似这个不太能办得到的,自己的笔记数量比较起来还是很少的。

    1 回复
  • 其他回帖
  • sxdtzjs

    谢谢回复。

    我目前就是类似的作法:在每个可能以后还会用到的笔记上加一行名为关键字的行,把自己能想到的相关词都写上,以后遇到当时没有想到的词,再加上。缺点就像您所说的”太麻烦“。

    这种做法与我以前用 logseq 的一个功能,好像是专门有个”别称“的属性,起到的作用类似。就是给一个笔记名称可以起其他不同的叫法,或说是等于打上了一些同义语的标签。用了思源后,没发现这个功能,但以我的理解,思源应该也有这个隐含的功能,不过我没有去研究。

    2 回复
  • icugg6

    给每个文档都加上备注,例如一篇文档的内容是 AI 有关的,可以把 AI 有关的关键字都加上去,后期如果需要检索的话,搜索到符合一个的都可以检索的到。缺点就是太麻烦,优点就是几乎可以精确搜索到自己想要的内容

    1 回复
  • sxdtzjs

    至于 ai(我也经常使用),以其目前的关于这方面的能力来说:

    1.关键是 ai 搜索不到我自己的思源笔记,自己笔记里有些资料是互联网上没有的,况且学习过程中会有很多自己的理解性笔记。

    2.你可以相信而且应该使用 ai 搜索出来的链接(因为 ai 具有远超简单语义的匹配能力),但你不要随便相信 AI 通过搜索而得出来的结论,必须自己打开一些链接的内容来验证。
    根据我经常使用的经验,越对于冷门的知识,AI 越胡说得厉害。

    3.另外,多说一句,用 ai 辅助阅读长文章,如果要求不高,只是粗略了解就无所谓,但如果你真的想无误而且无漏地掌握其中的逻辑脉络和概念的话,就会让失望了,且非常失望。
    不过 AI 的辅助阅读还是有用的。一是可以利用其强大的搜索功能;二是它总结出来的东西尽管不一定正确,但可以对我们起到启发的作用。

    1 回复
  • 查看全部回帖