如何做才可以让思源具有语义功能?这是有了大量笔记后再利用的关键。(内含建议思路)

请教大佬们:如何做才可以用语义搜索思源的笔记呀?

需求理由:

我虽然是一个外行,但我是一个几十年一直使用各种笔记学习的人,我相信我的需要也是那些真正学习者的需求。

这觉得笔记基本功能稳定后,这是最重要的了。否则积累了大量笔记后无法找到自己想到找到的资料,因为我们不可能总是准确地记住那些关键字,比如找“快乐”就可能找不到“高兴、愉快“等的资料,但其实我是想把这类资料都找到,我也不可能每次搜索时都穷尽近义词,这是我一直头痛的问题。

他人之石:

现在有专门搭设具有 RAG 功能的 AI 大模型的方法。但我不具备这种条件。

即便能搭设,思源笔记的专用格式也不一定能适用。

能实现的理由及思路:

思路一:因为思源笔记的结构有一套固定的标准,且很大程度上非常接近文本文件格式,应该容易处理成可以用来语义搜索的资料。

思路二:不依赖任何其他软件,不用增加复杂的功能,只有改变一下搜索策略就可以拥有一个由使用者自己维护的类似语义搜索功能。具体思路如下:

1.首先增加一个语义搜索库,里面可以增加任意语义定义。如,可以增加一行:”快乐 高兴 愉快......“等。

可由使用者来增加。

2.搜索时可提供两种方式,一种是现在用的搜索方式,称为精确搜索;另一种为自定义的近义搜索。

当使用自定义的近义搜索时,用户只需要提供一个关键字,如”快乐“,搜索引擎自动会在语义搜索库里找到这个关键字”快乐“所在的这一组,然后把这一组中的各个字词以”或“的关系组成正式的搜索关键字,如”快乐 or 高兴 or 愉快 or ......",这样就可以达到一种近似语义搜索的功能,虽然可能本质上不同,但却可以实实在在地解决我的难题。

而且这样做的好处是可以做到现在语义搜索所达不到的功能,就是用户自己认为的哪些不同的词可以算是同一语义范围,其实这个也很有用,有时软件强制的语义不一定完全包括用户的认知。

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22020 引用 • 87815 回帖 • 2 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • sxdtzjs

    是的,您做的类似思源或 obsidian 等里的“提及”功能,但您的优势是不依赖本地笔记,而且直接在互联网上完成。也是非常好的想法 👍 如果有了测试版可以告诉我一下,我可以帮助以用户的角度测试。

  • 其他回帖
  • @leolee 好像在干这个


    另外,回复在这里:

    image.png

    1 回复
  • sxdtzjs

    谢谢回复!说说我的理解,不一定对,仅讨论。以我几十年的学习实践认为:搜索是学习中用得最多的过程,除非你学的东西非常少,或只在熟悉的领域学习或你有不忘陀罗尼。理由如下:

    1. 学习的第一次过程是输入(搜集资料)--> 整理加工--> 输出。在这个过程中就会提高自己的理解能力并形成自己的记忆,但这种记忆如果以后不进行复习应用的话就会渐渐遗忘,特别是对那些不会专门记忆只作为备忘待查用的资料,比如某月某日进行了洗衣机筒自洁、洗衣机说明书放在了哪里、某人的生日等等。
    2. 再次学习过程:当进行考试、应用或阅读等活动时,需要从自己的记忆中提取,这时我们可能会有完全的记忆,也可能有一部分记忆,也可能只有印象,甚至连印象都没有。
      所以这个学习过程就非常需要一个功能强大的查询功能,因为往往你只能试着输入关键字,如果没有语义搜索功能加持,那么你输入的这个关键字的命中率有多高就很难说了。
      所以搜索是很重要的,因为学习就是为了用,而用在你没有形成永久记忆之前搜索就是你最好的(往往是唯一的)途径,而且有许多东西是完全没有必要必须形成记忆的,这也是 GTD 的原理之一,更是思源笔记“提及”及反链等功能的必要,在我学习大量陌生知识,特别是含有大量陌生概念的知识时,思源的”提及“功能给我的帮助非常大,极大极高了我的学习效率。
  • knowledgeShow.gif

    一个方案:

    如上图,把内容上传到大厂的平台,比如:百度千帆的知识库

    创建 应用智能体,针对 知识库 进行提问。

    具体做法请看这里

    1 回复
  • 查看全部回帖