关于实现“相关性”笔记功能的可行性思考,以及困惑

本贴最后更新于 332 天前,其中的信息可能已经事过境迁

关于实现“相关性”笔记功能

我刚才简单的思考了一下实现部分逻辑,当前遇到的问题是“文档性笔记如何确定哪些部分可以算作一个整体,或者看作一个卡片,去计算相关度”,尤其是针对我自己这种习惯大纲笔记的人来桌,毕竟我的笔记中除了撰写正稿之外都是大纲的形式

这点来说 flomo 就有本身的优势,因为它本身就可以看作是一张张卡片组成的,相关性的查找到卡的级别刚好,但咱思源这是“文档式”的啊

如果给出文档的相关度,担心文档太长,如果按照一个段落尤其是一个条大纲笔记的时候,又担心相关度太低,如果多条大纲笔记隶属于一个局部主题又难以界定界限在哪里

总不能因为一个相关度的功能就让我改变记录习惯的吧

啧啧,万一对此谈论出可行性,万一…万一…

万一就……

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    26125 引用 • 108472 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • science 1 评论

    “相关性”的本质就是全局搜索当前页面标题的结果,并将其展示在面板上(不管这个面板叫相关性面板 or 反链面板)。也就是说,只要支持全局搜索的软件,都可以轻易做到相关页面,后续只需要优化搜索逻辑即可

    1 回复
    这个不是现成的么,可以下载个思源,稍微用用就可以找到了
    Bard
  • “相关性”的本质就是全局搜索当前页面标题的结果

    这完全是虚假的相关嘛,只有标题相关而内容不相关的话怎么算“相关”呢。

    要排序的话就必须要知道内容的相关性才行。

    1 回复
  • pakeh2866

    flomo 是 XX,不要太 care.

  • science

    因为文章标题和各级标题本来就是文章内容和段落内容的总结

    1 回复
  • ACai 1 评论
    1 回复
    啧啧,只是点开一看。本来以为是蝶醋啊,结果人家都是直接酿醋种小麦啊 🤣
    Bard
  • fradeet

    印象笔记就有“相关笔记”功能,通过一种算法来计算笔记与其他笔记的相似性。个人在用印象笔记的时候觉得这个功能很妙,可以筛选其他“可能”相关的笔记。

    同感要把这样一个边角料功能拿来当正餐……可能只有部署个本地大模型才能驾驭得住了。

    image.png

    1 回复
  • 你这个方案算是把用 dailynotes 的抛弃了

  • Bard 1 赞同

    是啊

    盲猜印象的应该是基于“词汇”的搜索,毕竟之前只有这技术

    但是,时代变了啊,当前 LLM 才能更好的从“语义”层面实现相关性

  • Bard

    也对,其实想到这个问题之前,就应该想到这个肯定有现成作业可看的trollface

  • Bard

    根据楼上大佬提供信息,我也都去瞥了一眼开源项目

    假设已经有可行性的作业可以抄了

    又一想,问题还是这蝶饺子不够大,做这蝶醋太费劲啊

    开源呢,少有人能有 Z 佬级别的实力

    诚然可以做付费,但这碟饺子又难以够量啊

    还得继续思考,多过去看看人家的作业再说

  • Bard

    看完三个开源项目 README.md,我 TM 人都傻了

    我这天真的小脑瓜只会“把大象放冰箱”啊

    就像第一步蒸馏数据,第二步塞给 LLM,最后得到相关性文档 😋

  • Bard

    其实,既然用了 LLM 何必还纠结于跟自己这“一亩三分地”内的知识含量呢

    又有几个人的第二大脑能超过 LLM 呢,想干啥,直接让 LLM 现编不就完了吗 😂

    如果用 LLM 仅实现“相关度”实属用牛刀了

    “那就在思源里继续增加 LLM 的使用场景啊”

    这就还是个是倒醋或包饺子的问题啊,啧啧

  • Bard

    还不如直接去 OB 那里“胖巧侧记”“饮食力道”“醺醺善油”
    让他们朝着思源的方向走呢trollface

  • 相关笔记的重点不在于匹配什么。比如标题、内容。

    重点是你的所有数据,怎么喂给模型。总不可能你把所有笔记全丢给云端服务吧?

    只要介意这一点的,“相关性”这一点,就很难做到理想状态。

    最后只能实现一下简单的分词匹配

  • xnyshu via macOS

    这种分析总结关联之类的功能,终将被 AI 取代。

  • Bard

    所以使用在线 API 最好做成插件形式,隐私要求不大的,可以启用这个插件

    如果后期本地模型普及大众可用以后,就同时可以使用本地模型了

  • NishikigiReeves 1 赞同

    大模型随着更多的喂养,会越来越挤压笔记的生存空间。

    我在北京工作的同学已经开始每周都用大模型来应对所有的例会和总结等等。

    他 30 多年的人生里从来没写过笔记,也没练过写作,但是大模型突然给他外挂了写作能力。

    我认为大模型将来推开了的话,会更加挤压笔记软件-写作软件的空间。

    这种相关性,目前实现的都不够好,flomo 小便签用起来麻烦,印象笔记数据不可导出,writeathon 相关性要靠形成文档......

    只能说都在摸索吧,没有成熟的。

    1 回复
  • xnyshu via macOS

    笔记软件将来可能主要的作用就是给 AI 提供一个界面和编辑器窗口,所以开发者应该把重点放在将来怎样跟 AI 配合上,让数据库更高效,让编辑器更好用,让界面更人性化,这些才是重点。

请输入回帖内容 ...

推荐标签 标签

  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    12 引用 • 5 回帖 • 633 关注
  • 一些有用的避坑指南。

    69 引用 • 93 回帖 • 1 关注
  • Vditor

    Vditor 是一款浏览器端的 Markdown 编辑器,支持所见即所得、即时渲染(类似 Typora)和分屏预览模式。它使用 TypeScript 实现,支持原生 JavaScript、Vue、React 和 Angular。

    372 引用 • 1857 回帖 • 1 关注
  • flomo

    flomo 是新一代 「卡片笔记」 ,专注在碎片化时代,促进你的记录,帮你积累更多知识资产。

    6 引用 • 143 回帖
  • PWL

    组织简介

    用爱发电 (Programming With Love) 是一个以开源精神为核心的民间开源爱好者技术组织,“用爱发电”象征开源与贡献精神,加入组织,代表你将遵守组织的“个人开源爱好者”的各项条款。申请加入:用爱发电组织邀请帖
    用爱发电组织官网:https://programmingwithlove.stackoverflow.wiki/

    用爱发电组织的核心驱动力:

    • 遵守开源守则,体现开源&贡献精神:以分享为目的,拒绝非法牟利。
    • 自我保护:使用适当的 License 保护自己的原创作品。
    • 尊重他人:不以各种理由、各种漏洞进行未经允许的抄袭、散播、洩露;以礼相待,尊重所有对社区做出贡献的开发者;通过他人的分享习得知识,要留下足迹,表示感谢。
    • 热爱编程、热爱学习:加入组织,热爱编程是首当其要的。我们欢迎热爱讨论、分享、提问的朋友,也同样欢迎默默成就的朋友。
    • 倾听:正确并恳切对待、处理问题与建议,及时修复开源项目的 Bug ,及时与反馈者沟通。不抬杠、不无视、不辱骂。
    • 平视:不诋毁、轻视、嘲讽其他开发者,主动提出建议、施以帮助,以和谐为本。只要他人肯努力,你也可能会被昔日小看的人所超越,所以请保持谦虚。
    • 乐观且活跃:你的努力决定了你的高度。不要放弃,多年后回头俯瞰,才会发现自己已经成就往日所仰望的水平。积极地将项目开源,帮助他人学习、改进,自己也会获得相应的提升、成就与成就感。
    1 引用 • 487 回帖 • 3 关注
  • 音乐

    你听到信仰的声音了么?

    62 引用 • 512 回帖
  • NetBeans

    NetBeans 是一个始于 1997 年的 Xelfi 计划,本身是捷克布拉格查理大学的数学及物理学院的学生计划。此计划延伸而成立了一家公司进而发展这个商用版本的 NetBeans IDE,直到 1999 年 Sun 买下此公司。Sun 于次年(2000 年)六月将 NetBeans IDE 开源,直到现在 NetBeans 的社群依然持续增长。

    78 引用 • 102 回帖 • 707 关注
  • Linux

    Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。

    954 引用 • 944 回帖 • 1 关注
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖
  • 强迫症

    强迫症(OCD)属于焦虑障碍的一种类型,是一组以强迫思维和强迫行为为主要临床表现的神经精神疾病,其特点为有意识的强迫和反强迫并存,一些毫无意义、甚至违背自己意愿的想法或冲动反反复复侵入患者的日常生活。

    15 引用 • 161 回帖 • 1 关注
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 671 关注
  • RESTful

    一种软件架构设计风格而不是标准,提供了一组设计原则和约束条件,主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。

    30 引用 • 114 回帖 • 1 关注
  • 安全

    安全永远都不是一个小问题。

    199 引用 • 818 回帖 • 1 关注
  • 导航

    各种网址链接、内容导航。

    45 引用 • 177 回帖
  • Ruby

    Ruby 是一种开源的面向对象程序设计的服务器端脚本语言,在 20 世纪 90 年代中期由日本的松本行弘(まつもとゆきひろ/Yukihiro Matsumoto)设计并开发。在 Ruby 社区,松本也被称为马茨(Matz)。

    7 引用 • 31 回帖 • 262 关注
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 10 关注
  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 121 关注
  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    117 引用 • 99 回帖 • 197 关注
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 677 关注
  • Caddy

    Caddy 是一款默认自动启用 HTTPS 的 HTTP/2 Web 服务器。

    10 引用 • 54 回帖 • 181 关注
  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖 • 1 关注
  • 区块链

    区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法 。

    92 引用 • 752 回帖 • 2 关注
  • Office

    Office 现已更名为 Microsoft 365. Microsoft 365 将高级 Office 应用(如 Word、Excel 和 PowerPoint)与 1 TB 的 OneDrive 云存储空间、高级安全性等结合在一起,可帮助你在任何设备上完成操作。

    5 引用 • 34 回帖
  • 快应用

    快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。

    15 引用 • 127 回帖 • 3 关注
  • Follow
    4 引用 • 12 回帖 • 4 关注
  • 自由行
    2 关注