关于实现“相关性”笔记功能的可行性思考,以及困惑

关于实现“相关性”笔记功能

我刚才简单的思考了一下实现部分逻辑,当前遇到的问题是“文档性笔记如何确定哪些部分可以算作一个整体,或者看作一个卡片,去计算相关度”,尤其是针对我自己这种习惯大纲笔记的人来桌,毕竟我的笔记中除了撰写正稿之外都是大纲的形式

这点来说 flomo 就有本身的优势,因为它本身就可以看作是一张张卡片组成的,相关性的查找到卡的级别刚好,但咱思源这是“文档式”的啊

如果给出文档的相关度,担心文档太长,如果按照一个段落尤其是一个条大纲笔记的时候,又担心相关度太低,如果多条大纲笔记隶属于一个局部主题又难以界定界限在哪里

总不能因为一个相关度的功能就让我改变记录习惯的吧

啧啧,万一对此谈论出可行性,万一…万一…

万一就……

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    20643 引用 • 80670 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • science 1 评论

    “相关性”的本质就是全局搜索当前页面标题的结果,并将其展示在面板上(不管这个面板叫相关性面板 or 反链面板)。也就是说,只要支持全局搜索的软件,都可以轻易做到相关页面,后续只需要优化搜索逻辑即可

    1 回复
    这个不是现成的么,可以下载个思源,稍微用用就可以找到了
    Bard
  • “相关性”的本质就是全局搜索当前页面标题的结果

    这完全是虚假的相关嘛,只有标题相关而内容不相关的话怎么算“相关”呢。

    要排序的话就必须要知道内容的相关性才行。

    1 回复
  • pakeh2866

    flomo 是 XX,不要太 care.

  • science

    因为文章标题和各级标题本来就是文章内容和段落内容的总结

    1 回复
  • ACai 1 评论
    1 回复
    啧啧,只是点开一看。本来以为是蝶醋啊,结果人家都是直接酿醋种小麦啊 🤣
    Bard
  • fradeet

    印象笔记就有“相关笔记”功能,通过一种算法来计算笔记与其他笔记的相似性。个人在用印象笔记的时候觉得这个功能很妙,可以筛选其他“可能”相关的笔记。

    同感要把这样一个边角料功能拿来当正餐……可能只有部署个本地大模型才能驾驭得住了。

    image.png

    1 回复
  • 你这个方案算是把用 dailynotes 的抛弃了

  • Bard 1 赞同

    是啊

    盲猜印象的应该是基于“词汇”的搜索,毕竟之前只有这技术

    但是,时代变了啊,当前 LLM 才能更好的从“语义”层面实现相关性

  • Bard

    也对,其实想到这个问题之前,就应该想到这个肯定有现成作业可看的trollface

  • Bard

    根据楼上大佬提供信息,我也都去瞥了一眼开源项目

    假设已经有可行性的作业可以抄了

    又一想,问题还是这蝶饺子不够大,做这蝶醋太费劲啊

    开源呢,少有人能有 Z 佬级别的实力

    诚然可以做付费,但这碟饺子又难以够量啊

    还得继续思考,多过去看看人家的作业再说

  • Bard

    看完三个开源项目 README.md,我 TM 人都傻了

    我这天真的小脑瓜只会“把大象放冰箱”啊

    就像第一步蒸馏数据,第二步塞给 LLM,最后得到相关性文档 😋

  • Bard

    其实,既然用了 LLM 何必还纠结于跟自己这“一亩三分地”内的知识含量呢

    又有几个人的第二大脑能超过 LLM 呢,想干啥,直接让 LLM 现编不就完了吗 😂

    如果用 LLM 仅实现“相关度”实属用牛刀了

    “那就在思源里继续增加 LLM 的使用场景啊”

    这就还是个是倒醋或包饺子的问题啊,啧啧

  • Bard

    还不如直接去 OB 那里“胖巧侧记”“饮食力道”“醺醺善油”
    让他们朝着思源的方向走呢trollface

  • 相关笔记的重点不在于匹配什么。比如标题、内容。

    重点是你的所有数据,怎么喂给模型。总不可能你把所有笔记全丢给云端服务吧?

    只要介意这一点的,“相关性”这一点,就很难做到理想状态。

    最后只能实现一下简单的分词匹配

  • xnyshu

    这种分析总结关联之类的功能,终将被 AI 取代。

  • Bard

    所以使用在线 API 最好做成插件形式,隐私要求不大的,可以启用这个插件

    如果后期本地模型普及大众可用以后,就同时可以使用本地模型了

  • NishikigiReeves 1 赞同

    大模型随着更多的喂养,会越来越挤压笔记的生存空间。

    我在北京工作的同学已经开始每周都用大模型来应对所有的例会和总结等等。

    他 30 多年的人生里从来没写过笔记,也没练过写作,但是大模型突然给他外挂了写作能力。

    我认为大模型将来推开了的话,会更加挤压笔记软件-写作软件的空间。

    这种相关性,目前实现的都不够好,flomo 小便签用起来麻烦,印象笔记数据不可导出,writeathon 相关性要靠形成文档......

    只能说都在摸索吧,没有成熟的。

    1 回复
  • xnyshu

    笔记软件将来可能主要的作用就是给 AI 提供一个界面和编辑器窗口,所以开发者应该把重点放在将来怎样跟 AI 配合上,让数据库更高效,让编辑器更好用,让界面更人性化,这些才是重点。

请输入回帖内容 ...

推荐标签 标签

  • 反馈

    Communication channel for makers and users.

    123 引用 • 908 回帖 • 221 关注
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3169 引用 • 8208 回帖
  • Dubbo

    Dubbo 是一个分布式服务框架,致力于提供高性能和透明化的 RPC 远程服务调用方案,是 [阿里巴巴] SOA 服务化治理方案的核心框架,每天为 2,000+ 个服务提供 3,000,000,000+ 次访问量支持,并被广泛应用于阿里巴巴集团的各成员站点。

    60 引用 • 82 回帖 • 605 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 25 关注
  • React

    React 是 Facebook 开源的一个用于构建 UI 的 JavaScript 库。

    192 引用 • 291 回帖 • 417 关注
  • BAE

    百度应用引擎(Baidu App Engine)提供了 PHP、Java、Python 的执行环境,以及云存储、消息服务、云数据库等全面的云服务。它可以让开发者实现自动地部署和管理应用,并且提供动态扩容和负载均衡的运行环境,让开发者不用考虑高成本的运维工作,只需专注于业务逻辑,大大降低了开发者学习和迁移的成本。

    19 引用 • 75 回帖 • 620 关注
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    334 引用 • 622 回帖
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 5 关注
  • Redis

    Redis 是一个开源的使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API。从 2010 年 3 月 15 日起,Redis 的开发工作由 VMware 主持。从 2013 年 5 月开始,Redis 的开发由 Pivotal 赞助。

    285 引用 • 248 回帖 • 105 关注
  • 书籍

    宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”

    76 引用 • 390 回帖 • 1 关注
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 524 关注
  • 导航

    各种网址链接、内容导航。

    37 引用 • 168 回帖
  • 面试

    面试造航母,上班拧螺丝。多面试,少加班。

    324 引用 • 1395 回帖
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    82 引用 • 37 回帖
  • 博客

    记录并分享人生的经历。

    272 引用 • 2386 回帖
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 669 关注
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    405 引用 • 3557 回帖
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    175 引用 • 407 回帖 • 497 关注
  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    148 引用 • 3769 回帖
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    123 引用 • 168 回帖
  • Unity

    Unity 是由 Unity Technologies 开发的一个让开发者可以轻松创建诸如 2D、3D 多平台的综合型游戏开发工具,是一个全面整合的专业游戏引擎。

    25 引用 • 7 回帖 • 212 关注
  • PWL

    组织简介

    用爱发电 (Programming With Love) 是一个以开源精神为核心的民间开源爱好者技术组织,“用爱发电”象征开源与贡献精神,加入组织,代表你将遵守组织的“个人开源爱好者”的各项条款。申请加入:用爱发电组织邀请帖
    用爱发电组织官网:https://programmingwithlove.stackoverflow.wiki/

    用爱发电组织的核心驱动力:

    • 遵守开源守则,体现开源&贡献精神:以分享为目的,拒绝非法牟利。
    • 自我保护:使用适当的 License 保护自己的原创作品。
    • 尊重他人:不以各种理由、各种漏洞进行未经允许的抄袭、散播、洩露;以礼相待,尊重所有对社区做出贡献的开发者;通过他人的分享习得知识,要留下足迹,表示感谢。
    • 热爱编程、热爱学习:加入组织,热爱编程是首当其要的。我们欢迎热爱讨论、分享、提问的朋友,也同样欢迎默默成就的朋友。
    • 倾听:正确并恳切对待、处理问题与建议,及时修复开源项目的 Bug ,及时与反馈者沟通。不抬杠、不无视、不辱骂。
    • 平视:不诋毁、轻视、嘲讽其他开发者,主动提出建议、施以帮助,以和谐为本。只要他人肯努力,你也可能会被昔日小看的人所超越,所以请保持谦虚。
    • 乐观且活跃:你的努力决定了你的高度。不要放弃,多年后回头俯瞰,才会发现自己已经成就往日所仰望的水平。积极地将项目开源,帮助他人学习、改进,自己也会获得相应的提升、成就与成就感。
    1 引用 • 487 回帖
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 468 关注
  • 生活

    生活是指人类生存过程中的各项活动的总和,范畴较广,一般指为幸福的意义而存在。生活实际上是对人生的一种诠释。生活包括人类在社会中与自己息息相关的日常活动和心理影射。

    230 引用 • 1454 回帖
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    334 引用 • 323 回帖 • 12 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    103 引用 • 294 回帖
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1429 引用 • 10050 回帖 • 486 关注