关于实现“相关性”笔记功能的可行性思考,以及困惑

关于实现“相关性”笔记功能

我刚才简单的思考了一下实现部分逻辑,当前遇到的问题是“文档性笔记如何确定哪些部分可以算作一个整体,或者看作一个卡片,去计算相关度”,尤其是针对我自己这种习惯大纲笔记的人来桌,毕竟我的笔记中除了撰写正稿之外都是大纲的形式

这点来说 flomo 就有本身的优势,因为它本身就可以看作是一张张卡片组成的,相关性的查找到卡的级别刚好,但咱思源这是“文档式”的啊

如果给出文档的相关度,担心文档太长,如果按照一个段落尤其是一个条大纲笔记的时候,又担心相关度太低,如果多条大纲笔记隶属于一个局部主题又难以界定界限在哪里

总不能因为一个相关度的功能就让我改变记录习惯的吧

啧啧,万一对此谈论出可行性,万一…万一…

万一就……

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22337 引用 • 89380 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • science 1 评论

    “相关性”的本质就是全局搜索当前页面标题的结果,并将其展示在面板上(不管这个面板叫相关性面板 or 反链面板)。也就是说,只要支持全局搜索的软件,都可以轻易做到相关页面,后续只需要优化搜索逻辑即可

    1 回复
    这个不是现成的么,可以下载个思源,稍微用用就可以找到了
    Bard
  • “相关性”的本质就是全局搜索当前页面标题的结果

    这完全是虚假的相关嘛,只有标题相关而内容不相关的话怎么算“相关”呢。

    要排序的话就必须要知道内容的相关性才行。

    1 回复
  • pakeh2866

    flomo 是 XX,不要太 care.

  • science

    因为文章标题和各级标题本来就是文章内容和段落内容的总结

    1 回复
  • ACai 1 评论
    1 回复
    啧啧,只是点开一看。本来以为是蝶醋啊,结果人家都是直接酿醋种小麦啊 🤣
    Bard
  • fradeet

    印象笔记就有“相关笔记”功能,通过一种算法来计算笔记与其他笔记的相似性。个人在用印象笔记的时候觉得这个功能很妙,可以筛选其他“可能”相关的笔记。

    同感要把这样一个边角料功能拿来当正餐……可能只有部署个本地大模型才能驾驭得住了。

    image.png

    1 回复
  • 你这个方案算是把用 dailynotes 的抛弃了

  • Bard 1 赞同

    是啊

    盲猜印象的应该是基于“词汇”的搜索,毕竟之前只有这技术

    但是,时代变了啊,当前 LLM 才能更好的从“语义”层面实现相关性

  • Bard

    也对,其实想到这个问题之前,就应该想到这个肯定有现成作业可看的trollface

  • Bard

    根据楼上大佬提供信息,我也都去瞥了一眼开源项目

    假设已经有可行性的作业可以抄了

    又一想,问题还是这蝶饺子不够大,做这蝶醋太费劲啊

    开源呢,少有人能有 Z 佬级别的实力

    诚然可以做付费,但这碟饺子又难以够量啊

    还得继续思考,多过去看看人家的作业再说

  • Bard

    看完三个开源项目 README.md,我 TM 人都傻了

    我这天真的小脑瓜只会“把大象放冰箱”啊

    就像第一步蒸馏数据,第二步塞给 LLM,最后得到相关性文档 😋

  • Bard

    其实,既然用了 LLM 何必还纠结于跟自己这“一亩三分地”内的知识含量呢

    又有几个人的第二大脑能超过 LLM 呢,想干啥,直接让 LLM 现编不就完了吗 😂

    如果用 LLM 仅实现“相关度”实属用牛刀了

    “那就在思源里继续增加 LLM 的使用场景啊”

    这就还是个是倒醋或包饺子的问题啊,啧啧

  • Bard

    还不如直接去 OB 那里“胖巧侧记”“饮食力道”“醺醺善油”
    让他们朝着思源的方向走呢trollface

  • 相关笔记的重点不在于匹配什么。比如标题、内容。

    重点是你的所有数据,怎么喂给模型。总不可能你把所有笔记全丢给云端服务吧?

    只要介意这一点的,“相关性”这一点,就很难做到理想状态。

    最后只能实现一下简单的分词匹配

  • xnyshu

    这种分析总结关联之类的功能,终将被 AI 取代。

  • Bard

    所以使用在线 API 最好做成插件形式,隐私要求不大的,可以启用这个插件

    如果后期本地模型普及大众可用以后,就同时可以使用本地模型了

  • NishikigiReeves 1 赞同

    大模型随着更多的喂养,会越来越挤压笔记的生存空间。

    我在北京工作的同学已经开始每周都用大模型来应对所有的例会和总结等等。

    他 30 多年的人生里从来没写过笔记,也没练过写作,但是大模型突然给他外挂了写作能力。

    我认为大模型将来推开了的话,会更加挤压笔记软件-写作软件的空间。

    这种相关性,目前实现的都不够好,flomo 小便签用起来麻烦,印象笔记数据不可导出,writeathon 相关性要靠形成文档......

    只能说都在摸索吧,没有成熟的。

    1 回复
  • xnyshu

    笔记软件将来可能主要的作用就是给 AI 提供一个界面和编辑器窗口,所以开发者应该把重点放在将来怎样跟 AI 配合上,让数据库更高效,让编辑器更好用,让界面更人性化,这些才是重点。

请输入回帖内容 ...

推荐标签 标签

  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    55 引用 • 85 回帖
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1434 引用 • 10054 回帖 • 490 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 16 关注
  • 钉钉

    钉钉,专为中国企业打造的免费沟通协同多端平台, 阿里巴巴出品。

    15 引用 • 67 回帖 • 339 关注
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    75 引用 • 1737 回帖 • 5 关注
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    17 引用 • 53 回帖 • 136 关注
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    96 引用 • 155 回帖 • 1 关注
  • 招聘

    哪里都缺人,哪里都不缺人。

    190 引用 • 1057 回帖
  • iOS

    iOS 是由苹果公司开发的移动操作系统,最早于 2007 年 1 月 9 日的 Macworld 大会上公布这个系统,最初是设计给 iPhone 使用的,后来陆续套用到 iPod touch、iPad 以及 Apple TV 等产品上。iOS 与苹果的 Mac OS X 操作系统一样,属于类 Unix 的商业操作系统。

    85 引用 • 139 回帖 • 1 关注
  • 博客

    记录并分享人生的经历。

    273 引用 • 2388 回帖
  • 安装

    你若安好,便是晴天。

    132 引用 • 1184 回帖
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用 • 1 关注
  • Eclipse

    Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。

    75 引用 • 258 回帖 • 617 关注
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    98 引用 • 344 回帖
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖
  • 创业

    你比 99% 的人都优秀么?

    84 引用 • 1399 回帖
  • SVN

    SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。

    29 引用 • 98 回帖 • 680 关注
  • Latke

    Latke 是一款以 JSON 为主的 Java Web 框架。

    71 引用 • 535 回帖 • 787 关注
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    52 引用 • 228 回帖
  • IPFS

    IPFS(InterPlanetary File System,星际文件系统)是永久的、去中心化保存和共享文件的方法,这是一种内容可寻址、版本化、点对点超媒体的分布式协议。请浏览 IPFS 入门笔记了解更多细节。

    21 引用 • 245 回帖 • 241 关注
  • jQuery

    jQuery 是一套跨浏览器的 JavaScript 库,强化 HTML 与 JavaScript 之间的操作。由 John Resig 在 2006 年 1 月的 BarCamp NYC 上释出第一个版本。全球约有 28% 的网站使用 jQuery,是非常受欢迎的 JavaScript 库。

    63 引用 • 134 回帖 • 724 关注
  • wolai

    我来 wolai:不仅仅是未来的云端笔记!

    2 引用 • 14 回帖
  • TGIF

    Thank God It's Friday! 感谢老天,总算到星期五啦!

    287 引用 • 4484 回帖 • 669 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 22 关注
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    8 引用 • 26 回帖
  • Dubbo

    Dubbo 是一个分布式服务框架,致力于提供高性能和透明化的 RPC 远程服务调用方案,是 [阿里巴巴] SOA 服务化治理方案的核心框架,每天为 2,000+ 个服务提供 3,000,000,000+ 次访问量支持,并被广泛应用于阿里巴巴集团的各成员站点。

    60 引用 • 82 回帖 • 595 关注