粒度问题 - 来自多篇 -> 多段内容中的具有相同特征的句子,除打标签外如何汇总整理?

本贴最后更新于 985 天前,其中的信息可能已经事过景迁

大家好:

现在有这样的需求:我有多篇笔记内容,但多篇的笔记内容中,某一段的某一句特别有启发意义。在学习完这么多篇内容后,准备把散落于多篇笔记中的、有启发意义的句子汇总整理起来。

但思源笔记目前支持段落级的粒度,好像是不支持一段话中的某一句这样的粒度。

则除了将句子打标签外,上述的需求如何解决?

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23014 引用 • 92573 回帖
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    8447 引用 • 38483 回帖 • 155 关注

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • fangly 3 3 赞同

    思源笔记,roam research、logseq 之类的双链软件对于这个问题都是相同的处理思路:将这句有用的话变成文档。第一次使用这种方法时可能会有点不适应,但这确实是目前双链笔记软件社区中的主流方法。

    以及卡片盒笔记法、zettelkasten 笔记法等笔记方法中提到的永久笔记等概念、roam research 中的知名插件 discourse-graph 对于类似问题也是采用这种处理方式。

    例子如下:

    比如下面这段话中,有一部分内容我觉得很好,那么我就选中这句话,alt+[ 生成文档:

    image.png

    然后在这句话的文档中,你可以把这个文档再链接到一个专门的文档,比如叫做《literature notes》,所有有价值的话都链接到《literature notes》这个文档中,可以再将这个文档链接到其他文档,比如下图中我将其链接到《哲学》文档,说明这句话是哲学话题之下的,在这个文档中还可以写自己对这句话的感受、评论等

    image.png

    然后在《literature notes》这个文档的反链,便可以看到所有句子

    image.png

    到了后期,可能《literature notes》有很多很多,有关于哲学的、有关于数学的、有关于情感的等之类的,这时候《literature notes》的反链可能就很乱,这时可以进行多关键字筛选,目前的反链面板不支持多关键字筛选,可以通过 sql 实现,比如像下面这样,其中 20220412190212-urdntw320220412191321-d1iar08 分别是《literature notes》和《哲学》这两个文档的 id

    image.png

    但这时候有点问题,和 roam research、logseq 不一样,思源笔记中的嵌入块不显示面包屑,因此只有点击嵌入块后才能看到这句话是什么,在有大量搜索结果时会很不方便:

    image.png

    github 上已经有相关 issue:https://github.com/siyuan-note/siyuan/issues/2985,但目前可能还没时间处理这个问题,等到 2.0 发布后,可以多跟 D 大催一下这个功能

    而且,你不止可以摘录这句话,还可以用自己的话重写这句话,并且保留原文,锚文本设置为原句,而文档名是自己重写后的句子:

    image.png

    image.png

    可以再参考更加详细的实际案例,下图来自 https://www.bilibili.com/video/BV1T94y1d7fu 这个视频:

    image.png

    还可以参考 joel chan 大神的一些演示视频:

    https://www.youtube.com/user/chozen86/videos

    1 回复
    4 操作
    fangly 在 2022-04-12 20:07:18 更新了该回帖
    fangly 在 2022-04-12 19:50:00 更新了该回帖
    fangly 在 2022-04-12 19:46:40 更新了该回帖
    fangly 在 2022-04-12 19:22:45 更新了该回帖
  • 其他回帖
  • 加粗高亮后,汇总时的粒度还是段落块级别,没法到句子级别,和打双链/标签 后汇总在性质上应该差不多,而且也没法保留原文和自己改写句子的两个版本,不方便对这句话批注,以及没法在别处直接复用链接这句话,如果不在乎上面这些,加粗高亮确实可以作为某种意义上的标签快捷方式。

    加粗高亮汇总这套思路可以和 Progressive Summarization 有机结合。

    1 回复
  • ymzang

    感谢两位,受两位启发,考虑到目前思源是有标签一览的,因此感觉这种问题可以分情况灵活处理。

    1. 对于那些以后只考虑引用,而不做深加工的句子,可以考虑打标签、加粗或者高亮的形式;操作简单,满足需求。
    2. 对于那些特别有启发意义,以后可能深加工的,采用新建文档的形式,发挥文档块的多功能特点。

    以上,再次表示感谢。

  • suiji

    楼上介绍得非常好啊。补充一小点,集市里 Meteor/Me 模板里的“link”能以 sql 查询的形式列出反链内容,不需要手动从反链面板弄到文档里。

    不想用双链的话,应该可以使用加粗或高亮,然后汇总。我没用过,我只见过有人分享过模板,参见 【模板分享】文档背景色高亮文字汇总模板【模板分享】如何汇总文档中所有包含加粗 | 高亮 | 颜色文字的内容块

    1 回复
  • 查看全部回帖

推荐标签 标签

  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3454 回帖 • 189 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    27 引用 • 225 回帖 • 163 关注
  • IDEA

    IDEA 全称 IntelliJ IDEA,是一款 Java 语言开发的集成环境,在业界被公认为最好的 Java 开发工具之一。IDEA 是 JetBrains 公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨著称的东欧程序员为主。

    181 引用 • 400 回帖
  • Shell

    Shell 脚本与 Windows/Dos 下的批处理相似,也就是用各类命令预先放入到一个文件中,方便一次性执行的一个程序文件,主要是方便管理员进行设置或者管理用的。但是它比 Windows 下的批处理更强大,比用其他编程程序编辑的程序效率更高,因为它使用了 Linux/Unix 下的命令。

    123 引用 • 74 回帖 • 2 关注
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    692 引用 • 535 回帖
  • C

    C 语言是一门通用计算机编程语言,应用广泛。C 语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。

    85 引用 • 165 回帖 • 2 关注
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 667 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23014 引用 • 92572 回帖
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 4 关注
  • Telegram

    Telegram 是一个非盈利性、基于云端的即时消息服务。它提供了支持各大操作系统平台的开源的客户端,也提供了很多强大的 APIs 给开发者创建自己的客户端和机器人。

    5 引用 • 35 回帖
  • Ruby

    Ruby 是一种开源的面向对象程序设计的服务器端脚本语言,在 20 世纪 90 年代中期由日本的松本行弘(まつもとゆきひろ/Yukihiro Matsumoto)设计并开发。在 Ruby 社区,松本也被称为马茨(Matz)。

    7 引用 • 31 回帖 • 216 关注
  • Facebook

    Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。

    4 引用 • 15 回帖 • 440 关注
  • Docker

    Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的操作系统上。容器完全使用沙箱机制,几乎没有性能开销,可以很容易地在机器和数据中心中运行。

    492 引用 • 926 回帖
  • MongoDB

    MongoDB(来自于英文单词“Humongous”,中文含义为“庞大”)是一个基于分布式文件存储的数据库,由 C++ 语言编写。旨在为应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似 JSON 的 BSON 格式,因此可以存储比较复杂的数据类型。

    90 引用 • 59 回帖 • 1 关注
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    41 引用 • 130 回帖 • 253 关注
  • jQuery

    jQuery 是一套跨浏览器的 JavaScript 库,强化 HTML 与 JavaScript 之间的操作。由 John Resig 在 2006 年 1 月的 BarCamp NYC 上释出第一个版本。全球约有 28% 的网站使用 jQuery,是非常受欢迎的 JavaScript 库。

    63 引用 • 134 回帖 • 724 关注
  • JSON

    JSON (JavaScript Object Notation)是一种轻量级的数据交换格式。易于人类阅读和编写。同时也易于机器解析和生成。

    52 引用 • 190 回帖 • 1 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    265 引用 • 666 回帖 • 1 关注
  • 尊园地产

    昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。

    1 引用 • 22 回帖 • 772 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖
  • Love2D

    Love2D 是一个开源的, 跨平台的 2D 游戏引擎。使用纯 Lua 脚本来进行游戏开发。目前支持的平台有 Windows, Mac OS X, Linux, Android 和 iOS。

    14 引用 • 53 回帖 • 538 关注
  • Solidity

    Solidity 是一种智能合约高级语言,运行在 [以太坊] 虚拟机(EVM)之上。它的语法接近于 JavaScript,是一种面向对象的语言。

    3 引用 • 18 回帖 • 401 关注
  • DevOps

    DevOps(Development 和 Operations 的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    51 引用 • 25 回帖
  • 反馈

    Communication channel for makers and users.

    123 引用 • 913 回帖 • 250 关注
  • PostgreSQL

    PostgreSQL 是一款功能强大的企业级数据库系统,在 BSD 开源许可证下发布。

    22 引用 • 22 回帖
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 584 关注