粒度问题 - 来自多篇 -> 多段内容中的具有相同特征的句子,除打标签外如何汇总整理?

本贴最后更新于 954 天前,其中的信息可能已经事过景迁

大家好:

现在有这样的需求:我有多篇笔记内容,但多篇的笔记内容中,某一段的某一句特别有启发意义。在学习完这么多篇内容后,准备把散落于多篇笔记中的、有启发意义的句子汇总整理起来。

但思源笔记目前支持段落级的粒度,好像是不支持一段话中的某一句这样的粒度。

则除了将句子打标签外,上述的需求如何解决?

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22340 引用 • 89396 回帖 • 1 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    8115 引用 • 37010 回帖 • 160 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • fangly 3 3 赞同

    思源笔记,roam research、logseq 之类的双链软件对于这个问题都是相同的处理思路:将这句有用的话变成文档。第一次使用这种方法时可能会有点不适应,但这确实是目前双链笔记软件社区中的主流方法。

    以及卡片盒笔记法、zettelkasten 笔记法等笔记方法中提到的永久笔记等概念、roam research 中的知名插件 discourse-graph 对于类似问题也是采用这种处理方式。

    例子如下:

    比如下面这段话中,有一部分内容我觉得很好,那么我就选中这句话,alt+[ 生成文档:

    image.png

    然后在这句话的文档中,你可以把这个文档再链接到一个专门的文档,比如叫做《literature notes》,所有有价值的话都链接到《literature notes》这个文档中,可以再将这个文档链接到其他文档,比如下图中我将其链接到《哲学》文档,说明这句话是哲学话题之下的,在这个文档中还可以写自己对这句话的感受、评论等

    image.png

    然后在《literature notes》这个文档的反链,便可以看到所有句子

    image.png

    到了后期,可能《literature notes》有很多很多,有关于哲学的、有关于数学的、有关于情感的等之类的,这时候《literature notes》的反链可能就很乱,这时可以进行多关键字筛选,目前的反链面板不支持多关键字筛选,可以通过 sql 实现,比如像下面这样,其中 20220412190212-urdntw320220412191321-d1iar08 分别是《literature notes》和《哲学》这两个文档的 id

    image.png

    但这时候有点问题,和 roam research、logseq 不一样,思源笔记中的嵌入块不显示面包屑,因此只有点击嵌入块后才能看到这句话是什么,在有大量搜索结果时会很不方便:

    image.png

    github 上已经有相关 issue:https://github.com/siyuan-note/siyuan/issues/2985,但目前可能还没时间处理这个问题,等到 2.0 发布后,可以多跟 D 大催一下这个功能

    而且,你不止可以摘录这句话,还可以用自己的话重写这句话,并且保留原文,锚文本设置为原句,而文档名是自己重写后的句子:

    image.png

    image.png

    可以再参考更加详细的实际案例,下图来自 https://www.bilibili.com/video/BV1T94y1d7fu 这个视频:

    image.png

    还可以参考 joel chan 大神的一些演示视频:

    https://www.youtube.com/user/chozen86/videos

    1 回复
    4 操作
    fangly 在 2022-04-12 20:07:18 更新了该回帖
    fangly 在 2022-04-12 19:50:00 更新了该回帖
    fangly 在 2022-04-12 19:46:40 更新了该回帖
    fangly 在 2022-04-12 19:22:45 更新了该回帖
  • suiji

    楼上介绍得非常好啊。补充一小点,集市里 Meteor/Me 模板里的“link”能以 sql 查询的形式列出反链内容,不需要手动从反链面板弄到文档里。

    不想用双链的话,应该可以使用加粗或高亮,然后汇总。我没用过,我只见过有人分享过模板,参见 【模板分享】文档背景色高亮文字汇总模板【模板分享】如何汇总文档中所有包含加粗 | 高亮 | 颜色文字的内容块

    1 回复
  • 加粗高亮后,汇总时的粒度还是段落块级别,没法到句子级别,和打双链/标签 后汇总在性质上应该差不多,而且也没法保留原文和自己改写句子的两个版本,不方便对这句话批注,以及没法在别处直接复用链接这句话,如果不在乎上面这些,加粗高亮确实可以作为某种意义上的标签快捷方式。

    加粗高亮汇总这套思路可以和 Progressive Summarization 有机结合。

    1 回复
  • suiji

    原来如此,感谢你的说明 ❤️

  • ymzang

    感谢感谢,学习了。总结起来,是将这句话变为文档,而这句话在原文中转变为嵌入块。变为文档后就可链接到其他文档,实现多种功能。而且现在感觉将链接处的内容使用“引述”与使用“段落”形式要好得多

  • ymzang

    感谢两位,受两位启发,考虑到目前思源是有标签一览的,因此感觉这种问题可以分情况灵活处理。

    1. 对于那些以后只考虑引用,而不做深加工的句子,可以考虑打标签、加粗或者高亮的形式;操作简单,满足需求。
    2. 对于那些特别有启发意义,以后可能深加工的,采用新建文档的形式,发挥文档块的多功能特点。

    以上,再次表示感谢。

请输入回帖内容 ...

推荐标签 标签

  • OnlyOffice
    4 引用 • 2 关注
  • Logseq

    Logseq 是一个隐私优先、开源的知识库工具。

    Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.

    6 引用 • 63 回帖
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    70 引用 • 193 回帖 • 431 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    5 引用 • 26 回帖 • 529 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 22 关注
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 462 关注
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    98 引用 • 344 回帖
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    407 引用 • 1246 回帖 • 582 关注
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3187 引用 • 8213 回帖
  • 禅道

    禅道是一款国产的开源项目管理软件,她的核心管理思想基于敏捷方法 scrum,内置了产品管理和项目管理,同时又根据国内研发现状补充了测试管理、计划管理、发布管理、文档管理、事务管理等功能,在一个软件中就可以将软件研发中的需求、任务、bug、用例、计划、发布等要素有序的跟踪管理起来,完整地覆盖了项目管理的核心流程。

    6 引用 • 15 回帖 • 113 关注
  • Vditor

    Vditor 是一款浏览器端的 Markdown 编辑器,支持所见即所得、即时渲染(类似 Typora)和分屏预览模式。它使用 TypeScript 实现,支持原生 JavaScript、Vue、React 和 Angular。

    351 引用 • 1814 回帖
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 16 关注
  • GitLab

    GitLab 是利用 Ruby 一个开源的版本管理系统,实现一个自托管的 Git 项目仓库,可通过 Web 界面操作公开或私有项目。

    46 引用 • 72 回帖
  • 代码片段

    代码片段分为 CSS 与 JS 两种代码,添加在 [设置 - 外观 - 代码片段] 中,这些代码会在思源笔记加载时自动执行,用于改善笔记的样式或功能。

    用户在该标签下分享代码片段时需在帖子标题前添加 [css] [js] 用于区分代码片段类型。

    69 引用 • 373 回帖
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 536 关注
  • Kubernetes

    Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。

    110 引用 • 54 回帖
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 672 关注
  • Sphinx

    Sphinx 是一个基于 SQL 的全文检索引擎,可以结合 MySQL、PostgreSQL 做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。

    1 引用 • 210 关注
  • PWA

    PWA(Progressive Web App)是 Google 在 2015 年提出、2016 年 6 月开始推广的项目。它结合了一系列现代 Web 技术,在网页应用中实现和原生应用相近的用户体验。

    14 引用 • 69 回帖 • 154 关注
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 709 关注
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    58 引用 • 22 回帖 • 1 关注
  • 书籍

    宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”

    77 引用 • 390 回帖
  • App

    App(应用程序,Application 的缩写)一般指手机软件。

    91 引用 • 384 回帖
  • Swift

    Swift 是苹果于 2014 年 WWDC(苹果开发者大会)发布的开发语言,可与 Objective-C 共同运行于 Mac OS 和 iOS 平台,用于搭建基于苹果平台的应用程序。

    36 引用 • 37 回帖 • 529 关注
  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 384 回帖 • 8 关注
  • 电影

    这是一个不能说的秘密。

    120 引用 • 599 回帖