粒度问题 - 来自多篇 -> 多段内容中的具有相同特征的句子,除打标签外如何汇总整理?

本贴最后更新于 753 天前,其中的信息可能已经事过景迁

大家好:

现在有这样的需求:我有多篇笔记内容,但多篇的笔记内容中,某一段的某一句特别有启发意义。在学习完这么多篇内容后,准备把散落于多篇笔记中的、有启发意义的句子汇总整理起来。

但思源笔记目前支持段落级的粒度,好像是不支持一段话中的某一句这样的粒度。

则除了将句子打标签外,上述的需求如何解决?

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    18853 引用 • 70586 回帖 • 2 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    6596 引用 • 29609 回帖 • 251 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • ymzang

    感谢两位,受两位启发,考虑到目前思源是有标签一览的,因此感觉这种问题可以分情况灵活处理。

    1. 对于那些以后只考虑引用,而不做深加工的句子,可以考虑打标签、加粗或者高亮的形式;操作简单,满足需求。
    2. 对于那些特别有启发意义,以后可能深加工的,采用新建文档的形式,发挥文档块的多功能特点。

    以上,再次表示感谢。

  • 其他回帖
  • 加粗高亮后,汇总时的粒度还是段落块级别,没法到句子级别,和打双链/标签 后汇总在性质上应该差不多,而且也没法保留原文和自己改写句子的两个版本,不方便对这句话批注,以及没法在别处直接复用链接这句话,如果不在乎上面这些,加粗高亮确实可以作为某种意义上的标签快捷方式。

    加粗高亮汇总这套思路可以和 Progressive Summarization 有机结合。

    1 回复
  • fangly 3 3 赞同

    思源笔记,roam research、logseq 之类的双链软件对于这个问题都是相同的处理思路:将这句有用的话变成文档。第一次使用这种方法时可能会有点不适应,但这确实是目前双链笔记软件社区中的主流方法。

    以及卡片盒笔记法、zettelkasten 笔记法等笔记方法中提到的永久笔记等概念、roam research 中的知名插件 discourse-graph 对于类似问题也是采用这种处理方式。

    例子如下:

    比如下面这段话中,有一部分内容我觉得很好,那么我就选中这句话,alt+[ 生成文档:

    image.png

    然后在这句话的文档中,你可以把这个文档再链接到一个专门的文档,比如叫做《literature notes》,所有有价值的话都链接到《literature notes》这个文档中,可以再将这个文档链接到其他文档,比如下图中我将其链接到《哲学》文档,说明这句话是哲学话题之下的,在这个文档中还可以写自己对这句话的感受、评论等

    image.png

    然后在《literature notes》这个文档的反链,便可以看到所有句子

    image.png

    到了后期,可能《literature notes》有很多很多,有关于哲学的、有关于数学的、有关于情感的等之类的,这时候《literature notes》的反链可能就很乱,这时可以进行多关键字筛选,目前的反链面板不支持多关键字筛选,可以通过 sql 实现,比如像下面这样,其中 20220412190212-urdntw320220412191321-d1iar08 分别是《literature notes》和《哲学》这两个文档的 id

    image.png

    但这时候有点问题,和 roam research、logseq 不一样,思源笔记中的嵌入块不显示面包屑,因此只有点击嵌入块后才能看到这句话是什么,在有大量搜索结果时会很不方便:

    image.png

    github 上已经有相关 issue:Issue #2985 · siyuan-note/siyuan,但目前可能还没时间处理这个问题,等到 2.0 发布后,可以多跟 D 大催一下这个功能

    而且,你不止可以摘录这句话,还可以用自己的话重写这句话,并且保留原文,锚文本设置为原句,而文档名是自己重写后的句子:

    image.png

    image.png

    可以再参考更加详细的实际案例,下图来自 https://www.bilibili.com/video/BV1T94y1d7fu 这个视频:

    image.png

    还可以参考 joel chan 大神的一些演示视频:

    https://www.youtube.com/user/chozen86/videos

    1 回复
    4 操作
    fangly 在 2022-04-12 20:07:18 更新了该回帖
    fangly 在 2022-04-12 19:50:00 更新了该回帖
    fangly 在 2022-04-12 19:46:40 更新了该回帖
    fangly 在 2022-04-12 19:22:45 更新了该回帖
  • suiji

    原来如此,感谢你的说明 ❤️

  • 查看全部回帖

推荐标签 标签

  • 旅游

    希望你我能在旅途中找到人生的下一站。

    85 引用 • 895 回帖
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 18 关注
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    96 引用 • 330 回帖
  • 快应用

    快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。

    15 引用 • 127 回帖 • 4 关注
  • 博客

    记录并分享人生的经历。

    270 引用 • 2386 回帖
  • Sym

    Sym 是一款用 Java 实现的现代化社区(论坛/BBS/社交网络/博客)系统平台。

    下一代的社区系统,为未来而构建

    523 引用 • 4581 回帖 • 693 关注
  • RYMCU

    RYMCU 致力于打造一个即严谨又活泼、专业又不失有趣,为数百万人服务的开源嵌入式知识学习交流平台。

    4 引用 • 6 回帖 • 41 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    261 引用 • 662 回帖 • 1 关注
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    96 引用 • 155 回帖 • 3 关注
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    397 引用 • 3416 回帖
  • 工具

    子曰:“工欲善其事,必先利其器。”

    276 引用 • 685 回帖
  • 知乎

    知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。

    10 引用 • 66 回帖
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    675 引用 • 535 回帖 • 1 关注
  • Netty

    Netty 是一个基于 NIO 的客户端-服务器编程框架,使用 Netty 可以让你快速、简单地开发出一个可维护、高性能的网络应用,例如实现了某种协议的客户、服务端应用。

    49 引用 • 33 回帖 • 21 关注
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖 • 3 关注
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    35 引用 • 35 回帖
  • GraphQL

    GraphQL 是一个用于 API 的查询语言,是一个使用基于类型系统来执行查询的服务端运行时(类型系统由你的数据定义)。GraphQL 并没有和任何特定数据库或者存储引擎绑定,而是依靠你现有的代码和数据支撑。

    4 引用 • 3 回帖 • 22 关注
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 8 关注
  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 635 关注
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    75 引用 • 146 回帖
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 21 关注
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1425 引用 • 10043 回帖 • 469 关注
  • JavaScript

    JavaScript 一种动态类型、弱类型、基于原型的直译式脚本语言,内置支持类型。它的解释器被称为 JavaScript 引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在 HTML 网页上使用,用来给 HTML 网页增加动态功能。

    711 引用 • 1173 回帖 • 161 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    25 引用 • 217 回帖 • 158 关注
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    5 引用 • 18 回帖 • 153 关注
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    53 引用 • 85 回帖 • 1 关注
  • 安装

    你若安好,便是晴天。

    128 引用 • 1184 回帖