粒度问题 - 来自多篇 -> 多段内容中的具有相同特征的句子,除打标签外如何汇总整理?

本贴最后更新于 1157 天前,其中的信息可能已经事过景迁

大家好:

现在有这样的需求:我有多篇笔记内容,但多篇的笔记内容中,某一段的某一句特别有启发意义。在学习完这么多篇内容后,准备把散落于多篇笔记中的、有启发意义的句子汇总整理起来。

但思源笔记目前支持段落级的粒度,好像是不支持一段话中的某一句这样的粒度。

则除了将句子打标签外,上述的需求如何解决?

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    25916 引用 • 107405 回帖 • 2 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    9950 引用 • 45199 回帖 • 77 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • fangly 3 3 赞同

    思源笔记,roam research、logseq 之类的双链软件对于这个问题都是相同的处理思路:将这句有用的话变成文档。第一次使用这种方法时可能会有点不适应,但这确实是目前双链笔记软件社区中的主流方法。

    以及卡片盒笔记法、zettelkasten 笔记法等笔记方法中提到的永久笔记等概念、roam research 中的知名插件 discourse-graph 对于类似问题也是采用这种处理方式。

    例子如下:

    比如下面这段话中,有一部分内容我觉得很好,那么我就选中这句话,alt+[ 生成文档:

    image.png

    然后在这句话的文档中,你可以把这个文档再链接到一个专门的文档,比如叫做《literature notes》,所有有价值的话都链接到《literature notes》这个文档中,可以再将这个文档链接到其他文档,比如下图中我将其链接到《哲学》文档,说明这句话是哲学话题之下的,在这个文档中还可以写自己对这句话的感受、评论等

    image.png

    然后在《literature notes》这个文档的反链,便可以看到所有句子

    image.png

    到了后期,可能《literature notes》有很多很多,有关于哲学的、有关于数学的、有关于情感的等之类的,这时候《literature notes》的反链可能就很乱,这时可以进行多关键字筛选,目前的反链面板不支持多关键字筛选,可以通过 sql 实现,比如像下面这样,其中 20220412190212-urdntw320220412191321-d1iar08 分别是《literature notes》和《哲学》这两个文档的 id

    image.png

    但这时候有点问题,和 roam research、logseq 不一样,思源笔记中的嵌入块不显示面包屑,因此只有点击嵌入块后才能看到这句话是什么,在有大量搜索结果时会很不方便:

    image.png

    github 上已经有相关 issue:https://github.com/siyuan-note/siyuan/issues/2985,但目前可能还没时间处理这个问题,等到 2.0 发布后,可以多跟 D 大催一下这个功能

    而且,你不止可以摘录这句话,还可以用自己的话重写这句话,并且保留原文,锚文本设置为原句,而文档名是自己重写后的句子:

    image.png

    image.png

    可以再参考更加详细的实际案例,下图来自 https://www.bilibili.com/video/BV1T94y1d7fu 这个视频:

    image.png

    还可以参考 joel chan 大神的一些演示视频:

    https://www.youtube.com/user/chozen86/videos

    1 回复
    4 操作
    fangly 在 2022-04-12 20:07:18 更新了该回帖
    fangly 在 2022-04-12 19:50:00 更新了该回帖
    fangly 在 2022-04-12 19:46:40 更新了该回帖
    fangly 在 2022-04-12 19:22:45 更新了该回帖
  • 其他回帖
  • ymzang via macOS

    感谢感谢,学习了。总结起来,是将这句话变为文档,而这句话在原文中转变为嵌入块。变为文档后就可链接到其他文档,实现多种功能。而且现在感觉将链接处的内容使用“引述”与使用“段落”形式要好得多

  • ymzang via macOS

    感谢两位,受两位启发,考虑到目前思源是有标签一览的,因此感觉这种问题可以分情况灵活处理。

    1. 对于那些以后只考虑引用,而不做深加工的句子,可以考虑打标签、加粗或者高亮的形式;操作简单,满足需求。
    2. 对于那些特别有启发意义,以后可能深加工的,采用新建文档的形式,发挥文档块的多功能特点。

    以上,再次表示感谢。

  • 加粗高亮后,汇总时的粒度还是段落块级别,没法到句子级别,和打双链/标签 后汇总在性质上应该差不多,而且也没法保留原文和自己改写句子的两个版本,不方便对这句话批注,以及没法在别处直接复用链接这句话,如果不在乎上面这些,加粗高亮确实可以作为某种意义上的标签快捷方式。

    加粗高亮汇总这套思路可以和 Progressive Summarization 有机结合。

    1 回复
  • 查看全部回帖

推荐标签 标签

  • 反馈

    Communication channel for makers and users.

    120 引用 • 906 回帖 • 279 关注
  • 游戏

    沉迷游戏伤身,强撸灰飞烟灭。

    185 引用 • 825 回帖
  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3455 回帖 • 152 关注
  • 代码片段

    代码片段分为 CSS 与 JS 两种代码,添加在 [设置 - 外观 - 代码片段] 中,这些代码会在思源笔记加载时自动执行,用于改善笔记的样式或功能。

    用户在该标签下分享代码片段时需在帖子标题前添加 [css] [js] 用于区分代码片段类型。

    177 引用 • 1257 回帖
  • 程序员

    程序员是从事程序开发、程序维护的专业人员。

    588 引用 • 3528 回帖 • 1 关注
  • Spring

    Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。

    947 引用 • 1460 回帖
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    42 引用 • 130 回帖 • 250 关注
  • FFmpeg

    FFmpeg 是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。

    23 引用 • 32 回帖 • 1 关注
  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    180 引用 • 3878 回帖 • 1 关注
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    77 引用 • 37 回帖
  • 尊园地产

    昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。

    1 引用 • 22 回帖 • 795 关注
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 677 关注
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    211 引用 • 358 回帖 • 2 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 569 关注
  • 锤子科技

    锤子科技(Smartisan)成立于 2012 年 5 月,是一家制造移动互联网终端设备的公司,公司的使命是用完美主义的工匠精神,打造用户体验一流的数码消费类产品(智能手机为主),改善人们的生活质量。

    4 引用 • 31 回帖 • 1 关注
  • Logseq

    Logseq 是一个隐私优先、开源的知识库工具。

    Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.

    7 引用 • 69 回帖 • 5 关注
  • 设计模式

    设计模式(Design pattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的一般问题的解决方案。这些解决方案是众多软件开发人员经过相当长的一段时间的试验和错误总结出来的。

    201 引用 • 120 回帖 • 1 关注
  • OnlyOffice
    4 引用 • 25 关注
  • 电影

    这是一个不能说的秘密。

    122 引用 • 608 回帖
  • SendCloud

    SendCloud 由搜狐武汉研发中心孵化的项目,是致力于为开发者提供高质量的触发邮件服务的云端邮件发送平台,为开发者提供便利的 API 接口来调用服务,让邮件准确迅速到达用户收件箱并获得强大的追踪数据。

    2 引用 • 8 回帖 • 503 关注
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    12 引用 • 5 回帖 • 637 关注
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 395 关注
  • LeetCode

    LeetCode(力扣)是一个全球极客挚爱的高质量技术成长平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer!

    209 引用 • 72 回帖
  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖
  • CongSec

    本标签主要用于分享网络空间安全专业的学习笔记

    1 引用 • 1 回帖 • 36 关注
  • OAuth

    OAuth 协议为用户资源的授权提供了一个安全的、开放而又简易的标准。与以往的授权方式不同之处是 oAuth 的授权不会使第三方触及到用户的帐号信息(如用户名与密码),即第三方无需使用用户的用户名与密码就可以申请获得该用户资源的授权,因此 oAuth 是安全的。oAuth 是 Open Authorization 的简写。

    36 引用 • 103 回帖 • 34 关注
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 18 关注