思源笔记 bug 反馈:虚拟引用捕获失效

本贴最后更新于 693 天前,其中的信息可能已经时移世易

问题 1 捕获失效

设置一个新文档,命名文档名和一级标题为:测试思源笔记,链接锚文本和标题也一样。然后执行重建索引,再键入文本后刷新,发现上述信息全部没有被虚拟引用捕获。

2022102613.56.35.png

设置别名为测试,显示成功。不知道这里面命名和别名长度是否有影响?还是因为分词策略引发的?

问题 2 标题的捕获逻辑

当前文档中的标题是否会被自动捕获也不清楚。有的标题没有设置别名和命名也有虚拟引用,但大部分标题都没有,不知道里面的逻辑是什么。

比如官方文档里设置的提及内容块就被虚拟引用捕获,但标题和内容都没有设置任何命名和别名。

2022102614.00.02.png

但大部分情况下,文档中的标题不会被虚拟引用捕获。

还请 D 大和 V 大关注,谢谢!

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    21053 引用 • 82801 回帖 • 7 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • moongoat

    谢谢 D 大回复。

    但标题是否会被虚拟引用的问题还存在疑惑。

    我建立了一个测试思源笔记标题的一级标题,发现在新文档中没有被虚拟引用捕获。但又无法解释思源笔记文档中那个“提及”标题在没有命名和别名时被引用的案例。

    我现在想要让虚拟引用捕获我的标题文本,除了单独设置命名和别名外能否实现呢?

    2022102615.32.40.png

    2022102615.33.03.png

    1 回复
    • 只有文档标题会纳入搜索,普通的 H1-H6 不会纳入
    • “提及”是因为锚文本纳入的
    • 参考设置 - 搜索 中的选项
    1 回复
  • moongoat 1

    感谢 D 大回复。这个解释带来两个新的关键问题:

    1. 在不设置别名和命名的情况下,如何将一个文本设置为锚文本?我发现提及这个标题的属性全部是空值。
    2. 提及描述中提到使用链接按钮将提及转化为链接,这个按钮在哪里呢?我现在选中提及文本后的链接是直接插入,而非文档中描述的转化。
    1 回复
    1. 方引用的时候设置锚文本
    2. 现在的版本已经不支持了,稍后会更新文档
    2 回复
  • moongoat

    1.我将思源笔记文档中的提及块全部删除,然后重建索引。结果发现,键入提及二字后刷新仍然存在虚拟引用,只是显示不存在复合条件的块。那么这里这个提及的虚拟引用引用到底源自哪里呢?感觉很疑惑。或者说这是文档自身的问题吗?

    2022102623.34.43.png

    1 回复
  • moongoat

    另外,能否在虚拟引用中加入标题的选项呢?因为很多以剪藏方式导入的文本包含标题内容,这些内容如果想要被虚拟引用捕获需要逐一设置命名别名和锚文本,操作成本很高,如果虚拟引用能够识别标题的话能节省大量时间,增加文本的关联度。

    另一方面,希望能够增加文本根据标题自动分解为文档树的功能。当前块直接拖入文档树可以转化为文档,但需要手动操作,能否直接增加一个自动化的文章全部转化为文档树的功能呢?这个功能的好处是拆解文档中的提及过于集中的问题。很多长文档存在大量提及的情况下,如果提及分类功能不好做,可以将长文档拆解为文档树,这样也变相将提及集中的问题解决了。

    供 D 大和 V 大参考,谢谢!

  • 这里的引用删了吗?

    image.png

    1 回复
  • moongoat

    谢谢 D 大,我现在终于理解这里的逻辑了 😂

    提及内容在自身没有设置命名和别名的情况下,还存在一种被虚拟引用捕获的情况:在其他文档中被引用,并且在引用时设置了作为提及词的锚文本。

    在这种情况下,哪怕删除提及内容自身,提及的虚拟引用仍然会捕获到其他文档中的锚文本,因此就出现哪怕删除掉提及内容,虚拟引用仍然存在的情况。

    这个逻辑的确复杂,所以虚拟引用捕获锚文本的意义是什么呢?似乎并没有特别的作用,除了制造出这种无效的虚拟引用,在更新索引后还删除不了,且很难发现……

    1 回复
  • 不需要自动搜索锚文本的话可以在搜索里面关掉的。

    另外,最新版支持在编辑器设置里手动添加关键字。

    1 回复
  • moongoat

    感谢 D 大,这个功能非常实用!

请输入回帖内容 ...

推荐标签 标签

  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    17 引用 • 53 回帖 • 131 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖
  • HHKB

    HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。

    5 引用 • 74 回帖 • 450 关注
  • 安装

    你若安好,便是晴天。

    131 引用 • 1184 回帖
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    76 引用 • 429 回帖
  • sts
    2 引用 • 2 回帖 • 186 关注
  • Linux

    Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。

    927 引用 • 937 回帖 • 1 关注
  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    116 引用 • 99 回帖 • 244 关注
  • 负能量

    上帝为你关上了一扇门,然后就去睡觉了....努力不一定能成功,但不努力一定很轻松 (° ー °〃)

    88 引用 • 1234 回帖 • 429 关注
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    58 引用 • 22 回帖 • 4 关注
  • TGIF

    Thank God It's Friday! 感谢老天,总算到星期五啦!

    287 引用 • 4484 回帖 • 667 关注
  • Logseq

    Logseq 是一个隐私优先、开源的知识库工具。

    Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.

    5 引用 • 62 回帖 • 1 关注
  • Vim

    Vim 是类 UNIX 系统文本编辑器 Vi 的加强版本,加入了更多特性来帮助编辑源代码。Vim 的部分增强功能包括文件比较(vimdiff)、语法高亮、全面的帮助系统、本地脚本(Vimscript)和便于选择的可视化模式。

    28 引用 • 66 回帖
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    128 引用 • 171 回帖
  • 钉钉

    钉钉,专为中国企业打造的免费沟通协同多端平台, 阿里巴巴出品。

    15 引用 • 67 回帖 • 354 关注
  • JavaScript

    JavaScript 一种动态类型、弱类型、基于原型的直译式脚本语言,内置支持类型。它的解释器被称为 JavaScript 引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在 HTML 网页上使用,用来给 HTML 网页增加动态功能。

    726 引用 • 1312 回帖 • 57 关注
  • Spring

    Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。

    942 引用 • 1459 回帖 • 74 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 1 关注
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 626 关注
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 368 关注
  • 分享

    有什么新发现就分享给大家吧!

    246 引用 • 1786 回帖
  • Unity

    Unity 是由 Unity Technologies 开发的一个让开发者可以轻松创建诸如 2D、3D 多平台的综合型游戏开发工具,是一个全面整合的专业游戏引擎。

    25 引用 • 7 回帖 • 203 关注
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    11 引用 • 5 回帖 • 600 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 563 关注
  • Scala

    Scala 是一门多范式的编程语言,集成面向对象编程和函数式编程的各种特性。

    13 引用 • 11 回帖 • 115 关注
  • 快应用

    快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。

    15 引用 • 127 回帖 • 4 关注
  • 以太坊

    以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。

    34 引用 • 367 回帖 • 5 关注