块引排序问题

1.9.7 下,如下图,我不清楚现在这是按什么顺序排的,从逻辑上讲,我认为红框标的内容应该排在第一个

image.png

而 1.9.6 中,排序在逻辑上是正确的:

image.png

此外,1.9.7 中,按照下图操作,搜索结果中的第一个是无意义内容:

temp212.gif

1.9.6 中也有,但排序在后面,所以平时使用时不会被影响到:

image.png

1 操作
fangly 在 2022-04-07 17:22:31 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • fangly
    订阅者 作者

    问题 1 和 3 不一样,问题 1 和引用数量有关,问题 3 和引用数量无关,和 https://ld246.com/article/1649338100756 这个问题有一定关联

    首先我在搜索设置中关闭了段落块

    然后比如说我在某文档中写了关于 线段树 的内容,在顶级节点上写线段树,子列表中写线段树的具体内容,子列表中会大量包含 线段树 这个关键字

    然后我在其他地方想要引用 线段树,讲道理应该引用最外层这个列表项,这个列表项的第一个块的内容和 线段树 关键词完全匹配,但是实际搜索结果中,因为最外层列表项长度最长,所以会排在最后

    image.png

    而如果我在搜索设置中打开段落块,这时候搜索的第一个结果和我想要的结果非常近,但可惜是段落块,我想要外层的列表项块

    image.png

    这个问题可以和 https://ld246.com/article/1649338100756 这个帖子一起考虑下

  • 其他回帖
  • fangly
    订阅者 作者

    问题 1:sort 字段中有考虑被引用次数吗,我认为排序时首先看匹配程度,然后看被引用次数,之后再是其他,像下图中,红框标出的被引用次数有 2,其他都是 0,这个应该排在最前面:

    image.png

    问题 2:测试时又发现一个古老 bug,锚文本为空时应该显示列表项的第一个块,可以看到刚引用时并不是,我得修改一下锚文本再清空锚文本才行:

    temp215.gif

    问题 3:单论匹配程度,我认为下图中,也是红框中的列表项匹配程度最高(我在搜索设置中过滤掉了段落块),该列表项的第一个块和搜索内容完全匹配。

    image.png

    这在实际使用过程中非常常见,比如说我想要写关于 线段树 的内容,如下图,我有三种选择:1. 我可以单独新建一个文档叫线段树,2. 可以列一个标题叫线段树,3. 可以使用列表,在列表项的第一个段落块上写上线段树,三者是等价的。我在其他地方想引用线段树时,如果是文档块或标题块的话,目前没问题,都是排序在第一个,但当我用列表时,排序就出现问题,我想要引用的内容并不在最前面,甚至可能在非常后面。不清楚在技术上实现这个排序逻辑方不方便,不方便的话,只要把问题 1 解决,大部分情况下也还能用。

    image.png

    1 回复
    1 操作
    fangly 在 2022-04-07 22:15:12 更新了该回帖
  • 88250
    订阅者

    收到,问题 1 和 3 看上去好像是一样的,我们先按照长度排序的逻辑实现,按引用计数排序太复杂了,目前还没有找到实现方案。如果有一个需要强调排序的,可以指定命名试试,命名的排序优先级是最高的。

    问题 2 下个版本修复 Issue #4536 · siyuan-note/siyuan

    1 回复
  • 88250
    订阅者

    v1.9.7 改过搜索排序实现 Issue #4493 · siyuan-note/siyuan 看来还是不太好用,得继续改进。

    这个问题主要是因为 length 字段影响,列表项 线段树+ 子项 ccc 的长度大于了上面单项 abc 是 线段树 的长度,因为目前的长度是使用 markdown 字段得出的,这个里面包含了标记符和换行符。

    下个版本我们把 length 值取自 content 应该就正确了 Issue #4530 · siyuan-note/siyuan

    最后提到的那个忽略当前块暂时先不改进了。

    1 回复

推荐标签 标签

  • HBase

    HBase 是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的 Google 论文 “Bigtable:一个结构化数据的分布式存储系统”。就像 Bigtable 利用了 Google 文件系统所提供的分布式数据存储一样,HBase 在 Hadoop 之上提供了类似于 Bigtable 的能力。

    17 引用 • 6 回帖 • 11 关注
  • IPFS

    IPFS(InterPlanetary File System,星际文件系统)是永久的、去中心化保存和共享文件的方法,这是一种内容可寻址、版本化、点对点超媒体的分布式协议。请浏览 IPFS 入门笔记了解更多细节。

    20 引用 • 245 回帖 • 232 关注
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    56 引用 • 28 回帖 • 5 关注
  • 倾城之链
    10 引用 • 39 回帖 • 31 关注
  • PWA

    PWA(Progressive Web App)是 Google 在 2015 年提出、2016 年 6 月开始推广的项目。它结合了一系列现代 Web 技术,在网页应用中实现和原生应用相近的用户体验。

    12 引用 • 68 回帖 • 57 关注
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    105 引用 • 272 回帖
  • Netty

    Netty 是一个基于 NIO 的客户端-服务器编程框架,使用 Netty 可以让你快速、简单地开发出一个可维护、高性能的网络应用,例如实现了某种协议的客户、服务端应用。

    48 引用 • 32 回帖 • 3 关注
  • 分享

    有什么新发现就分享给大家吧!

    233 引用 • 1671 回帖 • 1 关注
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    33 引用 • 40 回帖
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    86 引用 • 155 回帖
  • React

    React 是 Facebook 开源的一个用于构建 UI 的 JavaScript 库。

    184 引用 • 282 回帖 • 515 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    103 引用 • 297 回帖 • 2 关注
  • Love2D

    Love2D 是一个开源的, 跨平台的 2D 游戏引擎。使用纯 Lua 脚本来进行游戏开发。目前支持的平台有 Windows, Mac OS X, Linux, Android 和 iOS。

    14 引用 • 53 回帖 • 458 关注
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    646 引用 • 529 回帖 • 379 关注
  • uTools

    uTools 是一个极简、插件化、跨平台的现代桌面软件。通过自由选配丰富的插件,打造你得心应手的工具集合。

    6 引用 • 13 回帖 • 3 关注
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 255 回帖
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    47 引用 • 206 回帖 • 531 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    5 引用 • 26 回帖 • 468 关注
  • Vditor

    Vditor 是一款浏览器端的 Markdown 编辑器,支持所见即所得、即时渲染(类似 Typora)和分屏预览模式。它使用 TypeScript 实现,支持原生 JavaScript、Vue、React 和 Angular。

    214 引用 • 1265 回帖
  • LaTeX

    LaTeX(音译“拉泰赫”)是一种基于 ΤΕΧ 的排版系统,由美国计算机学家莱斯利·兰伯特(Leslie Lamport)在 20 世纪 80 年代初期开发,利用这种格式,即使使用者没有排版和程序设计的知识也可以充分发挥由 TeX 所提供的强大功能,能在几天,甚至几小时内生成很多具有书籍质量的印刷品。对于生成复杂表格和数学公式,这一点表现得尤为突出。因此它非常适用于生成高印刷质量的科技和数学类文档。

    7 引用 • 31 回帖 • 360 关注
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    320 引用 • 309 回帖 • 358 关注
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 480 关注
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖 • 201 关注
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    95 引用 • 330 回帖
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 686 关注
  • V2Ray

    Project V 是一个工具集合,它可以帮助你打造专属的基础通信网络。Project V 的核心工具称为 V2Ray,其主要负责网络协议和功能的实现,与其它 Project V 通信。

    10 引用 • 14 回帖
  • Firefox

    Mozilla Firefox 中文俗称“火狐”(正式缩写为 Fx 或 fx,非正式缩写为 FF),是一个开源的网页浏览器,使用 Gecko 排版引擎,支持多种操作系统,如 Windows、OSX 及 Linux 等。

    7 引用 • 30 回帖 • 507 关注