搜索结果的匹配块的排列逻辑是什么呢?

本贴最后更新于 219 天前,其中的信息可能已经事过境迁

我之前提了一个反馈(希望能优化两个关于搜索结果的问题 - 链滴 (ld246.com)),在其中的第二点上提到了希望支持标题(或者说是“字母”)排序。

我现在又重新琢磨了一下搜索功能,发现我弄不懂搜索结果的匹配块的排列逻辑 😂

首先,我请问在排序方式中,那些排序要素应该都是针对“块”而不是“文档”吧?

Snipaste20240517162305.png

按“相关度排序”是什么意思呢?

如果这些排序方式都是针对的“块”的话,那么我想要的“按标题或字母排序”指的是“按文档的标题或字母排序”。

当排序方式是默认选择“类型”的情况下,我测试了一下,但我搞不懂匹配块的排列逻辑:

Snipaste20240517165821.png

为什么两个文档中匹配的表格块不是排列在一起咧?

为什么列表块的块标也是段落块呢?(我知道“搜索类型”中默认没有勾选列表和列表项,但还是不明白为什么。)

这些块的排列的先后顺序的依据是什么?

下图是“按相关度升序”的匹配结果,我也搞不懂它们的先后顺序的依据是什么?

Snipaste20240517170222.png

我觉得似乎有必要在用户指南中有一个专门的章节来解释其中的搜索匹配逻辑?

我提供的示例只是一个很小的测试集。当笔记比较多的时候,就更容易弄不懂匹配结果的排列逻辑。

就算我不理会其中的排列逻辑,但它们给我带来的最大困扰是同一个文档的块不一定会排列在一起,可能在搜索结果的第一页有 A 文档的一些块,然后再第四页又有 A 文档的一些块。B 文档的块可能也是如此分散。

我个人认为相对友好且易懂的搜索匹配的默认设置:“按文档分组”,块是“按原文内容顺序排序”,然后文档名包含对应关键字的文档优先排在最上面,并支持用户选择按文档名排序。

Snipaste20240517171146.png

有热心人可以解答一下我的疑惑吗?也可以说说你对 Siyuan 目前的搜索匹配的设计的看法?

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23026 引用 • 92628 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 88250 1

    默认的块类型排序是按块类型的 sort 值升序的,sort 值可参考 用户指南 - 数据库表 章节,当 sort 值相同时再按块更新时间降序。

    “相关度”排序指的是关键字在内容中的相关性,简单理解就是如果一段内容中关键字出现多次,则相关性更高,具体的排序算法用的是 SQLite FTS5 rank

    按文档分组不作为默认,因为大多数场景下需要的是搜索散列在不同文档中的关键字,如果用户的使用场景刚好是需要默认文档分组,可以考虑使用 保存查询条件 满足需求。

    1 回复
  • 其他回帖
  • Wetoria 2 1 评论

    引述块不是可以当作段落块,而是引述块里,可以放其他块。说白了就是【[]】这样大块套小块。

    如果列表是【】、列表项是[]、段落块是{}、引述块是「」。

    引述块是:「{}」

    列表是【[{}]】

    理解了这种包含关系,就很容理解。

    我琢磨了一下,我想我理解了那个被包含的段落块了,谢谢。
    syjack
  • JeffreyChen 1 1 评论

    “引述块”可以包含“段落块”,不相等

    我琢磨了一下,我想我理解了那个被包含的段落块了,谢谢。
    syjack
  • syjack
    作者

    懂了不少,谢谢。

    在搜索类型中没有默认勾选引述块、列表块和列表项快,在搜索匹配中,它们都会被默认看作为段落块,是这样吗?我个人觉得这样的设计好像有点拧巴,尽管理解之后就挺好明白的。

  • 查看全部回帖

推荐标签 标签

  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 361 关注
  • 工具

    子曰:“工欲善其事,必先利其器。”

    288 引用 • 734 回帖
  • 尊园地产

    昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。

    1 引用 • 22 回帖 • 772 关注
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    334 引用 • 323 回帖 • 4 关注
  • LaTeX

    LaTeX(音译“拉泰赫”)是一种基于 ΤΕΧ 的排版系统,由美国计算机学家莱斯利·兰伯特(Leslie Lamport)在 20 世纪 80 年代初期开发,利用这种格式,即使使用者没有排版和程序设计的知识也可以充分发挥由 TeX 所提供的强大功能,能在几天,甚至几小时内生成很多具有书籍质量的印刷品。对于生成复杂表格和数学公式,这一点表现得尤为突出。因此它非常适用于生成高印刷质量的科技和数学类文档。

    12 引用 • 54 回帖 • 49 关注
  • Solidity

    Solidity 是一种智能合约高级语言,运行在 [以太坊] 虚拟机(EVM)之上。它的语法接近于 JavaScript,是一种面向对象的语言。

    3 引用 • 18 回帖 • 400 关注
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    76 引用 • 1737 回帖 • 2 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 483 关注
  • Sillot

    Insights(注意当前设置 master 为默认分支)

    汐洛彖夲肜矩阵(Sillot T☳Converbenk Matrix),致力于服务智慧新彖乄,具有彖乄驱动、极致优雅、开发者友好的特点。其中汐洛绞架(Sillot-Gibbet)基于自思源笔记(siyuan-note),前身是思源笔记汐洛版(更早是思源笔记汐洛分支),是智慧新录乄终端(多端融合,移动端优先)。

    主仓库地址:Hi-Windom/Sillot

    文档地址:sillot.db.sc.cn

    注意事项:

    1. ⚠️ 汐洛仍在早期开发阶段,尚不稳定
    2. ⚠️ 汐洛并非面向普通用户设计,使用前请了解风险
    3. ⚠️ 汐洛绞架基于思源笔记,开发者尽最大努力与思源笔记保持兼容,但无法实现 100% 兼容
    29 引用 • 25 回帖 • 86 关注
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 637 关注
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    209 引用 • 358 回帖
  • Pipe

    Pipe 是一款小而美的开源博客平台。Pipe 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    132 引用 • 1114 回帖 • 125 关注
  • RIP

    愿逝者安息!

    8 引用 • 92 回帖 • 364 关注
  • 招聘

    哪里都缺人,哪里都不缺人。

    190 引用 • 1057 回帖
  • abitmean

    有点意思就行了

    28 关注
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    179 引用 • 407 回帖 • 490 关注
  • 前端

    前端技术一般分为前端设计和前端开发,前端设计可以理解为网站的视觉设计,前端开发则是网站的前台代码实现,包括 HTML、CSS 以及 JavaScript 等。

    247 引用 • 1348 回帖
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 745 关注
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    7 引用 • 40 回帖
  • 微软

    微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

    8 引用 • 44 回帖
  • jsDelivr

    jsDelivr 是一个开源的 CDN 服务,可为 npm 包、GitHub 仓库提供免费、快速并且可靠的全球 CDN 加速服务。

    5 引用 • 31 回帖 • 72 关注
  • 钉钉

    钉钉,专为中国企业打造的免费沟通协同多端平台, 阿里巴巴出品。

    15 引用 • 67 回帖 • 335 关注
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    4 引用 • 16 回帖
  • C

    C 语言是一门通用计算机编程语言,应用广泛。C 语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。

    85 引用 • 165 回帖 • 1 关注
  • 书籍

    宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”

    78 引用 • 391 回帖
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 584 关注
  • 禅道

    禅道是一款国产的开源项目管理软件,她的核心管理思想基于敏捷方法 scrum,内置了产品管理和项目管理,同时又根据国内研发现状补充了测试管理、计划管理、发布管理、文档管理、事务管理等功能,在一个软件中就可以将软件研发中的需求、任务、bug、用例、计划、发布等要素有序的跟踪管理起来,完整地覆盖了项目管理的核心流程。

    5 引用 • 15 回帖 • 101 关注