搜索结果的匹配块的排列逻辑是什么呢?

本贴最后更新于 335 天前,其中的信息可能已经事过境迁

我之前提了一个反馈(希望能优化两个关于搜索结果的问题 - 链滴 (ld246.com)),在其中的第二点上提到了希望支持标题(或者说是“字母”)排序。

我现在又重新琢磨了一下搜索功能,发现我弄不懂搜索结果的匹配块的排列逻辑 😂

首先,我请问在排序方式中,那些排序要素应该都是针对“块”而不是“文档”吧?

Snipaste20240517162305.png

按“相关度排序”是什么意思呢?

如果这些排序方式都是针对的“块”的话,那么我想要的“按标题或字母排序”指的是“按文档的标题或字母排序”。

当排序方式是默认选择“类型”的情况下,我测试了一下,但我搞不懂匹配块的排列逻辑:

Snipaste20240517165821.png

为什么两个文档中匹配的表格块不是排列在一起咧?

为什么列表块的块标也是段落块呢?(我知道“搜索类型”中默认没有勾选列表和列表项,但还是不明白为什么。)

这些块的排列的先后顺序的依据是什么?

下图是“按相关度升序”的匹配结果,我也搞不懂它们的先后顺序的依据是什么?

Snipaste20240517170222.png

我觉得似乎有必要在用户指南中有一个专门的章节来解释其中的搜索匹配逻辑?

我提供的示例只是一个很小的测试集。当笔记比较多的时候,就更容易弄不懂匹配结果的排列逻辑。

就算我不理会其中的排列逻辑,但它们给我带来的最大困扰是同一个文档的块不一定会排列在一起,可能在搜索结果的第一页有 A 文档的一些块,然后再第四页又有 A 文档的一些块。B 文档的块可能也是如此分散。

我个人认为相对友好且易懂的搜索匹配的默认设置:“按文档分组”,块是“按原文内容顺序排序”,然后文档名包含对应关键字的文档优先排在最上面,并支持用户选择按文档名排序。

Snipaste20240517171146.png

有热心人可以解答一下我的疑惑吗?也可以说说你对 Siyuan 目前的搜索匹配的设计的看法?

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    25125 引用 • 103584 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • Wetoria 2 1 评论 via macOS

    引述块不是可以当作段落块,而是引述块里,可以放其他块。说白了就是【[]】这样大块套小块。

    如果列表是【】、列表项是[]、段落块是{}、引述块是「」。

    引述块是:「{}」

    列表是【[{}]】

    理解了这种包含关系,就很容理解。

    我琢磨了一下,我想我理解了那个被包含的段落块了,谢谢。
    syjack
  • 其他回帖
  • syjack
    作者

    谢谢,就是理解起来有点绕,照你所说,“引述块”也可以当成“段落块”。

    2 回复
  • JeffreyChen 1 1 评论

    “引述块”可以包含“段落块”,不相等

    我琢磨了一下,我想我理解了那个被包含的段落块了,谢谢。
    syjack
  • syjack
    作者

    懂了不少,谢谢。

    在搜索类型中没有默认勾选引述块、列表块和列表项快,在搜索匹配中,它们都会被默认看作为段落块,是这样吗?我个人觉得这样的设计好像有点拧巴,尽管理解之后就挺好明白的。

  • 查看全部回帖

推荐标签 标签

  • 小说

    小说是以刻画人物形象为中心,通过完整的故事情节和环境描写来反映社会生活的文学体裁。

    31 引用 • 108 回帖 • 1 关注
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 653 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖
  • 游戏

    沉迷游戏伤身,强撸灰飞烟灭。

    181 引用 • 821 回帖
  • Hprose

    Hprose 是一款先进的轻量级、跨语言、跨平台、无侵入式、高性能动态远程对象调用引擎库。它不仅简单易用,而且功能强大。你无需专门学习,只需看上几眼,就能用它轻松构建分布式应用系统。

    9 引用 • 17 回帖 • 627 关注
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    693 引用 • 537 回帖
  • LaTeX

    LaTeX(音译“拉泰赫”)是一种基于 ΤΕΧ 的排版系统,由美国计算机学家莱斯利·兰伯特(Leslie Lamport)在 20 世纪 80 年代初期开发,利用这种格式,即使使用者没有排版和程序设计的知识也可以充分发挥由 TeX 所提供的强大功能,能在几天,甚至几小时内生成很多具有书籍质量的印刷品。对于生成复杂表格和数学公式,这一点表现得尤为突出。因此它非常适用于生成高印刷质量的科技和数学类文档。

    12 引用 • 54 回帖 • 12 关注
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    432 引用 • 1250 回帖 • 597 关注
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    52 引用 • 228 回帖
  • 尊园地产

    昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。

    1 引用 • 22 回帖 • 786 关注
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    22 引用 • 148 回帖 • 12 关注
  • OpenResty

    OpenResty 是一个基于 NGINX 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

    17 引用 • 56 关注
  • 音乐

    你听到信仰的声音了么?

    62 引用 • 512 回帖
  • danl
    165 关注
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    83 引用 • 37 回帖 • 1 关注
  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    20 引用 • 37 回帖 • 576 关注
  • Word
    13 引用 • 40 回帖
  • 酷鸟浏览器

    安全 · 稳定 · 快速
    为跨境从业人员提供专业的跨境浏览器

    3 引用 • 59 回帖 • 46 关注
  • 招聘

    哪里都缺人,哪里都不缺人。

    189 引用 • 1057 回帖
  • Mac

    Mac 是苹果公司自 1984 年起以“Macintosh”开始开发的个人消费型计算机,如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro 等计算机。

    168 引用 • 595 回帖 • 1 关注
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖
  • Redis

    Redis 是一个开源的使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API。从 2010 年 3 月 15 日起,Redis 的开发工作由 VMware 主持。从 2013 年 5 月开始,Redis 的开发由 Pivotal 赞助。

    286 引用 • 248 回帖 • 2 关注
  • 自由行
    2 关注
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖 • 1 关注
  • 反馈

    Communication channel for makers and users.

    126 引用 • 930 回帖 • 273 关注
  • TGIF

    Thank God It's Friday! 感谢老天,总算到星期五啦!

    289 引用 • 4492 回帖 • 654 关注
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 680 关注