块引排序问题

本贴最后更新于 837 天前,其中的信息可能已经时移俗易

1.9.7 下,如下图,我不清楚现在这是按什么顺序排的,从逻辑上讲,我认为红框标的内容应该排在第一个

image.png

而 1.9.6 中,排序在逻辑上是正确的:

image.png

此外,1.9.7 中,按照下图操作,搜索结果中的第一个是无意义内容:

temp212.gif

1.9.6 中也有,但排序在后面,所以平时使用时不会被影响到:

image.png

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    20158 引用 • 77745 回帖
1 操作
fangly 在 2022-04-07 17:22:31 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • v1.9.7 改过搜索排序实现 Issue #4493 · siyuan-note/siyuan 看来还是不太好用,得继续改进。

    这个问题主要是因为 length 字段影响,列表项 线段树+ 子项 ccc 的长度大于了上面单项 abc 是 线段树 的长度,因为目前的长度是使用 markdown 字段得出的,这个里面包含了标记符和换行符。

    下个版本我们把 length 值取自 content 应该就正确了 Issue #4530 · siyuan-note/siyuan

    最后提到的那个忽略当前块暂时先不改进了。

    1 回复
  • fangly

    问题 1:sort 字段中有考虑被引用次数吗,我认为排序时首先看匹配程度,然后看被引用次数,之后再是其他,像下图中,红框标出的被引用次数有 2,其他都是 0,这个应该排在最前面:

    image.png

    问题 2:测试时又发现一个古老 bug,锚文本为空时应该显示列表项的第一个块,可以看到刚引用时并不是,我得修改一下锚文本再清空锚文本才行:

    temp215.gif

    问题 3:单论匹配程度,我认为下图中,也是红框中的列表项匹配程度最高(我在搜索设置中过滤掉了段落块),该列表项的第一个块和搜索内容完全匹配。

    image.png

    这在实际使用过程中非常常见,比如说我想要写关于 线段树 的内容,如下图,我有三种选择:1. 我可以单独新建一个文档叫线段树,2. 可以列一个标题叫线段树,3. 可以使用列表,在列表项的第一个段落块上写上线段树,三者是等价的。我在其他地方想引用线段树时,如果是文档块或标题块的话,目前没问题,都是排序在第一个,但当我用列表时,排序就出现问题,我想要引用的内容并不在最前面,甚至可能在非常后面。不清楚在技术上实现这个排序逻辑方不方便,不方便的话,只要把问题 1 解决,大部分情况下也还能用。

    image.png

    1 回复
    1 操作
    fangly 在 2022-04-07 22:15:12 更新了该回帖
  • 收到,问题 1 和 3 看上去好像是一样的,我们先按照长度排序的逻辑实现,按引用计数排序太复杂了,目前还没有找到实现方案。如果有一个需要强调排序的,可以指定命名试试,命名的排序优先级是最高的。

    问题 2 下个版本修复 Issue #4536 · siyuan-note/siyuan

    1 回复
  • fangly

    问题 1 和 3 不一样,问题 1 和引用数量有关,问题 3 和引用数量无关,和 https://ld246.com/article/1649338100756 这个问题有一定关联

    首先我在搜索设置中关闭了段落块

    然后比如说我在某文档中写了关于 线段树 的内容,在顶级节点上写线段树,子列表中写线段树的具体内容,子列表中会大量包含 线段树 这个关键字

    然后我在其他地方想要引用 线段树,讲道理应该引用最外层这个列表项,这个列表项的第一个块的内容和 线段树 关键词完全匹配,但是实际搜索结果中,因为最外层列表项长度最长,所以会排在最后

    image.png

    而如果我在搜索设置中打开段落块,这时候搜索的第一个结果和我想要的结果非常近,但可惜是段落块,我想要外层的列表项块

    image.png

    这个问题可以和 https://ld246.com/article/1649338100756 这个帖子一起考虑下

推荐标签 标签

  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖
  • JSON

    JSON (JavaScript Object Notation)是一种轻量级的数据交换格式。易于人类阅读和编写。同时也易于机器解析和生成。

    51 引用 • 190 回帖
  • GitLab

    GitLab 是利用 Ruby 一个开源的版本管理系统,实现一个自托管的 Git 项目仓库,可通过 Web 界面操作公开或私有项目。

    46 引用 • 72 回帖
  • 酷鸟浏览器

    安全 · 稳定 · 快速
    为跨境从业人员提供专业的跨境浏览器

    3 引用 • 59 回帖 • 23 关注
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    76 引用 • 429 回帖
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖 • 1 关注
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    76 引用 • 37 回帖
  • Linux

    Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。

    923 引用 • 936 回帖
  • BND

    BND(Baidu Netdisk Downloader)是一款图形界面的百度网盘不限速下载器,支持 Windows、Linux 和 Mac,详细介绍请看这里

    107 引用 • 1281 回帖 • 29 关注
  • BookxNote

    BookxNote 是一款全新的电子书学习工具,助力您的学习与思考,让您的大脑更高效的记忆。

    笔记整理交给我,一心只读圣贤书。

    1 引用 • 1 回帖 • 1 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 30 关注
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    58 引用 • 22 回帖
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    207 引用 • 358 回帖
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖
  • 996
    13 引用 • 200 回帖 • 6 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    262 引用 • 664 回帖
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    17 引用 • 236 回帖 • 373 关注
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 701 关注
  • 倾城之链
    23 引用 • 66 回帖 • 121 关注
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 680 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    26 引用 • 222 回帖 • 167 关注
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    4 引用 • 16 回帖 • 1 关注
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    16 引用 • 7 回帖 • 2 关注
  • 阿里云

    阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。

    89 引用 • 345 回帖 • 1 关注
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    386 引用 • 1226 回帖 • 593 关注
  • 生活

    生活是指人类生存过程中的各项活动的总和,范畴较广,一般指为幸福的意义而存在。生活实际上是对人生的一种诠释。生活包括人类在社会中与自己息息相关的日常活动和心理影射。

    230 引用 • 1454 回帖