块引排序问题

本贴最后更新于 990 天前,其中的信息可能已经时移俗易

1.9.7 下,如下图,我不清楚现在这是按什么顺序排的,从逻辑上讲,我认为红框标的内容应该排在第一个

image.png

而 1.9.6 中,排序在逻辑上是正确的:

image.png

此外,1.9.7 中,按照下图操作,搜索结果中的第一个是无意义内容:

temp212.gif

1.9.6 中也有,但排序在后面,所以平时使用时不会被影响到:

image.png

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23014 引用 • 92572 回帖
1 操作
fangly 在 2022-04-07 17:22:31 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • v1.9.7 改过搜索排序实现 Issue #4493 · siyuan-note/siyuan 看来还是不太好用,得继续改进。

    这个问题主要是因为 length 字段影响,列表项 线段树+ 子项 ccc 的长度大于了上面单项 abc 是 线段树 的长度,因为目前的长度是使用 markdown 字段得出的,这个里面包含了标记符和换行符。

    下个版本我们把 length 值取自 content 应该就正确了 Issue #4530 · siyuan-note/siyuan

    最后提到的那个忽略当前块暂时先不改进了。

    1 回复
  • fangly

    问题 1:sort 字段中有考虑被引用次数吗,我认为排序时首先看匹配程度,然后看被引用次数,之后再是其他,像下图中,红框标出的被引用次数有 2,其他都是 0,这个应该排在最前面:

    image.png

    问题 2:测试时又发现一个古老 bug,锚文本为空时应该显示列表项的第一个块,可以看到刚引用时并不是,我得修改一下锚文本再清空锚文本才行:

    temp215.gif

    问题 3:单论匹配程度,我认为下图中,也是红框中的列表项匹配程度最高(我在搜索设置中过滤掉了段落块),该列表项的第一个块和搜索内容完全匹配。

    image.png

    这在实际使用过程中非常常见,比如说我想要写关于 线段树 的内容,如下图,我有三种选择:1. 我可以单独新建一个文档叫线段树,2. 可以列一个标题叫线段树,3. 可以使用列表,在列表项的第一个段落块上写上线段树,三者是等价的。我在其他地方想引用线段树时,如果是文档块或标题块的话,目前没问题,都是排序在第一个,但当我用列表时,排序就出现问题,我想要引用的内容并不在最前面,甚至可能在非常后面。不清楚在技术上实现这个排序逻辑方不方便,不方便的话,只要把问题 1 解决,大部分情况下也还能用。

    image.png

    1 回复
    1 操作
    fangly 在 2022-04-07 22:15:12 更新了该回帖
  • 收到,问题 1 和 3 看上去好像是一样的,我们先按照长度排序的逻辑实现,按引用计数排序太复杂了,目前还没有找到实现方案。如果有一个需要强调排序的,可以指定命名试试,命名的排序优先级是最高的。

    问题 2 下个版本修复 Issue #4536 · siyuan-note/siyuan

    1 回复
  • fangly

    问题 1 和 3 不一样,问题 1 和引用数量有关,问题 3 和引用数量无关,和 https://ld246.com/article/1649338100756 这个问题有一定关联

    首先我在搜索设置中关闭了段落块

    然后比如说我在某文档中写了关于 线段树 的内容,在顶级节点上写线段树,子列表中写线段树的具体内容,子列表中会大量包含 线段树 这个关键字

    然后我在其他地方想要引用 线段树,讲道理应该引用最外层这个列表项,这个列表项的第一个块的内容和 线段树 关键词完全匹配,但是实际搜索结果中,因为最外层列表项长度最长,所以会排在最后

    image.png

    而如果我在搜索设置中打开段落块,这时候搜索的第一个结果和我想要的结果非常近,但可惜是段落块,我想要外层的列表项块

    image.png

    这个问题可以和 https://ld246.com/article/1649338100756 这个帖子一起考虑下

推荐标签 标签

  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3454 回帖 • 189 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    27 引用 • 225 回帖 • 163 关注
  • IDEA

    IDEA 全称 IntelliJ IDEA,是一款 Java 语言开发的集成环境,在业界被公认为最好的 Java 开发工具之一。IDEA 是 JetBrains 公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨著称的东欧程序员为主。

    181 引用 • 400 回帖
  • Shell

    Shell 脚本与 Windows/Dos 下的批处理相似,也就是用各类命令预先放入到一个文件中,方便一次性执行的一个程序文件,主要是方便管理员进行设置或者管理用的。但是它比 Windows 下的批处理更强大,比用其他编程程序编辑的程序效率更高,因为它使用了 Linux/Unix 下的命令。

    123 引用 • 74 回帖 • 2 关注
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    692 引用 • 535 回帖
  • C

    C 语言是一门通用计算机编程语言,应用广泛。C 语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。

    85 引用 • 165 回帖 • 2 关注
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 667 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23014 引用 • 92572 回帖
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 4 关注
  • Telegram

    Telegram 是一个非盈利性、基于云端的即时消息服务。它提供了支持各大操作系统平台的开源的客户端,也提供了很多强大的 APIs 给开发者创建自己的客户端和机器人。

    5 引用 • 35 回帖
  • Ruby

    Ruby 是一种开源的面向对象程序设计的服务器端脚本语言,在 20 世纪 90 年代中期由日本的松本行弘(まつもとゆきひろ/Yukihiro Matsumoto)设计并开发。在 Ruby 社区,松本也被称为马茨(Matz)。

    7 引用 • 31 回帖 • 216 关注
  • Facebook

    Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。

    4 引用 • 15 回帖 • 440 关注
  • Docker

    Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的操作系统上。容器完全使用沙箱机制,几乎没有性能开销,可以很容易地在机器和数据中心中运行。

    492 引用 • 926 回帖
  • MongoDB

    MongoDB(来自于英文单词“Humongous”,中文含义为“庞大”)是一个基于分布式文件存储的数据库,由 C++ 语言编写。旨在为应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似 JSON 的 BSON 格式,因此可以存储比较复杂的数据类型。

    90 引用 • 59 回帖 • 1 关注
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    41 引用 • 130 回帖 • 253 关注
  • jQuery

    jQuery 是一套跨浏览器的 JavaScript 库,强化 HTML 与 JavaScript 之间的操作。由 John Resig 在 2006 年 1 月的 BarCamp NYC 上释出第一个版本。全球约有 28% 的网站使用 jQuery,是非常受欢迎的 JavaScript 库。

    63 引用 • 134 回帖 • 724 关注
  • JSON

    JSON (JavaScript Object Notation)是一种轻量级的数据交换格式。易于人类阅读和编写。同时也易于机器解析和生成。

    52 引用 • 190 回帖 • 1 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    265 引用 • 666 回帖 • 1 关注
  • 尊园地产

    昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。

    1 引用 • 22 回帖 • 772 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖
  • Love2D

    Love2D 是一个开源的, 跨平台的 2D 游戏引擎。使用纯 Lua 脚本来进行游戏开发。目前支持的平台有 Windows, Mac OS X, Linux, Android 和 iOS。

    14 引用 • 53 回帖 • 538 关注
  • Solidity

    Solidity 是一种智能合约高级语言,运行在 [以太坊] 虚拟机(EVM)之上。它的语法接近于 JavaScript,是一种面向对象的语言。

    3 引用 • 18 回帖 • 401 关注
  • DevOps

    DevOps(Development 和 Operations 的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    51 引用 • 25 回帖
  • 反馈

    Communication channel for makers and users.

    123 引用 • 913 回帖 • 250 关注
  • PostgreSQL

    PostgreSQL 是一款功能强大的企业级数据库系统,在 BSD 开源许可证下发布。

    22 引用 • 22 回帖
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 584 关注