列表块“一炮三响”问题现状和改进提议

现状

众所周知，一个列表块至少包含了三个块。例如 * foo 的列表块实际的语法树结构和对应的 Markdown 为：

列表块容器 * foo
列表项块容器 * foo
段落块 foo

其对应的数据库表行数据为：

类型	markdown	content
l	* foo	foo
i	* foo	foo
p	foo	foo

问题

这就导致在数据库上查询 foo 时，会同时命中三行，也就是“一炮三响”问题。当存在子列表时该问题尤为突出，表现为所有子列表上重复一次。例如：

* foo
  * bar

其对应的数据库表行数据为：

类型	markdown	content
l	* foo * bar	foobar
i	* foo * bar	foobar
p	foo	foo
l	* bar	bar
i	* bar	bar
p	bar	bar

当搜索 bar 时，会命中 5 行作为结果集。

之前的改进

在搜索时加入了类型过滤，可以设置为过滤容器块，这样上述示例的搜索结果将减少为 1 行，即段落块 bar。

新改进提议

考虑在列表块和列表项块上的 markdown 和 content 字段上仅存储第一个块级子节点内容：

类型	markdown	content
l	* foo	foo
i	* foo	foo
p	foo	foo
l	* bar	bar
i	* bar	bar
p	bar	bar

搜索 bar 时命中三行，即仅在当前列表块“一炮三响”。这个改进逻辑也匹配引用容器块时自动渲染锚文本改进 #3126 和列表项折叠，除第一个子块外其余子块都隐藏 #3142。

更进一步

容器块上的 markdown 和 content 字段完全留空，搜索时仅命中叶子块。

影响范围

对通过子级搜索父级的逻辑会产生影响，比如想搜索同时包含分散在列表项上的某些关键字的父级列表就比较困难，但实现复杂度应该低于之前去重子级的复杂度
已有的一些查询逻辑可能会冗余（为了排除父级），但应该不会产生副作用

正则匹配批量替换修改格式

请问如何通过搜索方式：正则表达式，命中大量段落后，将命中的段落在不修改内容的前提下替换为一级标题、二级标记、加粗、斜体等格式？现在挨个变更段落为一级、二级、三级等标题过于耗费时间，请问有没有快速修改的方法？ [图片]

如何使笔记本折叠后，记忆之前打开的格式，再次打开时恢复

目前状况当我打开这个今日日记的文档后（图一），折叠一下再去看其他的文档（图二），之后返回来时，文档树就全折叠了（图三）图一[图片] 图二[图片] 图三[图片] 求助请问有什么插件，或者设置能做到折叠后再次打开笔记本，会自动展开上一次的样子的。因为类似日记，项目结构一旦多于 3 个嵌套，基本上再次定位就有些许麻烦 ..

问题反馈：右边侧边栏最小过宽

[图片] 右边最小也忒宽了，然后不固定感觉又过于灵敏了，太难受了；还有「聚焦」 UI 稍微修改一下，感觉太大了，然后还有就是，额可能我比较喜欢 Obsidian 拖动「反向链接按键、大纲按钮」现在思源是点击按钮选择，怎么说呢我可以适应，感觉还行；现在最主要就是先看下能不能解决宽度问题；

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

13 回帖

列表块“一炮三响”问题现状和改进提议

注册关于

请输入回帖内容 ...

fangly • 4 年前 • 1
订阅者先知

在数据库改进了之后，想要在上面这个图中搜索同时包含 CNN 模型和 RNN 模型的块，要写非常非常复杂的 sql 讨论各种情况。

知道块长什么样的话，那用非常复杂的 sql 肯定能搜出来，但现实使用过程中，我根本无法知道我笔记中“同时包含 CNN 模型和 RNN 模型”的块是长什么样的，我只知道肯定有容器块包含了它们，而改进后的数据库无法对容器块进行搜索。

原先的数据库设计下，对于这个场景，虽然可能会有重复，但至少保证我能搜索到所有可能有用的块，最后无非是在 sql 查询结果中看到重复的内容跳过不看，但我用 sql 本来就是在挑选后续可能有用的块，有重复内容其实无所谓，看到重复内容，花 1 秒钟识别出是重复的，跳过就好。

个人觉得，“搜不到”比“有重复”带来的问题更加严重，一个是功能上的缺失，一个是体验上稍微麻烦点。

2 操作
fangly 在 2021-10-15 00:40:46 更新了该回帖

fangly 在 2021-10-15 00:31:13 更新了该回帖
其他回帖
audiolabj • 4 年前 • 1 • 1 赞同
赞助者
几点浅见：
1. 对于单一搜索关键词而言，将所有自身 Content 匹配的块（不论是容器块还是叶子块，只要这个块本身的内容（包含扩展属性）匹配搜索条件）作为搜索结果逐条显示，应该符合搜索者的直观期望，所以建议结果中保留这些容器块，可以通过图标和排序的方式（类似于文件命关键字搜索结果中的匹配文件夹和匹配文件的排列）来区隔
2. 如果除了想获得匹配搜索的节点，还想看到节点归属的各上级容器节点，建议是否可以在结果里包含”块面包屑路径“且路径上每个节点都可以直接点击查看；这样可以解决”查看包含 < 关键字 > 的容器节点“的需求，目前思源给出了结果块归属的文档路径（全路径，但每个节点不可单独点击），是否可以再给出块的面包屑 —— 例如：查询包含 CNN 内容的节点，以及包含这些节点的各层容器块，查询结果中仅列出实际包含该内容的某个块，通过这个块的面包屑路径，自然带出各容器节点，上述容器节点不会直接列在查询结果中，既压缩了结果占用的空间，又可以通过这个结果节点的面包屑直观访问
3. 对于 fangly 用户提出的复合关键字查询，且每个关键字匹配在不同层级节点的情形，这个在理解上可以类比网页搜索，查看同时包含"foo"和"bar"的内容，一个 content="foobar"的节点属于直观匹配，但是一个二级子节点包含"foo"且四级子节点包含"bar"的容器节点，是否应该符合”直观“的匹配结果呢？如果这个节点符合，那么包含这个节点的所有容器节点，乃至整个文档，以及该文档的父文档，是否也应该算符合呢？毕竟思源笔记的架构上，文档-子文档-容器块-叶子块，在使用逻辑上是无缝的；网页的搜索结果会把包含"foo"和"bar"的网页全部展示，只是按 page ranking 排序，匹配的字加亮显示。因此这样的需求，可能不同的搜索者，期望不同，用”宁可重复，也不漏掉“的原则处理似乎是恰当的。
fangly • 4 年前 • 1
订阅者先知

从用户的角度来看，一个比较理想的搜索体验：我只用关心我要查询什么，不用关心块的类型，软件自动帮我筛选出满足条件的块。也就是说我只需要 select * from blocks where markdown like "%x1%" and markdown like "%x2%" and markdown like "%x3%"，然后软件自动搜索出同时包含 x1、x2、x3 的所有最小的块（也就是会自动去重）。在这个搜索结果的基础上，我还可以再限定块的类型等其他条件。

当然这已经超出 sql 的范围，不加新字段，无论怎么修改数据库，只用 sql 来实现上面的逻辑肯定会非常复杂。我的看法：要么和 sql 可视化结合，可视化的背后是非常复杂的 sql；要么就是同咸鱼大佬说的，加一个新的字段便于去重，但加深度字段我想了一下貌似没法解决去重这个问题。

举例：

在这种情况下，我只关心：我要搜索同时包含 a b c d 的块。然后软件自动把这 3 个红框中的内容搜索出来。

当时这是非常理想的方式。

3 操作
fangly 在 2021-10-14 23:50:44 更新了该回帖

fangly 在 2021-10-14 23:47:37 更新了该回帖

fangly 在 2021-10-14 23:33:33 更新了该回帖
leolee • 4 年前 • 1 • 2 赞同
订阅者捐赠者恶龙

笔记内容比较多的时候更容易发生的问题是有些内容永远不会被看到而不是一些内容过多的重复出现我觉得可能相对偏宽松的命中范围可能比过于范围过于狭小的反馈更有利于笔记的常青

因为检索需要本身就是因为我们不可能准确记住内容的所在位置而产生,从一个更加宽泛的检索结果去做减法往往比从狭窄的检索结果做加法容易,因为在前面一种情况下我们能看到自己要减去的是一些什么内容,而在后面一种情况下可能连想清楚可能有哪些内容没有覆盖都很难.
查看全部回帖

现状

问题

之前的改进

新改进提议

更进一步

影响范围

相关帖子

v3.5.0 希望只读文档下 Callout 图标能和可编辑模式下一样“宽敞”

正则匹配批量替换修改格式

申请退款, 找不到退款链接

标记背景底色能修改吗

如何使笔记本折叠后，记忆之前打开的格式，再次打开时恢复

问题反馈：右边侧边栏最小过宽

如何修改鼠标选中时的文本样式?

欢迎来到这里！