[已解决] 使用多个关键词进行全局模糊搜索的问题

本贴最后更新于 582 天前,其中的信息可能已经事过景迁

这是上次我发帖的那个问题,感觉没有说清楚,这次组织一下语言说的详细一些。

我拿 D 大写的「思源笔记用户指南」举个例子,假使我忘记了某篇笔记的名字,但是我记得某篇笔记里有写过「思源」、「笔记」、「编辑器」、「内容块」这些内容

image.png

于是我使用了模糊搜索「思源 笔记 编辑器 内容块」,但是结果显示「0 个文档中匹配 0 项」

image.png

在上个帖子中 D 大说可以用 OR 语法查询,但是用 OR 查询不仅不能精确定位,而且模糊记忆的词越多,出来的结果越杂乱。比如上面的 AND 查询,我改成 OR 查询一次「思源 OR 笔记 OR 编辑器 OR 内容块」,会发生什么呢?

image.png

搜索结果显示「38 个文档中匹配 193 项」,这还是我关闭了自己的笔记本,只留下了一个「思源笔记用户指南」笔记本的搜索。这样的搜索结果对于查找自己模糊记忆中的笔记是灾难性的。

所以我的想法是,全局搜索应该改成按照文档匹配而不是内容块匹配,否则 AND 语法的模糊搜索就完全失去了应有的作用。因为一个长篇的笔记文档,不可能只有一个内容块,在同一篇文档内跨块模糊搜索是一个基础操作

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    20156 引用 • 77717 回帖
1 操作
Reader 在 2022-12-18 21:37:36 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 可以试试使用 SQL 搜索

    1 回复
  • SQL 可能是我不太熟悉,不知道我下面写的对不对。type = 'p'或者 type = 'd'都不行,搜不出匹配的文档。

    另外从这个提示上感觉 SQL 也是以内容块为单位进行搜索,如果是同一篇文档内的跨块模糊搜索可能也无能为力

    image.png

  • lzuwujx 1

    select * from blocks
    where (id in (select root_id from blocks where content like "% 思源 %")) and
    (id in (select root_id from blocks where content like "%wolai%"))
    order by random() limit 3

    多个关键词可以自行叠加。

    1 回复
  • Reader 1 评论

    我把老铁提供的 SQL 复制粘贴了,把“wolai”改成了“编辑器”,其余未改,但是还是搜不到这篇文档

    老铁熟悉 SQL,麻烦一下老铁,用 SQL 搜「思源」、「笔记」、「编辑器」、「内容块」这四个关键词能搜出来「请从这里开始」这篇文档吗?

    image.png

    2 回复
    原来我思源后面多打了一个空格,老铁的代码有效,可以搜出来这篇文档
    Reader 1 赞同
  • lzuwujx

    select * from blocks
    where (id in (select root_id from blocks where content like "% 思源 %")) and
    (id in (select root_id from blocks where content like "% 笔记 %")) and
    (id in (select root_id from blocks where content like "% 编辑器 %")) and
    (id in (select root_id from blocks where content like "% 内容块 %"))
    order by random()

    20221218212029065.png

  • lzuwujx

    我试了,可以搜到哈

    你再试试呢。【嗯,注意代码直接复制粘贴时可能会有多余的空格】

    1 回复
  • 可以了,通过老铁的热心帮助,问题得到了解决。

    AND 语法的模糊搜索使用 SQL 搜索可以解决,代码如下

    select * from blocks where 
    (id in (select root_id from blocks where content like "%替换内容%")) 
    and (id in (select root_id from blocks where content like "%替换内容%"))
    /*需要多个关键词可自行复制添加*/
    

    只是这种方法还是稍微要点技术,没有老铁的帮忙我压根就做不了这个搜索,希望 D 大在自带的搜索中也能够支持吧

    2 操作
    Reader 在 2022-12-18 21:41:09 更新了该回帖
    Reader 在 2022-12-18 21:39:27 更新了该回帖
  • 是的,感谢老铁的帮助,确实可以了,我没有代码基础,写的 SQL 完全是看帮助文档写的,技术太菜就搜索不到trollface

  • 可以集中肝一下 sql 然后存一些命名搜索以后方便用

    1 回复
  • 确实,只是才疏学浅,目前东抄西抄做了几个,勉强够用 😂

    image.png|400

  • 不过说起来感觉思源的 SQL 嵌入块也有待加强,内容嵌入到了当前页面,但是 Ctrl+F 搜索不了内容。

    嵌入块做操作需要点进去,但是点进去之后又不能定位到刚刚浏览的位置,有些蛋疼

    2 回复
  • 这个确实是有些许蛋疼....... 不知道之后会咋整

  • 现在搜索面板支持保存查询了, 可以试试将搜索方式设置为 SQL 后, 在搜索框中输入 SQL 语句并保存为查询

    1 回复
  • 我这边的搜索很奇怪,不能保存设置。但是我觉得这可能是个小 bug,下个版本应该会修复,就没发帖了

  • v2.7.5 会进行一些改进,但是仅支持使用 SQL 搜索方式。

    select a.*
    from blocks as a,
         (select *
          from blocks
          where id in
                (select root_id from blocks where content like '%思源%')
            and id in
                (select root_id from blocks where content like '%本地%')) as b
    where a.root_id = b.id
      and (a.content like '%思源%' or a.content like '%本地%')
    

    以下截图是按文档分组的结果:

    image

    1 回复
  • 这样写好像比前面的版本要复杂一点。优势在哪里呢?

    1 回复
  • 可以列出具体命中的块。

  • 这个应该算是搜索的基础功能,希望能有更方便的方式

    1 回复
  • Reader 1 赞同

    可以看我最新发布的 query 用法的帖子,对于多关键词搜索,已经可以较为完善的实现了

    1 回复
请输入回帖内容 ...
Reader
纸上得来终觉浅,绝知此事要躬行

推荐标签 标签

  • 前端

    前端技术一般分为前端设计和前端开发,前端设计可以理解为网站的视觉设计,前端开发则是网站的前台代码实现,包括 HTML、CSS 以及 JavaScript 等。

    247 引用 • 1347 回帖 • 2 关注
  • 微信

    腾讯公司 2011 年 1 月 21 日推出的一款手机通讯软件。用户可以通过摇一摇、搜索号码、扫描二维码等添加好友和关注公众平台,同时可以将自己看到的精彩内容分享到微信朋友圈。

    130 引用 • 793 回帖
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    262 引用 • 664 回帖
  • 智能合约

    智能合约(Smart contract)是一种旨在以信息化方式传播、验证或执行合同的计算机协议。智能合约允许在没有第三方的情况下进行可信交易,这些交易可追踪且不可逆转。智能合约概念于 1994 年由 Nick Szabo 首次提出。

    1 引用 • 11 回帖 • 7 关注
  • Mac

    Mac 是苹果公司自 1984 年起以“Macintosh”开始开发的个人消费型计算机,如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro 等计算机。

    164 引用 • 594 回帖
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖
  • OpenShift

    红帽提供的 PaaS 云,支持多种编程语言,为开发人员提供了更为灵活的框架、存储选择。

    14 引用 • 20 回帖 • 606 关注
  • ZeroNet

    ZeroNet 是一个基于比特币加密技术和 BT 网络技术的去中心化的、开放开源的网络和交流系统。

    1 引用 • 21 回帖 • 609 关注
  • Sillot

    Insights(注意当前设置 master 为默认分支)

    汐洛彖夲肜矩阵(Sillot T☳Converbenk Matrix),致力于服务智慧新彖乄,具有彖乄驱动、极致优雅、开发者友好的特点。其中汐洛绞架(Sillot-Gibbet)基于自思源笔记(siyuan-note),前身是思源笔记汐洛版(更早是思源笔记汐洛分支),是智慧新录乄终端(多端融合,移动端优先)。

    主仓库地址:Hi-Windom/Sillot

    文档地址:sillot.db.sc.cn

    注意事项:

    1. ⚠️ 汐洛仍在早期开发阶段,尚不稳定
    2. ⚠️ 汐洛并非面向普通用户设计,使用前请了解风险
    3. ⚠️ 汐洛绞架基于思源笔记,开发者尽最大努力与思源笔记保持兼容,但无法实现 100% 兼容
    29 引用 • 25 回帖 • 53 关注
  • Logseq

    Logseq 是一个隐私优先、开源的知识库工具。

    Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.

    5 引用 • 62 回帖
  • React

    React 是 Facebook 开源的一个用于构建 UI 的 JavaScript 库。

    192 引用 • 291 回帖 • 430 关注
  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖
  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    143 引用 • 3752 回帖
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 566 关注
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖 • 1 关注
  • HBase

    HBase 是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的 Google 论文 “Bigtable:一个结构化数据的分布式存储系统”。就像 Bigtable 利用了 Google 文件系统所提供的分布式数据存储一样,HBase 在 Hadoop 之上提供了类似于 Bigtable 的能力。

    17 引用 • 6 回帖 • 61 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    69 引用 • 190 回帖 • 474 关注
  • 正则表达式

    正则表达式(Regular Expression)使用单个字符串来描述、匹配一系列遵循某个句法规则的字符串。

    31 引用 • 94 回帖 • 1 关注
  • 京东

    京东是中国最大的自营式电商企业,2015 年第一季度在中国自营式 B2C 电商市场的占有率为 56.3%。2014 年 5 月,京东在美国纳斯达克证券交易所正式挂牌上市(股票代码:JD),是中国第一个成功赴美上市的大型综合型电商平台,与腾讯、百度等中国互联网巨头共同跻身全球前十大互联网公司排行榜。

    14 引用 • 102 回帖 • 403 关注
  • SMTP

    SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。

    4 引用 • 18 回帖 • 609 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 714 关注
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    14 引用 • 7 回帖 • 5 关注
  • RESTful

    一种软件架构设计风格而不是标准,提供了一组设计原则和约束条件,主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。

    30 引用 • 114 回帖 • 2 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    20156 引用 • 77717 回帖
  • Eclipse

    Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。

    75 引用 • 258 回帖 • 632 关注
  • AngularJS

    AngularJS 诞生于 2009 年,由 Misko Hevery 等人创建,后为 Google 所收购。是一款优秀的前端 JS 框架,已经被用于 Google 的多款产品当中。AngularJS 有着诸多特性,最为核心的是:MVC、模块化、自动化双向数据绑定、语义化标签、依赖注入等。2.0 版本后已经改名为 Angular。

    12 引用 • 50 回帖 • 441 关注
  • 黑曜石

    黑曜石是一款强大的知识库工具,支持本地 Markdown 文件编辑,支持双向链接和关系图。

    A second brain, for you, forever.

    10 引用 • 88 回帖