[已解决] 使用多个关键词进行全局模糊搜索的问题

本贴最后更新于 495 天前,其中的信息可能已经事过景迁

这是上次我发帖的那个问题,感觉没有说清楚,这次组织一下语言说的详细一些。

我拿 D 大写的「思源笔记用户指南」举个例子,假使我忘记了某篇笔记的名字,但是我记得某篇笔记里有写过「思源」、「笔记」、「编辑器」、「内容块」这些内容

image.png

于是我使用了模糊搜索「思源 笔记 编辑器 内容块」,但是结果显示「0 个文档中匹配 0 项」

image.png

在上个帖子中 D 大说可以用 OR 语法查询,但是用 OR 查询不仅不能精确定位,而且模糊记忆的词越多,出来的结果越杂乱。比如上面的 AND 查询,我改成 OR 查询一次「思源 OR 笔记 OR 编辑器 OR 内容块」,会发生什么呢?

image.png

搜索结果显示「38 个文档中匹配 193 项」,这还是我关闭了自己的笔记本,只留下了一个「思源笔记用户指南」笔记本的搜索。这样的搜索结果对于查找自己模糊记忆中的笔记是灾难性的。

所以我的想法是,全局搜索应该改成按照文档匹配而不是内容块匹配,否则 AND 语法的模糊搜索就完全失去了应有的作用。因为一个长篇的笔记文档,不可能只有一个内容块,在同一篇文档内跨块模糊搜索是一个基础操作

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    18708 引用 • 69846 回帖
1 操作
Reader 在 2022-12-18 21:37:36 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 可以试试使用 SQL 搜索

    1 回复
  • SQL 可能是我不太熟悉,不知道我下面写的对不对。type = 'p'或者 type = 'd'都不行,搜不出匹配的文档。

    另外从这个提示上感觉 SQL 也是以内容块为单位进行搜索,如果是同一篇文档内的跨块模糊搜索可能也无能为力

    image.png

  • lzuwujx 1

    select * from blocks
    where (id in (select root_id from blocks where content like "% 思源 %")) and
    (id in (select root_id from blocks where content like "%wolai%"))
    order by random() limit 3

    多个关键词可以自行叠加。

    1 回复
  • Reader 1 评论

    我把老铁提供的 SQL 复制粘贴了,把“wolai”改成了“编辑器”,其余未改,但是还是搜不到这篇文档

    老铁熟悉 SQL,麻烦一下老铁,用 SQL 搜「思源」、「笔记」、「编辑器」、「内容块」这四个关键词能搜出来「请从这里开始」这篇文档吗?

    image.png

    2 回复
    原来我思源后面多打了一个空格,老铁的代码有效,可以搜出来这篇文档
    Reader 1 赞同
  • lzuwujx

    select * from blocks
    where (id in (select root_id from blocks where content like "% 思源 %")) and
    (id in (select root_id from blocks where content like "% 笔记 %")) and
    (id in (select root_id from blocks where content like "% 编辑器 %")) and
    (id in (select root_id from blocks where content like "% 内容块 %"))
    order by random()

    20221218212029065.png

  • lzuwujx

    我试了,可以搜到哈

    你再试试呢。【嗯,注意代码直接复制粘贴时可能会有多余的空格】

    1 回复
  • 可以了,通过老铁的热心帮助,问题得到了解决。

    AND 语法的模糊搜索使用 SQL 搜索可以解决,代码如下

    select * from blocks where 
    (id in (select root_id from blocks where content like "%替换内容%")) 
    and (id in (select root_id from blocks where content like "%替换内容%"))
    /*需要多个关键词可自行复制添加*/
    

    只是这种方法还是稍微要点技术,没有老铁的帮忙我压根就做不了这个搜索,希望 D 大在自带的搜索中也能够支持吧

    2 操作
    Reader 在 2022-12-18 21:41:09 更新了该回帖
    Reader 在 2022-12-18 21:39:27 更新了该回帖
  • 是的,感谢老铁的帮助,确实可以了,我没有代码基础,写的 SQL 完全是看帮助文档写的,技术太菜就搜索不到trollface

  • 可以集中肝一下 sql 然后存一些命名搜索以后方便用

    1 回复
  • 确实,只是才疏学浅,目前东抄西抄做了几个,勉强够用 😂

    image.png|400

  • 不过说起来感觉思源的 SQL 嵌入块也有待加强,内容嵌入到了当前页面,但是 Ctrl+F 搜索不了内容。

    嵌入块做操作需要点进去,但是点进去之后又不能定位到刚刚浏览的位置,有些蛋疼

    2 回复
  • 这个确实是有些许蛋疼....... 不知道之后会咋整

  • 现在搜索面板支持保存查询了, 可以试试将搜索方式设置为 SQL 后, 在搜索框中输入 SQL 语句并保存为查询

    1 回复
  • 我这边的搜索很奇怪,不能保存设置。但是我觉得这可能是个小 bug,下个版本应该会修复,就没发帖了

  • v2.7.5 会进行一些改进,但是仅支持使用 SQL 搜索方式。

    select a.*
    from blocks as a,
         (select *
          from blocks
          where id in
                (select root_id from blocks where content like '%思源%')
            and id in
                (select root_id from blocks where content like '%本地%')) as b
    where a.root_id = b.id
      and (a.content like '%思源%' or a.content like '%本地%')
    

    以下截图是按文档分组的结果:

    image

    1 回复
  • 这样写好像比前面的版本要复杂一点。优势在哪里呢?

    1 回复
  • 可以列出具体命中的块。

  • 这个应该算是搜索的基础功能,希望能有更方便的方式

    1 回复
  • Reader 1 赞同

    可以看我最新发布的 query 用法的帖子,对于多关键词搜索,已经可以较为完善的实现了

    1 回复
  • 好的,多谢

请输入回帖内容 ...
Reader
纸上得来终觉浅,绝知此事要躬行

推荐标签 标签

  • 小薇

    小薇是一个用 Java 写的 QQ 聊天机器人 Web 服务,可以用于社群互动。

    由于 Smart QQ 从 2019 年 1 月 1 日起停止服务,所以该项目也已经停止维护了!

    34 引用 • 467 回帖 • 693 关注
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    75 引用 • 145 回帖 • 1 关注
  • PostgreSQL

    PostgreSQL 是一款功能强大的企业级数据库系统,在 BSD 开源许可证下发布。

    22 引用 • 22 回帖
  • Sillot

    Sillot (汐洛)孵化自思源笔记,致力于服务智慧新彖乄,具有彖乄驱动、极致优雅、开发者友好的特点
    Github 地址:https://github.com/Hi-Windom/Sillot

    15 引用 • 6 回帖 • 28 关注
  • Latke

    Latke 是一款以 JSON 为主的 Java Web 框架。

    70 引用 • 532 回帖 • 712 关注
  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    51 引用 • 37 回帖
  • Logseq

    Logseq 是一个隐私优先、开源的知识库工具。

    Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.

    4 引用 • 55 回帖 • 10 关注
  • CSDN

    CSDN (Chinese Software Developer Network) 创立于 1999 年,是中国的 IT 社区和服务平台,为中国的软件开发者和 IT 从业者提供知识传播、职业发展、软件开发等全生命周期服务,满足他们在职业发展中学习及共享知识和信息、建立职业发展社交圈、通过软件开发实现技术商业化等刚性需求。

    14 引用 • 155 回帖
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    59 引用 • 29 回帖 • 18 关注
  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    131 引用 • 3639 回帖
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    140 引用 • 441 回帖 • 1 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    261 引用 • 662 回帖
  • 反馈

    Communication channel for makers and users.

    123 引用 • 906 回帖 • 193 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    103 引用 • 294 回帖
  • Caddy

    Caddy 是一款默认自动启用 HTTPS 的 HTTP/2 Web 服务器。

    10 引用 • 54 回帖 • 126 关注
  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 89 关注
  • LeetCode

    LeetCode(力扣)是一个全球极客挚爱的高质量技术成长平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer!

    209 引用 • 72 回帖 • 2 关注
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 47 关注
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    21 引用 • 140 回帖 • 28 关注
  • WebClipper

    Web Clipper 是一款浏览器剪藏扩展,它可以帮助你把网页内容剪藏到本地。

    3 引用 • 9 回帖 • 6 关注
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    164 引用 • 407 回帖 • 526 关注
  • 音乐

    你听到信仰的声音了么?

    59 引用 • 509 回帖
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    675 引用 • 535 回帖 • 1 关注
  • 锤子科技

    锤子科技(Smartisan)成立于 2012 年 5 月,是一家制造移动互联网终端设备的公司,公司的使命是用完美主义的工匠精神,打造用户体验一流的数码消费类产品(智能手机为主),改善人们的生活质量。

    4 引用 • 31 回帖 • 10 关注
  • 快应用

    快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。

    15 引用 • 127 回帖 • 2 关注
  • ZeroNet

    ZeroNet 是一个基于比特币加密技术和 BT 网络技术的去中心化的、开放开源的网络和交流系统。

    1 引用 • 21 回帖 • 592 关注
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1425 引用 • 10043 回帖 • 470 关注