同义词 / 别名的一个小建议

本贴最后更新于 1336 天前,其中的信息可能已经时移世改

在记笔记的时候我们应该都很经常遇到同义词的现象,比如一个人的名字有中文的不同翻译 + 英文名,一个名词、定理的全称和简称等等。我很希望可以在日后搜索时无论搜索哪一个关键词都可以找到这个块,而不是每次写的时候都提心吊胆的不能用英文名或是不能用简称。

思源很明显已经考虑到了这个问题,并且给出了别名这个解决方案。但是怎么说呢,就感觉很不方便,我只能一个块一个块的去添加别名,这就是一个很大的工作量,然后可能还会有遗漏,我希望有一个一劳永逸的解决方案,目前有两种简单的想法:

  1. 现在已经有别名机制了,或许就可以利用他进行稍微拓展一些的开发。我们事先在软件中进行设置同义词,比如我设定麦克斯韦方程组、Maxwell Equation、Maxwell Eq 是同义词,然后呢在我每编辑完一个标题、块的时候就进行一下扫描,无论发现哪个关键词都自动添加其他的两个别名;然后以后再次修改时在重新扫描一次。
  2. 还是事先设置同义词,直接在引用时检测如果发现这些关键词就自动搜索含这些同义词的块。仍采用上面的那个例子,我输入“【【麦克斯韦方程组”,软件检测一下,发现了有同义词,就把搜索逻辑改成含“麦克斯韦方程组”或“Maxwell Equation”或“Maxwell Eq”。当然如果输入“【【麦克斯韦”(即输入某个同义词的前几个字)也能匹配就更好了。但是这样可能会造成较多的误搜索结果,不过影响可能不大?因为我使用的时候误搜索结果也不少,尤其搜数字(我闲着没事测试用的,好像正常情况搜数字比较少,除非搜日期之类,或许可以考虑优化一下这方面,就是图片、块的 id 啥的排除在搜索结果外),影响也不大。具体利弊就请 D 大、V 姐权衡了。
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22353 引用 • 89448 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • ri 1 赞同

    对于这个,我觉得可以参考一下 RoamEdit 的解决方案,创立一个特殊的文件,专门用于存放同义词

    鲁迅周树人

    并且在搜索的时候留出一行同义词

  • 其他回帖
  • zhangy 1 评论
    作者

    V 姐,您说的第一条没特别理解。是说一个段落可能既有鲁迅、又有麦克斯韦吗,这样的话同时加上分别的同义词不应该正是我们比较需要的一个情况吗,就是后续搜索搜周树人/Maxwell 都能找到这个段落。我觉得可能有问题的情况可能是一个段落既有鲁迅又有周树人,对这种情况我觉得可以一组同义词只要扫描到一次就把其他的词加上去,然后这一组同义词暂时失效这样一个逻辑。

    因为我对同义词的这个定义基本是无论在什么情况下,或者说 99% 的情况下这俩词的意思都是完全一样的,所以我认为加上不想要的东西基本不太可能,基本没有什么情况我需要把鲁迅和周树人区分开,也不需要把 md 和 markdown 区分开,这在几乎所有情况下都是一个意思完全相同的事情,但是我在写文章时确实会时不时乱用,一会写个 md,一会写个 markdown。只要不滥用这个功能进行。而且由于这个功能需要事先预设,滥用的概率也很低。

    如果比较影响性能,或许可以在刷新文件树的时候同时进行一次?

    然后 V 姐提到的解决方案好像确实可以,我研究一下模板的使用,还没太研究过这一块。感谢 V 姐。

    我的意思是自动可能会产生大量的别名。随着同义词的增加,每个块上都会有非常多的别名,这可能不是我们所想要的。
    Vanessa
  • Dawn99 5 评论

    是的,感觉第一个方案会使得块增加没必要的同义词,这个主要是很多包含这个词语的块并不一定就要表达这个词语的意思。

    感觉使用同义词更多的还是在搜索的时候。大家都比较希望能在搜索“麦克斯韦方程组”的时候也能照顾到“Maxwell Equations”。这个或许创建一个同义词的文件(或者是设置项),能在搜索其中其中词语的时候同时搜索同义词,或许会比较契合楼主的意思?

    当然现在也有解决方法。就是创建一些包含同义词的 sql 模板,但是这个方法在搜索框就没法用上了。。。

    搜索框也可以使用 sql
    Vanessa
    @Vanessa 噢,是的,我的意思是没法使用模板,得自己输入所有的同义词
    Dawn99
    @Dawn99 好的,你说服我了,已记录,但是优先级不高,感谢
    Vanessa 1
    @Vanessa 嗯嗯,感谢感谢,这种有替代方案的不急
    Dawn99
    @Dawn99 理解万岁
    Vanessa
  • 非常感谢你的建议

    1. 自动添加可能会添加一些不想要的东西上来,一个段落可能会同时命中多组同义词。
    2. 可以使用 SQL 进行插叙,麻烦的话可以把 SQL 设置为一个模版。
    2 回复

推荐标签 标签

  • SVN

    SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。

    29 引用 • 98 回帖 • 680 关注
  • 设计模式

    设计模式(Design pattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的一般问题的解决方案。这些解决方案是众多软件开发人员经过相当长的一段时间的试验和错误总结出来的。

    200 引用 • 120 回帖 • 1 关注
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    17 引用 • 236 回帖 • 328 关注
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 62 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 476 关注
  • V2Ray
    1 引用 • 15 回帖 • 1 关注
  • 创造

    你创造的作品可能会帮助到很多人,如果是开源项目的话就更赞了!

    179 引用 • 995 回帖
  • 支付宝

    支付宝是全球领先的独立第三方支付平台,致力于为广大用户提供安全快速的电子支付/网上支付/安全支付/手机支付体验,及转账收款/水电煤缴费/信用卡还款/AA 收款等生活服务应用。

    29 引用 • 347 回帖
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    17 引用 • 53 回帖 • 136 关注
  • Facebook

    Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。

    4 引用 • 15 回帖 • 453 关注
  • WebClipper

    Web Clipper 是一款浏览器剪藏扩展,它可以帮助你把网页内容剪藏到本地。

    3 引用 • 9 回帖
  • 智能合约

    智能合约(Smart contract)是一种旨在以信息化方式传播、验证或执行合同的计算机协议。智能合约允许在没有第三方的情况下进行可信交易,这些交易可追踪且不可逆转。智能合约概念于 1994 年由 Nick Szabo 首次提出。

    1 引用 • 11 回帖 • 4 关注
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 585 关注
  • 外包

    有空闲时间是接外包好呢还是学习好呢?

    26 引用 • 232 回帖 • 2 关注
  • OAuth

    OAuth 协议为用户资源的授权提供了一个安全的、开放而又简易的标准。与以往的授权方式不同之处是 oAuth 的授权不会使第三方触及到用户的帐号信息(如用户名与密码),即第三方无需使用用户的用户名与密码就可以申请获得该用户资源的授权,因此 oAuth 是安全的。oAuth 是 Open Authorization 的简写。

    36 引用 • 103 回帖 • 9 关注
  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 94 关注
  • 自由行
    11 关注
  • Windows

    Microsoft Windows 是美国微软公司研发的一套操作系统,它问世于 1985 年,起初仅仅是 Microsoft-DOS 模拟环境,后续的系统版本由于微软不断的更新升级,不但易用,也慢慢的成为家家户户人们最喜爱的操作系统。

    222 引用 • 473 回帖
  • Tomcat

    Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。

    162 引用 • 529 回帖
  • 运维

    互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。

    149 引用 • 257 回帖
  • Log4j

    Log4j 是 Apache 开源的一款使用广泛的 Java 日志组件。

    20 引用 • 18 回帖 • 30 关注
  • CongSec

    本标签主要用于分享网络空间安全专业的学习笔记

    1 引用 • 1 回帖 • 9 关注
  • 百度

    百度(Nasdaq:BIDU)是全球最大的中文搜索引擎、最大的中文网站。2000 年 1 月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

    63 引用 • 785 回帖 • 177 关注
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    21 引用 • 140 回帖 • 1 关注
  • SQLite

    SQLite 是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。SQLite 是全世界使用最为广泛的数据库引擎。

    5 引用 • 7 回帖
  • jsDelivr

    jsDelivr 是一个开源的 CDN 服务,可为 npm 包、GitHub 仓库提供免费、快速并且可靠的全球 CDN 加速服务。

    5 引用 • 31 回帖 • 58 关注
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖 • 18 关注