同义词 / 别名的一个小建议

本贴最后更新于 1121 天前,其中的信息可能已经时移世改

在记笔记的时候我们应该都很经常遇到同义词的现象,比如一个人的名字有中文的不同翻译 + 英文名,一个名词、定理的全称和简称等等。我很希望可以在日后搜索时无论搜索哪一个关键词都可以找到这个块,而不是每次写的时候都提心吊胆的不能用英文名或是不能用简称。

思源很明显已经考虑到了这个问题,并且给出了别名这个解决方案。但是怎么说呢,就感觉很不方便,我只能一个块一个块的去添加别名,这就是一个很大的工作量,然后可能还会有遗漏,我希望有一个一劳永逸的解决方案,目前有两种简单的想法:

  1. 现在已经有别名机制了,或许就可以利用他进行稍微拓展一些的开发。我们事先在软件中进行设置同义词,比如我设定麦克斯韦方程组、Maxwell Equation、Maxwell Eq 是同义词,然后呢在我每编辑完一个标题、块的时候就进行一下扫描,无论发现哪个关键词都自动添加其他的两个别名;然后以后再次修改时在重新扫描一次。
  2. 还是事先设置同义词,直接在引用时检测如果发现这些关键词就自动搜索含这些同义词的块。仍采用上面的那个例子,我输入“【【麦克斯韦方程组”,软件检测一下,发现了有同义词,就把搜索逻辑改成含“麦克斯韦方程组”或“Maxwell Equation”或“Maxwell Eq”。当然如果输入“【【麦克斯韦”(即输入某个同义词的前几个字)也能匹配就更好了。但是这样可能会造成较多的误搜索结果,不过影响可能不大?因为我使用的时候误搜索结果也不少,尤其搜数字(我闲着没事测试用的,好像正常情况搜数字比较少,除非搜日期之类,或许可以考虑优化一下这方面,就是图片、块的 id 啥的排除在搜索结果外),影响也不大。具体利弊就请 D 大、V 姐权衡了。
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    18619 引用 • 69285 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • zhangy 1 评论
    作者

    V 姐,您说的第一条没特别理解。是说一个段落可能既有鲁迅、又有麦克斯韦吗,这样的话同时加上分别的同义词不应该正是我们比较需要的一个情况吗,就是后续搜索搜周树人/Maxwell 都能找到这个段落。我觉得可能有问题的情况可能是一个段落既有鲁迅又有周树人,对这种情况我觉得可以一组同义词只要扫描到一次就把其他的词加上去,然后这一组同义词暂时失效这样一个逻辑。

    因为我对同义词的这个定义基本是无论在什么情况下,或者说 99% 的情况下这俩词的意思都是完全一样的,所以我认为加上不想要的东西基本不太可能,基本没有什么情况我需要把鲁迅和周树人区分开,也不需要把 md 和 markdown 区分开,这在几乎所有情况下都是一个意思完全相同的事情,但是我在写文章时确实会时不时乱用,一会写个 md,一会写个 markdown。只要不滥用这个功能进行。而且由于这个功能需要事先预设,滥用的概率也很低。

    如果比较影响性能,或许可以在刷新文件树的时候同时进行一次?

    然后 V 姐提到的解决方案好像确实可以,我研究一下模板的使用,还没太研究过这一块。感谢 V 姐。

    我的意思是自动可能会产生大量的别名。随着同义词的增加,每个块上都会有非常多的别名,这可能不是我们所想要的。
    Vanessa
  • 其他回帖
  • 非常感谢你的建议

    1. 自动添加可能会添加一些不想要的东西上来,一个段落可能会同时命中多组同义词。
    2. 可以使用 SQL 进行插叙,麻烦的话可以把 SQL 设置为一个模版。
    2 回复
  • ri 1 赞同

    对于这个,我觉得可以参考一下 RoamEdit 的解决方案,创立一个特殊的文件,专门用于存放同义词

    鲁迅周树人

    并且在搜索的时候留出一行同义词

  • Dawn99 5 评论

    是的,感觉第一个方案会使得块增加没必要的同义词,这个主要是很多包含这个词语的块并不一定就要表达这个词语的意思。

    感觉使用同义词更多的还是在搜索的时候。大家都比较希望能在搜索“麦克斯韦方程组”的时候也能照顾到“Maxwell Equations”。这个或许创建一个同义词的文件(或者是设置项),能在搜索其中其中词语的时候同时搜索同义词,或许会比较契合楼主的意思?

    当然现在也有解决方法。就是创建一些包含同义词的 sql 模板,但是这个方法在搜索框就没法用上了。。。

    搜索框也可以使用 sql
    Vanessa
    @Vanessa 噢,是的,我的意思是没法使用模板,得自己输入所有的同义词
    Dawn99
    @Dawn99 好的,你说服我了,已记录,但是优先级不高,感谢
    Vanessa 1
    @Vanessa 嗯嗯,感谢感谢,这种有替代方案的不急
    Dawn99
    @Dawn99 理解万岁
    Vanessa

推荐标签 标签

  • 生活

    生活是指人类生存过程中的各项活动的总和,范畴较广,一般指为幸福的意义而存在。生活实际上是对人生的一种诠释。生活包括人类在社会中与自己息息相关的日常活动和心理影射。

    228 引用 • 1450 回帖
  • Oracle

    Oracle(甲骨文)公司,全称甲骨文股份有限公司(甲骨文软件系统有限公司),是全球最大的企业级软件公司,总部位于美国加利福尼亚州的红木滩。1989 年正式进入中国市场。2013 年,甲骨文已超越 IBM,成为继 Microsoft 后全球第二大软件公司。

    103 引用 • 126 回帖 • 452 关注
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    40 引用 • 40 回帖
  • 京东

    京东是中国最大的自营式电商企业,2015 年第一季度在中国自营式 B2C 电商市场的占有率为 56.3%。2014 年 5 月,京东在美国纳斯达克证券交易所正式挂牌上市(股票代码:JD),是中国第一个成功赴美上市的大型综合型电商平台,与腾讯、百度等中国互联网巨头共同跻身全球前十大互联网公司排行榜。

    14 引用 • 102 回帖 • 401 关注
  • TensorFlow

    TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。

    20 引用 • 19 回帖
  • Ngui

    Ngui 是一个 GUI 的排版显示引擎和跨平台的 GUI 应用程序开发框架,基于
    Node.js / OpenGL。目标是在此基础上开发 GUI 应用程序可拥有开发 WEB 应用般简单与速度同时兼顾 Native 应用程序的性能与体验。

    7 引用 • 9 回帖 • 346 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 696 关注
  • Markdown

    Markdown 是一种轻量级标记语言,用户可使用纯文本编辑器来排版文档,最终通过 Markdown 引擎将文档转换为所需格式(比如 HTML、PDF 等)。

    163 引用 • 1450 回帖 • 1 关注
  • 倾城之链
    23 引用 • 66 回帖 • 97 关注
  • 微软

    微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

    8 引用 • 44 回帖 • 1 关注
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    21 引用 • 140 回帖 • 25 关注
  • Kubernetes

    Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。

    108 引用 • 54 回帖 • 1 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 1 关注
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    96 引用 • 155 回帖
  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    131 引用 • 3639 回帖
  • Telegram

    Telegram 是一个非盈利性、基于云端的即时消息服务。它提供了支持各大操作系统平台的开源的客户端,也提供了很多强大的 APIs 给开发者创建自己的客户端和机器人。

    5 引用 • 35 回帖
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    16 引用 • 53 回帖 • 118 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    395 引用 • 3408 回帖 • 1 关注
  • 职场

    找到自己的位置,萌新烦恼少。

    126 引用 • 1699 回帖
  • 酷鸟浏览器

    安全 · 稳定 · 快速
    为跨境从业人员提供专业的跨境浏览器

    3 引用 • 59 回帖 • 23 关注
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 45 关注
  • DevOps

    DevOps(Development 和 Operations 的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    38 引用 • 24 回帖
  • 书籍

    宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”

    76 引用 • 390 回帖
  • Latke

    Latke 是一款以 JSON 为主的 Java Web 框架。

    70 引用 • 532 回帖 • 711 关注