同义词 / 别名的一个小建议

本贴最后更新于 1336 天前,其中的信息可能已经时移世改

在记笔记的时候我们应该都很经常遇到同义词的现象,比如一个人的名字有中文的不同翻译 + 英文名,一个名词、定理的全称和简称等等。我很希望可以在日后搜索时无论搜索哪一个关键词都可以找到这个块,而不是每次写的时候都提心吊胆的不能用英文名或是不能用简称。

思源很明显已经考虑到了这个问题,并且给出了别名这个解决方案。但是怎么说呢,就感觉很不方便,我只能一个块一个块的去添加别名,这就是一个很大的工作量,然后可能还会有遗漏,我希望有一个一劳永逸的解决方案,目前有两种简单的想法:

  1. 现在已经有别名机制了,或许就可以利用他进行稍微拓展一些的开发。我们事先在软件中进行设置同义词,比如我设定麦克斯韦方程组、Maxwell Equation、Maxwell Eq 是同义词,然后呢在我每编辑完一个标题、块的时候就进行一下扫描,无论发现哪个关键词都自动添加其他的两个别名;然后以后再次修改时在重新扫描一次。
  2. 还是事先设置同义词,直接在引用时检测如果发现这些关键词就自动搜索含这些同义词的块。仍采用上面的那个例子,我输入“【【麦克斯韦方程组”,软件检测一下,发现了有同义词,就把搜索逻辑改成含“麦克斯韦方程组”或“Maxwell Equation”或“Maxwell Eq”。当然如果输入“【【麦克斯韦”(即输入某个同义词的前几个字)也能匹配就更好了。但是这样可能会造成较多的误搜索结果,不过影响可能不大?因为我使用的时候误搜索结果也不少,尤其搜数字(我闲着没事测试用的,好像正常情况搜数字比较少,除非搜日期之类,或许可以考虑优化一下这方面,就是图片、块的 id 啥的排除在搜索结果外),影响也不大。具体利弊就请 D 大、V 姐权衡了。
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22353 引用 • 89444 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 非常感谢你的建议

    1. 自动添加可能会添加一些不想要的东西上来,一个段落可能会同时命中多组同义词。
    2. 可以使用 SQL 进行插叙,麻烦的话可以把 SQL 设置为一个模版。
    2 回复
  • 其他回帖
  • ri 1 赞同

    对于这个,我觉得可以参考一下 RoamEdit 的解决方案,创立一个特殊的文件,专门用于存放同义词

    鲁迅周树人

    并且在搜索的时候留出一行同义词

  • Dawn99 5 评论

    是的,感觉第一个方案会使得块增加没必要的同义词,这个主要是很多包含这个词语的块并不一定就要表达这个词语的意思。

    感觉使用同义词更多的还是在搜索的时候。大家都比较希望能在搜索“麦克斯韦方程组”的时候也能照顾到“Maxwell Equations”。这个或许创建一个同义词的文件(或者是设置项),能在搜索其中其中词语的时候同时搜索同义词,或许会比较契合楼主的意思?

    当然现在也有解决方法。就是创建一些包含同义词的 sql 模板,但是这个方法在搜索框就没法用上了。。。

    搜索框也可以使用 sql
    Vanessa
    @Vanessa 噢,是的,我的意思是没法使用模板,得自己输入所有的同义词
    Dawn99
    @Dawn99 好的,你说服我了,已记录,但是优先级不高,感谢
    Vanessa 1
    @Vanessa 嗯嗯,感谢感谢,这种有替代方案的不急
    Dawn99
    @Dawn99 理解万岁
    Vanessa
  • zhangy 1 评论
    作者

    V 姐,您说的第一条没特别理解。是说一个段落可能既有鲁迅、又有麦克斯韦吗,这样的话同时加上分别的同义词不应该正是我们比较需要的一个情况吗,就是后续搜索搜周树人/Maxwell 都能找到这个段落。我觉得可能有问题的情况可能是一个段落既有鲁迅又有周树人,对这种情况我觉得可以一组同义词只要扫描到一次就把其他的词加上去,然后这一组同义词暂时失效这样一个逻辑。

    因为我对同义词的这个定义基本是无论在什么情况下,或者说 99% 的情况下这俩词的意思都是完全一样的,所以我认为加上不想要的东西基本不太可能,基本没有什么情况我需要把鲁迅和周树人区分开,也不需要把 md 和 markdown 区分开,这在几乎所有情况下都是一个意思完全相同的事情,但是我在写文章时确实会时不时乱用,一会写个 md,一会写个 markdown。只要不滥用这个功能进行。而且由于这个功能需要事先预设,滥用的概率也很低。

    如果比较影响性能,或许可以在刷新文件树的时候同时进行一次?

    然后 V 姐提到的解决方案好像确实可以,我研究一下模板的使用,还没太研究过这一块。感谢 V 姐。

    我的意思是自动可能会产生大量的别名。随着同义词的增加,每个块上都会有非常多的别名,这可能不是我们所想要的。
    Vanessa

推荐标签 标签

  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    342 引用 • 708 回帖
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖 • 4 关注
  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3453 回帖 • 203 关注
  • SVN

    SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。

    29 引用 • 98 回帖 • 680 关注
  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 94 关注
  • SQLServer

    SQL Server 是由 [微软] 开发和推广的关系数据库管理系统(DBMS),它最初是由 微软、Sybase 和 Ashton-Tate 三家公司共同开发的,并于 1988 年推出了第一个 OS/2 版本。

    21 引用 • 31 回帖 • 1 关注
  • SQLite

    SQLite 是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。SQLite 是全世界使用最为广泛的数据库引擎。

    5 引用 • 7 回帖
  • Quicker

    Quicker 您的指尖工具箱!操作更少,收获更多!

    32 引用 • 131 回帖 • 1 关注
  • Kotlin

    Kotlin 是一种在 Java 虚拟机上运行的静态类型编程语言,由 JetBrains 设计开发并开源。Kotlin 可以编译成 Java 字节码,也可以编译成 JavaScript,方便在没有 JVM 的设备上运行。在 Google I/O 2017 中,Google 宣布 Kotlin 成为 Android 官方开发语言。

    19 引用 • 33 回帖 • 64 关注
  • InfluxDB

    InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。

    2 引用 • 73 关注
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 462 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 4 关注
  • Redis

    Redis 是一个开源的使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API。从 2010 年 3 月 15 日起,Redis 的开发工作由 VMware 主持。从 2013 年 5 月开始,Redis 的开发由 Pivotal 赞助。

    286 引用 • 248 回帖 • 61 关注
  • 反馈

    Communication channel for makers and users.

    123 引用 • 911 回帖 • 245 关注
  • Chrome

    Chrome 又称 Google 浏览器,是一个由谷歌公司开发的网页浏览器。该浏览器是基于其他开源软件所编写,包括 WebKit,目标是提升稳定性、速度和安全性,并创造出简单且有效率的使用者界面。

    62 引用 • 289 回帖 • 1 关注
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 49 关注
  • Log4j

    Log4j 是 Apache 开源的一款使用广泛的 Java 日志组件。

    20 引用 • 18 回帖 • 30 关注
  • GAE

    Google App Engine(GAE)是 Google 管理的数据中心中用于 WEB 应用程序的开发和托管的平台。2008 年 4 月 发布第一个测试版本。目前支持 Python、Java 和 Go 开发部署。全球已有数十万的开发者在其上开发了众多的应用。

    14 引用 • 42 回帖 • 764 关注
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 355 关注
  • GraphQL

    GraphQL 是一个用于 API 的查询语言,是一个使用基于类型系统来执行查询的服务端运行时(类型系统由你的数据定义)。GraphQL 并没有和任何特定数据库或者存储引擎绑定,而是依靠你现有的代码和数据支撑。

    4 引用 • 3 回帖 • 9 关注
  • ZeroNet

    ZeroNet 是一个基于比特币加密技术和 BT 网络技术的去中心化的、开放开源的网络和交流系统。

    1 引用 • 21 回帖 • 638 关注
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    15 引用 • 7 回帖 • 1 关注
  • 前端

    前端技术一般分为前端设计和前端开发,前端设计可以理解为网站的视觉设计,前端开发则是网站的前台代码实现,包括 HTML、CSS 以及 JavaScript 等。

    247 引用 • 1348 回帖
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖 • 1 关注
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    36 引用 • 35 回帖 • 1 关注
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    17 引用 • 236 回帖 • 328 关注