请问有 obsidian 迁移思源的工具吗?

本贴最后更新于 388 天前,其中的信息可能已经时过境迁

如题。

obsidian 里有七八百篇笔记,想迁移到思源,请问有没有什么无痛的方法。

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22340 引用 • 89390 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • Veritas

    同求,真的很需要

  • 思源可以导入整个 markdown 文件夹,所以理论上应该是可以直接导入的。

    但是 ob 有些私有的语法,不符合 markdown 的标准规范。

    首先是各种依赖插件的语法结构肯定是保留不了了。

    再有一个常见的问题是,如果你插入图片用的是 wiki link [[]] 而非标准语法 ![]() 的话,那图片可能无法正常导入。

    --

    总之来讲,可以导入。但是如果你用了 ob 的插件或者是什么私有的语法功能,那就不要指望保留完整的结构了,顶多只能保留 markdown 最基本的功能。

    1 回复
  • MkFly 1 2 赞同

    我来回答。

    答案是没有这种东西。

    你可以试试 obsidian 迁移到 logseq,或者是 logseq 迁移到 obsidian,也可以是 notion 迁移到 logseq。

    答案是,没有什么无痛的方法,必然会有痛苦。

    1.如果使用了 obsidian 的特有语法的 md 文件(比如 wikilink)。在 vscode、typora 等 md 编辑器里,一样无法渲染这种特有语法。你需要自己去改过来。

    2.使用了插件污染 md 文件。都说“污染”了,比 1.的情况更严重。那就要自己去删除这些“乱码”,再用新软件的功能去实现相同的效果。

    说到底,md 本身就不适合拿来做什么笔记。只能简单拿来写点东西,想要复杂的功能?要么是添加私有语法,要么是软件本身的功能。前者不适合迁移,后者同样不适合迁移。

  • 思源插件里有个导入链接的转化工具,可以先尝试用那个转化一下 ob 的链接,如果那个转化完还不行,那只能去 ob 那边找一下如何导出标准化 markdown 的教程,我记得是有的,导出后就可以直接库导入思源。

    2 回复
  • 没有,私有语法会污染文档

  • fortun5

    收到,谢谢。看起来大家提及的主要痛点就是 wiki link,刚好我在 ob 里基本都是标准的 link 形式,所以这个倒是问题不大。

    1 回复
  • 那直接文档树导入 markdown 文件夹选 ob 的库就行,不过也得注意图片的处理,是不是都在一个地方

  • timyhh

    用這個 Obsidian plugin 便可將某個筆記本的筆記 收集至 "output",以及將筆記內的相片收集至 "output/attachment"
    https://github.com/bingryan/obsidian-markdown-export-plugin

    但 import 之後 要做點工夫 才可正常顯示那些相片

  • fortun5 1 赞同

    花了点时间迁移完了,汇报一下。

    卡点其实主要在图片和附件,只要都保存在相对路径,并且使用标准的 markdown link 就没问题。

    所以用 python 写个脚本,把 link 处理一下,把附件都挪到相对路径,就能一键迁移了。

    1 回复
  • 建议发出来造福群众

    1 回复
  • fortun5

    因为凑合用就行,代码比较 ugly,只能参考一下思路吧。主要做了两件事:1)处理了三种 link 形式 [[]] ![]() [](),2)把所有附件都放到了 md 同目录。注意处理前先备份整个 vault。。

    
    import sys
    import re
    import os
    import shutil
    
    pattern_markdown = r'\!\[[^\]]*\]\(([^\)]+)\)'
    pattern_wikilink = r'\!\[\[([^\]]+)\]\]'
    pattern_pdf = r'\[\[([^\]]+)\]\]'
    
    base_path = '/Path/to/Obsidian/vault/assets'
    
    def replace_markdown(matchobj):
        orig = matchobj.group(0)
        image = matchobj.group(1)
        image_dir = os.path.dirname(image)
        image_filename = os.path.basename(image)
        image_description = ''
        ext = os.path.splitext(image_filename)[1]
        if ext not in ('.jpg', '.jpeg', '.png', '.gif', '.pdf', '.svg'):
            if '|' in image_filename:  # format [[a.png|500]]
                rets = image_filename.split('|')
                image_filename = rets[0]
                print('image splited by | ')
            else:
                rets = image_filename.split()
                image_filename = rets[0]  # format ![](a.png "some description")
                image_description = ' '.join(rets[1:])
                print('image splited out description: %s.' % image_description)
        orig_image = os.path.join(image_dir, image_filename)
        orig_path = os.path.join(base_path, orig_image)
        #dest_path = os.path.join('assets', image_filename)
        dest_path = image_filename
        #if not os.path.isdir('assets'):
        #    os.mkdir('assets')
        #if image_dir:
        #    new_dir = os.path.join('assets', image_dir)
        #    if not os.path.isdir(new_dir):
        #        os.mkdir(new_dir)
        #print('rename from %s to %s' % (orig_path, dest_path))
        try:
            shutil.move(orig_path, dest_path)
        except:
            print('failed to move %s!!!' % orig_path)
        output = '![](%s)' % dest_path
        if image_description:
            output += '\n' + image_description
        return output
    
    
    def process(infile):
        outlines = []
        with open(infile, "r") as fp:
            lcnt = 0
            for line in fp:
                lcnt += 1
                if lcnt in (1, 2, 4):  # skip front matter
                    continue
                if line.startswith('[['):
                    ret = re.sub(pattern_pdf, replace_markdown, line)
                else:
                    ret = re.sub(pattern_markdown, replace_markdown, line)
                    ret = re.sub(pattern_wikilink, replace_markdown, ret)
                outlines.append(ret)
        output = "".join(outlines)
        with open(infile, "w") as fp:
            fp.write(output)
    
    
    if __name__ == "__main__":
        infile = sys.argv[1]
        process(infile)
    
    
  • comi

    已经导出了标准化的 md,但是没能导入到思源

    1 回复
  • comi

    已经导出了标准化的 md,但是没能导入到思源

  • 直接用 vscode 打开看能不能识别就知道了,比如图片、链接。另外所谓没能导入是指的什么?

请输入回帖内容 ...

推荐标签 标签

  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 477 关注
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖 • 1 关注
  • 分享

    有什么新发现就分享给大家吧!

    248 引用 • 1792 回帖
  • Kubernetes

    Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。

    110 引用 • 54 回帖
  • 安装

    你若安好,便是晴天。

    132 引用 • 1184 回帖
  • Linux

    Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。

    943 引用 • 943 回帖
  • 知乎

    知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。

    10 引用 • 66 回帖
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 362 关注
  • LaTeX

    LaTeX(音译“拉泰赫”)是一种基于 ΤΕΧ 的排版系统,由美国计算机学家莱斯利·兰伯特(Leslie Lamport)在 20 世纪 80 年代初期开发,利用这种格式,即使使用者没有排版和程序设计的知识也可以充分发挥由 TeX 所提供的强大功能,能在几天,甚至几小时内生成很多具有书籍质量的印刷品。对于生成复杂表格和数学公式,这一点表现得尤为突出。因此它非常适用于生成高印刷质量的科技和数学类文档。

    12 引用 • 54 回帖 • 65 关注
  • 工具

    子曰:“工欲善其事,必先利其器。”

    286 引用 • 729 回帖
  • 阿里云

    阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。

    89 引用 • 345 回帖
  • 倾城之链
    23 引用 • 66 回帖 • 136 关注
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 51 关注
  • Caddy

    Caddy 是一款默认自动启用 HTTPS 的 HTTP/2 Web 服务器。

    12 引用 • 54 回帖 • 165 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    266 引用 • 665 回帖
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖 • 19 关注
  • 服务器

    服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。

    125 引用 • 588 回帖
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 537 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 628 关注
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 671 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    5 引用 • 26 回帖 • 528 关注
  • DevOps

    DevOps(Development 和 Operations 的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    47 引用 • 25 回帖
  • Sillot

    Insights(注意当前设置 master 为默认分支)

    汐洛彖夲肜矩阵(Sillot T☳Converbenk Matrix),致力于服务智慧新彖乄,具有彖乄驱动、极致优雅、开发者友好的特点。其中汐洛绞架(Sillot-Gibbet)基于自思源笔记(siyuan-note),前身是思源笔记汐洛版(更早是思源笔记汐洛分支),是智慧新录乄终端(多端融合,移动端优先)。

    主仓库地址:Hi-Windom/Sillot

    文档地址:sillot.db.sc.cn

    注意事项:

    1. ⚠️ 汐洛仍在早期开发阶段,尚不稳定
    2. ⚠️ 汐洛并非面向普通用户设计,使用前请了解风险
    3. ⚠️ 汐洛绞架基于思源笔记,开发者尽最大努力与思源笔记保持兼容,但无法实现 100% 兼容
    29 引用 • 25 回帖 • 85 关注
  • iOS

    iOS 是由苹果公司开发的移动操作系统,最早于 2007 年 1 月 9 日的 Macworld 大会上公布这个系统,最初是设计给 iPhone 使用的,后来陆续套用到 iPod touch、iPad 以及 Apple TV 等产品上。iOS 与苹果的 Mac OS X 操作系统一样,属于类 Unix 的商业操作系统。

    85 引用 • 139 回帖 • 1 关注
  • Eclipse

    Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。

    75 引用 • 258 回帖 • 617 关注
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    52 引用 • 228 回帖
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    86 引用 • 122 回帖 • 625 关注