请问有 obsidian 迁移思源的工具吗?

本贴最后更新于 237 天前,其中的信息可能已经时过境迁

如题。

obsidian 里有七八百篇笔记,想迁移到思源,请问有没有什么无痛的方法。

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    19665 引用 • 75131 回帖

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • Veritas

    同求,真的很需要

  • 思源可以导入整个 markdown 文件夹,所以理论上应该是可以直接导入的。

    但是 ob 有些私有的语法,不符合 markdown 的标准规范。

    首先是各种依赖插件的语法结构肯定是保留不了了。

    再有一个常见的问题是,如果你插入图片用的是 wiki link [[]] 而非标准语法 ![]() 的话,那图片可能无法正常导入。

    --

    总之来讲,可以导入。但是如果你用了 ob 的插件或者是什么私有的语法功能,那就不要指望保留完整的结构了,顶多只能保留 markdown 最基本的功能。

    1 回复
  • MkFly 1 2 赞同

    我来回答。

    答案是没有这种东西。

    你可以试试 obsidian 迁移到 logseq,或者是 logseq 迁移到 obsidian,也可以是 notion 迁移到 logseq。

    答案是,没有什么无痛的方法,必然会有痛苦。

    1.如果使用了 obsidian 的特有语法的 md 文件(比如 wikilink)。在 vscode、typora 等 md 编辑器里,一样无法渲染这种特有语法。你需要自己去改过来。

    2.使用了插件污染 md 文件。都说“污染”了,比 1.的情况更严重。那就要自己去删除这些“乱码”,再用新软件的功能去实现相同的效果。

    说到底,md 本身就不适合拿来做什么笔记。只能简单拿来写点东西,想要复杂的功能?要么是添加私有语法,要么是软件本身的功能。前者不适合迁移,后者同样不适合迁移。

  • mozhu 1 1 赞同

    思源插件里有个导入链接的转化工具,可以先尝试用那个转化一下 ob 的链接,如果那个转化完还不行,那只能去 ob 那边找一下如何导出标准化 markdown 的教程,我记得是有的,导出后就可以直接库导入思源。

  • 没有,私有语法会污染文档

  • fortun5

    收到,谢谢。看起来大家提及的主要痛点就是 wiki link,刚好我在 ob 里基本都是标准的 link 形式,所以这个倒是问题不大。

    1 回复
  • 那直接文档树导入 markdown 文件夹选 ob 的库就行,不过也得注意图片的处理,是不是都在一个地方

  • timyhh

    用這個 Obsidian plugin 便可將某個筆記本的筆記 收集至 "output",以及將筆記內的相片收集至 "output/attachment"
    https://github.com/bingryan/obsidian-markdown-export-plugin

    但 import 之後 要做點工夫 才可正常顯示那些相片

  • fortun5 1 赞同

    花了点时间迁移完了,汇报一下。

    卡点其实主要在图片和附件,只要都保存在相对路径,并且使用标准的 markdown link 就没问题。

    所以用 python 写个脚本,把 link 处理一下,把附件都挪到相对路径,就能一键迁移了。

    1 回复
  • 建议发出来造福群众

    1 回复
  • fortun5

    因为凑合用就行,代码比较 ugly,只能参考一下思路吧。主要做了两件事:1)处理了三种 link 形式 [[]] ![]() [](),2)把所有附件都放到了 md 同目录。注意处理前先备份整个 vault。。

    
    import sys
    import re
    import os
    import shutil
    
    pattern_markdown = r'\!\[[^\]]*\]\(([^\)]+)\)'
    pattern_wikilink = r'\!\[\[([^\]]+)\]\]'
    pattern_pdf = r'\[\[([^\]]+)\]\]'
    
    base_path = '/Path/to/Obsidian/vault/assets'
    
    def replace_markdown(matchobj):
        orig = matchobj.group(0)
        image = matchobj.group(1)
        image_dir = os.path.dirname(image)
        image_filename = os.path.basename(image)
        image_description = ''
        ext = os.path.splitext(image_filename)[1]
        if ext not in ('.jpg', '.jpeg', '.png', '.gif', '.pdf', '.svg'):
            if '|' in image_filename:  # format [[a.png|500]]
                rets = image_filename.split('|')
                image_filename = rets[0]
                print('image splited by | ')
            else:
                rets = image_filename.split()
                image_filename = rets[0]  # format ![](a.png "some description")
                image_description = ' '.join(rets[1:])
                print('image splited out description: %s.' % image_description)
        orig_image = os.path.join(image_dir, image_filename)
        orig_path = os.path.join(base_path, orig_image)
        #dest_path = os.path.join('assets', image_filename)
        dest_path = image_filename
        #if not os.path.isdir('assets'):
        #    os.mkdir('assets')
        #if image_dir:
        #    new_dir = os.path.join('assets', image_dir)
        #    if not os.path.isdir(new_dir):
        #        os.mkdir(new_dir)
        #print('rename from %s to %s' % (orig_path, dest_path))
        try:
            shutil.move(orig_path, dest_path)
        except:
            print('failed to move %s!!!' % orig_path)
        output = '![](%s)' % dest_path
        if image_description:
            output += '\n' + image_description
        return output
    
    
    def process(infile):
        outlines = []
        with open(infile, "r") as fp:
            lcnt = 0
            for line in fp:
                lcnt += 1
                if lcnt in (1, 2, 4):  # skip front matter
                    continue
                if line.startswith('[['):
                    ret = re.sub(pattern_pdf, replace_markdown, line)
                else:
                    ret = re.sub(pattern_markdown, replace_markdown, line)
                    ret = re.sub(pattern_wikilink, replace_markdown, ret)
                outlines.append(ret)
        output = "".join(outlines)
        with open(infile, "w") as fp:
            fp.write(output)
    
    
    if __name__ == "__main__":
        infile = sys.argv[1]
        process(infile)
    
    
请输入回帖内容 ...

推荐标签 标签

  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    35 引用 • 35 回帖 • 1 关注
  • Gzip

    gzip (GNU zip)是 GNU 自由软件的文件压缩程序。我们在 Linux 中经常会用到后缀为 .gz 的文件,它们就是 Gzip 格式的。现今已经成为互联网上使用非常普遍的一种数据压缩格式,或者说一种文件格式。

    9 引用 • 12 回帖 • 122 关注
  • 知乎

    知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。

    10 引用 • 66 回帖
  • LeetCode

    LeetCode(力扣)是一个全球极客挚爱的高质量技术成长平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer!

    209 引用 • 72 回帖
  • 微信

    腾讯公司 2011 年 1 月 21 日推出的一款手机通讯软件。用户可以通过摇一摇、搜索号码、扫描二维码等添加好友和关注公众平台,同时可以将自己看到的精彩内容分享到微信朋友圈。

    130 引用 • 793 回帖
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 11 关注
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    7 引用 • 26 回帖
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖 • 12 关注
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    21 引用 • 140 回帖 • 17 关注
  • IDEA

    IDEA 全称 IntelliJ IDEA,是一款 Java 语言开发的集成环境,在业界被公认为最好的 Java 开发工具之一。IDEA 是 JetBrains 公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨著称的东欧程序员为主。

    180 引用 • 400 回帖
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 318 关注
  • V2Ray
    1 引用 • 15 回帖
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 697 关注
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    14 引用 • 7 回帖
  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    139 引用 • 3718 回帖
  • RIP

    愿逝者安息!

    8 引用 • 92 回帖 • 310 关注
  • Telegram

    Telegram 是一个非盈利性、基于云端的即时消息服务。它提供了支持各大操作系统平台的开源的客户端,也提供了很多强大的 APIs 给开发者创建自己的客户端和机器人。

    5 引用 • 35 回帖 • 2 关注
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    402 引用 • 3506 回帖
  • CSS

    CSS(Cascading Style Sheet)“层叠样式表”是用于控制网页样式并允许将样式信息与网页内容分离的一种标记性语言。

    184 引用 • 461 回帖 • 1 关注
  • iOS

    iOS 是由苹果公司开发的移动操作系统,最早于 2007 年 1 月 9 日的 Macworld 大会上公布这个系统,最初是设计给 iPhone 使用的,后来陆续套用到 iPod touch、iPad 以及 Apple TV 等产品上。iOS 与苹果的 Mac OS X 操作系统一样,属于类 Unix 的商业操作系统。

    84 引用 • 139 回帖 • 2 关注
  • Redis

    Redis 是一个开源的使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API。从 2010 年 3 月 15 日起,Redis 的开发工作由 VMware 主持。从 2013 年 5 月开始,Redis 的开发由 Pivotal 赞助。

    284 引用 • 247 回帖 • 153 关注
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    106 引用 • 152 回帖
  • TensorFlow

    TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。

    20 引用 • 19 回帖 • 5 关注
  • Docker

    Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的操作系统上。容器完全使用沙箱机制,几乎没有性能开销,可以很容易地在机器和数据中心中运行。

    482 引用 • 905 回帖
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    5 引用 • 26 回帖 • 498 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    262 引用 • 664 回帖
  • 强迫症

    强迫症(OCD)属于焦虑障碍的一种类型,是一组以强迫思维和强迫行为为主要临床表现的神经精神疾病,其特点为有意识的强迫和反强迫并存,一些毫无意义、甚至违背自己意愿的想法或冲动反反复复侵入患者的日常生活。

    15 引用 • 161 回帖