请问有 obsidian 迁移思源的工具吗?

如题。

obsidian 里有七八百篇笔记,想迁移到思源,请问有没有什么无痛的方法。

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    16135 引用 • 57250 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • Veritas

    同求,真的很需要

  • 思源可以导入整个 markdown 文件夹,所以理论上应该是可以直接导入的。

    但是 ob 有些私有的语法,不符合 markdown 的标准规范。

    首先是各种依赖插件的语法结构肯定是保留不了了。

    再有一个常见的问题是,如果你插入图片用的是 wiki link [[]] 而非标准语法 ![]() 的话,那图片可能无法正常导入。

    --

    总之来讲,可以导入。但是如果你用了 ob 的插件或者是什么私有的语法功能,那就不要指望保留完整的结构了,顶多只能保留 markdown 最基本的功能。

    1 回复
  • MkFly 1 2 赞同

    我来回答。

    答案是没有这种东西。

    你可以试试 obsidian 迁移到 logseq,或者是 logseq 迁移到 obsidian,也可以是 notion 迁移到 logseq。

    答案是,没有什么无痛的方法,必然会有痛苦。

    1.如果使用了 obsidian 的特有语法的 md 文件(比如 wikilink)。在 vscode、typora 等 md 编辑器里,一样无法渲染这种特有语法。你需要自己去改过来。

    2.使用了插件污染 md 文件。都说“污染”了,比 1.的情况更严重。那就要自己去删除这些“乱码”,再用新软件的功能去实现相同的效果。

    说到底,md 本身就不适合拿来做什么笔记。只能简单拿来写点东西,想要复杂的功能?要么是添加私有语法,要么是软件本身的功能。前者不适合迁移,后者同样不适合迁移。

  • 思源插件里有个导入链接的转化工具,可以先尝试用那个转化一下 ob 的链接,如果那个转化完还不行,那只能去 ob 那边找一下如何导出标准化 markdown 的教程,我记得是有的,导出后就可以直接库导入思源。

  • 没有,私有语法会污染文档

  • fortun5

    收到,谢谢。看起来大家提及的主要痛点就是 wiki link,刚好我在 ob 里基本都是标准的 link 形式,所以这个倒是问题不大。

    1 回复
  • 那直接文档树导入 markdown 文件夹选 ob 的库就行,不过也得注意图片的处理,是不是都在一个地方

  • timyhh

    用這個 Obsidian plugin 便可將某個筆記本的筆記 收集至 "output",以及將筆記內的相片收集至 "output/attachment"
    https://github.com/bingryan/obsidian-markdown-export-plugin

    但 import 之後 要做點工夫 才可正常顯示那些相片

  • fortun5 1 赞同

    花了点时间迁移完了,汇报一下。

    卡点其实主要在图片和附件,只要都保存在相对路径,并且使用标准的 markdown link 就没问题。

    所以用 python 写个脚本,把 link 处理一下,把附件都挪到相对路径,就能一键迁移了。

    1 回复
  • 建议发出来造福群众

    1 回复
  • fortun5

    因为凑合用就行,代码比较 ugly,只能参考一下思路吧。主要做了两件事:1)处理了三种 link 形式 [[]] ![]() [](),2)把所有附件都放到了 md 同目录。注意处理前先备份整个 vault。。

    
    import sys
    import re
    import os
    import shutil
    
    pattern_markdown = r'\!\[[^\]]*\]\(([^\)]+)\)'
    pattern_wikilink = r'\!\[\[([^\]]+)\]\]'
    pattern_pdf = r'\[\[([^\]]+)\]\]'
    
    base_path = '/Path/to/Obsidian/vault/assets'
    
    def replace_markdown(matchobj):
        orig = matchobj.group(0)
        image = matchobj.group(1)
        image_dir = os.path.dirname(image)
        image_filename = os.path.basename(image)
        image_description = ''
        ext = os.path.splitext(image_filename)[1]
        if ext not in ('.jpg', '.jpeg', '.png', '.gif', '.pdf', '.svg'):
            if '|' in image_filename:  # format [[a.png|500]]
                rets = image_filename.split('|')
                image_filename = rets[0]
                print('image splited by | ')
            else:
                rets = image_filename.split()
                image_filename = rets[0]  # format ![](a.png "some description")
                image_description = ' '.join(rets[1:])
                print('image splited out description: %s.' % image_description)
        orig_image = os.path.join(image_dir, image_filename)
        orig_path = os.path.join(base_path, orig_image)
        #dest_path = os.path.join('assets', image_filename)
        dest_path = image_filename
        #if not os.path.isdir('assets'):
        #    os.mkdir('assets')
        #if image_dir:
        #    new_dir = os.path.join('assets', image_dir)
        #    if not os.path.isdir(new_dir):
        #        os.mkdir(new_dir)
        #print('rename from %s to %s' % (orig_path, dest_path))
        try:
            shutil.move(orig_path, dest_path)
        except:
            print('failed to move %s!!!' % orig_path)
        output = '![](%s)' % dest_path
        if image_description:
            output += '\n' + image_description
        return output
    
    
    def process(infile):
        outlines = []
        with open(infile, "r") as fp:
            lcnt = 0
            for line in fp:
                lcnt += 1
                if lcnt in (1, 2, 4):  # skip front matter
                    continue
                if line.startswith('[['):
                    ret = re.sub(pattern_pdf, replace_markdown, line)
                else:
                    ret = re.sub(pattern_markdown, replace_markdown, line)
                    ret = re.sub(pattern_wikilink, replace_markdown, ret)
                outlines.append(ret)
        output = "".join(outlines)
        with open(infile, "w") as fp:
            fp.write(output)
    
    
    if __name__ == "__main__":
        infile = sys.argv[1]
        process(infile)
    
    
请输入回帖内容 ...

推荐标签 标签

  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 588 关注
  • SQLite

    SQLite 是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。SQLite 是全世界使用最为广泛的数据库引擎。

    4 引用 • 7 回帖
  • 博客

    记录并分享人生的经历。

    269 引用 • 2385 回帖
  • Tomcat

    Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。

    157 引用 • 529 回帖
  • QQ

    1999 年 2 月腾讯正式推出“腾讯 QQ”,在线用户由 1999 年的 2 人(马化腾和张志东)到现在已经发展到上亿用户了,在线人数超过一亿,是目前使用最广泛的聊天软件之一。

    44 引用 • 555 回帖 • 277 关注
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 413 关注
  • 钉钉

    钉钉,专为中国企业打造的免费沟通协同多端平台, 阿里巴巴出品。

    14 引用 • 67 回帖 • 377 关注
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    96 引用 • 330 回帖
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    170 引用 • 414 回帖 • 463 关注
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    7 引用 • 26 回帖 • 2 关注
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    4 引用 • 16 回帖 • 6 关注
  • SVN

    SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。

    29 引用 • 98 回帖 • 664 关注
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    177 引用 • 120 回帖 • 1 关注
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    14 引用 • 7 回帖
  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1089 引用 • 3465 回帖 • 333 关注
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    162 引用 • 402 回帖 • 524 关注
  • uTools

    uTools 是一个极简、插件化、跨平台的现代桌面软件。通过自由选配丰富的插件,打造你得心应手的工具集合。

    5 引用 • 13 回帖
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    16135 引用 • 57250 回帖
  • 设计模式

    设计模式(Design pattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的一般问题的解决方案。这些解决方案是众多软件开发人员经过相当长的一段时间的试验和错误总结出来的。

    198 引用 • 120 回帖 • 2 关注
  • 服务器

    服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。

    123 引用 • 580 回帖 • 1 关注
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1420 引用 • 10033 回帖 • 476 关注
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    50 引用 • 83 回帖
  • 以太坊

    以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。

    34 引用 • 367 回帖 • 4 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 547 关注
  • 996
    13 引用 • 200 回帖 • 3 关注
  • Swift

    Swift 是苹果于 2014 年 WWDC(苹果开发者大会)发布的开发语言,可与 Objective-C 共同运行于 Mac OS 和 iOS 平台,用于搭建基于苹果平台的应用程序。

    34 引用 • 37 回帖 • 465 关注