思源笔记导入 Logseq 笔记数据转换需求收集

最近在考虑把我之前的 logseq 笔记数据导入到思源笔记,直接导入会有一些问题,打算弄个 quicker 动作进行下处理,下面是我自己遇到、想到的一些问题,有其他需要处理的东西欢迎回帖讨论。进度不会很快,估计年底弄完?

序号 主要问题 问题描述 解决阶段 解决方案 状态
1 嵌入块 logseq 的嵌入块:{{embed ((672c4d14-0e02-4a1e-b2a4-c4a475adddac))}}
思源的嵌入块:{{select * from blocks where id='20241023154602-8rb32bu'}}
两者格式不一样,块 id 不一样
导入后 1. 提取 Logseq 块 id 与思源块 id 的对应关系
2. 删除定义块处的 logseq 块 id
3. 替换嵌入块处的引用格式与 id
未完成
2 块引用 logseq 的块引用:((672c4cfb-b160-4c18-91e6-9994ce7bc2f1))
思源笔记的块引用 ((20241023154602-8rb32bu '表格'))
两者格式不一样,块 id 不一样
导入后 同上 未完成
2.1 文档引用 logseq 的引用基于文档名(所以不支持同名文档),格式为 [[文档A]]​,思源的文档引用格式同块引用。思源会自行处理大多数文档引用,但是当文档名和 md 文件名不一致时,会转换失败。 思源笔记导入时会自动处理,带特殊符号的文档需要额外处理

未完成
2.2 标签的处理 logseq 中 #文档A​=[[文档A]]​,思源中是两种东西 导入前 #文档A​、#[[文档A]]​转换为 [[文档A]]​,同 2.1,需要注意文档名与 md 文件名不相同的情况 未完成
2.3 嵌套块引用 有些人会使用 [[[[文档A]]和[[文档B]]]]​这样的嵌套引用,一次性引用了 文档A​、文档B​和 [[文档A]]和[[文档B]]​3 个文档,思源不支持这种嵌套引用 暂时不管,反正我的库里没有嵌套引用 :) 未完成
3 namespace logseq 工作空间下面需要导入的文件夹有:
- assets(资源)
- journals(日记)
- pages(文档)
直接导入的话,会在笔记本或文档下方生成 jornals 和 pages 两个文档,这两个文档下面就是所有的文档了。namespace 的层次结构丢失。
导入前 假设 pages 下面存在含有具有 namespace 结构的文档:
- 笔记软件___思源.md
- 笔记软件.md
笔记软件___思源.md 是笔记软件.md 的子文档,需要在 pages 下面新建“笔记软件”文件夹,然后把思源.md 放进去,需要对思源.md 中的资源路径增加层级。
未完成
4 日记属性 思源笔记的日记会有 custom-dailynote-20241107​这样的自定义属性 导入前 在 yaml 区增加自定义属性 未完成
5 块创建时间与修改时间 logseq 中未保存块的创建时间、修改时间等信息 导入前 将 md 文件的创建时间、修改时间写入 yaml 未完成
6 闪卡 logseq:带 #card​标签的块是闪卡
思源笔记:带 custom-riff-decks="20230218211946-2kw8jgx"​ial 属性的是闪卡
导入前 #card​段落后面添加 ial 属性 未完成
7 字体颜色 转化为思源笔记的字体样式,需要手动选择对应关系?好像有点麻烦 未完成
8 无序列表转段落 logseq 的所有 md 文件里面都是无序列表,而思源加载大的无序列表会卡顿 导入前 - jornals 文件夹里的 md 文件一般不长,不做处理。
- pages 文件夹里的 md 文件可能会很长,需要处理。
- 将一级列表转为段落。
- 如果一级列表下面含有子级,保留该项。
未完成
9 有序列表 有序列表会有 logseq.order-list-type:: number​属性 导入前 将具有 logseq.order-list-type:: number​属性的无序列表转为 md 格式的有序列表 未完成
10 表格 logseq 中有一种非 md 格式的表格,长这样:
[:table [:tbody [:tr [:td"4"][:td {:colspan "2", :rowspan "2"}"5]"][:td"6"]][:tr [:td"7"][:td"8"]][:tr [:td"9"][:td"10"][:td"11"][:td"12"]]]]
导入前 转化为 md 表格,注意合并单元格的处理 未完成
11 pdf 批注 转化为思源笔记的 pdf 批注,先记录,感觉会有点麻烦 未完成
12 自定义属性 logseq 支持给文档、块添加自定义属性,而且属性支持中文名称。思源笔记的自定义属性名称必须是英文的。 还没想好 未完成
13 任务状态 logseq 的任务具有 later、now、done 三种状态,有 A、B、C 三种优先级。而思源笔记的任务只有未完成、完成两种状态,没有优先级 导入前 将任务状态、优先级转化为自定义属性写入 ial 未完成

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22331 引用 • 89354 回帖
  • Logseq

    Logseq 是一个隐私优先、开源的知识库工具。

    Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.

    6 引用 • 63 回帖
  • Quicker

    Quicker 您的指尖工具箱!操作更少,收获更多!

    32 引用 • 130 回帖 • 3 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • simonmz

    我也是从 logseq 转过来了,logseq 的检索太复杂了,而且检索内容展示界面也太粗糙了,所以就转过来了,就是对思源的文档数模式还很不适应,你这个很有意义,支持大大佬

推荐标签 标签

  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    209 引用 • 358 回帖
  • Mac

    Mac 是苹果公司自 1984 年起以“Macintosh”开始开发的个人消费型计算机,如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro 等计算机。

    166 引用 • 595 回帖
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    77 引用 • 430 回帖 • 2 关注
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 660 关注
  • PWA

    PWA(Progressive Web App)是 Google 在 2015 年提出、2016 年 6 月开始推广的项目。它结合了一系列现代 Web 技术,在网页应用中实现和原生应用相近的用户体验。

    14 引用 • 69 回帖 • 154 关注
  • PWL

    组织简介

    用爱发电 (Programming With Love) 是一个以开源精神为核心的民间开源爱好者技术组织,“用爱发电”象征开源与贡献精神,加入组织,代表你将遵守组织的“个人开源爱好者”的各项条款。申请加入:用爱发电组织邀请帖
    用爱发电组织官网:https://programmingwithlove.stackoverflow.wiki/

    用爱发电组织的核心驱动力:

    • 遵守开源守则,体现开源&贡献精神:以分享为目的,拒绝非法牟利。
    • 自我保护:使用适当的 License 保护自己的原创作品。
    • 尊重他人:不以各种理由、各种漏洞进行未经允许的抄袭、散播、洩露;以礼相待,尊重所有对社区做出贡献的开发者;通过他人的分享习得知识,要留下足迹,表示感谢。
    • 热爱编程、热爱学习:加入组织,热爱编程是首当其要的。我们欢迎热爱讨论、分享、提问的朋友,也同样欢迎默默成就的朋友。
    • 倾听:正确并恳切对待、处理问题与建议,及时修复开源项目的 Bug ,及时与反馈者沟通。不抬杠、不无视、不辱骂。
    • 平视:不诋毁、轻视、嘲讽其他开发者,主动提出建议、施以帮助,以和谐为本。只要他人肯努力,你也可能会被昔日小看的人所超越,所以请保持谦虚。
    • 乐观且活跃:你的努力决定了你的高度。不要放弃,多年后回头俯瞰,才会发现自己已经成就往日所仰望的水平。积极地将项目开源,帮助他人学习、改进,自己也会获得相应的提升、成就与成就感。
    1 引用 • 487 回帖
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    52 引用 • 228 回帖
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    340 引用 • 708 回帖
  • Kotlin

    Kotlin 是一种在 Java 虚拟机上运行的静态类型编程语言,由 JetBrains 设计开发并开源。Kotlin 可以编译成 Java 字节码,也可以编译成 JavaScript,方便在没有 JVM 的设备上运行。在 Google I/O 2017 中,Google 宣布 Kotlin 成为 Android 官方开发语言。

    19 引用 • 33 回帖 • 63 关注
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 333 关注
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3187 引用 • 8213 回帖
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 22 关注
  • 安装

    你若安好,便是晴天。

    132 引用 • 1184 回帖
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    86 引用 • 122 回帖 • 625 关注
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 354 关注
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    59 引用 • 29 回帖 • 5 关注
  • V2Ray
    1 引用 • 15 回帖
  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    117 引用 • 99 回帖 • 211 关注
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    179 引用 • 407 回帖 • 488 关注
  • Sphinx

    Sphinx 是一个基于 SQL 的全文检索引擎,可以结合 MySQL、PostgreSQL 做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。

    1 引用 • 211 关注
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    55 引用 • 85 回帖
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    408 引用 • 3574 回帖
  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 478 关注
  • ZeroNet

    ZeroNet 是一个基于比特币加密技术和 BT 网络技术的去中心化的、开放开源的网络和交流系统。

    1 引用 • 21 回帖 • 637 关注
  • CSS

    CSS(Cascading Style Sheet)“层叠样式表”是用于控制网页样式并允许将样式信息与网页内容分离的一种标记性语言。

    198 引用 • 550 回帖