关于手动备份思源笔记数据文件的问题

我每过一段时间就会手动备份一次思源笔记的数据库,但是整个 Data 文件夹数量太多了,有一万多个文件,和备份盘对比会耗时间。所以我就像采取备份最少必要文件的策略。我一直都是备份这 3 个关键文件夹(下图红色标记的):

SP20240601184611.webp

不过今天偶然发现 Data 下面居然还有一个 Data 文件夹(上图绿色标记),不知道什么时候出现的,如下图所示:

SP20240601184746.webp

里面的文件名和外面的完全一样,只是修改时间更新。这是不是意味着我之前的备份都搞错了?😅

大佬们,能不能帮我确认一下,备份的文件对不对?

正确的备份策略应该是怎样的?哪些文件和文件夹是必须备份的?

先谢谢了 🙏

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22353 引用 • 89443 回帖
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    8119 引用 • 37027 回帖 • 160 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 看这个修改时间,我判断是工作空间搞混了,一部分笔记在外面,一部分笔记在里面。

    建议楼主先别碰工作空间了,打开你的思源笔记(正在使用的工作空间)后看看左上角显示的是什么?

    image.png

    2 回复
  • seabirdr

    SP20240601191625.webp

    截图了,看起来没有什么不对,平常使用也没有什么异常的地方

    1 回复
  • seabirdr

    SP20240601191608.webp

    抱歉,刚上传错文件了,这是打开菜单的样子

  • 这样看的话,你的这个工作空间的文件夹应该是叫 DATA 才对。再按如下操作确认一下实际路径在哪:

    image.png

    1 回复
  • ringx 3 评论

    其实你可以试试文件系统级别的备份,好像 windows 下的 NTFS 文件系统也是支持快照的吧。

    我是这么做的,我使用的是 docker 的方式运行思源笔记,

    提供给思源笔记的存储是一个 zfs 的 dataset,

    定期对这个 dataset 做快照,就可以保存【增量】内容了,而且支持透明压缩,

    所以整体存储的备份还是比较方便的。

    这样的好处是,思源笔记的数据是【绝对】不会错乱和丢失的。

    像你这样手工备份特定文件夹的方式,很容易在某次更新时候发生错乱的。要备份就整个备份,并且备注好数据对应的思源笔记版本。

    感谢你的分享,看起来很有效率。但 docker 的方式有一些门槛,我有硬性需求的时候再来研究了。目前的方案用得比较顺手,暂时不会改变。
    seabirdr
    @seabirdr 我的意思是,你可以准备一个分区,这个分区专门存放思源笔记。然后对这个分区做快照。不需要用 docker 的。
    ringx
    @ringx 抱歉误解了你的意思。快照以前也没用过,感谢你的推荐,我得花时间学习一下。不过我目前并不是备份到本地,而是用 freefilesync,备份到挂载到本地的网盘中,其实也算是一种「增量备份」,只会上传修改了的文件
    seabirdr
  • seabirdr

    SP20240601192658.webp

    SP20240601193027.webp

    打开后可以确认,是我之前备份的文件夹路径。
    感谢指点,接下来该研究 data 文件夹下的问题了

    1 回复
  • 你这个问题是,原来已经有个叫 SiYuan 的工作空间,但现在又在这个工作空间的 Data 文件夹下创建了一个新的工作空间,并且你正在用着的就是这个新的工作空间。

    我不太好判断这些数据里哪些是新的。如果你很久都没换过工作空间的话,在 SiYuan/data/data 文件夹下的才是最新的数据。

    我一直都是备份这 3 个关键文件夹(下图红色标记的)

    也就是说你一直都备份错了

    1 回复
    我这个情况有办法整理一下吗?让文件夹不要嵌套得这么乱
    seabirdr
  • seabirdr

    SP20240601194056.webp

    所以我是不是应该备份 ...data/data/ 内的内容,

    请大佬再帮我看一下是不是备份截图中红色标记的文件夹就行了

    1 回复
  • 你这两个工作空间都混在一起比较乱了,很容易误操作,我建议你以后用工作空间里自带的导出:

    image.png

    @JeffreyChen 感谢你推荐的方法。我目前的做法是通过 Freefilesync 来上传文件到挂载到本地磁盘的的网盘中。配置好以后操作很傻瓜,点击一下「同步」就行了,修改了的文件才会上传到网盘。用思源导出文件的方法要多一步上传的操作,更适合本地备份。我想是不是可以把目前数据库导出,然后删除所有内容,再重新把数据导入进来,达到整理 Data 文件夹的效果,这应该能解决问题吧?
    seabirdr
    @seabirdr 如果你能确保操作正确的话,确实从根源解决问题会更好
    JeffreyChen 1
请输入回帖内容 ...

推荐标签 标签

  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    21 引用 • 37 回帖 • 545 关注
  • Pipe

    Pipe 是一款小而美的开源博客平台。Pipe 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    132 引用 • 1114 回帖 • 124 关注
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    66 引用 • 114 回帖 • 228 关注
  • Node.js

    Node.js 是一个基于 Chrome JavaScript 运行时建立的平台, 用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞 I/O 模型而得以轻量和高效。

    139 引用 • 269 回帖 • 43 关注
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 660 关注
  • Vim

    Vim 是类 UNIX 系统文本编辑器 Vi 的加强版本,加入了更多特性来帮助编辑源代码。Vim 的部分增强功能包括文件比较(vimdiff)、语法高亮、全面的帮助系统、本地脚本(Vimscript)和便于选择的可视化模式。

    29 引用 • 66 回帖
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    4 引用 • 16 回帖 • 6 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 733 关注
  • ReactiveX

    ReactiveX 是一个专注于异步编程与控制可观察数据(或者事件)流的 API。它组合了观察者模式,迭代器模式和函数式编程的优秀思想。

    1 引用 • 2 回帖 • 155 关注
  • 安全

    安全永远都不是一个小问题。

    199 引用 • 816 回帖 • 2 关注
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    83 引用 • 37 回帖
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    36 引用 • 35 回帖
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    77 引用 • 430 回帖
  • 生活

    生活是指人类生存过程中的各项活动的总和,范畴较广,一般指为幸福的意义而存在。生活实际上是对人生的一种诠释。生活包括人类在社会中与自己息息相关的日常活动和心理影射。

    230 引用 • 1454 回帖
  • SMTP

    SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。

    4 引用 • 18 回帖 • 614 关注
  • Kotlin

    Kotlin 是一种在 Java 虚拟机上运行的静态类型编程语言,由 JetBrains 设计开发并开源。Kotlin 可以编译成 Java 字节码,也可以编译成 JavaScript,方便在没有 JVM 的设备上运行。在 Google I/O 2017 中,Google 宣布 Kotlin 成为 Android 官方开发语言。

    19 引用 • 33 回帖 • 63 关注
  • 域名

    域名(Domain Name),简称域名、网域,是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。

    43 引用 • 208 回帖
  • 京东

    京东是中国最大的自营式电商企业,2015 年第一季度在中国自营式 B2C 电商市场的占有率为 56.3%。2014 年 5 月,京东在美国纳斯达克证券交易所正式挂牌上市(股票代码:JD),是中国第一个成功赴美上市的大型综合型电商平台,与腾讯、百度等中国互联网巨头共同跻身全球前十大互联网公司排行榜。

    14 引用 • 102 回帖 • 374 关注
  • 反馈

    Communication channel for makers and users.

    123 引用 • 911 回帖 • 245 关注
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 710 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22352 引用 • 89437 回帖
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖
  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    117 引用 • 99 回帖 • 212 关注
  • Log4j

    Log4j 是 Apache 开源的一款使用广泛的 Java 日志组件。

    20 引用 • 18 回帖 • 30 关注
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖 • 4 关注
  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    153 引用 • 3783 回帖 • 1 关注