关于手动备份思源笔记数据文件的问题

我每过一段时间就会手动备份一次思源笔记的数据库,但是整个 Data 文件夹数量太多了,有一万多个文件,和备份盘对比会耗时间。所以我就像采取备份最少必要文件的策略。我一直都是备份这 3 个关键文件夹(下图红色标记的):

SP20240601184611.webp

不过今天偶然发现 Data 下面居然还有一个 Data 文件夹(上图绿色标记),不知道什么时候出现的,如下图所示:

SP20240601184746.webp

里面的文件名和外面的完全一样,只是修改时间更新。这是不是意味着我之前的备份都搞错了?😅

大佬们,能不能帮我确认一下,备份的文件对不对?

正确的备份策略应该是怎样的?哪些文件和文件夹是必须备份的?

先谢谢了 🙏

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22350 引用 • 89424 回帖 • 1 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    8118 引用 • 37021 回帖 • 160 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • ringx 3 评论

    其实你可以试试文件系统级别的备份,好像 windows 下的 NTFS 文件系统也是支持快照的吧。

    我是这么做的,我使用的是 docker 的方式运行思源笔记,

    提供给思源笔记的存储是一个 zfs 的 dataset,

    定期对这个 dataset 做快照,就可以保存【增量】内容了,而且支持透明压缩,

    所以整体存储的备份还是比较方便的。

    这样的好处是,思源笔记的数据是【绝对】不会错乱和丢失的。

    像你这样手工备份特定文件夹的方式,很容易在某次更新时候发生错乱的。要备份就整个备份,并且备注好数据对应的思源笔记版本。

    感谢你的分享,看起来很有效率。但 docker 的方式有一些门槛,我有硬性需求的时候再来研究了。目前的方案用得比较顺手,暂时不会改变。
    seabirdr
    @seabirdr 我的意思是,你可以准备一个分区,这个分区专门存放思源笔记。然后对这个分区做快照。不需要用 docker 的。
    ringx
    @ringx 抱歉误解了你的意思。快照以前也没用过,感谢你的推荐,我得花时间学习一下。不过我目前并不是备份到本地,而是用 freefilesync,备份到挂载到本地的网盘中,其实也算是一种「增量备份」,只会上传修改了的文件
    seabirdr
  • 其他回帖
  • 看这个修改时间,我判断是工作空间搞混了,一部分笔记在外面,一部分笔记在里面。

    建议楼主先别碰工作空间了,打开你的思源笔记(正在使用的工作空间)后看看左上角显示的是什么?

    image.png

    2 回复
  • 这样看的话,你的这个工作空间的文件夹应该是叫 DATA 才对。再按如下操作确认一下实际路径在哪:

    image.png

    1 回复
  • 你这个问题是,原来已经有个叫 SiYuan 的工作空间,但现在又在这个工作空间的 Data 文件夹下创建了一个新的工作空间,并且你正在用着的就是这个新的工作空间。

    我不太好判断这些数据里哪些是新的。如果你很久都没换过工作空间的话,在 SiYuan/data/data 文件夹下的才是最新的数据。

    我一直都是备份这 3 个关键文件夹(下图红色标记的)

    也就是说你一直都备份错了

    1 回复
    我这个情况有办法整理一下吗?让文件夹不要嵌套得这么乱
    seabirdr
  • 查看全部回帖

推荐标签 标签

  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖 • 1 关注
  • GAE

    Google App Engine(GAE)是 Google 管理的数据中心中用于 WEB 应用程序的开发和托管的平台。2008 年 4 月 发布第一个测试版本。目前支持 Python、Java 和 Go 开发部署。全球已有数十万的开发者在其上开发了众多的应用。

    14 引用 • 42 回帖 • 764 关注
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 62 关注
  • ngrok

    ngrok 是一个反向代理,通过在公共的端点和本地运行的 Web 服务器之间建立一个安全的通道。

    7 引用 • 63 回帖 • 624 关注
  • 音乐

    你听到信仰的声音了么?

    60 引用 • 511 回帖 • 1 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 16 关注
  • 服务器

    服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。

    125 引用 • 588 回帖
  • 自由行
    10 关注
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 709 关注
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖 • 2 关注
  • BAE

    百度应用引擎(Baidu App Engine)提供了 PHP、Java、Python 的执行环境,以及云存储、消息服务、云数据库等全面的云服务。它可以让开发者实现自动地部署和管理应用,并且提供动态扩容和负载均衡的运行环境,让开发者不用考虑高成本的运维工作,只需专注于业务逻辑,大大降低了开发者学习和迁移的成本。

    19 引用 • 75 回帖 • 641 关注
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    334 引用 • 323 回帖 • 2 关注
  • InfluxDB

    InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。

    2 引用 • 72 关注
  • Maven

    Maven 是基于项目对象模型(POM)、通过一小段描述信息来管理项目的构建、报告和文档的软件项目管理工具。

    186 引用 • 318 回帖 • 304 关注
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    55 引用 • 85 回帖 • 1 关注
  • 职场

    找到自己的位置,萌新烦恼少。

    127 引用 • 1705 回帖
  • QQ

    1999 年 2 月腾讯正式推出“腾讯 QQ”,在线用户由 1999 年的 2 人(马化腾和张志东)到现在已经发展到上亿用户了,在线人数超过一亿,是目前使用最广泛的聊天软件之一。

    45 引用 • 557 回帖 • 67 关注
  • Netty

    Netty 是一个基于 NIO 的客户端-服务器编程框架,使用 Netty 可以让你快速、简单地开发出一个可维护、高性能的网络应用,例如实现了某种协议的客户、服务端应用。

    49 引用 • 33 回帖 • 21 关注
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    209 引用 • 358 回帖 • 2 关注
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖
  • 知乎

    知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。

    10 引用 • 66 回帖
  • SendCloud

    SendCloud 由搜狐武汉研发中心孵化的项目,是致力于为开发者提供高质量的触发邮件服务的云端邮件发送平台,为开发者提供便利的 API 接口来调用服务,让邮件准确迅速到达用户收件箱并获得强大的追踪数据。

    2 引用 • 8 回帖 • 483 关注
  • SQLite

    SQLite 是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。SQLite 是全世界使用最为广泛的数据库引擎。

    5 引用 • 7 回帖
  • V2Ray
    1 引用 • 15 回帖 • 1 关注
  • GraphQL

    GraphQL 是一个用于 API 的查询语言,是一个使用基于类型系统来执行查询的服务端运行时(类型系统由你的数据定义)。GraphQL 并没有和任何特定数据库或者存储引擎绑定,而是依靠你现有的代码和数据支撑。

    4 引用 • 3 回帖 • 9 关注
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    53 引用 • 40 回帖 • 1 关注
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    86 引用 • 122 回帖 • 625 关注