S3 换源后发现丢失了部分笔记,有办法找回吗?

本贴最后更新于 342 天前,其中的信息可能已经物是人非

从我自己搭建的 MinIO 换到了 CF R2,方法是直接在思源里更换了 endpoint 和其他相关的 S3 桶信息,连接正常之后点同步按钮。

可能我第一次同步的电脑上数据不够新?也许 R2 上的数据不够新?我不确定,总之同步之后才发现有一段时间的笔记丢失了。

然而,好像又不是这段时间的笔记全都丢了,因为我看到部分 Daily 笔记还在,而这些笔记的链接无法找到目标,比如我的 Daily 里都会有“今日笔记”这条笔记名称的链接,但“今日笔记”这条笔记丢失了。

我估计 MinIO 上这些笔记还在,只是现在设备不在我身边,Tunnel 访问 S3 现在受限,现在访问不太方便。

想问下想要恢复这些数据,可以尝试的操作是?有没有什么其他风险?

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    28446 引用 • 119787 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 88250

    可以试试通过 数据历史 - 数据快照 回滚恢复。

    1 回复
  • Whacka

    感谢,我试了下找到关键节点了,确实发生在转移到 R2 的日期,删除了 400+ 个笔记。。。

    请问下回滚应该意味这之后的修改都被放弃了吧?有没有两边都能保全的方法?

    3 回复
  • 88250 1 1 评论

    再弄一个工作空间,回滚以后手动拷贝 data 文件夹合并。

    1 回复
    明白了,不过我这台电脑还没安装合并软件,而且我回忆这几天新增的笔记不多,就在数据回滚的对比界面直接复制了几个关键的笔记(先复制笔记名称,退出来新建笔记,然后再找到笔记内容,退出来粘贴这样。。。)
    Whacka
  • 整个工作空间搞一个副本,然后打开这个副本去回滚,把找回的这些笔记移出来

    思源 data 目录的内容结构我不是很了解,不知道咋移动。用合并软件的话也许会方便一些。
    Whacka
    @Whacka 用别的方式自动合并的话可能会有问题,找到文档导出导入或者手动复制粘贴应该更好
    JeffreyChen
  • Whacka

    话说我还是想问下,这类问题常见吗?可能的原因是?

    2 回复
  • 88250 1 评论

    不要切换源,不然同步信息无法跟踪。

    我尽量不这么做,但某些特殊情况也是不得已。但为何说同步信息无法跟踪呢?
    Whacka
  • EmptyLight 5 评论

    我自己理解如下:

    你原本的所有内容记为 A 状态,之后你回退了一部分提交,回到 A'状态,这时候是切换了同步存储桶。在这时候你就已经丢失了部分笔记,应该是最初同步到 R2 的设备笔记不全,同步之后通过修改时间认为那个是最新版本。后面你其他设备同步 R2 之后发现上面的数据修改时间比本地的数据要新,所以从 R2 拉取了不全的数据。

    正常使用一般不会出现这种数据丢失问题,在同步的时候会检查两边的数据修改时间。不过这次估计是最早同步的那台设备数据不全,又正好因为切换存储桶导致数据修改时间更新了,导致其他设备同步之后删除了一些数据。我粗略画了一个 Git 提交图来表示这种情况。

    gitGraph commit id: "origin" commit id: "切换R2同步" branch R2 commit id: "新写的笔记" checkout main commit id: "丢失的笔记"
    非常感谢您的解释和配图,很详细!不过我这次换源删除了有 400+ 的文件,这些删除的文件应该不存在更新时间的问题吧?
    Whacka
    另外您提供的配图(但文字可以框选?)是怎么制作的呢?看起来很精致~
    Whacka
    @Whacka 是一个 mermaid 图表,同时在思源中可用,在思源笔记内部用户指南有粗略的介绍。我这里使用的是 GitGraph。上述假设你有 2 部设备(基于假设分析的),A 笔记保持最新,B 有一段时间没有同步。A 在丢失笔记的地方,B 因为同步不及时落后在 R2 同步处,这里使用 B 设备切换到新同步存储桶,之后云端生成一份修改时间最新的快照,A 连接到 R2 之后发现云端数据更新,采用了云端数据,导致本地的新笔记丢失。之后所有笔记都是在丢过笔记的基础上添加的。
    EmptyLight
    @EmptyLight 如果是笔记文件在多个节点都存在(只是修改的情况)可以用修改的时间戳解释,但如果是删除的文件,A 如何确定这个文件不是新的呢?换句话说 A 应该不知道这个文件被删除了,因为没有删除的记录。
    Whacka
    @Whacka 删除也会生成一次记录,标记这次删除了什么东西。你可以看看文件历史那些地方,我记得会有删除的记录
    EmptyLight
  • Kyun

    倘若主要是文字修改的話,可以兩邊都導出 MarkDown 格式,然後用類似 WinMerge 這些工具來對比各自解壓後的文件夾來手工合併。

请输入回帖内容 ...

推荐标签 标签

  • CSS

    CSS(Cascading Style Sheet)“层叠样式表”是用于控制网页样式并允许将样式信息与网页内容分离的一种标记性语言。

    200 引用 • 545 回帖 • 1 关注
  • Maven

    Maven 是基于项目对象模型(POM)、通过一小段描述信息来管理项目的构建、报告和文档的软件项目管理工具。

    188 引用 • 319 回帖 • 222 关注
  • Windows

    Microsoft Windows 是美国微软公司研发的一套操作系统,它问世于 1985 年,起初仅仅是 Microsoft-DOS 模拟环境,后续的系统版本由于微软不断的更新升级,不但易用,也慢慢的成为家家户户人们最喜爱的操作系统。

    232 引用 • 484 回帖
  • 职场

    找到自己的位置,萌新烦恼少。

    127 引用 • 1708 回帖 • 1 关注
  • OnlyOffice
    4 引用 • 41 关注
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    17 引用 • 7 回帖 • 1 关注
  • 叶归
    25 引用 • 100 回帖 • 37 关注
  • Netty

    Netty 是一个基于 NIO 的客户端-服务器编程框架,使用 Netty 可以让你快速、简单地开发出一个可维护、高性能的网络应用,例如实现了某种协议的客户、服务端应用。

    49 引用 • 33 回帖 • 63 关注
  • ngrok

    ngrok 是一个反向代理,通过在公共的端点和本地运行的 Web 服务器之间建立一个安全的通道。

    7 引用 • 63 回帖 • 668 关注
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖
  • Spring

    Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。

    950 引用 • 1460 回帖 • 2 关注
  • TGIF

    Thank God It's Friday! 感谢老天,总算到星期五啦!

    293 引用 • 4496 回帖 • 688 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 799 关注
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 740 关注
  • JavaScript

    JavaScript 一种动态类型、弱类型、基于原型的直译式脚本语言,内置支持类型。它的解释器被称为 JavaScript 引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在 HTML 网页上使用,用来给 HTML 网页增加动态功能。

    736 引用 • 1307 回帖 • 2 关注
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    140 引用 • 407 回帖
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    46 引用 • 114 回帖 • 139 关注
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    16 引用 • 236 回帖 • 224 关注
  • jQuery

    jQuery 是一套跨浏览器的 JavaScript 库,强化 HTML 与 JavaScript 之间的操作。由 John Resig 在 2006 年 1 月的 BarCamp NYC 上释出第一个版本。全球约有 28% 的网站使用 jQuery,是非常受欢迎的 JavaScript 库。

    63 引用 • 134 回帖 • 736 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    70 引用 • 193 回帖 • 404 关注
  • 支付宝

    支付宝是全球领先的独立第三方支付平台,致力于为广大用户提供安全快速的电子支付/网上支付/安全支付/手机支付体验,及转账收款/水电煤缴费/信用卡还款/AA 收款等生活服务应用。

    29 引用 • 347 回帖 • 2 关注
  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 133 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 664 关注
  • 游戏

    沉迷游戏伤身,强撸灰飞烟灭。

    188 引用 • 833 回帖 • 1 关注
  • Node.js

    Node.js 是一个基于 Chrome JavaScript 运行时建立的平台, 用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞 I/O 模型而得以轻量和高效。

    139 引用 • 269 回帖 • 1 关注
  • OpenResty

    OpenResty 是一个基于 NGINX 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

    17 引用 • 51 关注
  • BAE

    百度应用引擎(Baidu App Engine)提供了 PHP、Java、Python 的执行环境,以及云存储、消息服务、云数据库等全面的云服务。它可以让开发者实现自动地部署和管理应用,并且提供动态扩容和负载均衡的运行环境,让开发者不用考虑高成本的运维工作,只需专注于业务逻辑,大大降低了开发者学习和迁移的成本。

    19 引用 • 75 回帖 • 702 关注