震惊:1.4G 的云端存储竟变成八百兆!数据丢失?

  • 之前都是 1.4G 左右的云端同步空间,今早发现只剩下 882M 了? 不知道是否正常??

PS:思源官方同步,最新 3.0.17

  • 我的数据库快照:都是 887.91M

    • Snipaste_2024-06-06_10-31-53

  • 我有两个工作空间:siyuan 是主要使用的;思源工作空间 2 是之前反馈问题用的测试空间,平时不用。

    • Snipaste_2024-06-06_10-34-18


2024 年 6 月 6 日 14:58:15:更新情况

  1. 在思源数据快照里面发现了数据缺口点。6 月 4 中午,数据量锐减。少了四五百兆。

  2. 经过确认.sy 文件并没有丢失,减少的数据量是图片.png 文件

  3. 我现在想不起来做了什么使得数据量少了这么多。可能是我第一次在资源里面 清理未引用的资源。【这个操作我很少做,我一般只是在关于里面做 数据仓库清理。

  4. 也许动图非常占空间吧。我平时在思源里面刷文章的时候,会刻意把不必要的动图删除,但是可能思源的资源管理逻辑 是文章里面删除了,这个图片还在,需要在资源里面清理未引用的资源。这样才是真的释放空间的删除。如果是这样的话,逻辑就比较通了,我近年来在文章里面删除的图片 所占用的空间终于被释放了。

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22020 引用 • 87822 回帖 • 3 关注
2 操作
1ssss 在 2024-06-06 15:06:34 更新了该帖
1ssss 在 2024-06-06 12:34:20 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 88250

    没有备份,没有云端图床,只有同步的情况下,和快照大小基本一样的话就是正常的。

  • 丢不丢失你应该看前后的快照大小

    1 回复
  • 5.17 号我发帖表示数据占用很大,之前 1.4G 的云端储存显示 是 2.8G。

    后来,好像是因为有某台电脑里面 云端存储目录里面有 两个空间。删除之后,只剩下 1.4G 左右的空间,这样看起来还比较妥当。

    之后至今两个多星期了,期间有过清理快照,重建目录,删除未引用资源的情况【但是记得删除不是非常多】

    今天突然发现自己就 882M 云端存储了,我都不知道我做了啥?有点慌


    如果单纯看快照数据的话,那基本差不多,问题不大

    现在看来,数据肯定是少了,我不知道为什么少了,少哪里了?

    Snipaste20240606122853.png

    @88250

    1 回复
    1 操作
    1ssss 在 2024-06-06 12:33:10 更新了该回帖
  • Snipaste20240606122853.png

    5 月 17 号我的数据导出压缩包有 1.09G,2024 年 6 月 6 日我的数据压缩包只剩下 668M
    我究竟做了什么使得我的数据少了这么多?!

    我这段时间数据应当是增加的,而不是减少的。

    我的数据去哪了?

    这个问题是只有我有吗?

  • 图片.png

    看看数据历史这里的变化

    1 回复
  • 88250

    看下这段时间的数据快照变化

    1 回复
  • Snipaste20240606135509.jpgSnipaste20240606135729.png


    这个数据快照最早到昨天 5 号晚上,再之前的数据就不知道了。

    疑似丢失的 500M 数据 在快照里面没有痕迹。

  • Snipaste20240606140249.png


    两台电脑的快照只到昨天,在昨天这个时间点就只有 880M 左右的数据了
    对应导出的压缩包只有 668M,

    5.21 号导出的压缩包有 1.09GB

    期间的数据丢失 成谜

  • 数据对比 确有 巨大缺口

  • 你应该往更前的时间看,上面有左右按钮可以切换页面,看你 5 月之前的数据大小,如果都是几百 M,那就说明你之前有一个空间标记了快照,标记的快照是完整备份占空间的,比如 800M 的空间,标记了一份,那就是 1.6g。根据你的描述清理过快照,还是看看数据快照的内容吧,你清理快照是直接删文件夹?

    image.png

    1 回复
  • 图片.png我这里很久以前的都有,看你之前发的图也有 4 页,继续往前翻看

    1 回复
  • 我所说的清理只是说数据仓库清理 + 未引用的资源清理,我从来不去动思源的数据文件夹:Snipaste20240606141208.png

    1 回复
  • Snipaste20240606141509.png

    --

    找到了 1.4G 的,确实中间不知道怎么就一下子数据变少了。 ** 原因不明。**

    现在怎么办

    这几天我进行了很多文档的重要更新。还涉及到数据库比较复杂。

    如果直接恢复到 1.4G 的时候的话,这几天的重要工作就没了

  • 一切都有迹可循,清理未引用也会导致 data 文件夹减少,从而导致云端占用减少。而至于想知道自己操作了什么,操作了多少,如果确定自己没有动标记数据快照,可以去空间下的历史文件夹看看每天的文件夹大小即可。两个空间都可以看下。

    1 回复
  • 我确定自己没有动标记数据快照,我平时甚至不会打开数据快照。

    现在我已经在快照里面发现了出现问题的时间点

    现在新的问题是如何处理:

    1. 是保之前的数据? 这样的话,2 天的新增数据,以及对于文档的修改 就都没了。
    2. 能否做到两个数据快照的同类项合并?
    1 回复
  • 不需要做什么动作。去你截图的那个设备下的空间的历史文件夹找 6 月 4 日那个时间点的操作就行了。从你截图看,思源文档没改,就删了一堆图片,所以很有可能就是一堆未引用的图片。恢复就把里面的图片复制回 data 的资源文件夹。

    1 回复
  • 好的,我按照你的思路确认了一下。确实.sy 的文件基本没差,就是.png 的文件相差很多,可能是被清理了。【没想到有这么大】

    现在很放心。感谢。

    png 文件基本都是一些网页的动图之类的丢了也就丢了,不重要的,我手动码字的笔记没有丢失就没啥问题

    你过你说空间的历史文件夹里面可以找到过去的快照吗?

    Snipaste20240606144737.png

    1 回复
  • 快照是 repo 文件夹,是上传同步服务器的文件夹,是通过 data 加密转化过来的,所以本地的占用会多一点。实际同步的内容还是 data 文件夹里的。

    快照在默认设置里只保留 30 天,快照还是通过思源的界面去看好一点。你截图的就是历史文件夹,对应数据历史里的操作,你可以主要看 delete 操作。之所以有这么多图片,很有可能就是剪藏的文章里有很多图片,文档删除并不会删资源文件夹,但它们已经失去引用了,你点清理就会清理很多掉。

    image.png

    1 回复
  • 我在文件历史里面看了 delete 的操作,在那天没有 delete 的操作

    Snipaste20240606151052.png


    我理了一下逻辑,大概率就是那天【我可能心血来潮点了一下资源 删除未引用的资源】把我经年在剪藏文章里面删除的图片 彻底删除而释放空间了。

    因为这个功能用得非常少,对于思源的同步逻辑不知道,所以没想到会一下子释放这么大的云端存储空间。

    所以才有了今天疑问

    数据安全是安全的,但是这个资源删除 和【数据仓库清理 删除所有未引用的快照和相关数据对象】这两个看着意思非常像

    希望 D 大有时间优化一下逻辑,放一起,或者在数据仓库清理 下面 放一个资源删除的跳转链接。 旁边加一个? 解释下不同的意思。

    因为数据的事情我已经发文两次了,可以的话 尽量附带解释,便宜新人吧。【我觉得不直观方便.jpg]

    笔记软件检查数据的安全 感觉是一个挺奇怪的事情,从 Word,WPS,office,云端笔记 没道理越先进,越要在数据安全上花费 本该记笔记的时间。

    @88250

    1 回复
  • 帮助文档其实都有写,但没人细看。

    image.png

    1 回复
  • 我也算是用了较久的人了,当时一开始帮助说明我大概都是看过的。我还看了很多思源相关的内容,但是我还是中箭了

    但是不基于问题解决导向,我不会把所有的信息都留意到注意到。【简单来说就是数据溢出,看了容易忘】

    很多不合使用习惯的,缺乏提示的,帮助文档分散的, 用一句没人细看,来说不太妥当。

    另外我现在遇到问题,搜索一下论坛里面没有回答就直接发问了。😅

    不想 细看 文档哈,认知负担有点重。😅

请输入回帖内容 ...

推荐标签 标签

  • IDEA

    IDEA 全称 IntelliJ IDEA,是一款 Java 语言开发的集成环境,在业界被公认为最好的 Java 开发工具之一。IDEA 是 JetBrains 公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨著称的东欧程序员为主。

    180 引用 • 400 回帖 • 2 关注
  • 负能量

    上帝为你关上了一扇门,然后就去睡觉了....努力不一定能成功,但不努力一定很轻松 (° ー °〃)

    88 引用 • 1235 回帖 • 408 关注
  • QQ

    1999 年 2 月腾讯正式推出“腾讯 QQ”,在线用户由 1999 年的 2 人(马化腾和张志东)到现在已经发展到上亿用户了,在线人数超过一亿,是目前使用最广泛的聊天软件之一。

    45 引用 • 557 回帖 • 84 关注
  • 脑图

    脑图又叫思维导图,是表达发散性思维的有效图形思维工具 ,它简单却又很有效,是一种实用性的思维工具。

    25 引用 • 83 回帖
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 2 关注
  • 正则表达式

    正则表达式(Regular Expression)使用单个字符串来描述、匹配一系列遵循某个句法规则的字符串。

    31 引用 • 94 回帖
  • HBase

    HBase 是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的 Google 论文 “Bigtable:一个结构化数据的分布式存储系统”。就像 Bigtable 利用了 Google 文件系统所提供的分布式数据存储一样,HBase 在 Hadoop 之上提供了类似于 Bigtable 的能力。

    17 引用 • 6 回帖 • 71 关注
  • Docker

    Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的操作系统上。容器完全使用沙箱机制,几乎没有性能开销,可以很容易地在机器和数据中心中运行。

    490 引用 • 916 回帖 • 1 关注
  • Scala

    Scala 是一门多范式的编程语言,集成面向对象编程和函数式编程的各种特性。

    13 引用 • 11 回帖 • 124 关注
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 663 关注
  • SMTP

    SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。

    4 引用 • 18 回帖 • 612 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 733 关注
  • Ngui

    Ngui 是一个 GUI 的排版显示引擎和跨平台的 GUI 应用程序开发框架,基于
    Node.js / OpenGL。目标是在此基础上开发 GUI 应用程序可拥有开发 WEB 应用般简单与速度同时兼顾 Native 应用程序的性能与体验。

    7 引用 • 9 回帖 • 387 关注
  • 禅道

    禅道是一款国产的开源项目管理软件,她的核心管理思想基于敏捷方法 scrum,内置了产品管理和项目管理,同时又根据国内研发现状补充了测试管理、计划管理、发布管理、文档管理、事务管理等功能,在一个软件中就可以将软件研发中的需求、任务、bug、用例、计划、发布等要素有序的跟踪管理起来,完整地覆盖了项目管理的核心流程。

    6 引用 • 15 回帖 • 127 关注
  • OpenResty

    OpenResty 是一个基于 NGINX 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

    17 引用 • 47 关注
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    142 引用 • 442 回帖
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    55 引用 • 85 回帖
  • 安全

    安全永远都不是一个小问题。

    199 引用 • 816 回帖 • 1 关注
  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 383 回帖 • 6 关注
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    52 引用 • 228 回帖 • 1 关注
  • CSDN

    CSDN (Chinese Software Developer Network) 创立于 1999 年,是中国的 IT 社区和服务平台,为中国的软件开发者和 IT 从业者提供知识传播、职业发展、软件开发等全生命周期服务,满足他们在职业发展中学习及共享知识和信息、建立职业发展社交圈、通过软件开发实现技术商业化等刚性需求。

    14 引用 • 155 回帖 • 2 关注
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 706 关注
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    21 引用 • 140 回帖 • 5 关注
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 366 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    26 引用 • 222 回帖 • 164 关注
  • Google

    Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于 1998 年 9 月 7 日以私有股份公司的形式创立,设计并管理一个互联网搜索引擎。Google 公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号。

    49 引用 • 192 回帖