分享一个从云端下载快照到本地的脚本

本贴最后更新于 279 天前,其中的信息可能已经事过境迁

一个手贱,把我本地的快照全给清空了。

image.png

想了想感觉还是需要下载回来一部分,不然还是有些风险。

但是一个个翻页点击,体感还是太恐怖了。

image.png

看了一下,发现有提供快照相关的 API,所以写了一个脚本批量处理,以下的代码依赖于 RunJs 插件,请放到代码块里面,然后使用插件运行。

"use strict"; const request = globalThis.runJs.api.request; class SnapshotScheduler { constructor() { this.now = new Date(); } isInCurrentWeek(date) { const startOfWeek = new Date(this.now); startOfWeek.setDate(this.now.getDate() - this.now.getDay()); return date >= startOfWeek; } getTimeDifferenceInDays(date) { return Math.floor((this.now.getTime() - date.getTime()) / (1000 * 3600 * 24)); } isSameDay(date1, date2) { return date1.getFullYear() === date2.getFullYear() && date1.getMonth() === date2.getMonth() && date1.getDate() === date2.getDate(); } isHourDifferent(date1, date2) { return date1.getHours() !== date2.getHours(); } shouldDownloadSnapshot(last, current, next) { const currentDate = new Date(current.created); const daysDifference = this.getTimeDifferenceInDays(currentDate); if (this.isInCurrentWeek(currentDate)) { return true; // Download all snapshots from the current week } const lastDate = last ? new Date(last.created) : null; const nextDate = next ? new Date(next.created) : null; if (daysDifference <= 30) { // Every hour, plus start and end of day if (!lastDate || !this.isSameDay(currentDate, lastDate)) { return true; // First snapshot of the day } if (!nextDate || !this.isSameDay(currentDate, nextDate)) { return true; // Last snapshot of the day } return this.isHourDifferent(currentDate, lastDate); } if (daysDifference <= 90) { // First and last snapshot of each day return (!lastDate || !this.isSameDay(currentDate, lastDate)) || (!nextDate || !this.isSameDay(currentDate, nextDate)); } if (daysDifference <= 180) { // Last snapshot of each day return !nextDate || !this.isSameDay(currentDate, nextDate); } if (daysDifference <= 365) { // Every third day, last snapshot if (daysDifference % 3 !== 0) return false; return !nextDate || !this.isSameDay(currentDate, nextDate); } // Over a year: weekly, last snapshot const weekNumber = Math.floor(daysDifference / 7); if (daysDifference % 7 !== 0) return false; return !nextDate || Math.floor(this.getTimeDifferenceInDays(nextDate) / 7) !== weekNumber; } } class SnapshotManager { constructor() { this.scheduler = new SnapshotScheduler(); } async getAllSnapshots(startFrom, endTo, startPage) { let page = startPage !== null && startPage !== void 0 ? startPage : 0; let allSnapshots = []; let continueFetching = true; while (continueFetching) { const snaps = await this.getCloudRepoSnapshots(page); const filteredSnapshots = snaps.snapshots.filter(snapshot => { const snapshotDate = new Date(snapshot.created); return snapshotDate <= startFrom && snapshotDate >= endTo; }); console.debug(`Fetched page ${page + 1}, total snapshots: ${filteredSnapshots.length}: ${snaps.snapshots[0].hCreated} ~ ${snaps.snapshots[snaps.snapshots.length - 1].hCreated}`); allSnapshots = allSnapshots.concat(filteredSnapshots); page++; if (page >= snaps.pageCount || new Date(snaps.snapshots[snaps.snapshots.length - 1].created) < endTo) { continueFetching = false; } } return allSnapshots.sort((a, b) => b.created - a.created); // Sort descending } async downloadSnapshots(startFrom, cutoff, startPage) { console.log("Fetching all snapshots..."); const allSnapshots = await this.getAllSnapshots(startFrom, cutoff, startPage); console.log(`Total snapshots fetched: ${allSnapshots.length}`); let totalDownloaded = 0; for (let i = 0; i < allSnapshots.length; i++) { const currentSnapshot = allSnapshots[i]; const lastSnapshot = i > 0 ? allSnapshots[i - 1] : null; const nextSnapshot = i < allSnapshots.length - 1 ? allSnapshots[i + 1] : null; if (this.scheduler.shouldDownloadSnapshot(lastSnapshot, currentSnapshot, nextSnapshot)) { await this.downloadSnapshot(currentSnapshot); totalDownloaded++; } } return totalDownloaded; } async getCloudRepoSnapshots(page) { const response = await request('/api/repo/getCloudRepoSnapshots', { page: page }); return response; } async downloadSnapshot(snapshot) { const snapshotId = snapshot.id; console.debug(`[${snapshot.hCreated}] Downloaded snapshot ${snapshotId}`); await request('/api/repo/downloadCloudSnapshot', { id: snapshotId, tag: '' }); } } async function runMainWithTiming(startFrom, endTo, startPage) { console.log("Starting snapshot download process..."); console.log(`Start date: ${startFrom.toISOString()}`); console.log(`Cutoff date: ${endTo.toISOString()}`); const startTime = Date.now(); const snapshotManager = new SnapshotManager(); const totalDownloaded = await snapshotManager.downloadSnapshots(startFrom, endTo, startPage); const endTime = Date.now(); const executionTime = (endTime - startTime) / 1000; // Convert to seconds console.log(`Download process completed.`); console.log(`Total snapshots downloaded: ${totalDownloaded}`); console.log(`Total execution time: ${executionTime.toFixed(2)} seconds`); } let startFrom = new Date('2024-09-01'); let endTo = new Date('2023-12-01'); runMainWithTiming(startFrom, endTo, 74);

下载快照的时候,遵循以下策略:

  • 对于当前周的快照,全部下载
  • 对于最近一个月内的快照,确保每小时至少下载一个,并且总是下载每天的第一个和最后一个快照
  • 对于 1-3 个月内的快照,只保留每天的第一个和最后一个快照
  • 对于 3-6 个月内的快照,只保留每天的最后一个快照
  • 对于 6 个月到 1 年内的快照,每三天保留最后一个快照。
  • 对于超过 1 年的快照,每周保留最后一个快照

运行时间还是相当长的,我大概跑了半个小时的样子,主要问题在于为了谨慎期间没有做并行处理,而是在 for loop 里面一个个 await Promise。

最后效果如下,原本 387 页,下载之后保留了 22 页。临近的一段时间,快照保存的都比较密集;而更为久远的时间段,快照的保存就稀疏一些。

image.png

image.png

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    26081 引用 • 108288 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Vim

    Vim 是类 UNIX 系统文本编辑器 Vi 的加强版本,加入了更多特性来帮助编辑源代码。Vim 的部分增强功能包括文件比较(vimdiff)、语法高亮、全面的帮助系统、本地脚本(Vimscript)和便于选择的可视化模式。

    29 引用 • 66 回帖
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 675 关注
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    108 引用 • 153 回帖 • 2 关注
  • SQLServer

    SQL Server 是由 [微软] 开发和推广的关系数据库管理系统(DBMS),它最初是由 微软、Sybase 和 Ashton-Tate 三家公司共同开发的,并于 1988 年推出了第一个 OS/2 版本。

    21 引用 • 31 回帖
  • Love2D

    Love2D 是一个开源的, 跨平台的 2D 游戏引擎。使用纯 Lua 脚本来进行游戏开发。目前支持的平台有 Windows, Mac OS X, Linux, Android 和 iOS。

    14 引用 • 53 回帖 • 562 关注
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    115 引用 • 318 回帖
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 671 关注
  • HHKB

    HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。

    5 引用 • 74 回帖 • 521 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖 • 1 关注
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    142 引用 • 442 回帖
  • 禅道

    禅道是一款国产的开源项目管理软件,她的核心管理思想基于敏捷方法 scrum,内置了产品管理和项目管理,同时又根据国内研发现状补充了测试管理、计划管理、发布管理、文档管理、事务管理等功能,在一个软件中就可以将软件研发中的需求、任务、bug、用例、计划、发布等要素有序的跟踪管理起来,完整地覆盖了项目管理的核心流程。

    10 引用 • 15 回帖 • 5 关注
  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3455 回帖 • 149 关注
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    98 引用 • 367 回帖
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 93 关注
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖 • 1 关注
  • React

    React 是 Facebook 开源的一个用于构建 UI 的 JavaScript 库。

    192 引用 • 291 回帖 • 367 关注
  • iOS

    iOS 是由苹果公司开发的移动操作系统,最早于 2007 年 1 月 9 日的 Macworld 大会上公布这个系统,最初是设计给 iPhone 使用的,后来陆续套用到 iPod touch、iPad 以及 Apple TV 等产品上。iOS 与苹果的 Mac OS X 操作系统一样,属于类 Unix 的商业操作系统。

    89 引用 • 150 回帖 • 1 关注
  • SpaceVim

    SpaceVim 是一个社区驱动的模块化 vim/neovim 配置集合,以模块的方式组织管理插件以
    及相关配置,为不同的语言开发量身定制了相关的开发模块,该模块提供代码自动补全,
    语法检查、格式化、调试、REPL 等特性。用户仅需载入相关语言的模块即可得到一个开箱
    即用的 Vim-IDE。

    3 引用 • 31 回帖 • 110 关注
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 2 关注
  • 支付宝

    支付宝是全球领先的独立第三方支付平台,致力于为广大用户提供安全快速的电子支付/网上支付/安全支付/手机支付体验,及转账收款/水电煤缴费/信用卡还款/AA 收款等生活服务应用。

    29 引用 • 347 回帖
  • NetBeans

    NetBeans 是一个始于 1997 年的 Xelfi 计划,本身是捷克布拉格查理大学的数学及物理学院的学生计划。此计划延伸而成立了一家公司进而发展这个商用版本的 NetBeans IDE,直到 1999 年 Sun 买下此公司。Sun 于次年(2000 年)六月将 NetBeans IDE 开源,直到现在 NetBeans 的社群依然持续增长。

    78 引用 • 102 回帖 • 707 关注
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    22 引用 • 148 回帖 • 6 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    10017 引用 • 45536 回帖 • 71 关注
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 393 关注
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 646 关注
  • LeetCode

    LeetCode(力扣)是一个全球极客挚爱的高质量技术成长平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer!

    209 引用 • 72 回帖 • 2 关注
  • CentOS

    CentOS(Community Enterprise Operating System)是 Linux 发行版之一,它是来自于 Red Hat Enterprise Linux 依照开放源代码规定释出的源代码所编译而成。由于出自同样的源代码,因此有些要求高度稳定的服务器以 CentOS 替代商业版的 Red Hat Enterprise Linux 使用。两者的不同在于 CentOS 并不包含封闭源代码软件。

    240 引用 • 224 回帖 • 1 关注