ES 数据库备份快照

本贴最后更新于 675 天前,其中的信息可能已经事过景迁

背景:

某客户 UCSS-HA+DB 高可用环境,由于事件和日志量非常大,预估 20G+,考虑到导出事件和日志备份有一定风险导出失败,故考虑该手工备份 ES 数据库相关表

下述操作部署,为 3.10 db 高可用环境操作,参考文档:ElasticSearch 手工归档


  1. 登录 db-master 服务器,启用并配置 nfs 挂载信息

    说明:为什么要启用 nfs 挂载备份路径:

    es 备份时,需要所有节点都可以访问同一个路径,默认是本地路径,相当于每个节点访问的这个备份路径都是不同的,备份就会失败

    vi /opt/skyguard/elasticsearch/es-all.yaml  #取消下述列的注释
    108       #- name: backups
    109       #  mountPath: /backups
    
    121       #- name: backups
    122       #  nfs:
    123       #    path: /mnt/nfs_shared   #修改为nfs挂载路径
    124       #    server: 172.22.111.11   #修改为nfs服务器ip
    

    安装 nfs 客户端组件

    ubuntu 环境

    dpkg -l |grep nfs-common  #查询是否有安装包
    ii  nfs-common      1:1.2.8-9ubuntu12.3         amd64        NFS support files common to client and server
    apt install nfs-common  #执行安装
    

    redhat/centos/oraclelinux 环境

    yum list |grep nfs-utils  #查询是否有安装包
    nfs-utils.x86_64                       1:1.3.0-0.68.0.1.el7.2      @ol7_latest  
    yum install nfs-utils  #执行安装
    
  2. 启用仓库地址

    配置备份后的快照文件存放地址(此地址为 es 容器内的地址)

    root@k8s-master2 ~]# vi /opt/skyguard/elasticsearch/es-cm.yaml
    # path.repo: "/backups"  #取消注释,生效备份快照的路径
    
  3. 生效配置:
    kubectl apply -f  /opt/skyguard/elasticsearch/es-all.yaml
    kubectl apply -f  /opt/skyguard/elasticsearch/es-cm.yaml
    

    停掉当前的 es
    kubectl delete statefulset es
    之后使用 kubectl get pods | grep es 命令查看 es pod 的情况,直到检索不到结果为止,说明 es 的 pod 都已经删除掉了。

  4. 删掉 ES 集群界节点容器

    查看 ES 容器节点

    kubectl get pods | grep es
    es-0                                     1/1     Running   0          16h
    es-1                                     1/1     Running   0          16h
    es-2                                     1/1     Running   0          16h
    

    删掉 ES 容器节点

    kubectl delete pod es-0 es-1 es-2
    pod "es-0" deleted
    pod "es-1" deleted
    pod "es-2" deleted
    

    确认看 K8S 已经已经创建好新的容器节点(看 Runling 的运行时间判断是否是新创建)

    kubectl get pods | grep es
    es-0                                     1/1     Running   0          2m37s
    es-1                                     1/1     Running   0          2m6s
    es-2                                     1/1     Running   0          2m36s
    
  5. 生成仓库地址

    生成仓库地址的过程,就是指定 ES 的备份文件存放路径的过程

    注意:此命令及下述命令,均需要在 ucss 服务器的 sps 容器上执行

    原因:db 高可用环境,只授信了 ucss ip

    curl -H "Content-Type: application/json"  -XPUT http://172.22.2.179:9200/_snapshot/backup_archive -d '{"type":"fs","settings":{"location":"/backups"}}' -u skyguard:Elastic@SkyGuard     #表示仓库地址为/backups
    响应信息:{"acknowledged":true}  #表示执行成功
    
  6. 查看需要生成快照的表信息

    curl http://172.22.2.179:9200/_cat/indices -u skyguard:Elastic@SkyGuard
    green open swg-20221119-01                 460ytmRqRuK85gtLy1aOsw 5 1 1206 3   2.5mb   1.2mb
    green open ucwi-20221119-01                KFqxV4LUTxWsbeBL-SxzUg 5 1    0 0     2kb     1kb
    green open dlp-mobile-20221119-01          A4mn4ef0QoK4-x6qcgEEAg 5 1    0 0     2kb     1kb
    green open connect-log-20221119-01         q1WtputiQxq6R0oJwtbWlA 5 1   39 0 436.7kb 218.3kb
    green open dlp-discovery-20221119-01       tKtXvhw8STS5m-38aKCMCg 5 1    0 0     2kb     1kb
    green open email-message-20221119-01       QPCnoOWZQPm5ZwnmUpd69A 5 1   38 0   1.2mb 649.7kb
    green open dlp-endpoint-20221119-01        W_obj8ExSKia5v7rQJTNRw 5 1    0 0     2kb     1kb
    green open dlp-network-20221119-01         oKqBLAfJSIitTFjJL1cW2Q 5 1   35 3   3.8mb   1.9mb
    green open dlp-watermark-20221119-01       sqQpxwz8T82hgomfcX_uxw 5 1    0 0     2kb     1kb
    green open mobile-app-incident-20221119-01 drzGKMroQsKULGDaKC2zYA 5 1    0 0     2kb     1kb
    green open mobile-mag-log-20221119-01      yJQSxhKPS4OhElVydO0-mQ 5 1    0 0     2kb     1kb
    green open itm-scores-20221119-01          Z0G6pV01SWiyDT3JFIIADA 5 1    0 0     2kb     1kb
    
  7. 生成快照(会自动导出到 nas 目录)

    curl -X PUT -H "Content-Type:application/json" http://172.22.2.179:9200/_snapshot/backup_archive/dlp-20230118 -d '{"indices":"swg-20221119-01,connect-log-20221119-01"}' -u skyguard:Elastic@SkyGuard 
    

完成上诉操作后,进入 nas 目录,便可以看到备份的快照信息了,如下图所示:

[root@k8s-master1 backups]# pwd
/var/lib/kubelet/pods/fa0aaf80-5c04-4676-a52a-7cfdc40bd113/volumes/kubernetes.io~nfs/backups
[root@k8s-master1 backups]# ls -lh
total 36K
drwxrwxr-x 4 skyguard root 4.0K Jan 17 23:21 indices
-rw-rw-r-- 1 skyguard root  27K Jan 17 23:21 meta--9kdlqjSSlWSeIP7ZD_svQ.dat
-rw-rw-r-- 1 skyguard root 2.2K Jan 17 23:21 snap--9kdlqjSSlWSeIP7ZD_svQ.dat

拷贝完后,请其实 copy 走数据,防止被后续的备份冲掉。

  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    117 引用 • 99 回帖 • 212 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    21 引用 • 37 回帖 • 547 关注
  • Maven

    Maven 是基于项目对象模型(POM)、通过一小段描述信息来管理项目的构建、报告和文档的软件项目管理工具。

    186 引用 • 318 回帖 • 303 关注
  • RESTful

    一种软件架构设计风格而不是标准,提供了一组设计原则和约束条件,主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。

    30 引用 • 114 回帖
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 536 关注
  • NetBeans

    NetBeans 是一个始于 1997 年的 Xelfi 计划,本身是捷克布拉格查理大学的数学及物理学院的学生计划。此计划延伸而成立了一家公司进而发展这个商用版本的 NetBeans IDE,直到 1999 年 Sun 买下此公司。Sun 于次年(2000 年)六月将 NetBeans IDE 开源,直到现在 NetBeans 的社群依然持续增长。

    78 引用 • 102 回帖 • 681 关注
  • OpenResty

    OpenResty 是一个基于 NGINX 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

    17 引用 • 40 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    27 引用 • 225 回帖 • 169 关注
  • 阿里云

    阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。

    89 引用 • 345 回帖
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    169 引用 • 506 回帖
  • OpenShift

    红帽提供的 PaaS 云,支持多种编程语言,为开发人员提供了更为灵活的框架、存储选择。

    14 引用 • 20 回帖 • 633 关注
  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    53 引用 • 37 回帖 • 2 关注
  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖 • 1 关注
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    41 引用 • 130 回帖 • 261 关注
  • 笔记

    好记性不如烂笔头。

    308 引用 • 793 回帖
  • RIP

    愿逝者安息!

    8 引用 • 92 回帖 • 351 关注
  • 安装

    你若安好,便是晴天。

    132 引用 • 1184 回帖 • 1 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖
  • MongoDB

    MongoDB(来自于英文单词“Humongous”,中文含义为“庞大”)是一个基于分布式文件存储的数据库,由 C++ 语言编写。旨在为应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似 JSON 的 BSON 格式,因此可以存储比较复杂的数据类型。

    90 引用 • 59 回帖 • 1 关注
  • WebClipper

    Web Clipper 是一款浏览器剪藏扩展,它可以帮助你把网页内容剪藏到本地。

    3 引用 • 9 回帖 • 1 关注
  • JavaScript

    JavaScript 一种动态类型、弱类型、基于原型的直译式脚本语言,内置支持类型。它的解释器被称为 JavaScript 引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在 HTML 网页上使用,用来给 HTML 网页增加动态功能。

    729 引用 • 1327 回帖 • 1 关注
  • Kubernetes

    Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。

    110 引用 • 54 回帖 • 1 关注
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    59 引用 • 29 回帖 • 6 关注
  • Love2D

    Love2D 是一个开源的, 跨平台的 2D 游戏引擎。使用纯 Lua 脚本来进行游戏开发。目前支持的平台有 Windows, Mac OS X, Linux, Android 和 iOS。

    14 引用 • 53 回帖 • 530 关注
  • SpaceVim

    SpaceVim 是一个社区驱动的模块化 vim/neovim 配置集合,以模块的方式组织管理插件以
    及相关配置,为不同的语言开发量身定制了相关的开发模块,该模块提供代码自动补全,
    语法检查、格式化、调试、REPL 等特性。用户仅需载入相关语言的模块即可得到一个开箱
    即用的 Vim-IDE。

    3 引用 • 31 回帖 • 99 关注
  • Telegram

    Telegram 是一个非盈利性、基于云端的即时消息服务。它提供了支持各大操作系统平台的开源的客户端,也提供了很多强大的 APIs 给开发者创建自己的客户端和机器人。

    5 引用 • 35 回帖 • 2 关注
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 653 关注
  • Swagger

    Swagger 是一款非常流行的 API 开发工具,它遵循 OpenAPI Specification(这是一种通用的、和编程语言无关的 API 描述规范)。Swagger 贯穿整个 API 生命周期,如 API 的设计、编写文档、测试和部署。

    26 引用 • 35 回帖