需求
因为工作,学习需要,要对思源的中文档数据定期进行备份,转存到第三方平台,所以就有了这篇教程和一个开源的小工具 siyuanBackUp。方便地将服务端数据备份到第三方云盘(包括但不限于阿里云盘、Onedrive)
要求
- 一定要无感备份,即最好一键备份,或者触发了某个事件就自主备份
- 不修改后端源码,方便后续跟进官方更新,可以快速切换版本
最终效果
将原来的同步按钮改为备份按钮,作为备份操作的 url 触发器,一键实现数据的打包、转存
(不影响付费用户使用同步功能,仍然可以按 F9 快捷键进行同步)
也可通过公网访问此 url 进行远程触发,完成备份
后端接收到打包请求,开始异步执行打包、上传
折腾开始
提醒
- 本方案是针对服务器上 docker 部署的思源,如果你是本地用户,那么很抱歉帮不到你。
- 本备份方案不适合非常小白的同学食用,最好有过服务端部署项目的经验。如果你要跟着部署,请务必准备好下面的基础设施
- 一台 CentOS 服务器(我的版本是 release 8.5.2111,实际跟这个没关系,6,7 都可以)
- 一个阿里云盘账号
不修改源码的前提下,我想到的方案是通过中间人进行流量监控,如果有请求触发了预设的逻辑,就执行对于的操作。听起来好像就是网关路由,确实一开始想使用 Spring Gateway 做这个工作,但是我觉得为了一个自动化需求去部署一个微服务,有点杀鸡用牛刀了,所以最终选型用 mitmproxy,开发快速,完美解决我的需求。
这里不多介绍 mitmproxy,简单说是一个流量监控开源工具,常用做测试、渗透等方面,更详细的介绍可以在官网阅读 Introduction (mitmproxy.org)
在用户发送请求到达思源服务端之前,将请求通过透明代理的方式,先访问 mitmproxy 服务,再由 mitmproxy 把请求转发到服务端。
如果用户的某个请求触发了 mitm 预设的条件,就会执行相应的动作,原理很简单,下面就开始进行部署。
一、创建思源 docker
首先创建一个工作空间目录,用于映射思源的 workspace
目录位置可以自定义,后面用到的地方自行替换
mkdir -p /myapps/siyuan/workspace
然后运行一个 docker 容器,用来拷贝我们后面需要用的原文件
docker run --name=siyuan -u 1000:1000 b3log/siyuan:v2.1.6 --workspace=/siyuan/workspace/
Ctrl + C,把运行思源进程停掉
拷贝容器中前端的 js 目录
docker cp siyuan:/opt/siyuan/stage/build/desktop /myapps/siyuan/
把这个容器删了,我们运行一个新的容器,并映射本地 workspace 和 desktop 这两个目录
运行容器之前给这两个目录设上权限,不然容器起不来
docker rm siyuan
chown -R 1000:1000 /myapps/siyuan/workspace
chown -R 1000:1000 /myapps/siyuan/desktop
我指定的端口是 6807,也可以自定义,后面 iptables 规则和 mitmproxy 程序中的端口需要改成一样的
docker run --name=siyuan-2.1.6 -v /myapps/siyuan/workspace:/siyuan/workspace -v /myapps/siyuan/desktop:/opt/siyuan/stage/build/desktop -p 6807:6806 -u 1000:1000 b3log/siyuan:v2.1.6 --workspace=/siyuan/workspace/
通过测试,在网页上正常访问
二、部署 aliyunpan
想要在 Linux 上操作阿里云盘,有一个很好用的开源工具 aliyunpan,用于我们备份工作的上传
apt 安装
适用于 apt 包管理器的系统,例如 Ubuntu,国产 deepin 深度操作系统等。目前只支持 amd64 和 arm64 架构的机器。
sudo curl -fsSL http://file.tickstep.com/apt/pgp | gpg --dearmor | sudo tee /etc/apt/trusted.gpg.d/tickstep-packages-archive-keyring.gpg > /dev/null && echo "deb [signed-by=/etc/apt/trusted.gpg.d/tickstep-packages-archive-keyring.gpg] http://file.tickstep.com/apt aliyunpan main" | sudo tee /etc/apt/sources.list.d/tickstep-aliyunpan.list > /dev/null && sudo apt-get update && sudo apt-get install -y aliyunpan
rpm 安装
适用于 rpm 包管理器的系统,例如 CentOS、RockyLinux 等。目前只支持 amd64 和 arm64 架构的机器。
sudo curl -fsSL http://file.tickstep.com/rpm/aliyunpan/aliyunpan.repo | sudo tee /etc/yum.repos.d/tickstep-aliyunpan.repo > /dev/null && sudo yum install aliyunpan -y
安装完成后用命令行登录阿里云盘
aliyunpan login
然后需要输入 RefreshToken,获取这个 RefreshToken 需要进到阿里云盘官网并登录,按照下方图片操作
获取到后,复制下来,粘贴到终端回车,登录成功
把 RefreshToken 记下来,等会自动化脚本还要用到这个
三、部署 mitmproxy 流量监控
运行 siyuanBackUp 需要机器中有 Python3 支持,没有环境可以直接
yum install python36
快速安装一个
克隆 siyuanBackUp,克隆的位置可以任意,我选择和之前的目录放在了一起 cd /myapps/siyuan
git clone https://gitclone.com/github.com/aqz236/siyuanBackUp.git
如果使用 github 克隆速度较慢,也可以克隆下面 gitee 的仓库
git clone https://gitee.com/FSHOU/siyuanBackUp.git
进入 siyuanBackUp,创建虚拟环境,并在虚拟环境中安装项目依赖
cd siyuanBackUp/
python3 -m venv siyuanEnv
source siyuanEnv/bin/activate
pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
安装完成后需要简单填写一下配置
编辑 backup.sh
,如果你之前没有对映射位置做过自定义的修改,那么这里只需要填写 RefreshToken
编辑 siyuan_mitm.py
,如果你的端口是设置的端口也是 6807,则此处不需要做任何修改
添加两条自定义 iptables 规则,此处的 6807 要与创建容器时设置的端口相同,8712 是设置的 mitmproxy 透明代理端口。
iptables -t nat -A PREROUTING -i eth0 -p tcp --dport 6807 -j REDIRECT --to-port 8712
iptables -t nat -A PREROUTING -i eth0 -p udp --dport 6807 -j REDIRECT --to-port 8712
然后把当前的 iptables 配置保存到配置文件中
iptables-save > /etc/sysconfig/iptables
为了让添加的两条规则永久生效,需要执行
service iptables save
如果报错 Failed to restart iptables.service: Unit not found.
,则需要安装 iptables-services
yum install iptables-services -y
查看全部的 nat 规则
iptables -t nat -L -n --line-numbers
在 DOCKER 链下看见了 6807 与 6806 之间的转发,是正在生效的
把这条规则删除,删除的行号要与查到的对应,想要让删除的规则永久生效,可以看补充 1。
这种删除方法不是彻底删除,重启 iptables 或者容器,都会失效,我正好利用这个机制来决定 siyuanBackUp 的启动与关闭,详细使用操作看后面的补充 2
iptables -t nat -D DOCKER 行号
删除规则后,页面刷新一下,已经是打不开了,此时用户访问的流量已经从原来的 6807 被转发到了 8712,如果仍然可访问,解决方法看后面的补充 3
然后以透明代理模式启动 mitmproxy
mitmdump -p 8712 --set block_global=false --mode transparent -s siyuan_mitm.py
页面正常加载,且 mitmproxy 成功捕获到了流量
补充:
-
如果需要让 6807->6806 的 docker 规则永久删除,可以在配置文件中将这条规则注释掉,这样再重启 iptables 都不会使其生效了
重启 iptables,查看规则,发现只有我们自定义规则了
不过,如果是重启了容器,规则还是会被覆盖生效,这是无可避免的,除非再写一条规则,把 docker 映射的 6807 端口映射到其他端口
-
如果想要停止透明代理,可以直接重启 iptables,或者重启容器,想需要再次让 6807 端口走透明代理就把 DOCKER 链下的 6807->6806 的转发规则删除,删除规则是立即生效的,不需要重启,下次再像代理,需要再手动把 docker 的规则删除。
-
如果添加了规则,并且删了 6807->6806 的规则,网页仍然可以访问,检查是不是网卡名称的原因,使用
ifconfig
看自己的网卡名称,像我这台虚拟机,网卡名就不是默认的 eth0,而是 ens33这就要修改两个地方,重新添加规则,并且修改 siyuan_mitm.py
vi /etc/sysconfig/iptables
找到添加的两条自定义规则,将两处的 eth0 改成自己的网卡名- 修改
siyuan_mitm.py
中 nic 的值
修改完后重启 iptables
四、制作触发器
最后需要做一个触发器,用于触发备份请求,这里的方案是改前端代码,通过制作按钮可以发起备份请求。
也可以再额外去写一个 crontab,做一个时间触发器,比如每周六晚上十一点做一次备份
0 23 * * 6 /myapps/siyuan/siyuanShell/backup.sh
时间触发器比较简单,下面说这个手动的怎么弄,进入最开始导出来的 desktop 目录,有一个叫 main.fcaf89eaf1cee5881c1f.js
的 js 文件,要修改的就是这个。
直接修改有点困难,这个 js 是被极限压缩了,得去做代码格式化,这里直接提供修改的快捷方法
vi 编辑文件,然后斜杠向下搜关键字
<div id="barSync" class="toolbar
搜到的第一个结果就是要改的目标,把 id 的值改为其他的,我改成了 barBackupSelf,也可以自定义其他的
再继续搜关键词
${window.siyuan.config.sync.stat||window.siyuan.languages.syncNow+
搜到的第一个结果,把双引号之间的内容改成 立即备份
然后继续 vi 搜关键词
if("barSync"===t.id){if((0,f.needSubscri
在 if 的前面插入一段代码,这个 /api/self/backup/alipan
就是我们用于触发上传的 api
if("barBackupSelf"===t.id){(0,c.fetchPost)("/api/self/backup/alipan",{}),e.stopPropagation();const i = n(1890);if(true) void(0, i.showMessage)(window.siyuan.languages._kernel[41]);break}
最后,让 mitmproxy 跑起来,看一下效果
记得把语言改成中文 > Settings-->Appearance-->Language
上传成功!
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于