今天偶尔翻出以前做运维的笔记, 感慨良多:
当时刚参加工作, 对工作有极大的热情, 做了很多笔记.
现在很多多遗失了, 现在也转岗做开发了, 运维方面的知识很多都不用了, 生疏了
今天翻出笔记, 干脆就把纸质的文档(当时印象笔记和有道云笔记等工具并不是很流行)重新记录在博客里.
1. 检查测试环境中需升级的程序版本是否已经通过回归测试 (根据测试用例进行)
2. 备份生产环境中主备两台服务器的所有数据和程序
3. 检查生产环境数据库与测试环境数据库是否一致。
3.1 若不一致,要确保修改后的数据库能让所有程序(有些不升级的程序)正常工作。
a) 备份测试环境所有数据和程序
b) 将生产环境所有程序放到测试环境中,APP 和 UUWiFi 进行基本流程测试(根据测试用例进行)
c) 若测试通过,确定数据库的修改不会影响到其它程序。可在生产环境中更新数据库。
d) 若测试未通过,需反馈给开发人员,需调整数据库的字段属性或更新对应程序3.2 若数据库一致,则进入下一步。
4. 在生产环境的备机中更新程序。
5. 检查配置,程序版本等,再次确认更新无误。
6. 切换集的主备,让生产系统工作在备用服务器(最新版本程序上)
7. 在生产系统上进行常用功能的回归测试,如 APP 和 WebService 的使用等,web 管理界面的访问,这些测试根据测试用例进行。
7.1 若测试未通过,应第一时间切换回主服务器,以保证用户正常使用。 然后在备用服务器上做回滚操作。检查问题所在,再安排下一次的升级。
7.2 若测试通过,则进入下一步。
8. 保持三天的观察期,观察期间主动检查系统运行状态,如 cpu,内存等,以及程序日志(是否有异常和错误)
8.1 在观察期间,有影响用户正常使用的异常时,都需要切换回主服务器,然后在备用服务器上做回滚操作。(同 7.1)
8.2 观察期间无问题,则进入下一步
9. 升级生产环境主服务器的程序,切换集群到主服务器上,进行回归测试(根据测试用例进行)
10. 保持两天的观察期,
10.1 若主服务器运行有问题,切换到备服务器,若问题依然存在,则整个系统做回退操作。
10.2 若无问题,则此次升级完成。
三个注意点:
1. 数据和程序在操作前要备份!
2. 数据和程序在操作前要备份!!
3. 数据和程序在操作前要备份!!!
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于