使用阿里云发布分布式网站,开发时候应该注意什么?

本贴最后更新于 1876 天前,其中的信息可能已经斗转星移

虽然之前写过关于负载均衡的文章,但是似乎大家都对负载均衡这个标题很陌生。今天就换个角度,从分布式网站发布角度说一下

首先,网站发布一定离不开服务器,就是阿里云的云服务器 ECS。最近发现,老用户也有机会购买特价服务器,参考阿里云天猫旗舰店。分布式网站架构,在开发环节需要处理号几个地方,才能更轻松的扩展:

1,数据库单独运行

这个最简单,相信只要用到了数据库的网站,大部分都是已经可以轻松实现网站和数据库分离的模式。之所以强调这点,就是因为,网站真的到了访问量大了,需要由单机发布改为分布式发布时候。首先就是要把数据库单独出来,使用单独一台 ECS 或者使用专门的 RDS 运行。

关于使用 ECS 自行搭建数据库,要说的无非就是,数据库文件一定要放在 SSD 硬盘上。因为云硬盘本质都是虚拟硬盘,读写指标 iops 会损失的很严重。当然业务量大了之后,我更建议选购 RDS,RDS 阿里云专门的数据库服务产品,mysql,sqlserver 等多款分支,说实话,用惯了 ECS 自建可能会感觉这个产品挺贵的。但是实际上 RDS 已经针对硬盘读写,高可用,轻松拓展读写分离等提供了巨大的便利。因此大部分分布式网站都是选用了 RDS 等产品。

2,session 存储

大部分网站都是有登录需求或者其他 session 存储需求的。其实真正服务某一个用户的服务器只有一个,然而分布式网站是在负载均衡的规则下转发到后台服务器,如果负载均衡没有开启回话保持功能,那么很有可能用户登录后,其他访问很有可能到达不同的后端服务器处理,而实现不同服务器同样能支持服务的办法就是,session 得共享起来。这样就做到了让用户不需要反复登录。

session 共享有多重方法,一种是什么都不用做,session 存储在收到请求的那台 ECS 本地,这种情况就需要负载均衡开启“会话保持”功能。这么做可以实现大部分分布式发布需求,但是如果有使用 session 统计在线量的时候就会发现只统计到某台 ECS 登录的用户量。

还有一种 session 共享的办法是使用单独的服务存储 session,例如专门拿出来一台 ECS 做 session 服务。这里也有人跟倾向于单独用一个 redis 服务共享存储 session,也是非常好的办法。

3,用户上传的文件

很多网站存在用户上传的情况,但是分布式发布后,显然用户上传的时候传入了服务器 A,等以后下载的时候使用的是服务器 B,这时候如果没做共享,显然用户下载的文件会报错 404,因为服务器 B 路径下显然没有用户传到 A 服务器里的文件。

解决办法很简单,就是讲所有的上传文件,传入到服务器之后,都转存到“共享文件服务器”,这个共享文件服务器,可以考虑自己搭建,但我建议的是使用阿里云提供的“对象存储 OSS”服务。这样用户所有的下载,都走的时候 OSS 的访问地址,就不会报错 404 了。而且 OSS 是个独立的服务,下载文件使用的是 OSS 的流量,不占用发布网站的 ECS 的带宽。这就可以做到 1M 服务器带宽撑起峰值几十人甚至上百人的并发的原因。如果文件较多,另外建议将 OSS 搭配 CDN 使用

4,网站的日志文件

很多网站开发时候都是留有日志功能的,这些日志,就不再适合继续使用网站目录下某个路径存储了。原因跟上一条一样:文件存储在单台服务器里,要拿到全部日志文件需要每台服务器去获取一遍,显然不合适!

解决办法跟上一条很相似:使用共享文件服务器存储日志。这里需要注意避免日志文件重名,常见的年月日明明,在这里就会冲突,因为多台服务器都会产生相同文件名称的日志。但是我在这里,更建议大家把需要收集的日志文件,直接放入数据库 RDS 中。这样获取日志就不用每台服务器去汇总了。直接从数据库查出来就好。

5,发布网站文件一致

发布文件一致,就是为了保证更好的扩展。将来服务器压力太大,只需要直接从现有服务器环境拷贝一份即可。甚至搭配阿里云的“弹性伸缩 ESS 服务”。可以根据设置好的伸缩规则,自动按照某个服务器模板增加或者减少 WEB 服务器数量,实现弹性扩容。

综上所述,一个功能较全的分布式网站发布在阿里云,公共需要这么几个服务:ECS 多台,SLB 一台,RDS 一台,Redis 或有,ESS 或有。

通过 ECS+SLB+RDS+Redis+ESS 的搭配,就可以轻松应对更多的访问量了。

附录:阿里云相关产品的帮助文档:

《云服务器 ECS 帮助文档》

《负载均衡 SLB 帮助文档》

《对象存储 OSS 帮助文档》

《弹性伸缩 ESS 帮助文档》

《CDN 帮助文档》

原文地址: https://www.opengps.cn/Blog/View.aspx?id=238 文章的更新编辑依此链接为准。欢迎关注源站原创文章!

  • 推广
    151 引用 • 491 回帖 • 6 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • SQLServer

    SQL Server 是由 [微软] 开发和推广的关系数据库管理系统(DBMS),它最初是由 微软、Sybase 和 Ashton-Tate 三家公司共同开发的,并于 1988 年推出了第一个 OS/2 版本。

    19 引用 • 31 回帖 • 3 关注
  • MongoDB

    MongoDB(来自于英文单词“Humongous”,中文含义为“庞大”)是一个基于分布式文件存储的数据库,由 C++ 语言编写。旨在为应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似 JSON 的 BSON 格式,因此可以存储比较复杂的数据类型。

    90 引用 • 59 回帖 • 3 关注
  • 安全

    安全永远都不是一个小问题。

    189 引用 • 813 回帖 • 1 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 459 关注
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    41 引用 • 130 回帖 • 298 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    18581 引用 • 69118 回帖
  • Google

    Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于 1998 年 9 月 7 日以私有股份公司的形式创立,设计并管理一个互联网搜索引擎。Google 公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号。

    49 引用 • 192 回帖
  • 大疆创新

    深圳市大疆创新科技有限公司(DJI-Innovations,简称 DJI),成立于 2006 年,是全球领先的无人飞行器控制系统及无人机解决方案的研发和生产商,客户遍布全球 100 多个国家。通过持续的创新,大疆致力于为无人机工业、行业用户以及专业航拍应用提供性能最强、体验最佳的革命性智能飞控产品和解决方案。

    2 引用 • 14 回帖
  • CodeMirror
    1 引用 • 2 回帖 • 116 关注
  • IDEA

    IDEA 全称 IntelliJ IDEA,是一款 Java 语言开发的集成环境,在业界被公认为最好的 Java 开发工具之一。IDEA 是 JetBrains 公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨著称的东欧程序员为主。

    180 引用 • 400 回帖
  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    116 引用 • 99 回帖 • 265 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 19 关注
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    76 引用 • 37 回帖 • 1 关注
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    77 引用 • 1741 回帖
  • 微信

    腾讯公司 2011 年 1 月 21 日推出的一款手机通讯软件。用户可以通过摇一摇、搜索号码、扫描二维码等添加好友和关注公众平台,同时可以将自己看到的精彩内容分享到微信朋友圈。

    129 引用 • 793 回帖
  • 职场

    找到自己的位置,萌新烦恼少。

    126 引用 • 1699 回帖
  • 电影

    这是一个不能说的秘密。

    120 引用 • 597 回帖 • 2 关注
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 550 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    5 引用 • 26 回帖 • 492 关注
  • 创造

    你创造的作品可能会帮助到很多人,如果是开源项目的话就更赞了!

    172 引用 • 990 回帖
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    17 引用 • 236 回帖 • 420 关注
  • Chrome

    Chrome 又称 Google 浏览器,是一个由谷歌公司开发的网页浏览器。该浏览器是基于其他开源软件所编写,包括 WebKit,目标是提升稳定性、速度和安全性,并创造出简单且有效率的使用者界面。

    60 引用 • 287 回帖
  • Pipe

    Pipe 是一款小而美的开源博客平台。Pipe 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    131 引用 • 1114 回帖 • 150 关注
  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖
  • 笔记

    好记性不如烂笔头。

    303 引用 • 777 回帖
  • 运维

    互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。

    148 引用 • 257 回帖 • 1 关注
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    57 引用 • 22 回帖