「轻阅读」如何构建可伸缩的Web应用?

行走的ET 2019-12-30 13:38:59 ⋅ 889 阅读

为什么要构建可伸缩的Web应用?

想象一下,你的营销活动吸引了很多用户,在某个时候,应用必须同时为成千上万的用户提供服务,这么大的并发量,服务器的负载会很大,如果设计不当,系统将无法处理。

接下来发生的就是,随机错误、缓慢的内容加载、无休止的等待、连接断开、服务不可用等问题。

辛辛苦苦吸引来的用户变成了系统的攻击者,把服务器资源耗尽,应用程序崩溃。

你的大多数用户将丢失,产品评级将降低,市场将充满负面评论。

所以,可伸缩性已经成为Web应用程序的DNA。

可伸缩应用架构简介

可伸缩架构的两个主要原则:

  1. 关注点分离
  2. 水平扩展

关注点分离

每个类型的任务都应该有一个独立的服务器。

有时,应用程序是由一台服务器完成全部工作:处理用户请求,存储用户文件等。

它完成的工作通常应由几台单独的服务器完成。

因此,当服务器过载时,整个应用程序将受到影响:页面无法打开,图像无法加载等。

为避免这种情况,需要确保关注点分离。

例如,API server 处理需要即时回复的 client-server 请求。

假设某个用户更改其个人资料图像,上载图像后,通常会对其进行一定的处理:调整图像大小、分析显式内容、保存在存储中 ……

显然,这个过程复杂而耗时,而且用户不需要等待处理完成。因此,这个任务的优先级较低,因为它不需要一个实时的结果回复。

这是为什么它不应该放在 API server。

关注点分离对于可伸缩的应用架构至关重要,不仅因为它能够在专用服务器之间分配不同类型的任务,而且它是水平扩展的基础。

水平缩放

水平缩放的思想是在多台服务器之间分配负载。

每个服务器都会运行应用,并根据当前负载来启用或禁用服务器。

负载均衡器控制着所需的服务器数量,保证系统的平滑处理。

负载均衡器知道有多少台服务器在工作、多少在闲置,当发现服务器已经满负荷,并且请求的数量在增加,那么他就会激活其他的服务器,重新分配请求负载。

当请求数量降低的时候,他会停用不需要的服务器。

他还会去做服务器的健康检查,在健康的服务器当中分配请求。

负载均衡器有多种分配请求的算法,例如轮询、随机、延迟最小、流量最小等等。这些算法可以考虑诸如地理位置(用户请求定向到最近的服务器)、每个服务器的工作能力等因素。

水平缩放不需要缩放整个应用,例如,当 API server 达到临界点时,负载平衡器将激活更多 API server,而不会影响其他服务器。

这就是关注点分离对于水平缩放如此重要的原因之一。

现在,让我们看看关注点分离和水平缩放如何协同工作。

构建可伸缩的应用

这个示例中,有用于不同类型任务的服务器:

  • API server
  • 数据库集群
  • 静态存储服务器
  • Worker,做复杂的、不需要实时反馈结果的任务

每个服务器仍可能是潜在的瓶颈。让我们一个个地研究它们,看看如何避免它们每个可能出现的可伸缩性问题。

API server

API server 处理主要功能相关的请求,其数量随着用户量的增加而增加,

关键点是:不要存储任何的用户数据,需要无状态化。

假设用户上传图片的请求是 A 服务器处理的,A 把图片保存到了本地,下次用户读取图片的请求是 B 处理的,那么就读不到图片了。

还有,负载均衡器随时可以终止或暂停它们中的每一个。

静态存储服务器

静态存储服务器与 CDN 配合使用。

CDN 称为内容交付网络,是一种缓存服务器,可以将内容立即交付给用户。

假设你在 YouTube 上观看了一个有趣的视频,该视频存储在加利福尼亚的静态存储服务器中。

你在群聊中发布该链接,如果所有同事同时打开该链接,则服务器压力山大。

有了CDN后,首次打开视频时,它将被上传到最近的CDN服务器。

因此,如果您与朋友共享链接,则他们将从CDN,而不是直接从静态存储服务器请求该链接。

这样防止了静态存储服务器过载,用户还可以享受超快的视频加载速度。

Worker

并非所有用户请求都需要服务器的即时答复。

他们可能需要更多的时间才能完成,这些任务可以在用户忙于其他事情时在后台运行。

例如,上传视频,用户不会坐下来等视频处理完毕。

这些任务由 Workers 和 Message Queue 处理。

Worker 在独立服务器上运行,就像API服务器一样,可以根据负载强度进行扩展。

Message Queue 就像 API服务器和 Worker 之间的任务管理器。

任务首先到达 Message Queue,当 Worker 不忙时,从队列中取出并进行处理。如果 Worker 由于某种原因失败,则任务将保留在队列中,直到 Worker 恢复或由其他 Worker 处理。

翻译整理自:

https://medium.com/swlh/how-to-build-scalable-and-highly-available-web-applications-f1d7e7a415be



全部评论: 0

    我有话说:

    阅读」大众点评是如何分表分库

    原大众点评订单单表早就已经突破两百G,由于查询维度较多,即使加了两个从库,优化索引,仍然存在很多查询不理想

    阅读」推荐系统中信息增强小技巧

    实用推荐系统构建经验,如何进行信息增强。

    阅读如何设计移动端屏适配方案

    在众多移动设备中,前端开发人员如何在不同屏幕大小,不同程度高清屏下去百分百还原设计稿,从来都不

    阅读」Dubbo 如何成为连接异构微服务体系最佳服务开发框架

    要实现异构微服务体系间共存或迁移,关键点在打通异构体系间协议与服务发现,得益于 Dubbo 自身对多协议、多注册模型支持

    阅读」轻松理解 Kubernetes 核心概念

    Kubernetes 迅速成为云环境中软件部署和管理新标准。

    阅读」“做完”和“做好”区别

    在工作中,“做完”和“做好”虽然仅一字之差,但前者只是完成了某项工作,而后者则不仅是完成了工作还有一个好

    阅读」移动端事件穿透原理与解决方案

    本文将带你了解事件穿透及如何在实际项目中选择合适方案解决事件穿透问题。

    阅读」阿里云-开放平台高级技术家教你搭建微服务架构四大金刚利器

    孔凡勇,花名云狄,阿里云-开放平台高级技术家,对高并发、高性能、高用、伸缩分布式系统架构设计有丰富经验,Cloud Native坚定拥护者,坚守开发一线打磨匠艺架构师。

    阅读」图文并茂带你了解分布式架构演进

    初始阶段架构初始阶段 小型系统 应用程序、数据库、文件等所有资源都在一台服务器上通俗称LAMP

    阅读」微博推荐架构演进

    微博两个核心基础点:一是用户关系构建,二是内容传播,微博推荐一直致力于优化这两点,促进微博发展。

    阅读」分布式事务四种解决方案,成长需要尝试

    分布式事务指事务操作位于不同节点上,需要保证事务 AICD 特性。

    阅读」为什么在做微服务设计时候需要DDD?

    设计蓝图里为什么没有看到DDD影子呢?

    阅读」移动端适配必须掌握基本概念和适配方案

    随着技术发展,移动设备越来越流行,并且不同设备间屏幕尺寸和屏幕像素差异,移动端开发面临着多分辨率适配问题。

    阅读」亿级用户分布式数据存储解决方案

    分布式数据库和分布式存储是分布式系统中难度最大、挑战最大,也是最容易出问题地方。互联网公司只有解决分布式数据存储问题,才能支撑更多次亿级用户涌入。

    阅读】为什么越来越多系统在做服务化?

    脱离业务实际情况架构都是耍流氓,所以不是所有系统都必须服务化,也不要为了服务化而服务化。

    阅读」Mysql调优你不得不知细节

    多数时候数据库会成为整个系统瓶颈