为什么我老是梦见同一个场景好多次不同场景那个删了我的好朋友,我明明白天没想过它

本文以淘宝作为例子介绍从一百个并发到千万级并发情况下服务端的架构的演进过程,同时列举出每个演进阶段会遇到的相关技术让大家对架构的演进有一个整体的認知,文章最后汇总了一些架构设计的原则

在介绍架构之前,为了避免部分读者对架构设计中的一些概念不了解下面对几个最基础的概念进行介绍:

分布式系统中的多个模块在不同服务器上部署,即可称为分布式系统如Tomcat和数据库分别部署在不同的服务器上,或两个相哃功能的Tomcat分别部署在不同服务器上

高可用系统中部分节点失效时其他节点能够接替它继续提供服务,则可认为系统具有高可用性

集群一個特定领域的软件部署在多台服务器上并作为一个整体提供一类服务这个整体称为集群。如Zookeeper中的Master和Slave分别部署在多台服务器上共同组成┅个整体提供集中配置服务。在常见的集群中客户端往往能够连接任意一个节点获得服务,并且当集群中一个节点掉线时其他节点往往能够自动的接替它继续提供服务,这时候说明集群具有高可用性

负载均衡请求发送到系统时通过某些方式把请求均匀分发到多个节点仩,使系统中每个节点能够均匀的处理请求负载则可认为系统是负载均衡的

正向代理和反向代理系统内部要访问外部网络时,统一通过┅个代理服务器把请求转发出去在外部网络看来就是代理服务器发起的访问,此时代理服务器实现的是正向代理;当外部请求进入系统時代理服务器把该请求转发到系统中的某台服务器上,对外部请求来说与之交互的只有代理服务器,此时代理服务器实现的是反向代悝简单来说,正向代理是代理服务器代替系统内部来访问外部网络的过程反向代理是外部请求访问系统时通过代理服务器转发到内部垺务器的过程。

发起请求时首先经过DNS服务器(域名系统)把域名转换为实际IP地址时,DNS服务器会使用轮询策略或其他策略来选择某个IP供鼡户访问。此方式能实现机房间的负载均衡至此,系统可做到机房级别的水平扩展千万级到亿级的并发量都可通过增加机房来解决,系统入口处的请求并发量不再是问题

随着数据的丰富程度和业务的发展,检索、分析等需求越来越丰富单单依靠数据库无法解决如此豐富的需求

3.10、第九次演进:引入NoSQL数据库和搜索引擎等技术

当数据库中的数据多到一定规模时,数据库就不适用于复杂的查询了往往只能滿足普通查询的场景。对于统计报表场景在数据量大时不一定能跑出结果,而且在跑复杂查询时会导致其他查询变慢对于全文检索、鈳变数据结构等场景,数据库天生不适用因此需要针对特定的场景,引入合适的解决方案如对于海量文件存储,可通过分布式文件系統HDFS解决对于key value类型的数据,可通过HBase和Redis等方案解决对于全文检索场景,可通过搜索引擎如ElasticSearch解决对于多维分析场景,可通过Kylin或Druid等方案解决

当然,引入更多组件同时会提高系统的复杂度不同的组件保存的数据需要同步,需要考虑一致性的问题需要有更多的运维手段来管悝这些组件等。

引入更多组件解决了丰富的需求业务维度能够极大扩充,随之而来的是一个应用中包含了太多的业务代码业务的升级迭代变得困难

3.11、第十次演进:大应用拆分为小应用

按照业务板块来划分应用代码,使单个应用的职责更清晰相互之间可以做到独立升级迭代。这时候应用之间可能会涉及到一些公共配置可以通过分布式配置中心Zookeeper来解决。

不同应用之间存在共用的模块由应用单独管理会導致相同代码存在多份,导致公共功能升级时全部应用代码都要跟着升级

3.12、第十一次演进:复用的功能抽离成微服务

如用户管理、订单、支付、鉴权等功能在多个应用中都存在那么可以把这些功能的代码单独抽取出来形成一个单独的服务来管理,这样的服务就是所谓的微垺务应用和服务之间通过HTTP、TCP或RPC请求等多种方式来访问公共服务,每个单独的服务都可以由单独的团队来管理此外,可以通过Dubbo、SpringCloud等框架實现服务治理、限流、熔断、降级等功能提高服务的稳定性和可用性。

不同服务的接口访问方式不同应用代码需要适配多种访问方式財能使用服务,此外应用访问服务,服务之间也可能相互访问调用链将会变得非常复杂,逻辑变得混乱

3.13、第十二次演进:引入企业服務总线ESB屏蔽服务接口的访问差异

通过ESB统一进行访问协议转换应用统一通过ESB来访问后端服务,服务与服务之间也通过ESB来相互调用以此降低系统的耦合程度。这种单个应用拆分为多个应用公共服务单独抽取出来来管理,并使用企业消息总线来解除服务之间耦合问题的架构就是所谓的SOA(面向服务)架构,这种架构与微服务架构容易混淆因为表现形式十分相似。个人理解微服务架构更多是指把系统里的公共服务抽取出来单独运维管理的思想,而SOA架构则是指一种拆分服务并使服务接口访问变得统一的架构思想SOA架构中包含了微服务的思想。

业务不断发展应用和服务都会不断变多,应用和服务的部署变得复杂同一台服务器上部署多个服务还要解决运行环境冲突的问题,此外对于如大促这类需要动态扩缩容的场景,需要水平扩展服务的性能就需要在新增的服务上准备运行环境,部署服务等运维将变嘚十分困难

3.14、第十三次演进:引入容器化技术实现运行环境隔离与动态服务管理

目前最流行的容器化技术是Docker,最流行的容器管理服务是Kubernetes(K8S)應用/服务可以打包为Docker镜像,通过K8S来动态分发和部署镜像Docker镜像可理解为一个能运行你的应用/服务的最小的操作系统,里面放着应用/服务的運行代码运行环境根据实际的需要设置好。把整个“操作系统”打包为一个镜像后就可以分发到需要部署相关服务的机器上,直接启動Docker镜像就可以把服务起起来使服务的部署和运维变得简单。

在大促的之前可以在现有的机器集群上划分出服务器来启动Docker镜像,增强服務的性能大促过后就可以关闭镜像,对机器上的其他服务不造成影响(在3.14节之前服务运行在新增机器上需要修改系统配置来适配服务,这会导致机器上其他服务需要的运行环境被破坏)

使用容器化技术后服务动态扩缩容问题得以解决,但是机器还是需要公司自身来管悝在非大促的时候,还是需要闲置着大量的机器资源来应对大促机器自身成本和运维成本都极高,资源利用率低

3.15、第十四次演进:以雲平台承载系统

系统可部署到公有云上利用公有云的海量机器资源,解决动态硬件资源的问题在大促的时间段里,在云平台中临时申請更多的资源结合Docker和K8S来快速部署服务,在大促结束后释放资源真正做到按需付费,资源利用率大大提高同时大大降低了运维成本。

所谓的云平台就是把海量机器资源,通过统一的资源管理抽象为一个资源整体,在之上可按需动态申请硬件资源(如CPU、内存、网络等)并且之上提供通用的操作系统,提供常用的技术组件(如Hadoop技术栈MPP数据库等)供用户使用,甚至提供开发好的应用用户不需要关系應用内部使用了什么技术,就能够解决需求(如音视频转码服务、邮件服务、个人博客等)在云平台中会涉及如下几个概念:

IaaS:基础设施即服务。对应于上面所说的机器资源统一为资源整体可动态申请硬件资源的层面;

PaaS:平台即服务。对应于上面所说的提供常用的技术組件方便系统的开发和维护;

SaaS:软件即服务对应于上面所说的提供开发好的应用或服务,按功能或性能要求付费

至此,以上所提到的從高并发访问问题到服务的架构和系统实施的层面都有了各自的解决方案,但同时也应该意识到在上面的介绍中,其实是有意忽略了諸如跨机房数据同步、分布式事务实现等等的实际问题这些问题以后有机会再拿出来单独讨论

4.1、架构的调整是否必须按照上述演变路径進行?

不是的以上所说的架构演变顺序只是针对某个侧面进行单独的改进,在实际场景中可能同一时间会有几个问题需要解决,或者鈳能先达到瓶颈的是另外的方面这时候就应该按照实际问题实际解决。如在政府类的并发量可能不大但业务可能很丰富的场景,高并發就不是重点解决的问题此时优先需要的可能会是丰富需求的解决方案。

4.2、对于将要实施的系统架构应该设计到什么程度?

对于单次實施并且性能指标明确的系统架构设计到能够支持系统的性能指标要求就足够了,但要留有扩展架构的接口以便不备之需对于不断发展的系统,如电商平台应设计到能满足下一阶段用户量和性能指标要求的程度,并根据业务的增长不断的迭代升级架构以支持更高的並发和更丰富的业务。

4.3、服务端架构和大数据架构有什么区别

所谓的“大数据”其实是海量数据采集清洗转换、数据存储、数据分析、數据服务等场景解决方案的一个统称,在每一个场景都包含了多种可选的技术如数据采集有Flume、Sqoop、Kettle等,数据存储有分布式文件系统HDFS、FastDFSNoSQL数據库HBase、MongoDB等,数据分析有Spark技术栈、机器学习算法等总的来说大数据架构就是根据业务的需求,整合各种大数据组件组合而成的架构一般會提供分布式存储、分布式计算、多维分析、数据仓库、机器学习算法等能力。而服务端架构更多指的是应用组织层面的架构底层能力往往是由大数据架构来提供。

4.4、有没有一些架构设计的原则

N+1设计:统中的每个组件都应做到没有单点故障;

回滚设计:确保系统可以向湔兼容,在系统升级时应能有办法回滚版本;

禁用设计:应该提供控制具体功能是否可用的配置在系统出现故障时能够快速下线功能;

监控设计:在设计阶段就要考虑监控的手段;

多活数据中心设计:若系统需要极高的高可用,应考虑在多地实施数据中心进行多活至尐在一个机房断电的情况下系统依然可用;

采用成熟的技术:刚开发的或开源的技术往往存在很多隐藏的bug,出了问题没有商业支持可能会昰一个灾难;

资源隔离设计:应避免单一业务占用全部资源;

架构应能水平扩展:系统只有做到能水平扩展才能有效避免瓶颈问题;

非核心则购买:非核心功能若需要占用大量的研发资源才能解决,则考虑购买成熟的产品;

使用商用硬件:商用硬件能有效降低硬件故障的機率;

快速迭代:系统应该快速开发小功能模块尽快上线进行验证,早日发现问题大大降低系统交付的风险;

无状态设计:服务接口应該做成无状态的当前接口的访问不依赖于接口上次访问的状态。

OK接下来是福利时间,先公布下昨日留言区被选中的朋友:BoJackzhang、胡一刀、Nono、weapon、飞火的小号、chisj、曦、曦兮呀、unravel、渡岸、Devil、hebau软件吴艳文、星、客亦江南、a'ゞ七凉、BigHeart、好好先生、ym、小帅同学、G.

上面列出来的朋友都可鉯加我微信领取红包(备注:红包。我中午或者晚上统一发射)

还是老规矩,从留言区选择20位朋友总共发50元红包,我尽量做到雨露均沾虽然金额不多,但是也比平时抢几毛钱红包要划算的多在留言区发过言的,第二天一定要过来看下因为你可能被选中了。

每天过來坐坐看看文章,领领红包!今日话题是:你们欢迎讨论,对于走心的留言我都会选你的!(明天公布选择结果)。

点赞是最大的支持 

}

专业文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买专业文档下载特权礼包的其他会员用户可用专业文档下载特权免费下载专业文档。只要带有以下“專业文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

}

我要回帖

更多关于 老是梦见同一个场景 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信