超大规模数据中心网络

一、计算模式的演进

图 1 计算模式的演进

计算纪年:
1、大型机时代:20世纪60~70年代,计算机体积大、价格高,支持成百上千用户同时操作。
2、个人电脑时代:20世纪80~90年代,计算机体积小、价格低,只支持单个用户同时操作。
3、移动时代:21世纪00~10年代,终端设备搭载移动操作系统,用户随时随地可用。
4、泛在时代:21世纪20年代及以后,计算无处不在,无所不包,典型代表:云计算。

二、云计算应用场景及特征

图 2 云计算

应用场景:
1、支持动态组织和业务系统的应用:
典型代表:移动办公。

2、提供集中管理和集成共享的应用:
典型代表:桌面管理。

3、基于网络渠道和面向服务的应用:
典型代表:电子商务。

4、需要大数据计算和存储能力的应用:
典型代表:搜索服务。
特征:经济性、灵活性、共享性、可靠性、可扩展性。

三、云计算数据中心网络需求

图 3 云计算数据中心网络

云计算的主要载体是数据中心。数据中心云化对网络提出了新需求:
1、超大规模,平滑扩展:支持数万甚至更高量级的服务器接入。
2、虚机动态迁移:虚机可在不同物理机之间漂移。
3、交换无阻塞,转发低时延:网络流量以东西向为主,南北向为辅。
4、多租户:不同租户网络物理共享,逻辑隔离。
5、低成本,高扩展:采用普通商用组件作横向扩展。
6、网络灵活性:可动态调整拓扑、负载。
7、高效的网络协议:根据数据中心结构和流量特点设计网络协议。
但是在传统数据中心网络中难以满足上述需求。

四、数据中心软件定义网络

图 4 SDN网络架构

为了应对云计算的冲击,数据中心网络需要SDN化。SDN的价值主要体现在网络即服务。
SDN的本质在于抽象网络控制,包括转发抽象(网络模型)、状态分步抽象(全局网络视图)与规格抽象(抽象网络视图)。SDN的特征有控制与转发分离、开放的编程接口与集中化的网络控制。

五、基于Overlay的SDN解决方案

图 5 Overlay网络

基于Overlay的SDN解决方案存在如下优势:
1、复用传统网络基础设施,设备复用;
2、突破传统网络中虚拟网络数量限制;
3、虚拟网络拓扑与物理网络基础设施解耦;
4、支持VM动态迁移;
5、多租户支持,网络资源可复用且相互隔离不干扰;
6、虚拟网络多路径转发;
7、轻松实现业务编排。
但是云计算对数据中心网络的挑战依然存在。

六、挑战依然存在

1、网络故障定位:

图 6 网络故障定位

一旦网络出现异常,难以快速界定到底是上层网络、下层网络还是服务器的问题。往往需要虚拟网络、服务器、物理网络运维团队三方协同。解决问题难度大,耗时长,代价大。
2、物理网络部署:

图 7 物理网络部署

物理网络设备部署流程通常包括:网络设备上架加电、设备配置、调试网络连通性、添加网管、设备信息登记。网络设备配置复杂,人工操作易错,部署速度缓慢。
3、物理网络构建:

图 8 Core-Spine-Leaf无阻塞网络

以Core-Spine-Leaf无阻塞网络为例,Spine与Leaf采取CLOS组网方式构成POD,Core与POD也采取CLOS组网方式,其中Leaf交换设备选用华为的CE68系列,Core与Spine交换设备选用华为的CE128系列。受限于网络交换设备路由负载分担最大链路数64,任一Spine最多连接64个Core,任一Core最多连接64个Spine,则无阻塞网络最大提供16384端口的接入规模,网络交换设备成本支出在27M$左右。网络规模小,设备品牌锁定,Scale-up模式,构建成本高。
4、网络流量均衡:

图 9 网络流量均衡

常用的网络流量均衡技术有TRILL、BGP与静态路由等,都属于Local ECMP(等价多路径),无法动态调整,实际网络带宽利用率一般在40~80%。全局网络流量不均,局部容易拥塞,网络带宽利用率低。
5、网络转发性能:

图 10 VXLAN通信

图 11 VXLAN封装

虚拟网络通过隧道穿越物理网络,报文转发需要额外封装。以VXLAN(MAC in UDP)为例,每个以太帧至少增加50B封装开销,其它隧道协议大同小异。服务器网口线速10G,虚拟交换机吞吐量不及50%。服务器吞吐量低下,网络带宽浪费严重。
七、Heatsink网络架构
网络连接方式:
1、Spine与Leaf采取CLOS组网方式构成Fin;
2、Fin间彼此相连,由Spine间连接方式不同而产生两种变形。

图 12 粗放型Heatsink网络

粗放型网络Spine在Group内相连,以提升网络接入规模,适用于超大规模数据中心网络。

图 13 集约型Heatsink网络

集约型网络Spine在Group外相连,以提升网络设备利用率,适用于小、中、大规模数据中心网络。

八、Heatsink网络控制系统

图 14 Heatsink网络控制系统

1、全栈式控制:物理与虚拟网络设备统一控制管理。
2、控制器(Open Network Controller,ONC):

  • 部署分散,控制集中;
  • 南向屏蔽网络设备差异(OpenFlow/OVSDB/…);
  • 北向提供控制抽象(Rest API/…);
  • 网络操作系统,通过服务对外提供网络功能和接口。

九、 Heatsink网络部署

图 15 Spine Block

1、白盒交换机选型:

  • Spine:32×40GbE;
  • Leaf:48×10GbE + 4×40GbE。

2、Spine Block:
目前市面流通的40GbE白盒交换设备端口密度普遍偏低,通过Spine之间CLOS相连,多Spine拟合逻辑Spine,可以提升端口密度。

将Spine Block模拟的逻辑Spine代入Heatsink网络可以获得如下表所示的各种网络规模:

表 1 Heatsink网络规模

十、Heatsink网络路由方式

1、共Fin选路:

图 16 Heatsink网络共Fin选路

转发路径:源Leaf → Spine → 目的Leaf。路由选路即选择Group的过程。
2、跨Fin选路:
1)粗放型:

图 17 粗放型Heatsink网络跨Fin选路

转发路径:源Leaf → 源Spine → 中转Spine → 目的Spine → 目的Leaf。路由选路即选择Group与中转Spine的过程。中转Spine所属Group与选定Group相同。
2)集约型:

图 18 集约型Heatsink网络跨Fin选路

转发路径:源Leaf → 源Spine → 中转Spine → 目的Spine → 目的Leaf。路由选路即选择Group与中转Spine的过程。中转Spine所属Group与选定Group不同。

十一、Heatsink网络寻址方式

1、网络分区:
1)核心区:
白牌、盒式物理交换机。
2)边缘区:
虚拟交换机。

2、控制策略:
核心简单、鲁棒;边缘复杂、智能。

3、源标签路由:
控制器统一派发交换机标签,边缘交换机封装标签路径,核心交换机按路标寻址。

图 19 Fin内通信

图 20 Fin间通信

十二、Heatsink网络路径封装

图 21 VLAN + Src MAC封装

1、VLAN:
1)以VID标识报文剩余跳数,每跳递减,降至0时,剔除VLAN头;
2)共Fin通信,VID初始值取3;跨Fin通信,VID初始值取5。

2、Src MAC:
针对当前交换设备,指示报文下一跳,各字段填充不同Heatsink属性,掩码匹配可分别提取。

十三、演示

图 22 3D网络拓扑-Fin

图 23 3D网络拓扑-Spine层

图 24 2D网络拓扑

图 25 路径跟踪

图 26 端口信息统计

图 27 流表信息统计

十四、总结

1、网络构建:
1)Heatsink架构,采取多级CLOS组网,支持由小而大平滑扩展,公、私有云网络均适用;
2)选择白牌、盒式交换设备,Scale-out模式,避免品牌锁定,降低网络成本支出;
3)全网交换无阻塞,无单点故障,适应云计算数据中心流量模型由南北向转东西向的变化。

2、网络控制:
1)全栈式控制,物理与虚拟网络合一,设备即插即用,网络状态实时可见,运维难度低;
2)网络分区,核心简单、鲁棒,确保网络性能,边缘复杂、智能,确保业务灵活;
3)源标签路由,降低核心区物理交换设备流表消耗,解决物理交换设备流表容量不足的问题;
4)全网链路实时统计,端到端流量可控,基于流粒度实现全局流量均衡;
5)VLAN+Src MAC掩码匹配,封装开销小,节省网络带宽,提高服务器吞吐量、网络性能。

郑重申明PS:文章中举凡画得好看的图都是来自引用。本文是作者团队面向公、私有云构建数据中心网络的相关研究与实践,主要特点有超大规模网络、白盒交换设备、虚拟与物理网络设备统一管理等,Overlay网络解决方案的本质在于将传统数据中心网络SDN化,无可否认VXLAN/GRE等技术取得了一定的成功,尤其在兼容传统数据中心网络上,但是让本来已经很复杂的网络变得更加复杂了,自然也带来了大量的问题

我们认为Overlay只是数据中心网络SDN化进程中不可避免的一环,不过Singlelay才是SDN网络的终极,我们团队始终以推动SDN在云领域的商业化进程为目标

一些浅显的观点,与大家分享,欢迎拍砖,有任何问题可以直接联系我,咱们共同切磋。

作者简介:左少夫,就职于华为,从事网络技术研发,目前主要致力于促成SDN在数据中心网络的商业化成功。

--------------华丽的分割线------------------
本文系《SDNLAB原创文章奖励计划》投稿文章,该计划旨在鼓励广大从业人员在SDN/NFV/Cloud网络领域创新技术、开源项目、产业动态等方面进行经验和成果的文字传播、分享、交流。有意向投稿的同学请通过官方唯一指定投稿通道进行文章投递,投稿细则请参考《SDNLAB原创文章奖励计划》

 


  • 本站原创文章仅代表作者观点,不代表SDNLAB立场。所有原创内容版权均属SDNLAB,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用,转载须注明来自 SDNLAB并附上本文链接。
  • 本文链接http://www.sdnlab.com/16392.html
分享到:
相关文章
1条评论

登录后才可以评论

  1. comment reply kingkong 2016/03/31 20:18
    看了这篇文章,收获颇丰,提供了一种更加强大而且简便的SDN解决方案。
        1楼
SDNLAB君 发表于16-03-31
0