网络江湖内功篇之网络加速系统建设

作者简介:Domi,中国移动杭州研发中心

引言

天下武功,无坚不催,唯快不破。网络江湖,亦如是。‘快’,始终是江湖侠客刀光剑影亘古不变的追求。设备底层转发加速技术历经ASIC、NPU芯片到智能网卡到FPGA,Linux内核到用户态DPDK转发,软转到P4硬件流量卸载;业务上层加速技术更是百花齐放,从TCP单边加速到双边加速,拥塞控制算法从BIC到CUBIC再到BBR,从TCP到MPTCP、0-RTT TCP,甚至颠覆性变革从TCP到QUIC等。值得注意的是现实网络应用中,TCP流量占比近70%,且呈增长态势,故而上层业务多拿TCP说事,也就见怪不怪。

凡此种种,说的是武功的‘器’与‘技’。同是独孤九剑,同是降龙十八掌,同样的招数,有的武者使出来平平无奇,有的武者使出来惊天动地,登峰造极者不滞于物,草木竹石均可为剑,更多的是侠客气运内功的不同。接着上篇《漫谈业务切片与网络加速》埋下的引子,谈谈网络江湖的内功——加速网络的建设,窥探加速网络应具备的几个功能属性。

多网融合

天龙八部里,后期武力最高者非虚竹莫属,既得无涯子七十年深厚内力,又含“北冥神功”以及“小无相功”。后又习得“逍遥派”几大绝招“天山折梅手”、“天山六阳掌”、“生死符”,后又学习了“降龙十八掌”,简直bug级存在,这就是融合的威力。

时至今日,传统广域网建设已比较完善,家庭宽带网络、移动通信网络、企业专线网络以及各类专网等支撑了全球互联互通。网络的发展背负了沉重的历史包袱,推倒重来进行革命性变革,几不可能,全链条网络设备更新换代,同时要实现多厂商协议兼容互通,不是一朝一夕或投资几万亿就能搞定的事。单是IPv6,推出了这么些年尚未全面普及,通信界的 “超级网红”SRv6被赋予未来网络的灵魂,但未来却难以预料,更不用提所谓的NewIP。很多时候工程上和科学研究上是不同的,科学讲究的是完美的理论体系,工程研究的是可行和成本可控的技术方案。太完美,实现起来价格太高最终也会失败。这里围绕全球庞大互联网规模,尝试屏蔽多广域网差异,进行适当改造,探索融合多接入,构建多业务深度融合网络,为用户提供广覆盖、一致性、连续性体验。

固网宽带网络和移动通信网络,一个高铁,一个飞机,完全隔离。对用户来讲,体验割裂,离开家门或宽带网络不好,不得不切换为移动网络;反之,则需要切换为宽带网络。通信技术的迅猛发展,更兼提速降费背景之下,两者用户体验趋同,资费趋同。将至刚至柔的两种武功,合二为一,刚柔并济,大道融合,它不香么?

试想如下架构,在用户侧部署融合HCPE(Hybrid CPE)设备,运营商侧部署融合接入网关HAG(Hybrid Access Gateway),宽带网络及移动网络无需升级改造便可实现固移深度融合。一旦实现融合,为网络的吞吐量、可靠性、可用性、可玩性等带来无限想象空间。

图1宽带及移动网络融合

融合CPE逻辑上对用户暴露一个IP,设备内部两个子IP通过L3 OverLay隧道方式分别穿越宽带网络及移动网络,逻辑上直通融合接入网关。

图2 HCPE发起L3隧道方式实现多网融合

如果将L3隧道继续向上收缩,融合CPE基于L3网络,不感知隧道存在,运营商网络侧发起隧道建立,亦可采用如下方式实现融合。

图3 网络侧发起L3隧道方式实现多网融合

或许隧道方式过于粗暴,基于特定应用的多网融合,可基于L4 MPTCP(MultiPath TCP)实现融合。MPTCP在无线网络环境中作用尤为突出。除了信道的反向多路复用机制带来的数据传输率的增益,当用户进入或退出覆盖范围时,链路可以被添加或丢弃,不会中断端对端TCP连接。这样,链路切换的问题便通过传输层中的抽象,在端点处得到解决,而没有用到网络或链路级的任何特殊处理机制。近些年,QUIC以其更短的链接耗时、更出色的拥塞控制,逐步得到应用。尽管QUIC基于UDP,由于其天然的多路复用机制,只需根据QUIC链接会话标识即可实现类似MPTCP的多网融合,这里不再赘述。

图4 基于L4的多路TCP(MPTCP)融合架构

以上粗浅介绍了多网融合方案,多网智能调度选择、隧道技术选型、负载分担、无缝切换等,继续埋个雷,后续文章展开。

推而广之,当有多张WAN网络时,多网融合可抽象为如下架构,一言以蔽之,三个要素:流量分发、汇聚及策略控制。当策略控制施加更弹性、更智能的管理方式时,多网融合将发挥无穷威力。

图5 多WAN融合抽象架构

或许上面描述的正是当下行业最热的SD-WAN。伴随着网络虚拟化和公有云云计算的加速发展以及4G/5G的蓬勃发展,大量的厂商涌入SD-WAN领域,传统的路由器厂商把MPLS扩展加上TE流量工程叫SD-WAN,流控和应用交付厂商把流控设备和广域网加速产品加VPN加集中控制器成为SD-WAN,安全厂商把防火墙加VPN加集中网管称为SD-WAN,互联网和云计算厂商随便找代工厂生产OpenWRT盒子能够连接入云也叫SD-WAN。

玩着玩着,厂商也就迷失了SD-WAN最初的愿景。所谓潮水退去,才知道谁在裸泳,能将SD-WAN玩的出神入化,独树一帜的,数来数去也就那几家。

确定性转发

“小李神刀,冠绝天下,出手一刀,例不虚发”,飞刀普普通通,在李寻欢的手中便是“小李飞刀”,百发百中,技冠群雄,我想这是对确定性的最好描述。当加速网络具备确定性转发能力时,一切将收放自如。

刚刚过去的一年里,华为提出了NewIP数据网络协议架构创新,发布了论文《NewIP:开拓未来数据网络的新连接和新能力》。将确定性IP技术列为重中之重。确定性网络(DetNet)是一项帮助实现IP网络从“尽力而为(best-effort)”到“说到做到”,控制并降低端到端时延的技术;其网络服务的确定性除了有快速精确的时延还有高可靠性(不丢包、低抖动)。

NewIP通过引入周期调度机制,要求全网网络设备严格时钟频率同步,来严格避免微突发的存在,从而保证了确定性时延和无拥塞分组丢失。数据报文只需携带周期信息,通过查表转发即可实现确定性转发。感兴趣的小伙伴可研读相关论文。

图6 传统IP与NewIP结构对比

传统IP的瘦腰结构很大程度上是历史原因导致的,也有它缓慢演进的历史规律,形成了TCP/IP协议族,它的成功只在于这一点,当然带来的争议也在于这一点。华为提出了未来网络的“新腰”,如果要把这个腰动了,上下都得改,这是一个非常耗时耗力的浩大工程,能否实现,何时实现,各道友们自己感受下。如前文所述,我们探讨下,不做颠覆性改造,我们可否实现确定性转发?

当老司机开车去某地时,习惯性打开导航,哪里拥堵就绕开,一目了然轻松选择哪条路线既定时间内到达目的地。如此的自然,平平无奇的背后,却赋予了确定性内涵。

图7 地图导航示例

细品地图导航,老司机并不需要全部记住或清楚每个路口状况,只需关注拥堵的几个路段,避开即可。嗯,就是这么简单。可怜的是传统网络设备却难以做到,网络设备只能承诺自己将报文转发出去了,至于是否到达,何时到达,怎么到达一概不知。

当我们构建了一张IP网络,上海节点至莫斯科节点拥堵,上海节点至香港节点畅通,香港节点至莫斯科节点畅通,要确定性实现上海流量到达莫斯科的目的,很自然可选择转发路径:上海—香港—莫斯科。

当全球拥有数十上百节点,搭建成网时,到达某一目的的流量,通过绕行或避开中间节点,类似地图导航,将存在确定性的转发时延,形成确定性网络。那么问题来了,整个Internet IP都是基于目的地址的路由,如何做选择?如何做到像地图导航一样智能化实现基于网络质量的快速寻路?控制关键转发节点路径,自然会想到IPinIP技术,谷歌B4广域网事实也部分采用了该方式。随着网络层次的叠加及关键转发节点的增多,隧道的层层封装,设备的性能及芯片支持都成问题。

图8 IPinIP转发示例

航班机票可以联程,聪明的人类知道对联程航班的行李如何贴标签,这个灵感顺利的用到了网络上,那就是Segment Routing。例如我们给上海发往莫斯科的行李打上 HK(香港)->MOC(莫斯科)的标签,行李自然就随着这个标签经香港转运回来了。SR详细参考:《Segment Routing将助力SDN重塑新型网络》。有关SR在确定性转发中的具体应用,后续展开详述。

节点布局

如果说多网融合是武侠秘籍的融会贯通,确定性转发是修为精进百炼成金,那么节点布局则是基本功,是强健的体魄。限于篇幅暂不展开,继续埋雷,后续文章详述。

Google B4是一种横跨整个地球的连接到Google数据中心的广域网,基于SDN架构,网络带宽利用率提高了3倍以上,接近100%,仍是目前最成功的SDN网络。

图9 Google B4网络架构

图10 Google B4网络节点分布

结语

无涯子对虚竹说:“你体内已积蓄为师七十余年功力,学习本门武功,必会事半功倍,一日千里。本门内功深身,乘天地之正,御六气之辩,以游于无穷,是为逍遥。此为本门内功精要,也是为师数十年心得。”从此,虚竹开启开挂小和尚之旅。


  • 本站原创文章仅代表作者观点,不代表SDNLAB立场。所有原创内容版权均属SDNLAB,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用,转载须注明来自 SDNLAB并附上本文链接。 本站中所有编译类文章仅用于学习和交流目的,编译工作遵照 CC 协议,如果有侵犯到您权益的地方,请及时联系我们。
  • 本文链接https://www.sdnlab.com/24684.html
分享到:
相关文章
条评论

登录后才可以评论

domi 发表于21-01-14
8