李振斌:基于ONOS的统一控制器架构

各位观众,下午好!我是李振斌,是来自华为SDN控制器首席架构师,今天下午我讲两部分内容,第一部分讲SDN的技术发展趋势,关于我们的理解,第二部分介绍一下我们华为基于ONOS架构的统一控制器。

现在整个SDN已经形成了一个巨大的生态,在这个里面有这样一些协议的定义,在这里面最重要的,原来有OpenFlow,现在加入了很多开源组织,这个开源加快了标准化的进程,这是在过去从2013年开始展现出来的一个发展趋势。

我在这里想重点讲一下运营商的SDN,在过去的几年里,大家对SDN所解决的问题有了一个更加清楚的认识,是集中在三个方面。第一个,是增收,第二是减支,第三是调优。从最开始完全理想的转控分离,更多的向一个分布式网络加集中控制演进,各自发挥各自的优势,解决不同层面的问题。在这里面在IETF成立的工作组和定义的草案里体现了六方面的趋势。第一方面已经有更多的应用是集中控制的应用,已经展现出来了,包含网络虚拟化。第二部分是MPLS为代表的转发,运营商的SDN里头继续发挥一个重要的作用,这个跟DC有一些区别,大家普遍选择的是IP隧道,因为IP隧道更加简单,但是在运营商里面,MPS在转发面在新时代依然发挥一个重要的作用。

第三个趋势,就是IGP、BGP和PCEP,在集中控制协议里发挥着重要的作用,控制协议主要来自于三个方面,一个是IGP,一个是BGP,还有一个是PCEP。传统的MPLS协议即将被替代。

第四,我们会定义一系列的信息模型和对应的API和数据模型,满足构建一个开放系统的要求。

第五,现有的一些集中控制的部件,它不光是一个分布式网络,这个分布式部件是BGP里头的路由反射器,还有PCE计算服务器又得到了增强。

第六,这部分是DC,这里头包含以三层模拟二层的NVO3,与数据中心互联,同时向数据中心内进行迁移。

华为对于运营商SDN演进的整体方案,在转发面,我们认为MPLS为代表的是不同标准的小组,还有MPLS的路径编程,还有基于段的路径编程。控制面用于集中控制的一些协议的扩展,这个里面包含了我们统一定义为IGPCC、BGCCC,用于集中控制解决不同的网络应用。第三,构建一个开放系统,定义一系列的信息模型、数据模型,这些在相应的工作组开展了定义。

还有,就是我们在一些发展中提出了SDN的解决方案,还有网络人工智能架构,这个就是我们的创新解决方案的发展路线图,我们传统的IP网络也都有,以前有一些路径服务,引入了集中控制,就可以做更好的流量调优。原来有一些传统的Services,比较费时,也容易出错,引入SDN以后,就可以快速准确的业务发布,原来有一些传统的OAM,但是这些OAM机制复杂,跟SDN结合以后变得更加智能。原来SDN在单个领域进行展开,现在实际上已经向多个SDN控制器联合解决这样一个网络方向进行发展,我们定名为SDNI。比如说IP加光,DCN+DCI,还有端到端的流量调优,我们跟沃达丰进行了全局调优。

再往下,我们认为最后就是网络人工智能,这个里面因为随着NFV的引入,网络设备节点、数量大幅度增加,网络的状况也会海量增长,我们就要引入决策数、机器学习,人工智能,完成网络的感知和认知,提供人工智能服务。

虽然在过去的很多年里面,我们在SDN领域做了很多的工作,让我们的网络变得更加敏捷、更加迅速,但其实我们自己提出这样一个功能的时候,也觉得我们未来的使命还是非常长远的。现在按照普通的人工智能,现在人工智能综合达到的水平也就是人类3岁的水平,做得比较好的话,类似Google可能达到了人类6、7岁的孩子。但是对于网络的人工智能我认为我们才刚刚开始,尽管我们已经做了很多的工作。

第二个路线图,我们的这样一个发展路线图关于南向北向协议的发展,原来大家认为OpenFlow解决所有的问题,但是现在进行了分化。首先的分化就是通过Net Conf为代表的管理协议,这个协议相对来讲容易适配互通,缺点就是性能比较差,而且做一些新的特性出来的时候,用命令行,用配置写的话,可能就太慢了。所以,在这个过程中产生了一些控制协议,是IGP、BGP和PCEP,我们的网络截止目前有三大类应用,第一种是把集中应用的信息通知给网络中所有的节点,这个里头IGP是比较合适的,还有一个就是把网络中的应用信息通知给边缘节点,过去我们一直都用BGP在解决二层VPN和三层VPN,还有是通知给网络的部分节点,这块就是PCEP,对这块正好是合适的。在这里,把应用信息分发给所有节点,实际上是部分节点的一个特例,在最终的时候,我们认为IGP也要被PCEP给替代掉。

这一块是我们标准的工作,我们定义一些模型,在这里面南向的信息模型、数据模型就非常的重要,主要是在这些方面进行标准化。刚才讲了,因为它的性能存在问题,所以这种控制协议在现在进行这样一个标准化,第三,就是OpenFlow,现在在DC的应用相对比较广泛,我们也会持续关注。无论南向采用什么,我们的北向一定是统一的,而且是抽象的,简单的。最终是能够符合我们业务快速发放、更加智能的这么一个条件。这就是我们在相关的里面展开的布局,左边是我们在模型方面展开的布局,现在跟各大友商成立的组织定义的模型,PECP会继续发展,BGP现在最热的扩展。

对应的解决方案呈现了一个端到端,华为的控制器称之为敏捷控制器,我们会覆盖园区网、数据中心网络、广域网、光网络。随着SDN的网络解决方案的发展,呈现分层控制器,就出现了超级控制器,管理底下的预控制器,这样的话,最后完成一个端到端的网络解决方案。

为了完成端到端的解决方案,我们面临很多问题,所以最终要走向统一控制器,这个里面讲了几个方面的问题,第一方面的问题,就是网络边界的灵活变化,要求控制器的功能灵活迁移。我们以前的DC控制器管网关,这个WAN的控制器要完成DC,如果这两个Control不具备一个相同的架构,导致管理就要重复开发,造成效率低下。

第二,因为多控制器容易导致信息割裂,交互变得复杂。举一个例子,就是IP加光,IP和光的信息是分设的,我们最后简化了部署,做更智能的流量调优。做一个简单的比喻,在很多情况下相当于把人的大脑拆成两半就要复杂得多。

本来我们拿着SDN控制器是为了简化网络部署和运维,但是现在因为有不同的域和不同的功能,结果导致经常是多个控制器来满足用户的需要,这样的话,不但没有使运维简单,反而使得用户的网络部署运维变得复杂,这也是我们要避免的问题。

如果简单的把这些东西集中在一起做一个统一控制器,这也是很危险的,因为这里面意味着多种应用,实际上有不同的架构和不同的性能可扩展性的要求,意味着我们的架构元素有不同的选择,我们总结了四大类应用,第一是业务布放,这种应用性能要求不是很高,要多次访问数据库,完整性一定要保证。第二是接入控制类应用,比如在数据中心里上下线,有几万个VM同时上下线,对架构有一个巨大的冲击,所以在业务处理上有很高的要求。第三类是网络控制类应用,典型的就是IP的路径调优,特点就是单位内要做大量的业务计算和处理。

还有一个就是现在正在呈现的大数据,就是刚才讲的故障的自动发现、自动定位,这里面面临着海量数据的上报、存储和处理。不同的应用在最后选择分布式数据库,还有通信调度机制,就会有不同的选择,需要考虑不同的对于性能可扩展性、可靠性或者安全性不同的架构需求。

第二,我们在架构挑战里面就是这个模型,这个模型实际上需要有这样一个公共的模型基础,否则的话,在这个里面形似统一,但是最后做成了一个烟囱,实际上是伪统一,所以一定要有一个基础的模型。

在这种情况下,我们认为ONOS在这个里面的架构理念是符合我们的一些预期的,首先,它有分布式的机制,然后在集群分布式存储、性能可靠性、可扩展性方面有一个较好的基础,给我们一个很好的案例,我们在这个基础上进行优化。

第二就是红色的部分,对网络的资源进行优化,我们网络里很重要的基础服务就是拓扑、设备管理、服务资源管理,这三种网络的基础服务如果有统一的模型,最后导致这些应用必然是基于同样的一个基础在做,这样的话就会避免他们形成这样一个烟囱式开发。还有一个就是南北向模型,因为有开源,容易形成事实标准,从而形成互通。

最后,我们的架构就是这样一个展示,我们认为我们也有一个网络基础模型构建的系统,直接使用ONOS代码进行增强和优化。这个就是我们的开放性,首先是说在API,在网络基础服务上要保持一致,这样的话,可以做一些Built-in的APP。还有一个是南北向,用统一的北向模型、南向模型进行南向对接和北向对接。在集群分布式里面,有些东西这里面举了一些典型的数字,WAN领域的可能是一千个节点,大规模的数据中心网络到达几十万的OAS,在集群上必然有一个更多的考虑。在解决不了的时候,还要考虑这种分层控制器的架构来解决这个问题。

可靠性,因为这是一个商用,在开源这方面的考虑相对比较薄弱,所以,我们在这里面从北向负载分担到南向一致性,还有事物性,还有异地容灾,这里面有多层次的机制,保证高可靠性的达成。

我们最终就是通过这样一个ONOS,引入ONOS的架构理念,构建商用控制器,达到一个统一端到端覆盖全网络场景、功能和产品可以灵活组合和部署,第二就是开放性,可以基于ONOS,同时可以兼容ODL,最后无缝对接ONOS、ODL北向应用和南新转化器。面向商用,我们要构建高性能、高可扩展性、高可靠性。

随之而来,我们的商用控制器跟ONOS的开源可以实现一个差异,我们跟ONOS团队进行了一个密切沟通,我们认为后面ONOS开源要在三个方向上做提升,华为也愿意贡献自己的力量。第一部分,我们要在ONOS里头继续做一些机制,可以方便开发者进行开发,更有利于构建生态系统,这里头包含一些工具,还有一些新的南向北向协议,比如说现在Google正在提出的GRPC,还有更多的南向和北向模型,我们会提供北向的VPN模型。还要跟OpenStack等进行很好的互通,使得我们的开发者能够很好的在协同器、控制器和转化器三个层面上开发应用。

第二部分,为了不同的应用需求和商用,我们认为有两个面,一个是系统服务面,这里头做增强,主要是为了提高可扩展性,可用性,安全性。第二部分是SMP,包括YANG的机制,缺陷管理,配置管理,账户管理,性能管理,还有安全管理。

第三部分继续提升创新,包括解决方案的创新,比如现在比较火的SDN WAN、智能运维。我们需要进行孵化,包括从其他领域里借鉴一些经验解决网络的问题,还有从其他产业AI的成功实践解决网络的人工智能问题,也希望得到业界的支持。

为了解决所有的问题,在SDN时代,我们认为在边界上不管是软件、硬件,IT、CT、网管,协同器在边界上都已经打破了,我们需要更多的成员,更多的这样一些技术力量来共同进行合作,解决我们网络的问题,所以,我们在这个里面也是在构建了一个技术部落,包含中文的技术部落,截止到昨天,是1290人,英文的技术部落我们称之为大神部落,第一个群已经接近500人了,用于微信的方法,快速便捷的来解决我们的技术问题。

这个里面涉及到太多的问题,所以纵向上会出现OPS、还有实战团,在横向上因为跟所有的控制器都相关,从上往下进行切割,这里面包括基础平台和架构,我们借鉴数据库,分布式,这些东西,安全性、可靠性。还有就是端到端解决方案,再就是南北向协议与模型,再往下是北向协同器、南向设备器,在横向因为它跟所有控制器都是相关的,我们希望在细分的部落里进行一些专业问题的讨论。

这是我们已经开展的一些活动,从9月份开始构建,已经完成的第一次见面会,又在中国三大运营商进行了相关技术趋势的演讲和讨论。另外,我们在欧洲借助ONOS架构拓展技术资源。希望我们共同努力解决网络问题,把我们的网工解放出来,去解决更重要的一些问题。谢谢大家!


  • 本站原创文章仅代表作者观点,不代表SDNLAB立场。所有原创内容版权均属SDNLAB,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用,转载须注明来自 SDNLAB并附上本文链接。 本站中所有编译类文章仅用于学习和交流目的,编译工作遵照 CC 协议,如果有侵犯到您权益的地方,请及时联系我们。
  • 本文链接https://www.sdnlab.com/18177.html
分享到:
相关文章
条评论

登录后才可以评论

SDNLAB君 发表于16-12-07
0