梁伟:云眼:面向运营智慧化的思考和实践

大家下午好,我先谈一下运营商为什么要做自主研发。

首先面临的外部挑战,第一,互联网变得扁平,ICP逐渐成为全球网络的主要建设者。这个网络未来会变得更加的庞大,右边这个图是腾讯自建的DCN架构,有利于它的业务从云端直接延伸到基础通讯的领域。右下边这个图是2016年运营商和BAT营收的对比。形势还是非常严峻的。

第二,内部挑战。移动用户普及率超过95%,固网带宽市场已经进入平原战役,也就是增幅非常缓慢了。右下方是中国电信当前的网络架构。主要面临的几大问题:网络刚性、网元封闭、业务烟囱、运营复杂,导致最大的问题是资源难以协同、业务加载慢。

中国电信提出的转型3.0主要是三个抓手:第一,业务生态化,第二,网络智能化。第三,运营智慧化。业务生态化是2+5,2依靠天翼4G和天翼光宽两个基础。5是天翼高清、翼支付、物联网和云和大数据、互联网+。打造的是一横四纵的生态圈,智慧家庭、互联网金融、新型ICT、物联网的智能应用生态圈。我说的这些是说我们运营商在做自主研发的大的背景是什么。在这个背景上我们也在做转型,做自主开发。

我们根据实际遇到的问题在做自主开发过程中勾画的产品体系,6个图。第一,尺子,我们叫云眼之PerfRuler,主要是丈量数据的含义。第二,工具箱,云眼之Optikit,第三,放大镜,我们在上面做业务优化管理。第四,舞台,第五,盾牌。第六,我们需要探照灯,知道里面到底发生了什么。我们整个的业务产品研发就是围绕横纵向这样一个矩阵型的定位来展开。

我们在做自主研发的过程中,为什么要这样做?我们基于问题来驱动,我们碰到了哪些问题,需要怎么样来解决。

第一,尺子。基于行业基准和开源框架,提供基础设施及服务产品。

第二,工具箱,这个地方我们碰到了一些问题,基础设施的服务商以及它上面的客户,对于其资源和业务的性能和可用性,到底怎么实现监测?最主要的问题是,不要客户发现了故障,他来反应之后,你才解决。我们要先于客户发现问题,可以提高客户的感知和增强客户的满意度。这一块的研发,我们针对这个问题展开。OptiKit的特点是分布式、立体化、多维度。从数据中心到业务、中间件。多纬度,要由数据来驱动业务,在这个基础上做大数据的预测和优化。

第三,放大镜。我们碰到的问题是,上云的业务为什么慢。慢在哪,找瓶颈,因为有时候你企业内部的IT或者应用业务系统,他不可能用外面第三方的,把所有的数据都放到上面去,因此我们需要一个安全可信的方式来寻找这个瓶颈。在这一块,第一个提供的是业务流拓扑。第二,性能瓶颈到底在什么地方,从代码级的深度来看它的可视化,这跟业内的APM的产品有相似的地方,只是我们都是自己从代码来实现。

第四,舞台,云眼之TeamUp可以搭建一个舞台,让你在不需要太高成本的情况下,发动不同地区、不同网络环境对你产品的测试,解决大家评测的痛点。

第五,盾牌。安全也是很重要的,我们主要是为基础设施网络安全和应用系统的信息安全提供云化的在线安全监测服务。中小企业的业务系统,他需要的安全是厂商多、产品全、投资大、人才缺,我们目前包含从网络漏洞扫描、网站篡改监测,可用性监测、敏感内容监测这几个方面来提。服务即可生效、按需使用服务。

第六,探照灯,网络的复杂性持续的增长,导致网络的可建性下降,如果出现问题你不能快速的找到,导致面临的问题增加和难以解决。我们需要用自己的方式来找到他的原因在哪。因此,VNF提供在网络上自助的安插和释放,客户可以按照他自己的位置来做自动化的探测。实现端到端的用户体验和质量保证。这是我们在研发过程中面临的痛点和我们是怎么样解决的。

举几个案例,第一,天翼云3.0,这是我们的公有云的评测和优化。我们要用数据说话,要用典型业务评测,左边的业务是我们和华为合作的中国电信天翼3.0,阿里云到底好不好,好在哪,我们都可以通过这些数据看出来,包括承载业务的优势在哪。不同厂商有不同的优势,不同的解决方案有各自的特色,现在我们两个特点,第一,在业内加载了这些典型的业务场景。第二,涵盖了业内最全的产品序列,从基本规格到豪华的规格。这是我们对内部运营支撑的,也可以对外部。

第二个案例,我们在支撑的天翼云的资源池监控及VIP业务支撑。我们全国的分布式网络可以从不同区域模拟用户发出请求,在用户暴涨之前我们发现他的可用性、响应时间、可用速度的变化,统计出来业务规模的规律。这个指标包含了CPU内存基础的间到中间件的连接,API的业务监测、我们实际做业务云的运营过程中,也把它做成软件化,你要看Top10的进程列表,或者是包含error的日志,都可以通过定制化的方式实现。

这也是我们应用的一个案例,因为现在电信的IT和业务都在上云,它上云了好不好?慢在哪?这里我们主要基于代码插装和基于标签的跟踪树的技术,实现左边的图里面有多少的请求进来,他又是怎么样分发到数据库里面去的,都可以把它展现出来。右边是我们在实际运营中实际的数据来做数据驱动的运营。这里就是一个典型的关联规则的分析,我们可以在基于他的支持度,可以找到数据库访问和背景图片加载,是业务优化重点,这样我们可以实现一个闭环,从数据驱动业务的运营。

业内的可信云是我们主要做运营支撑的,包括可用性监测、分场景业务评估和开源解决方案测试,我们在今年北京国际通信展获得工信部数据中心联盟的奖项。大家可以访问我们网站了解更多数据中心的详情。谢谢大家!


  • 本站原创文章仅代表作者观点,不代表SDNLAB立场。所有原创内容版权均属SDNLAB,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用,转载须注明来自 SDNLAB并附上本文链接。 本站中所有编译类文章仅用于学习和交流目的,编译工作遵照 CC 协议,如果有侵犯到您权益的地方,请及时联系我们。
  • 本文链接https://www.sdnlab.com/18209.html
分享到:
相关文章
条评论

登录后才可以评论

SDNLAB君 发表于16-12-08
0