在今天举办的“2022中国光通信高质量发展论坛”上,阿里巴巴资深技术总监谢崇进发表了题为《计算和大数据需求下的灵活可编程光网络》的演讲。
谢崇进表示,近年来,数据中心光网络在可编程方面取得了很大进展,需要更多的灵活性和智能化来进一步提高网络效率和可扩展性,结合数据分析和可编程能力是未来可编程光网络的一个重要发展方向。
云计算开启大计算和大数据时代
云和数字化已经成为全球商用模式转型的重要方向。Gartner的报告预测,到2025年,云原生平台将成为95%的新增数字服务工作的基础。
谢崇进指出,云计算系统其实是一个大型的分布式计算系统,可以根据需求随意扩张。服务器是该系统的基本构成单元,只要将多个服务器集中一处,就能提升系统的计算能力。首先组成机架,多个机架组成集群,数量众多且分布在不同地区的数据中心组成一个大的分布式计算系统。
云计算和高性能计算有很大的不同。谢崇进介绍道:“不管是高性能计算机还是大型计算机,它们都坐落在一个地区,但真正的云计算需要遍布全球的基础设施。目前,阿里云数据中心在全球拥有超过80个可用区。这些设施分布在20多个地区,可覆盖6大洲70多个国家。这样,无论用户身在何处,都能够灵活、方便地使用阿里云的计算能力。”
云计算中的光网络
通信网络基础设施是“新基建”的重要基础,互联网是通信网络的核心,而光网络一直扮演着互联网“带宽承重墙”的角色。
在谢崇进看来,光网络之于云计算就好像总线之于计算机。光网络的速率和吞吐量直接决定了整个云计算系统的数据传输量和传输速度,在很大程度上,也决定了计算的速度。
当前,随着全球数字经济的蓬勃发展,新业态模式不断涌现,光网络正面临三大挑战:一是规模大,用户提出Pb/s级光传输的全球覆盖需求;二是增长快,带宽复合年均增长率(CAGR)达到50%~100%,基本每二至三年就能翻一番;三是可扩展,随着网络规模增加,CapEx与OpEx应处于可控范围内,满足可持续发展。
谢崇进表示,传统的光网络无法和计算有效融合,难以适应大计算和大数据的发展。因此,新一代数据中心光网络要和计算、数据、应用等有机组合,实现整体优化。具体可以采用三项举措:
一是开放解耦,以模块化、标准化的硬件设计,助力用户采用最合适的技术灵活组网,推动技术快速迭代;二是软件化和可编程,实现零触摸操作与网络自动化;三是智能化,全网层面端到端优化、提高网络效率,实现性能可预测与自愈网络。
可编程数据中心光网络发展现状和趋势
可编程的技术本质是把原先一体化的硬件设施打破,将基础硬件虚拟化并提供标准化的基本功能,然后通过管控软件,控制其基本功能,提供更开放、灵活、智能的管控服务。在大计算和大数据时代,可编程的数据中心光网络是大势所趋。
谢崇进指出,数字相干收发信机与ROADM(可重构光分插复用器)是光网络中两个重要的可编程器件。前者支持波特率可编程,支持调制格式、编码等可编程,可根据网络条件、距离、容量等完成灵活编程。后者支持高度MESH网络、支持灵活速率和带宽、支持无现场人力、全自动,可编程波长路由器。
据介绍,开放解耦数据中心光网络已实现行业的大规模部署,过去几年,已在自动化方面取得了诸多进展。例如:设备配置调整、业务开通、故障定位以及网络层面的光功率配置均已脱离人工干预。
谢崇进表示,通过API把光和IP网络结合在一起,实现了整个网络的全部打通。然而,目前的光网络很大程度上还是静态管道,下一步需要在性能可预测、根据流量实时重组、自愈功能等方面做出突破,把数据分析和可编程能力相互结合,通过更多的灵活性和智能化来提高网络效率和可扩展性。