高速互联系列之二:超以太网开放合作 灵活性的补充方案

类别:行业 机构:华西证券股份有限公司 研究员:马军/宋辉/柳珏廷 日期:2024-04-21

1、超以太网:基于以太网的完整通信堆栈架构在AIGC 等催化下智算需求激增, InfiniBand 一直以零丢包的特点在AI 训练中独占鳌头,配合英伟达GPU 几乎垄断AI 智算市场。为抵抗这种市场挤压,2023 年AMD、Arista、博通、思科等联合组织超以太联盟正式成立,力在推动行业格局变化。

    超以太网联盟(Ultra Ethernet Consortium,UEC)旨在创建一个“基于以太网的完整通信堆栈架构”,用超以太网传输协议取代基于以太网的RoCE 协议,提高网络吞吐量、降低延迟,增强网络的可靠性和稳定性,既保持了以太网的成本效益和普及性,又提供了超级计算互连所需的性能。

    UEC 集结了AMD、Arista、博通、思科等设备商和Meta、微软等云厂商,国内企业包括阿里云、百度、世纪互联、字节跳动、华为、新华三、光迅科技、腾讯、锐捷网络等。

    1.1 超以太关键技术与创新

    UEC 分别从物理层、链路层、传输层、软件层四大方面改进以太网技术;其中,当前物理层工作组致力于100G/Lane 和200G/Lane 的PHY 规范制定,已经确定了100G /Lane 介质类型、PHY 支持的速率和类型。

    200G/Lane 的规范等IEEE P802.3dj 批准后再定。

    UEC 采用一种新的超以太传输协议替代现有的RoCE 协议,致力于改造以太网上的RDMA 操作来优化AI 和HPC 工作负载。

    UEC 通过智能RDMA、网络级负载均衡、优先级流量控制(PFC)、iLossless 智能算法、ACC(Automatic ECN)和全生命周期自动管理等关键技术打造无损网络架构,解决丢包和重传问题,实现0 丢包以太网。

    2、 PCIe 与Nvidia NVLink 的对比

    超以太与InfiniBand 作为两种用于AI 和HPC 领域的网络通信技术,各具特点,适用于不同应用场景。

    在效应上,超以太网注重解决大规模部署中的性能和效率问题,而InfiniBand 可能因端点间的一对一关系限制网络效率。目前,以太网和InfiniBand 在支持大规模部署时都存在实际端点数量的限制,例如InfiniBand 的尾延迟增加问题。

    在生态上,超以太网以其开放标准促进了广泛的技术融合和不同制造商和设备间的联合创新,采取开放的方式寻求未来AI 与HPC 解决方案,而InfiniBand 则与NVIDIA GPU共同形成了一个封闭但优化的性能高地。

    3、 相关投资逻辑

    UEC 成立进一步增强网络设备端对AI 和HPC 大规模部署的灵活性,开放的生态与环境有望催化对于解耦等需求较多的客户选择相应的解决方案。其中超以太联盟相关企业包括:紫光股份(新华三)、锐捷网络、光迅科技、世纪互联等;此外网络侧交换机与光模块相关企业也有望受益,包括中兴通讯、菲菱科思等。

    4、 通信板块观点

    当前时点,面临全球地缘政治冲突及中美科技博弈的多重不确定性情况,TMT 行业对国产替代、自主可控等政策发展具有阶段性影响,从而催化包括算力、卫星通信、鲲鹏体系等热点主题,我们近期持续推荐:

    1)电信运营商:中国移动、中国电信、中国联通等;2)持续推荐算力&通信基础设施

    无线通信&服务器等设备商:紫光股份(华西通信&计算机联合覆盖)、中兴通讯等;

    相关配套服务商:英维克(液冷)、新雷能(电源);算力第三方租赁:光环新网、奥飞数据、网宿科技、数据港等。

    3)光网络升级

    光模块及光放大器:光迅科技、天孚通信、德科立、中际旭创、新易盛;

    激光器受益标的:源杰科技、长光华芯。

    4)军工通信:海格通信(华西通信&军工联合覆盖)、烽火电子(华西通信&军工联合覆盖)、七一二等;

    5)工业互联:金卡智能(华西通信&机械联合覆盖)、威胜信息等;

    6)液晶面板:TCL 科技(华西通信&电子联合覆盖)等。

    5、 风险提示

    应用推广不及预期;算力需求不及预期;技术路线演进不及预期。