新浪博客

机构研选|AI超算倒逼通信网络全面升级!光模块板块有望充分受益

2023-07-13 18:51阅读:
通信网络是制约数据中心算力高低的关键因素。AI超算对于网络层数据传输速率和延时要求非常苛刻,需要高带宽、高速率的交换机和通信链路匹配。电信接入网的“光进铜退”将在AI超算中上演,随着高速率光模块成本的降低,AI超算时代DAC方案有望加速向AOC方案升级。机构看好光模块有望全面受益。
2.png
通信网络是制约数据中心算力高低的关键因素。在多线程并行计算下,通信成为制约算力的短板,只要有一条交换链路出现网络阻塞或丢包,就会产生I/O延迟。因此,AI超算对于网络层数据传输速率和延时要求非常苛刻,需要高带宽、高速率的交换机和通信链路匹配。
交换网络的连接方案多样,AI超算和DCI场景中,主流是光模块+光纤、AOC(ActiveOpticalCables,有源光缆)和DAC(DirectAttachCables,直连电缆),DAC也可分为有源ACC、AEC和无源DAC。光模块+光缆最为主流,本身衍生出众多传输速率和封装类型,可以广泛、灵活应用于多种场景中,例如长距离电信传输网、中距离接入网和DCI、服务器架顶交换机皆可看到光模块家族的身影;光模块的I/O端口也可以广泛适配各种光纤连接器,传输距离灵活可控。
AOC将光模块和光缆集成化,避免光口被污染的可能性,以提升可靠性
AOC是成本与性能折中的一种优化设计方案,减少光器件数、去除DDM(数字诊断)功能,专用于超短距离的架顶以太网或InfiniBand交换机的互联场景,通常是100米传输距离。因为传输距离超短,所以AOC使用的光模块通常是VCSEL多模方案。
DAC没有光电转换模块,线缆两头是简单的电缆连接头,因此成本非常低。DAC可以进一步细分为有源ACC、AEC和无源DAC,有源ACC、AEC相比无源DAC传输距离更长。由于铜的物理性能限制,DAC传输距离极短,且带
宽越大,有效传输距离就越短。在速率从400G向800G升级中,其传输距离将从3m缩短到2m。
三种方案各有所长,适用场景各不相同
在传输场景上,光模块+光缆范围最广,从电信汇聚前传、中传网络,到数通交换机都可以使用;AOC则适用于百米距离的大带宽架顶交换机互联;DAC适用于服务器和GPU连接到架顶交换机。从成本看,光模块+光纤成本较高,但组网灵活,从全成本角度考虑仍是海外云厂商最主流方案;AOC因为是集成化设计,因此成本次之;DAC无需光电转换,成本最低,但高速率下传输距离距离极大受限,电信接入网的“光进铜退”也将在AI超算中上演,此前因为高速率光模块成本原因,AOC方案优势不明显,但随着高速率光模块成本的降低,AI超算时代DAC方案有望加速向AOC方案升级。
目前,国内外AI大模型加速迭代进步,相关硬件端也成为重点发力对象。近日,英伟达创始人兼CEO 黄仁勋在NVIDIA Computex 2023 演讲中宣布, 生成式AI 引擎NVIDIA DGX GH200 现已投入量产,NVIDIA DGX GH200是将256 个NVIDIA Grace Hopper 超级芯片完全连接到单个GPU 中的新型AI 超级计算机, 支持万亿参数AI 大模型训练。继英伟达发布用于AI领域的芯片和相关产品后,AMD也公布新款MI300X AI芯片,且还公布了MI300A芯片,将用于美国的'El Capitan'超级计算机。AMD董事会主席及CEO苏姿丰表示,MI300X将于今年第三季度向一些客户提供样品,并于第四季度量产。
随着AI产业链发展超市场预期,硬件等上游方向需求快速提升和率先受益
浙商证券近日研报指出,站在当前,随着人工智能崛起,将带来以TMT为代表的结构牛市。展望2023年,以算力、数据、大模型为代表的上游环节盈利有望逐步释放。当前正处在AI上游环节的主升段初期,核心特征在于,TMT和科创50指数慢涨,但基本面线索驱动龙头股超额收益不断扩大。
光模块市场持续演进,海外云厂商占据重要地位
光模块市场经历多年演进,形成了数通市场规模大于电信市场的格局。其中,海外云厂商对数通市场的持续增长贡献较大。海外云厂商的需求直接影响光模块厂商对上游的议价情况,进而对光模块行业整体毛利率产生影响。
人工智能模型训练和推理算力需求攀升,扩大光模块市场增长空间
近期人工智能大模型持续落地,催化了市场对人工智能板块的关注。随着模型训练和推理的算力需求不断增长,与高性能的服务器与网络交换机配套的高速光模块需求也同步攀升,促使下游云厂商和设备商持续增加800G光模块订单。考虑到1.6T光模块尚未实现量产,不同于100G和400G光模块,800G光模块的出货量将更长期处于高位水平。
(来源:国盛证券、上海证券、华金证券、国金证券)

我的更多文章

下载客户端阅读体验更佳

APP专享