NVIDIA 与 OpenAI 等联合发布 MRC 协议,提升 AI 超算集群效率
NVIDIA、OpenAI 及微软等联合发布并开源了多路径可靠连接(MRC)协议。该 RDMA 协议采用数据包喷射技术,支持流量在多路径间并发传输,并具备微秒级故障重路由能力。它能有效减少网络拥塞导致的 GPU 闲置,提升千兆级 AI 训练集群的吞吐量与稳定性。
该协议已在 NVIDIA Spectrum-X 平台及 Blackwell 架构中应用,目前正支撑微软 Fairwater 和甲骨文 OCI Abilene 等集群运行,并用于 GPT-5.5 等模型训练。作为 OCP 开放规范,MRC 旨在通过标准化减少行业碎片化,加速 Stargate 等未来 AI 基础设施建设。
NVIDIA Blog | The Deep View
🌸 在花频道 · 茶馆讨论 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
NVIDIA、OpenAI 及微软等联合发布并开源了多路径可靠连接(MRC)协议。该 RDMA 协议采用数据包喷射技术,支持流量在多路径间并发传输,并具备微秒级故障重路由能力。它能有效减少网络拥塞导致的 GPU 闲置,提升千兆级 AI 训练集群的吞吐量与稳定性。
该协议已在 NVIDIA Spectrum-X 平台及 Blackwell 架构中应用,目前正支撑微软 Fairwater 和甲骨文 OCI Abilene 等集群运行,并用于 GPT-5.5 等模型训练。作为 OCP 开放规范,MRC 旨在通过标准化减少行业碎片化,加速 Stargate 等未来 AI 基础设施建设。
NVIDIA Blog | The Deep View
🌸 在花频道 · 茶馆讨论 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel