RoCEv2在大规模数据中心的潜力

在快节奏的超大规模数据中心领域,对高性能网络解决方案的需求引发了人们对RoCEv2日益增长的兴趣。RoCEv2代表了InfiniBand的性能优势与以太网的广泛可访问性的结合,从而在现有以太网基础设施上实现无缝的RDMA功能……

Meta 推出最新AI芯片

就在昨日英特尔发布其最新AI加速器硬件之后,Meta迅速展示了其芯片研发的最新进展——新一代MTIA。作为先前MTIA v1版本的升级迭代,这款芯片能够支持包括针对Meta旗下各平台(例如Facebook)上的显示广告排名算法和……

你可能从没真正理解 MPLS !

尽管 MPLS 技术已经相当成熟,有关它的文章数不胜枚举,涵盖了从基本原理到 SR-MPLS 等方方面面。然而,令人意外的是,实际上大多数网络工程师并没有真正理解 MPLS。

史上最全大语言模型训练中的网络技术盘点

大语言模型的爆发式增长对网络提出了更高要求,产学研各界纷纷开始探索,围绕网络架构、网络协议等取得了丰富的实践进展。本文由中兴团队操刀,不同于SDNLAB以往编发的只是局限于网络协议类详解的文章,本文从多维……

CXL 不适合英伟达’s AI ?!

英伟达的 GPU 成本高昂且供应有限,增加内存容量使其能够完成更多工作似乎是个好主意,那么为什么 CXL 及其内存池没有成为英伟达GPU 争夺的前沿和中心呢?

揭秘 Meta 最新大规模AI集群技术细节!

近日,Meta 对外披露了其最新的AI基础设施部署,新推出了两个拥有2.4万个GPU的集群(共 49152 个 H100),这是其AI基础设施路线图中的一项重大举措。该公司的雄心壮志并未止步于此,Meta 表示会持续扩大基础设施建……