这几天朋友圈被阿里云最新一代智算集群网络架构HPN 7.0的成果论文确定收录入SIGCOMM2024论文名单的新闻刷屏了,新闻中对这个事件不吝各种赞美之词,“SIGCOMM历史上在AI智算集群网络架构领域的……
本文介绍了rPCIeBench,这是一个软硬件共同设计的基准测试框架,用于特性化可路由PCIe的性能,这是构建新兴可组合基础设施的基础集群互连。使用rPCIeBench首先检查了一个可路由PCIe路径的性能……
内核,在现代计算架构中扮演着至关重要的角色,它直接管理着系统资源并执行底层操作。出于系统安全性的考虑,对内核的访问权限被严格限制。这种机制有效地防止了潜在的系统破坏,但也带来了一……
谷歌在今年4月份的NSDI 2024上发表了《Resiliency at Scale:Managing Google’s TPUv4 Machine Learning Supercomputer》一文,详细介绍了谷歌的机器学习训练加速器TPUv4的设计和运营经验。(……
本年度USENIX NSDI 共有601篇投稿,录用112篇,录取率18.6%。本文简单介绍了NSDI 2024中调度网络、网络协议、网络可编程、大规模机器学习、广域和边缘方向的部分论文,文末附NSDI 2024全部论……
SONiC-DASH是SONiC NOS的扩展,全称为Disaggregated API for SONiC Hosts,简称DASH。它是一款开源软件,旨在利用各种智能网卡(SmartNIC)、智能交换机(SmartSwitch)、数据处理单元(DPU)……
在快节奏的超大规模数据中心领域,对高性能网络解决方案的需求引发了人们对RoCEv2日益增长的兴趣。RoCEv2代表了InfiniBand的性能优势与以太网的广泛可访问性的结合,从而在现有以太网基础设施……
请输入评论内容