计算机网络通信中两个重要的衡量指标是带宽和延迟,AI 网络也是如此。在向百亿级及以上规模的发展过程中,影响AI计算集群性能的关键并不只在于单个芯片的处理速度,每个芯片之间的通信速度也尤为重要。
根据 IDC 的数据,2022 年,AI 网络市场已达到 20亿美元,其中 InfiniBand 贡献了 75% 的收入。2023 年AI 基础设施建设投资将达到 1540亿美元,到 2026 年将增长到 3000亿美元。
数据中心在现代社会扮演着至关重要的角色,它们是数字化时代的神经中枢,支持着云计算、大数据、人工智能等技术的快速发展。在传统的数据中心中,冷空气通过充斥着计算、网络和存储系统的机架被加热后,通过冷却设……
在AIGC迅猛前进的道路上,智能算力作为AI网络的基石,是支持AI大模型训练和推理的关键;高性能网络则是AI网络基础设施的纽带,推动更高性能的网络互联成为业界重要的探讨方向。
9月10日 - 9月14日,SIGCOMM 2023在美国纽约哥伦比亚大学召开。SIGCOMM是ACM组织的网络通信领域旗舰型会议。本次SIGCOMM 2023共收到323篇论文,录用71篇(录用率为22%),录用文章数量创下了大会纪录。
2023 年 4 月,在捷克首都布拉格举行的开放计算项目 (OCP) 区域峰会上,一直游离在组织之外的Amazon宣布了一项新的贡献即开放企业边缘网关,同时拿出了新鲜出炉的边缘网关基础规范白皮书。
随着AI大模型“百花齐放”,底层的算力需求与日俱增。目前,AI大模型的训练参数已飙升至万亿级别,如此庞大的训练任务无法由单个服务器完成,需要大量服务器作为节点,通过高速网络组成算力集群,相互协作完成任务。……
生成式AI和大语言模型(LLM)正在以难以置信的方式吸引全世界的目光,本文简要介绍了大语言模型,训练这些模型带来的硬件挑战,以及GPU和网络行业如何针对训练的工作负载不断优化硬件。
8月25日下午,在第七届未来网络发展大会闭幕式上,紫金山科研团队在闭幕式活动中正式对外发布《算网操作系统白皮书》、《光电融合服务定制广域网》、《以网络IO为中心的无服务器数据中心》三本白皮书。
请输入评论内容