巨头们都要抢占的XPU道路,真的有这么香吗?

在芯片领域有这么一句传言:
每过18天,就会出现一个新的XPU。
曾几何时,一个CPU打天下的时代早已不复存在了。
……

三巨头的XPU征途

很久很久以前,CPU还长这样。

1971年,英特尔发布世界上第一块微处理器CPU-4004。
被誉为“人类历史上最具革新性的产品之一”。

接着8008、8088、8086相继跟上,正式开启了以微处理器为计算机中央处理器的时代。
英特尔也因此坐稳了领头老大的位置,一骑绝尘。
然而随着互联网的高速发展,我们发现,在处理大规模与高速数据时,CPU很难满足需要。
于是它的小弟——GPU,隆重登场了!

在英特尔还在“继续做大做强CPU”和“去GPU市场试试水”之间徘徊不定时,
英伟达已经在GPU领域站稳了脚跟。

2009年末,英特尔“痛下决心”宣布取消Larrabee图形芯片项目,
彼时的英伟达已经推出Tesla,并大举进攻。
更不用提那个戏剧般的2006年——那是值得AMD一直吹牛到今天的一年。

这一年AMD以54亿美元的价格收购了ATI公司。
自此踏上了“两手都要抓,两手都要硬的道路”。
就这样,左手CPU,右手GPU,AMD“扬言”拳打NVIDIA,脚踢英特尔。

虽然英特尔曾信誓旦旦表示不做独立显卡,但真香定律适用于全人类,企业也不能例外。
尤其是AMD“大放厥词”在前,英特尔怎么能忍得下这口气。
果不其然,从2015年开始,英特尔开启“买买买”模式,疯狂拓展XPU领土。

2015年收购FPGA供应商Altera,
2016年收购AI芯片供应商Nervana,
2017年收购自动驾驶视觉处理公司Mobileye和AI芯片供应商Movidius,
2018年收购eASIC,
2019年收购云端AI芯片供应商Habana Labs,
2021年收购RISC-V指令集架构的开发商SiFive。
……

自古以来,金钱的力量往往都是不容小觑的,
英特尔的疯狂输出成功帮助它打造了一支“CPU+GPU+加速器+FPGA”的XPU队伍,
并且这个队伍还在不断扩充中,比如又一个新名词:IPU。

眼看“好兄弟”都在为开疆扩土一掷千金,英伟达也按捺不住了。
凭借一系列的收购,英伟达打出了一套CPU、DPU和GPU的“组合拳”。

CPU、GPU、DPU、IPU,还有没出场的TPU、NPU、APU等等,
巨头们一直锲而不舍地创造新名词,XPU的队伍不断扩大,
或许在不久的将来,26个字母将被全部用完。
下面一起来简单看看这些XPU家族吧。

CPU

CPU—— Central Processing Unit, 中央处理器,
CPU之于计算机、服务器,也就相当于大脑对于人类的作用。
计算、控制、存储是CPU“大脑”布局谋略、发号施令、控制行动的主要表现形式。
CPU 是对计算机的所有硬件资源(如存储器、输入输出单元) 进行控制调配、执行通用运算的核心硬件单元。
CPU 是计算机的运算和控制核心。
如下图所示,CPU主要包括了计算单元、控制单元和存储单元:

我们可以很明显的看出,CPU的计算单元在整个结构中占比很少,
故而相对于大规模并行计算能力,CPU更擅长于逻辑控制。
随着人们对更大规模与更快处理速度的需求的增加,CPU渐渐力不从心。
因此,GPU,它来了!

GPU

GPU——Graphics Processing Unit,图形处理器,
跟它的名字一样,GPU最初是用在个人电脑、游戏机和一些移动设备上运行绘图运算工作的微处理器。
GPU的构成相对简单,有数量众多的计算单元和超长的流水线,特别适合处理大量的类型统一的数据。

不过GPU生来就是做小弟的命,不能单独工作,必须由CPU进行控制调用才行。
GPU的工作大部分都计算量大,但没什么技术含量,而且要重复很多很多次。
当CPU需要大量的处理类型统一的数据时,就可以调用GPU进行并行计算。
不过,GPU虽然叫图形处理器,但并不是只能处理图像。
GPU虽然是为了图像处理而生,但在结构上并没有专门为图像服务的部件,只对CPU的结构进行了优化与调整,
因此GPU可以被认为是一种较通用的芯片。
目前科学计算、密码破解、数值分析,海量数据处理等需要大规模并行计算的领域都有GPU的身影。

TPU

TPU——Tensor Processing Unit, 张量处理单元,
TPU是由Google设计的定制机器学习芯片,用于执行其常规机器学习工作负载。

起初机器学习以及图像处理算法大部分都跑在CPU与GPU上面,
但这两种芯片本质上是通用性芯片,在效能与功耗上不能紧密适配机器学习算法,且价格也比较贵,
TPU便就此诞生了。
TPU是一种ASIC芯片,即应用型专用集成电路(Application-Specific Integrated Circuit),是一种专为某种特定应用需求而定制的芯片。
据称最早的TPU就比同期的标准CPU和GPU快15-30倍,效率(性能/瓦特)提升 30-80倍。
目前谷歌已经发布了第四代TPU,据称TPU v4每秒能够实现10万万亿次运算,将于今年向谷歌云用户提供服务。

DPU

DPU—— Data Processing Unit ,数据处理单元,
DPU是面向数据中心的专用处理器。

CPU用于通用计算,GPU用于加速计算,而数据中心中传输数据的DPU则进行数据处理。
简单来说,CPU做不好,GPU做不了的那些计算任务,交给DPU就完事儿了。
有人说,DPU正在取代CPU作为数据中心服务器的中央控制点,建立以数据为中心的计算架构。
英伟达首席执行官黄仁勋将DPU称为“未来计算的三大支柱之一”。
要说带货还得服老黄,DPU的概念才提出没多久,
从国外巨头大佬英特尔、博通、英伟达、赛灵思、Marvell,
到国内的创企中科驭数、星云智联、芯启源等等,都纷纷陷入了DPU热潮。

XPU全家桶:前途漫漫,挑战不绝

随着5G、AI等新技术不断发展,计算场景也更为丰富多样,XPU的发展成为大势所趋。
许多半导体巨头厂商都推出了多元化的芯片产品,不断充实自己的XPU“全家桶”。
不少创新公司同样不甘示弱,也纷纷推出了专属芯片产品,
整个芯片市场迎来“百家争鸣”时刻。
然而值得注意的是,XPU不能仅仅是XPU,
它不是硬件简单的物理堆砌,而要考虑到其中的互联互通,跨架构的软件协同,
只有软硬件协同发展,才能更好发挥出产品应有的价值。
同样,技术创新还需要匹配用户的实际需求,这样才能在市场中打造自己的一番天地。

*注:
本文图片均源自网络,如有侵权,可联系我们删除。
参考:
https://www.csdn.net/article/2021-07-13/118707327
https://www.sohu.com/a/200698604_160923
https://zhuanlan.zhihu.com/p/287770200
https://www.eet-china.com/mp/a47982.html


  • 本站原创文章仅代表作者观点,不代表SDNLAB立场。所有原创内容版权均属SDNLAB,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用,转载须注明来自 SDNLAB并附上本文链接。 本站中所有编译类文章仅用于学习和交流目的,编译工作遵照 CC 协议,如果有侵犯到您权益的地方,请及时联系我们。
  • 本文链接https://www.sdnlab.com/25345.html
分享到:
相关文章
条评论

登录后才可以评论

SDNLAB君 发表于21-09-17
0