巨头们都要抢占的XPU道路，真的有这么香吗？ | SDNLAB

在芯片领域有这么一句传言：
每过18天，就会出现一个新的XPU。
曾几何时，一个CPU打天下的时代早已不复存在了。
……

三巨头的XPU征途

很久很久以前，CPU还长这样。

1971年，英特尔发布世界上第一块微处理器CPU-4004。
被誉为“人类历史上最具革新性的产品之一”。

接着8008、8088、8086相继跟上，正式开启了以微处理器为计算机中央处理器的时代。
英特尔也因此坐稳了领头老大的位置，一骑绝尘。
然而随着互联网的高速发展，我们发现，在处理大规模与高速数据时，CPU很难满足需要。
于是它的小弟——GPU，隆重登场了！

在英特尔还在“继续做大做强CPU”和“去GPU市场试试水”之间徘徊不定时，
英伟达已经在GPU领域站稳了脚跟。

2009年末，英特尔“痛下决心”宣布取消Larrabee图形芯片项目，
彼时的英伟达已经推出Tesla，并大举进攻。
更不用提那个戏剧般的2006年——那是值得AMD一直吹牛到今天的一年。

这一年AMD以54亿美元的价格收购了ATI公司。
自此踏上了“两手都要抓，两手都要硬的道路”。
就这样，左手CPU，右手GPU，AMD“扬言”拳打NVIDIA，脚踢英特尔。

虽然英特尔曾信誓旦旦表示不做独立显卡，但真香定律适用于全人类，企业也不能例外。
尤其是AMD“大放厥词”在前，英特尔怎么能忍得下这口气。
果不其然，从2015年开始，英特尔开启“买买买”模式，疯狂拓展XPU领土。

2015年收购FPGA供应商Altera，
2016年收购AI芯片供应商Nervana，
2017年收购自动驾驶视觉处理公司Mobileye和AI芯片供应商Movidius，
2018年收购eASIC，
2019年收购云端AI芯片供应商Habana Labs，
2021年收购RISC-V指令集架构的开发商SiFive。
……

自古以来，金钱的力量往往都是不容小觑的，
英特尔的疯狂输出成功帮助它打造了一支“CPU+GPU+加速器+FPGA”的XPU队伍，
并且这个队伍还在不断扩充中，比如又一个新名词：IPU。

眼看“好兄弟”都在为开疆扩土一掷千金，英伟达也按捺不住了。
凭借一系列的收购，英伟达打出了一套CPU、DPU和GPU的“组合拳”。

CPU、GPU、DPU、IPU，还有没出场的TPU、NPU、APU等等，
巨头们一直锲而不舍地创造新名词，XPU的队伍不断扩大，
或许在不久的将来，26个字母将被全部用完。
下面一起来简单看看这些XPU家族吧。

CPU

CPU—— Central Processing Unit, 中央处理器，
CPU之于计算机、服务器，也就相当于大脑对于人类的作用。
计算、控制、存储是CPU“大脑”布局谋略、发号施令、控制行动的主要表现形式。
CPU 是对计算机的所有硬件资源（如存储器、输入输出单元）进行控制调配、执行通用运算的核心硬件单元。
CPU 是计算机的运算和控制核心。
如下图所示，CPU主要包括了计算单元、控制单元和存储单元：

我们可以很明显的看出，CPU的计算单元在整个结构中占比很少，
故而相对于大规模并行计算能力，CPU更擅长于逻辑控制。
随着人们对更大规模与更快处理速度的需求的增加，CPU渐渐力不从心。
因此，GPU，它来了！

GPU

GPU——Graphics Processing Unit，图形处理器，
跟它的名字一样，GPU最初是用在个人电脑、游戏机和一些移动设备上运行绘图运算工作的微处理器。
GPU的构成相对简单，有数量众多的计算单元和超长的流水线，特别适合处理大量的类型统一的数据。

不过GPU生来就是做小弟的命，不能单独工作，必须由CPU进行控制调用才行。
GPU的工作大部分都计算量大，但没什么技术含量，而且要重复很多很多次。
当CPU需要大量的处理类型统一的数据时，就可以调用GPU进行并行计算。
不过，GPU虽然叫图形处理器，但并不是只能处理图像。
GPU虽然是为了图像处理而生，但在结构上并没有专门为图像服务的部件，只对CPU的结构进行了优化与调整，
因此GPU可以被认为是一种较通用的芯片。
目前科学计算、密码破解、数值分析，海量数据处理等需要大规模并行计算的领域都有GPU的身影。

TPU

TPU——Tensor Processing Unit, 张量处理单元，
TPU是由Google设计的定制机器学习芯片，用于执行其常规机器学习工作负载。

起初机器学习以及图像处理算法大部分都跑在CPU与GPU上面，
但这两种芯片本质上是通用性芯片，在效能与功耗上不能紧密适配机器学习算法，且价格也比较贵，
TPU便就此诞生了。
TPU是一种ASIC芯片，即应用型专用集成电路（Application-Specific Integrated Circuit），是一种专为某种特定应用需求而定制的芯片。
据称最早的TPU就比同期的标准CPU和GPU快15-30倍，效率（性能/瓦特）提升 30-80倍。
目前谷歌已经发布了第四代TPU，据称TPU v4每秒能够实现10万万亿次运算，将于今年向谷歌云用户提供服务。

DPU

DPU—— Data Processing Unit ，数据处理单元，
DPU是面向数据中心的专用处理器。

CPU用于通用计算，GPU用于加速计算，而数据中心中传输数据的DPU则进行数据处理。
简单来说，CPU做不好，GPU做不了的那些计算任务，交给DPU就完事儿了。
有人说，DPU正在取代CPU作为数据中心服务器的中央控制点，建立以数据为中心的计算架构。
英伟达首席执行官黄仁勋将DPU称为“未来计算的三大支柱之一”。
要说带货还得服老黄，DPU的概念才提出没多久，
从国外巨头大佬英特尔、博通、英伟达、赛灵思、Marvell，
到国内的创企中科驭数、星云智联、芯启源等等，都纷纷陷入了DPU热潮。

XPU全家桶：前途漫漫，挑战不绝

随着5G、AI等新技术不断发展，计算场景也更为丰富多样，XPU的发展成为大势所趋。
许多半导体巨头厂商都推出了多元化的芯片产品，不断充实自己的XPU“全家桶”。
不少创新公司同样不甘示弱，也纷纷推出了专属芯片产品，
整个芯片市场迎来“百家争鸣”时刻。
然而值得注意的是，XPU不能仅仅是XPU，
它不是硬件简单的物理堆砌，而要考虑到其中的互联互通，跨架构的软件协同，
只有软硬件协同发展，才能更好发挥出产品应有的价值。
同样，技术创新还需要匹配用户的实际需求，这样才能在市场中打造自己的一番天地。

*注：
本文图片均源自网络，如有侵权，可联系我们删除。
参考：
https://www.csdn.net/article/2021-07-13/118707327
https://www.sohu.com/a/200698604_160923
https://zhuanlan.zhihu.com/p/287770200
https://www.eet-china.com/mp/a47982.html