本周,AMD发布了第二季财报,数据中心处理器市场表现优异,数据中心营收约占第二季营收的20%,知名分析师Srivastava认为AMD数据中心第二季年增长率达20%左右,预计全年将保持增长。AMD CEO苏姿丰(Lisa Su)表示,Zen 3 架构的 Milan 服务器 CPU增长显著, Zen 2 Rome CPU 仍为主要收入来源。第二季度云端客户需求占比较大,由于云客户Milan CPU采用率加速,因此增长速度优于商用市场。苏姿丰看好第三季度数据中心,将继续保持增长态势,将全年营收增长率由50%上修至60%,这意味着将继续在利润丰厚的服务器芯片市场抢夺英特尔的市场份额。苏姿丰预期,下半年,Milan CPU 采用率将迅速增加,第三季Zen 3销量将超越Zen 2,其中主要由云端高速运算(HPC)所带动,而下半年商用需求增长力度也正在加强。近些年,AMD的数据中心业务一直在稳步发展,EPYC(霄龙)服务器处理器已开始为全球500部超级计算机中的49部服役,与一年前的11部相比大幅上升。
近几年,英特尔一直受困于产能问题,导致其新产品的发展速度落后于AMD和英伟达等竞争对手。上周,英特尔发布了Q2财报,尽管总营收和PC业务营收增长了,但数据中心部门营收65亿美元,同比下滑9%,处理器ASP均价跌了7%,运营利润则从31亿美元下滑到了19亿美元,运营利润率从44%跌到了现在的30%。也就是越来越便宜了,价格战已经拉开帷幕。这也证实了之前英特尔的表态,那就是在数据中心市场上,该公司可以为了保住份额而打价格战。此前,英特尔CEO Pat Gelsinger认为,在服务器CPU市场上,采用竞争性定价也是合适的,虽然会影响公司业绩,但可以保住甚至增加市场份额。考虑到英特尔的14nm工艺已经足够成熟、最近10nm工艺成本大幅降低45%,采取价格战的策略还是有底气的,毕竟AMD的7nm工艺到现在为止依然成本很高,台积电的代工价格不便宜,7nm芯片代工报价上万美元,5nm更是高达1.7万美元,今年可能还要涨价。对于友商降价、开打价格战的做法,苏姿丰表示,在数据中心处理器市场上,性能和总的拥有成本才是最重要的,价格因素是次要的。从AMD的立场来看,他们现在的优势主要还是超多核心,单插槽做到了64核128线程,5nm Zen4预计会进一步提升到96核192线程,算下来单位成本更低。2020年,英特尔和AMD都发布了其服务器处理器的产品预告和更新。进入2021年以后,双方在该领域的竞争更加针锋相对。以具体的产品来看,今年早些时候,英特尔发布了第三代至强可扩展处理器 Ice Lake。该芯片基于 Sunny Cove 微架构,英特尔首次使用该微架构更新其第 10 代客户端处理器。该处理器基于英特尔的 10nm+ 工艺。该芯片包括至少 28 个内核,与上一代至强可扩展产品中使用的 Skylake 架构相比,每时钟指令 (IPC) 增加了约 18%。英特尔称,Sunny Cove 微架构有几项重大改进,包括:新的片上系统架构,具有三个独立时钟的Ultra Path Interconnect 链路,用于多处理器连接;改进的、更高容量的指令前端和分支预测器;更宽更深的分配队列和执行资源;翻译后备缓冲区(TLB) 的增强,可减少访问内存的延迟;更大的中级缓存 (L2) 加上第二个固定乘加来加速向量运算;加速加密和压缩/解压缩操作的指令;新的 I/O 虚拟化设计,为大负载和集成PCIe Gen 4 控制器提供高达三倍的带宽;支持物理 RAM 的总内存加密;在电源管理状态之间切换时具有更好的性能和更低的延迟。在 2020 年架构日,英特尔表示代号为 Sapphire Rapids 的下一代至强处理器将支持 DDR5。英特尔在今年6月份表示,预计 Sapphire Rapids 将在 2022 年第一季度投入生产,预计 8 月份的 Hot Chips 2021 和 10 月份的英特尔创新日将提供更多技术信息。10nm至强Sapphire Rapids最多可以做到80核160线程,核心数上跟AMD的霄龙可以硬刚了,同时还支持8通道DDR5、PCIe 5.0,还集成了64GB HBM2内存,性能很强悍。不过,Sapphire Rapids又延期了,本来是想在今年年底推出的,但受产能和工艺的限制,推迟到了明年上半年才能问世,AMD明年要推5nm Zen4了,预计会升级到96核192线程,这个比赛又得重新开始。AMD方面,今年推出了多款新的客户端、服务器和 GPU 产品,并通过其EPYC服务器处理器中的Zen 3内核扩大其性价比领先优势。与英特尔不同,AMD 跳过了 10nm 工艺节点,该公司一直在采用 台积电的7nm制程工艺制造芯片,并使用 Zen 3 的更新版本。Zen 3 具有多项架构改进,包括:通过更大的 L1 缓存进行更好的分支预测,更快地从错过的预测和算法改进中恢复;通过更大的执行窗口、更低的延迟、更宽的整数执行单元、更快的乘法累加和其他变化,更快的执行引擎;更高的加载存储带宽、加载存储操作的更大灵活性以及对 TLB 的改进。Zen 3 的最大变化是采用了chiplet(小芯片)拓扑,其中每个 8 核小芯片围绕单个 32 MB 三级缓存进行组织,而不是分成两个 4 核/16 MB 缓存复合体。该设计使每个内核可用的 L3 空间加倍,减少了任何两个内核之间的有效内存延迟。总的来说,这些改进意味着与 Zen 2 相比,Zen 3 的 IPC 提高了 19%,每瓦性能提高了 24%。Zen 3 产品使用与现有 EPYC型号相同的小芯片封装,带有围绕一个 I/O 内存模块的八个 8 核处理器芯片。AMD 的路线图表明,采用新5nm工艺的 Zen 4 Genoa 处理器将于 2022 年问世。
虽然数据中心业务持续下滑对英特尔非常不利,但Pat Gelsinger仍积极面对AMD的竞争。为此,英特尔上个月还进行了组织调整,将更多资源放在高性能运算(HPC)业务上。Pat Gelsinger表示,目前Tiger Lake CPU的交货优于预期,迄今已出货超过5000万个,预计下半年Alder Lake将出货数百万个,Meteor Lake仍有望在2023年投产。此外,Pat Gelsinger相信Ice Lake处理器具有强大的竞争力,预计受益于Ice Lake,数据中心下半年表现将优于上半年。虽然Pat Gelsinger显得信心满满,但相较于AMD依靠台积电强大的出货能力,英特尔最大的问题就是新产品延迟量产,这已经是该公司的老问题了。该公司最近的两次至强处理器更新都比预定时间晚了两个季度到达客户手中,在一个通常每年都进行升级的市场中,公司可能会因为如此大的失误而错过升级周期的一半,客户不太可能在一个季度的延迟内改变他们的升级计划。而其最新的Sapphire Rapids处理器的量产出货时间依然从今年年底延迟到了2022年初。对英特尔及其客户而言,好消息是 Sapphire Rapids是一次重大升级,结合了多项新技术以提高性能。它配备了新的CPU核,这是 Jim Keller 的心血结晶,这位超级明星设计师在跳入竞争的另一端(去年离开英特尔)之前重振了 AMD 的 CPU。新 CPU 有望在大多数软件上带来强劲收益,并增加 AI 加速功能,帮助部署该热门技术的客户。即使有延迟,Sapphire Rapids 仍应在 AMD 的下一代服务器处理器 Genoa 之前进入市场。这将使英特尔在为服务器客户提供 DDR5 和更快的连接方面略微领先,因为Genoa支持相同的功能。更重要的是,新的 CPU 设计可以使英特尔在每核性能等关键指标上赶上甚至超越其竞争对手,而 AMD 的 EPYC服务器处理器目前在该领域处于领先地位。英特尔的至强新品总是跌跌撞撞,而AMD 的性能领先优势帮助该公司在过去几个季度中的每个季度都从英特尔手中夺得服务器市场份额。对于未来几个季度的新服务器市场,EPYC将继续提供领先的每瓦性能,为 CIO 提供强大的至强替代方案,用于除 AI 之外的应用程序。然而,在 2022 年,英特尔有机会借助 Sapphire Rapids 实现反弹,提供更高的性能和新技术。现在,关键是确保产品不会遭受任何额外的延迟,并且未来的至强项目能够保持其进程。
过去几年,基于Arm架构的服务器芯片一直在强化其在数据中心市场的存在感。包括AWS 在内的几家大型云提供商正在其数据中心部署基于 Arm 的芯片。去年,结合了 Arm CPU 和 GPU 加速器的富士通 Tomitake 超级计算机在日本的 Tomitake 中心运行,赢得了世界上最快的超级计算机称号。今年3月,Arm 发布了下一代 Arm CPU架构Arm v9,Arm 称,新芯片在数字信号处理和机器学习等领域优于旧型号,使 Arm 系统总体上更加稳健且安全。与数据中心处理器市场领导者英特尔和 AMD相比,Arm在先天功耗优势的基础上,性能越来越接近。目前,Arm正在尝试更改所有权,这取决于 Nvidia对其发出的收购能否获得各国监管部门的通过。Nvidia已将其大部分数据中心产品路线图押注在 Arm 架构上。一些最大的云供应商已全力支持 Arm。与本地数据中心一样,云数据中心中运行的大多数 Arm 服务器都位于 SmartNIC 等设备上,用于从 CPU 卸载网络处理任务。今天,Arm处理器的首要用途是以太网适配器或 SmartNIC。它支持网络协议、存储协议或任何类型的SDM(安全设备管理器)在以太网适配器上的 Arm 处理器上运行的功能。这意味着 CPU 不必执行协议,从而减少 CPU 并加快数据传输。这可能是当今最广泛的应用。随着越来越多的云服务器提供商开始向其客户提供 Arm 服务器,这种情况在过去几年发生了变化。AWS 拥有 Graviton 2,中国的一些 CSP 来自华为。今年,我们会看到更多大型超大规模 CSP 发布公告,并推向市场,所有大型基础设施和服务提供商将拥有基于Arm的应用案例。
在数据中心处理器市场,AMD步步紧逼,英特尔压力山大,而Arm阵营也在虎视眈眈,一点点积蓄着力量。未来的市场竞争局面将会越来越复杂,同时也给后来者提供了更多机会。