计算处理 — 尤其是在数据服务器中
数据量的增加要求在服务器内部和之间传输数据的服务器接口不断提速。任何障碍或不佳连接都会产生不理想的延迟,从而对用户体验产生不良影响。尽可能减少数据移动并在需要时提供高带宽、低延迟接口来转移数据是最大限度地提高性能和减少延迟与功耗的关键。
可以利用IP来满足这些要求的一些重要领域包括:
-
采用正在向6400 Mbps演进的DDR5接口
-
支持PCI Express (PCIe)接口从16 GT/s PCIe 4.0到32 GT/s PCIe 5.0再到64 GT/s PCIe 6.0的演进
-
简化NVMe SSD从PCIe 3.0升级到PCIe 5.0实现4倍带宽的过程
-
利用Compute Express Link (CXL)允许多个处理器/加速器高效共享数据和内存,从而减少需要在系统中移动的数据量
-
利用56 Gbps和112 Gbps的新型高速SerDes技术,以便借助PAM4编码和支持协议来加快设备间的接口速度,包括裸晶、芯片、加速器和背板
除上述接口外,各类内存也可以满足HPC用例的容量、功率和性能要求。当内存容量是主要考虑因素时,DDR5就是理想的选择。当内存带宽是非常重要的考虑因素时,HBM2E可以提供对内存中数据的高速访问。
网络基础设施
数据创建和消费量的增长要求加快网络速度。以太网已成为现代HPC应用(尤其是数据中心)中服务器间通信的标准。以太网数据帧通过各种通道和介质类型在服务器单元中传输。将MAC和PHY集成在以太网系统中可以缩短设计周期并提供差异化性能。许多数据中心都在努力将服务器与置顶式(ToR)交换机之间的网络接口速度从25 GbE提高到100 GbE,并在ToR交换机与Spine-Leaf(分布式)交换机之间以及数据中心设施之间安装400-GbE基础设施。
领先的以太网交换机供应商已经开始开发基于112G SerDes的800-Gbps交换机,随着数据量的不断增加,未来几年内可能会推出1.6-Tbps以太网。支持400 Gbps以太网端口的基础设施交换机可通过56G x 8或112G x 4 SerDes电接口实现。
所有这些都推动了对可靠IP的需求,以提高开发者的效率。为此,新思科技提供了具有PC、PMD、PMA和自动协商功能的全套200G/400G和800G以太网控制器和PHY IP解决方案。
安全性
除了更快的接口和更高效的内存外,数据保护对云计算来说也是至关重要的。为了严格保护授权用户数据的机密性、完整性和可用性,标准组织正在将安全要求纳入数据接口协议。在这些高速接口中为了实施必要的安全算法需要:用于数据加密和解密的高质量加密IP、用于实施高速安全协议的安全协议加速器IP、以及用于提供信任根和安全密钥管理的可信执行环境。
新思科技提供一个广泛的、高度集成的安全IP解决方案组合,这些解决方案使用一组基于标准的通用构建块和安全概念,可在HPC应用中实现更高效的芯片设计和更高级别的安全性。这些安全IP解决方案有助于防止联网设备中不断演变的各种威胁,如盗窃、篡改、侧信道攻击、恶意软件和数据泄露等。
存储
当下存储技术正在推动增长的数据量得到良好管理,同时促进使用加速器来处理数据,推动了计算存储、持久性内存、持久性存储的缓存一致性接口、以及旨在加快数据传输速度的下一代NVMe接口的使用。
基于NVMe的固态硬盘(SSD)可以利用PCIe接口直接连接到服务器CPU并用作缓存加速器,从而以极快的速度缓存频繁存取的数据或“有效”数据。基于PCIe的高性能NVMe SSD具有极为高效的输入/输出性能和低读取延迟,可以提高服务器效率并防止必须通过外部存储设备访问数据。
在存储应用中使用缓存一致性接口允许多个设备跨越共享内存来保持缓存一致性,从而提高性能并减少数据移动。其中CXL就是这样的接口。CXL 2.0基于PCIe 5.0构建,允许缓存、内存和I/O设备以32 GT/s的速度传输数据。NVMe存储设备采用PCIe 5.0接口,将SSD吞吐量提高到每PCIe通道4 GB/s,是x86服务器中迄今为止常用的PCIe 3.0接口的4倍。
新思科技的 DesignWare Interface IP产品系列支持PCIe、USB和DDR等高速协议并经过优化处理,以帮助开发者满足云计算存储应用的高吞吐量、低功耗和低延迟连接需求。
视觉计算
云应用经过不断发展演进,现已覆盖更多的视觉内容。因此,支持视觉计算(包括用于商业应用和娱乐的流视频和图像分析)已经成为云基础设施的一项附加功能。视觉计算作为一项云服务推动了供应商将高性能GPU集成到云服务器中,同时通过高速加速器接口与主机CPU基础设施相连接。
嵌入式视觉应用通常会带来与数据中心用例相似的独特的功耗和成本挑战。它们需要具备一定程度的灵活性来满足快速发展的市场、用例和标准需求。
新思科技可提供一套完全可编程和可配置的IP核心,这些核心已经针对嵌入式视觉应用进行了优化处理,既有软件解决方案的灵活性,也有硬件的低成本和低功耗优势。嵌入式视觉处理器集成了可选的高性能深度神经网络(DNN)加速器,用于快速准确地执行卷积神经网络(CNN)或递归神经网络(RNN)。视觉处理器可以轻松集成到SoC平台中,可与任何主机处理器一起使用,并与主机一起运行。
边缘基础设施
使计算更接近数据是HPC领域的增长趋势之一。这不仅能够提高效率和性能,而且还能带来安全优势。为此,云服务提供商正在与电信公司合作,在多接入边缘计算(MEC)平台中提供云服务。然而,在边缘基础设施中部署云服务需要运行云服务的设备能够适应边缘环境。边缘位置的物理空间、环境控制能力或电源可用性可能无法与典型的云数据中心相提并论。因此,延迟容忍度越低,越需要靠近边缘部署服务,服务对功耗的容忍度可能也越低。
用于上述关键计算、网络、存储和内存功能的新思科技IP产品已经过优化处理,能够满足边缘应用的性能、低延迟和低功耗要求。
机器学习和AI加速器
专为边缘计算设计的AI加速器旨在更大限度地减少延迟和功耗,同时提供了AI所需的卓越计算能力,包括了大规模矩阵乘法和张量运算。
PCIe和CXL提供高带宽通道,将加速器与应用处理器相连接,从而避免高强度计算操作。对于边缘系统和云系统,单个加速器裸晶通常不具备负载处理所需的性能,因此需要安装多个加速器。56 Gbps/112 Gbps SerDes和HBI并行接口等高速芯片间接口使AI加速器解决方案能够通过扩展来满足这些需求。
开放计算项目(OCP)组织正在推动芯片间互连的标准化工作,以期简化和提高加速器扩展接口的互操作性。其目的是为异构“小芯片(chiplet)”提供通用接口,以支持通用功能构件的SoC。如果一旦被业界采纳,这项工作将通过减少开发时间和相关成本来简化加速器SoC的开发过程。
基于IP的设计能够满足HPC应用需求
强大且经过验证的处理、接口和基础IP产品已经过优化处理,能够满足任何HPC应用的高性能、低延迟和低功耗需求。新思科技提供全面的高质量硅验证IP产品组合,使开发者能够开发当今和未来HPC应用的SoC。