“中国特供版”性能缩水严重 近日,据路透社报道,英伟达计划将于第二季度量产为中国设计的AI芯片H20,以符合美国的出口规定。
该报道称H20本计划应于2023年11月推出,但服务器厂商在集成该芯片时遇到困难,H20将优先满足中国大客户需求。
《IT时报》记者了解到,已有国内厂商将在今年第一季度拿到H20,但由于这些“特供版”AI芯片性能大幅缩水,大部分中国企业还处于观望状态。
一季度可到货
“中国特供版”恐遇冷
据产业链人士爆料称,英伟达正在开发针对中国区的“最新改良版”AI芯片,3款芯片均基于英伟达H100改良而来,以符合美国最新的技术出口管制政策,包括 HGX H20、L20 PCle 和 L2 PCle。
针对特供芯片在中国市场的前景,业内人士向《IT时报》记者透露,已有国内合作伙伴采购了英伟达H20芯片,大概三月份可以首批到货,但是否大批量采购,“到时候还要看测试的效果”。
根据此前曝光的参数信息,英伟达H20与H100、H200同系列,均采用英伟达Hopper架构,但显存容量增大至96GB HBM3,GPU显存带宽为4.0TB/s。算力方面,该产品的FP8算力为296 TFLOPS,FP16算力为148 TFLOPS,比H100缩水80%,仅为“最强”AI芯片H200的1/13。
“就大模型训练而言,H20基本属于不可用的机器。”山海引擎COO彭璐告诉《IT时报》记者,H20的配置更适用于推理,而不适用于模型训练。彭璐认为,从市场应用的角度看,除了一些大厂可能会投入成本进行推理外,大型模型创业公司很少大量购买推理算力,因为它们更注重模型训练的竞争力。
事实上,大厂们对H20的样品测试效果也并不满意。据知情人士透露,阿里巴巴集团、腾讯等公司从2023年11月便开始测试英伟达的特供芯片样本,并已表明,今年向英伟达订购的芯片数量将远远少于此前原计划购买的、已经被禁的英伟达高性能芯片。此前有报道称,2023 年中国互联网企业向英伟达下了50亿美元的AI芯片订单。
借汽车芯片
推高护城河
中国是英伟达最重要的市场之一,英伟达在财报中曾指出,中国和其他一些受限制影响的地区带来的营收约占其数据中心营收规模的四分之一,其中,中国市场占据绝大多数。
对于英伟达来说,既要满足美国监管机构的要求,又要满足中国市场所需,双重挑战之下,其将重点放在了扩大游戏、自动驾驶等消费级GPU的优势。
2023年底,英伟达正式推出GeForce RTX 4090D,这是自拜登政府2023年10月公布芯片出口新规以来,英伟达正式推出的首款专注于中国市场的芯片。2024年1月9日凌晨,英伟达在自家举办的CES展前活动上,发布了面向消费者的三款RTX 40 SUPER系列显卡产品,分别是RTX 4080 SUPER、 RTX 4070 Ti SUPER和RTX 4070 SUPER,三款产品均基于台积电4nm制程工艺,采用新的Ada Lovelace架构。英伟达方面表示,三款新显卡将符合出口管制,可以在中国销售。
GeForce RTX 4090D
CES 2024上,英伟达与多家中国游戏、汽车自动驾驶领域公司宣布达成合作,包括米哈游、网易游戏、掌趣科技、腾讯游戏等在内的中国游戏厂商将在AI技术应用领域与其开展合作,并应用于游戏开发。
此外,理想汽车将在下一代车型使用Thor汽车芯片平台。目前长城汽车、极氪和小米汽车三家厂商已采用Orin芯片来打造新一代智能驾驶系统。据高工智能汽车研究院的数据,截至2023年上半年,英伟达在具备高级别辅助驾驶功能(NOA)车型中的市场份额已达52.57%。
这些举动也为投资者带来了信心。1月11日,英伟达连续第三个交易日创盘中与收盘历史新高。券商Truist将英伟达的目标价从674美元上调至691美元。
英伟达首席财务官Colette Kress表示,根据美国规定,某些出口产品要获得许可证,公司正在与这些地区的客户合作,试图提供获得产品发货许可,以及不会引发美国政府限制的“解决方案”。她甚至表示,如果没有针对中国AI芯片的出货新规定,英伟达第四财季(截至今年1月)的业绩展望数据将会更高。
国产算力的机会来了吗?
科技研究公司TrendForce分析师指出,中国云计算公司约80%的高端AI芯片来自英伟达,这一比例可能在未来五年降至50%~60%,这也许为国产芯片提供了弯道超车的机会。
然而,不可否认的是,国内AI芯片与英伟达顶级产品仍存在差距。多位业内人士告诉《IT时报》记者,英伟达仍然是国内市场最大的芯片提供商,市场零星出现的搭载英伟达H800或A100芯片的服务器,仍然供不应求。
英伟达的生态系统是其巨大优势,如果换用国产芯片服务器,企业需要重新开发并适配原有训练数据,并解决一系列技术挑战。
一位电信运营商人士向《IT时报》记者表示,在选择芯片时,考虑的因素包括价格、算力性能、购买成本、销售价格以及维护成本。目前来看,华为昇腾910B是国内最接近英伟达顶级芯片的产品。
有消息称,昇腾910B今年出货量在40万颗以上,且价格还在水涨船高。因此,一些有实力的公司选择“两头下注”。
在中国芯片领域的机遇方面,彭璐认为主要有两个关键因素。首先是生态支持,即能够实现通用GPU,减少开发者在适配上的调整成本;其次是私有化部署,即面向行业解决方案和行业应用发展。
彭璐预测,这一领域可能在未来两年迎来大爆发,“很多企业,特别是国资企业,更倾向于选择国产芯片,以市场推动整个国产芯片产业发展的速度。”