和中方回应美批准H20芯片出口许可相关的信息还有黄仁勋称中国军方才不会用美国芯片、 评论员:中方的建议为印度点亮明灯、 记者:中方掌握中美交往主导权、 学者:澳外长对中方的言论是非不分、 用激光瞄准德国飞机?中方驳斥、 中方为何会对欧盟制裁、 外国船挂五星红旗防袭击?中方回应、 媒体人:中方反制欧盟是必要之举、 中方回应美称要对金砖国家加10%关税、 外交部:中方已向印度提出交涉、 等。
记者 郑晨烨
7月15日,英伟达(NVIDIA)创始人兼CEO黄仁勋现身第三届中国国际供应链促进博览会。这已是黄仁勋在2025年内第三次到访中国大陆,就在几天前的7月9日,他执掌的英伟达,市值盘中突破4万亿美元大关。
同日,根据英伟达官方微信公众号发布的信息,英伟达正在提交重新销售NVIDIA H20 GPU 的申请,“美国政府已向英伟达保证将授予许可证”,并且英伟达希望尽快启动交付。H20是英伟达此前“特供”中国市场的一款AI芯片,今年4月被美国政府列入出口管制。
英伟达在文中同时强调了其在美国“加强AI基础设施”的努力,以及在中国“探讨AI如何提高生产力”的意愿。
为“合规”而生的H20
H20芯片的诞生背景,可直接追溯至2023年10月17日。
彼时,美国商务部工业与安全局(BIS)发布了更新的出口管制最终规则,该规则对销往中国的先进计算芯片,设置了两道核心的、量化的技术红线。第一道红线是“总体处理性能”,用以衡量芯片的综合原始算力;第二道红线则是“性能密度”,即总体处理性能与芯片面积的比值,旨在限制通过芯粒(Chiplet)组合方式绕开管制的能力。
这两项指标的设定,将英伟达当时最畅销的H100、A100以及H800、A800等数据中心GPU产品,挡在了中国市场门外。
作为应对,英伟达迅速调整其产品策略。2023年11月,根据公开报道,英伟达已开发出三款专为中国市场设计的新芯片——H20、L20和L2,其核心设计目标,就是严格遵照BIS设定的技术参数框架,确保产品合规。其中,作为面向AI训练任务的旗舰型号,H20的公开规格参数,清晰地反映了这种“合规”的内在逻辑,它与被禁售的H100同样基于Hopper架构(英伟达推出的一种GPU架构),但在关键性能上进行了精确的调整。
在算力性能方面,H20的FP16/BF16(半精度浮点)算力为148 TFLOPS(每秒万亿次浮点运算)。作为对比,被限制的H100芯片在同等精度(FP16)下的算力高达1979 TFLOPS。尽管性能差距显著,H20的总体处理性能(TPP)经计算后低于美国商务部工业与安全局(BIS)设定的4800 TPP管制红线,从而达到了“合规”标准。
显存配置是H20少数未被削减的环节,其HBM3显存容量从H100的80GB增至96GB,显存带宽也由3.35 TB/s提升到4.0 TB/s。芯片间的互联性能,则是H20最受关注的环节之一,其单卡NVLink(英伟达开发的一种高速互连技术)互联总带宽为900 GB/s,与H100的规格持平,这保证了服务器节点内部的GPU间通信效率。
然而,真正的瓶颈在于跨节点的集群互联能力,由于美国对高速网络设备同样存在出口管制,中国客户将难以获得用于构建DGX SuperPOD级别集群的NVIDIA Quantum-2 InfiniBand网络方案——该方案能为每个服务器节点提供高达400 GB/s(即3.2 Tb/s)的外部互联带宽。
对于需要数千颗GPU互联以训练大模型的中国云厂商而言,外部互联能力的缺失,意味着组建超大规模集群的通信效率将大打折扣,难度与成本也随之显著增加。
从产品立项到正式获得销售许可,H20的问世之路并不平坦,该芯片原定于2024年初上市,但其面市时间一再推迟,市场普遍认为,延迟的原因在于该系列芯片需通过美国政府的额外审核程序。这漫长的等待,直至2025年7月15日英伟达官方宣布获得“保证”,才算告一段落。
“保证”之下的市场挑战
英伟达官方信息中“保证将授予许可证”的表述,在商业层面意义重大,它为英伟达在中国市场启动一系列商业活动提供了必要的基础,这意味着,英伟达可以正式与中国客户就H20的销售进行谈判、签署意向订单、进行产能规划和供应链准备。
与此同时,英伟达也亮出了其多产品策略的另一环。英伟达在官方公众号的文章中同时宣布,将推出一款“全新且完全兼容”的NVIDIA RTX PRO GPU,该产品“是为智能工厂和物流打造数字孪生AI的理想选择”。
在高性能计算芯片受限的背景下,转向工业AI应用领域,不仅符合中国推动制造业升级和“新质生产力”发展的宏观政策方向,也因其应用场景的特殊性,面临相对较低的出口管制风险。数字孪生、工业自动化等市场,或将成为英伟达在中国寻求更稳固业务的突破口。
然而,无论是H20的“有条件回归”,还是RTX PRO的“新路开拓”,都无法回避一个已然改变的市场现实——激烈的本土竞争。
在美国出口管制政策的窗口期内,中国本土AI芯片产业获得了加速发展的空间。
最直接的体现是市场份额的变化。根据TrendForce集邦咨询2025年5月发布的一份研究报告,中国AI服务器市场预计外购英伟达、AMD等芯片比例会从2024年约63%下降至2025年约42%,而中国本土芯片供应商在国有AI芯片政策支持下,预期2025年占比将提升至40%,几乎与外购芯片比例平分秋色。
另根据国际数据公司(IDC)发布的《中国半年度加速计算市场(2024上半年)跟踪》报告,2024年上半年,中国加速服务器市场规模达到50亿美元,同比2023上半年增长63%。在这一高速增长的市场中,一个关键的变化是,由NPU、ASIC等非GPU芯片驱动的加速服务器市场规模增速高达182%,达到近7亿美元。
从更底层的加速芯片角度看,这一趋势同样显著。IDC数据显示,2024上半年,中国加速芯片的市场总规模超过90万张,其中,中国本土人工智能芯片品牌的出货量已接近20万张,约占整个市场份额的20%。
值得注意的是,在服务器厂商层面,2024上半年按销售额计算,浪潮、新华三、宁畅等本土厂商占据了市场超过70%的份额,中国本土的服务器供应链正在与国产AI芯片加速深度绑定,构建起相对独立的生态系统。
IDC中国AI基础架构分析师杜昀龙在报告中认为,由于前期的大量采购,目前中国的AI服务器市场仍处于“存量市场”状态,这为本土技术的升级提供了一定的“缓冲期”。他亦指出,在当前环境下,随着行业大模型需求的不断加深,“适配中国算力设施的生态建设将成为主要的着力点”。
一个标志性的商业案例,则更直观地反映了本土AI芯片产业加速发展的趋势。2024年5月,中国移动公示了其《2024年至2025年新型智算中心采购》项目的中标结果,该项目共计采购人工智能服务器7994台,总金额高达191亿元人民币(不含税)。根据公开的中标信息,分享这一大单的服务器厂商包括昆仑、中科可控、宝德、长江计算、超聚变、百信、华鲲振宇等。一个关键的细节是,这七家中标厂商,均为华为昇腾生态体系内的硬件合作伙伴,此次招标的技术路线几乎被昇腾体系“全包”。
在市场需求最旺盛的互联网行业,头部云厂商也均用实际行动完成了对国产化AI基础设施的布局。根据华为昇腾官方公布的信息,其AI硬件平台已对阿里巴巴的全系列“通义千问”大模型——从70亿参数的Qwen-7B到千亿参数的Qwen-72B——实现了全面适配与深度优化;百度智能云通过其“千帆”大模型平台,为用户提供了将文心大模型一键部署至昇腾硬件的选项;腾讯云也已将其“混元”大模型与昇腾服务器相结合,面向政企客户推出解决方案;科大讯飞的“星火”大模型更是最早完成与昇腾平台适配的企业之一。
也就是说,英伟达“H20”此次重返市场,面对的已不再是一个对其高度依赖的空白地带,它不仅需要向客户解释其“合规”后性能参数的削减,更需要面对在价格、服务以及生态协同上都极具优势的本土竞争者。
此外,对于已经投入大量资源进行国产化AI基础设施适配与软件生态建设的中国客户而言,是否愿意以及在多大程度上“重返”英伟达的技术体系,也将是一个复杂且艰难的商业决策。
网友看法
1、网友清闲的春风LC:嘴上拒绝,身体还是很诚实的,马上很多企业就疯狂囤货。
2、网友零零柒:滚蛋,坚决不要买,一看中国有替代产品,立马来搞死你
3、网友粤西游民:中国不要买,买了就没有谁愿意花钱搞开发,那就永远赶不上美国
本财经资讯由崔放金融发布,版权来源于原作者,不代表崔放金融立场和观点,如有标注错误或侵犯利益请联系我们。