大家知道,近几年我们在先进芯片上被美国卡了脖子。从设计工具到代工生产,甚至购买,都被限制了。
先进芯片设计工具都是欧美公司掌握,我们有设计能力,但缺少先进的设计工具。
最先进的芯片生产工艺,由台积电、三星掌握;芯片生产的核心设备光刻机,由荷兰阿斯麦垄断。这些企业完全受美方节制。
公开市场上的尖端旗舰芯片生产商,美国的高通、英特尔,我国台湾地区的联发科,还有韩国的三星,也都唯美国政府马首是瞻。
美方一勒绳索,本来处于世界领先水平的华为自研旗舰芯片,一时间陷入了无法设计、设计了也不能生产,就连从外部买也买不到的困难境地。
怎么办?
要么跪,要么站起来斗。
正是在这种大环境下,从国家到企业,一场国产化替代的浪潮奔涌而起。
最近,一个好消息传来,华为再一次取得突破,在单卡性能受制程工艺限制的情况下,通过高速互联和系统优化(存储/通信/算法协同),实现了整体算力上的超越。
这里稍微展开解释一下。由于我们没有先进的生产设备,没有掌握最前沿的制程工艺,所以生产出来的单张芯片的性能比不上英伟达等厂商。但华为通过自己擅长的通信连接技术,以及系统级架构创新,把大量不那么先进的芯片更好地整合连接后,整体算力实现了对英伟达产品的超越。
按照华为的说法,这是走出了一条不同于英伟达的路。
【华为超级节点】
新一轮科技革命正加速演进,其中的重点在于AI人工智能。
人工智能将极大地革新科研效率,推动科技爆发式发展。但人工智能水平非常依赖算力,算力的基础是能源。
在能源领域,我国的发展可谓是日新月异。根据2024年的全球能源报告,中国全年发电量1.02万太瓦时,超过了美国(4200太瓦时)、欧盟(3100太瓦时)和印度(1800太瓦时)的总和。更关键的是,这些电里有38%来自风电、太阳能和核电等清洁能源。
能源供应足够强力,接下来就要看算力。
算力发展主要看算力芯片,而美国公司英伟达是这个领域的垄断者,全球市场份额一度占比高达98%。
美国为了遏制中国在人工智能、大数据等方面的发展,限制英伟达向中国出售拥有先进算力的芯片。
英伟达为了生意,依然针对中国市场推出了特供芯片,但性能落后,价格暴涨,整体性价比太低。今年7月,英伟达算力芯片更是被质疑存在安全问题,国家网信办对其约谈,要求其就对华销售的H20算力芯片漏洞后门安全风险问题进行说明,并提交相关证明材料。
如果说性价比低一些,还凑合能用。但如果存在安全问题,这事儿就难办了。算力芯片,用的地方都是大数据中心,很多都是国家战略基础设施,这要是有安全问题,可能造成的就是灾难级影响。
所以,算力芯片的国产替代也是必须要实现的。
关键时候,华为超级节点出现了。
9月18日,在华为全联接大会2025上,华为轮值董事长徐直军在演讲中表示,从大型AI算力基础设施建设的技术方向看,超节点已经成为主导性产品形态。
华为超级节点,是华为通过系统级架构创新打造的AI算力集群技术,其核心在于利用通信技术优势弥补单卡性能限制,实现全球领先的算力规模与效率。
【它牛在哪儿?】
大家知道,现在的算力中心一般都是万卡集群,也就是把上万张算力芯片连接起来,一起协作。
连接很容易,但要想实现“1+1等于2”的性能整合非常难,更别提“1+1大于2”了。
为什么呢?
因为芯片之间数据传输的速度很难跟上芯片的计算能力,而且传输过程中还会有损耗。举个例子,大家如果在一部手机内调用、移动文件,瞬间就能完成,要是跨手机传送大文件,就没有那么快了。
连接的芯片数量规模越大,这种掣肘就越明显,几百、上千、上万张卡连接在一起,损耗就会非常严重。
英伟达有自己的高速互联技术,但还是比不上华为。搞通信连接,是华为的看家本领,它把这些连接点变成了超级节点。
华为的超节点技术基于灵衢(取九州通衢之意)互联协议,通过高速光通信技术,能实现万级算力卡(NPU/GPU)的深度互联,使集群在逻辑层面如同单台计算机运行,解决计算、存储资源间的通信瓶颈。
看到了吗?能让规模级卡片像一台计算机一样运行!可以说彻底解决了芯片间连接的损耗问题。
它用全光互联替代铜缆,带宽提升15倍、时延降至200纳秒,突破英伟达同轴电缆的传输瓶颈。
支持内存、存储、DPU(数据处理器)等资源的统一调度,提升资源利用率至80%以上(传统方案仅30%-40%),这可是至少100%的翻倍提升!
说的这么牛,具体到产品上,能超越到什么地步?
华为轮值董事长徐直军透露,华为超节点Atlas 950 SuperPoD,算力规模8192卡,预计于今年四季度上市。(Atlas人工智能计算平台是华为推出的基于昇腾Ascend系列AI芯片的软硬件一体化解决方案,覆盖AI模型开发、训练及推理全流程。)
“Atlas 950超节点,至少在未来多年都将保持是全球最强算力的超节点,并且在各项主要能力上都远超业界主要产品。其中,相比英伟达同样将在明年下半年上市的NVL144,Atlas 950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,达到1152TB;互联带宽是其62倍,达到16.3PB/s。即使是与英伟达计划2027年上市的 NVL576相比,Atlas 950超节点在各方面依然是领先的。”
根据规划,更强大的算力规模15488卡的Atlas 960 SuperPoD,将在2027年四季度上市。
这还只是万卡级别。根据介绍,基于Atlas950、Atlas960超节点,可以构建50万卡、百万卡级集群。
这是什么概念?
这些“算力巨无霸”不仅能满足万亿级大模型的训练需求,更可通过全国一体化算力网调度,为中小企业与传统行业提供普惠化算力服务,真正让中国AI产业“没有算力之忧”。
根据华为在智能世界2035系列报告发布会上的信息,2035年全社会的算力总量将增长10万倍。
徐直军说,“用超节点架构以及支持超节点的灵衢互联协议,打造超节点和集群,来满足我国无穷无尽的算力需求,这既是我们对自己的一个目标,又是对产业界的承诺,更是对国家的承诺……把这条路闯出来,把中国产业链拉动起来,这条路就成了路。算不上新范式,是被迫出来的范式,是被逼出来的伟大。”