无障碍链接

中国时间 1:47 2026年5月1日 星期五

DeepSeek转向华为芯片:一款未能突破的模型,一个不容忽视的信号

资料照片:深度求索(DeepSeek)和华为的标志。(2025年1月29日)
资料照片:深度求索(DeepSeek)和华为的标志。(2025年1月29日)

中国人工智能初创公司深度求索(DeepSeek)上星期推出备受关注的新一代V4模型预览版。与去年一度震动华盛顿和硅谷的R1模型不同,这次发布并未引发同样程度的轰动,因为这款模型在性能上并无法与美国前沿模型抗衡。然而,这款新模型仍迅速成为美中科技竞争中的一个焦点,因为DeepSeek表示,新模型已适配华为昇腾(Ascend)芯片系统。

分析人士指出,DeepSeek的“华为转向”传递了一个新的信号:在美国持续收紧先进AI芯片和半导体制造设备出口限制之际,中国领先AI公司正试图减少对英伟达(Nvidia)的依赖,转而建立以国产芯片为基础的本土生态。

一款未能突破的模型

深度求索于上星期五(4月24日)发布的V4系列,距该公司推出R1模型已逾一年。当年,R1的问世震惊全球市场,一度引发外界对中国已抹平美国人工智能优势的担忧。这一次,华盛顿和硅谷的反应则冷静得多。

“这款模型在性能上无法与美国前沿模型抗衡,也未能缩小中国与美国在人工智能领域的差距,”美国外交关系协会(Council on Foreign Relations)中国与新兴技术高级研究员克里斯·麦奎尔(Chris McGuire)表示。深度求索在自家技术报告中也承认,新模型仍落后于OpenAI和谷歌(Google)五至六个月前发布的产品。这意味着中国依然维持在大约半年前的相对位置,与此前评估基本吻合。

前特朗普政府人工智能顾问迪恩·鲍尔(Dean Ball)在社交媒体上写道:“R1是我见过中国模型最接近美国前沿水平的一次,而V4落后的程度还要更大。”

一个不容忽视的信号

不过,这些基准测试数据只是故事的一部分。真正引发分析人士和部分国会议员更多关注的,是深度求索将新模型适配华为昇腾芯片架构的决定--使其至少在推理任务上,能够部署在完全在中国境内生产的硬件上。

“这非常重要。”布鲁金斯学会约翰·桑顿中国研究中心研究员陈凯欣(Kyle Chan)告诉美国之音。陈凯欣也是不久前美国国会众议院中国问题特设委员会举办的一场有关中国窃取美国人工智能优势的专题听证会的证人之一。“中国的人工智能产业正在从依赖美国芯片转向,这是重要的一步,尽管路途还很长,但这是一大步。”

这样的转向也符合中国最高领导人习近平的要求。中国官方的新华社报道,星期四(4月30日),习近平在加强基础研究座谈会上强调,“以更大力度更实举措加强基础研究, 进一步打牢科技强国建设根基。”

DeepSeek将V4模型适配昇腾架构,实际上是开始构建一条不依赖美国硬件的部署路径。华为昇腾系列在业界被普遍认为是中国本土最接近英伟达的替代方案,市场调研机构Omdia亦持相同判断。路透社报道,华为与深度求索在研发过程中紧密协作,确保新模型能够在华为高性能昇腾系统上运行。

陈凯欣在接受美国之音采访时指出,这条路并不平坦。这次华为转向主要适用于推理环节--即将训练好的模型部署给用户使用--而非训练环节,后者依然高度依赖英伟达芯片。他和麦奎尔也都强调,华为的产能依然是巨大瓶颈。

深度求索在技术报告中自承,由于算力限制,目前无法向大量用户提供新模型服务;公司表示,预计在更多华为芯片2026年下半年投产后,才能扩大服务范围。

“他们正在努力向本土芯片生态迁移,但在芯片产量上仍然极为有限。”麦圭尔告诉美国之音。

美中AI竞赛不只是芯片

分析人士认为,DeepSeek的转向展示了美中AI竞争的新态势。他们说,美中之间的“人工智能竞赛”已不仅仅是关于谁在某个月内推出了最好的模型。它关乎谁能掌控整个技术栈--包括支撑人工智能训练的芯片、制造这些芯片所需的半导体设备、开发者围绕其构建的软件生态系统、以大规模提供人工智能服务的云基础设施,以及使某一平台得以主导市场的开发者忠诚度。

在众议院中国问题特设委员会举办4月16日举办的题为“中国窃取美国人工智能优势的行动”(China’s Campaign to Steal America's AI Edge)的听证会上,议员和专家都强调,美中AI竞争并不只是先进芯片之争,而是围绕“整个AI技术栈”的竞争。

众院中国问题特设委员会主席、密歇根州共和党众议员约翰·穆勒纳尔(John Moolenaar)表示,中国目前“依赖美国及其盟友掌控AI技术栈的多个部分”,并强调中国“在AI技术栈的每一层”都在“能买就买、买不到就偷”。

“首先,必须弄清楚美国的人工智能技术栈究竟是什么。它并不是芯片,这就好比说汽车就是轮胎一样,”网络安全公司CrowdStrike联合创始人、席尔瓦多政策加速器(Silverado Policy Accelerator)主席德米特里·阿尔佩罗维奇(Dmitri Alperovitch)在同场听证会上表示,“美国的人工智能技术栈,是在美国云服务商平台上运行、驱动美国模型的芯片。”

陈凯欣则表示,中国正在推进一种“全栈式”的AI发展路径,从芯片、算力到模型和应用全面布局。

美国出口管制阻断中国获得先进芯片

华盛顿对中国人工智能雄心的出口管制,并非一步到位的单一政策,而是在数年间演变为针对半导体供应链多个节点的多层次战略。近年来,美国的出口管制政策建立在一个核心逻辑之上:阻断中国获取发展竞争性人工智能所需的先进半导体,北京的雄心便会受到遏制。

2022年的首批重大管制措施,封堵了英伟达A100等先进人工智能芯片向中国的出口。此后,这些限制持续扩展,覆盖更大范围的芯片型号,并堵塞了中国企业此前借以继续获取受限技术的漏洞。

据路透社独家报道,美国商务部星期二(4月28日)再度出手,勒令泛林集团(Lam Research)、应用材料(Applied Materials)和科磊(KLA)等主要芯片设备企业,暂停向中国第二大合同芯片制造商华虹半导体(Hua Hong)旗下部分工厂发货。

报道指出,美国官员认为华虹两处工厂可能正在生产中国最先进的芯片,包括可用于人工智能应用的7纳米制程。中国问题特设委员会在X平台上发贴称赞了此举。贴文写道,“美国商务部采取行动保护美国的科技优势是正确的。针对中国芯片制造商华虹半导体的新出口限制措施旨在维护国家安全,尤其是在中国正大力推进先进人工智能芯片生产之际。”

在国会,议员们也在推动《MATCH法案》,以进一步收紧对华半导体制造设备和维修服务的管控--针对的是制造芯片的机器,而非仅限于芯片本身。不过,来自业界的阻力已使相关进程有所迟滞。

这一系列层叠管控背后的逻辑,在众议院中国问题特设委员会最近的听证会上得到了清晰的阐述。“在这场竞争中,最关键的制约因素不是人才,不是数据,也不是资金,”阿尔佩罗维奇告诉特设委员会的议员们,“归根结底是算力。”这一判断与深度求索创始人梁文峰的公开表态形成了呼应--后者曾直言,“我们面临的问题从来不是钱,而是高端芯片被禁运。”

管制还在发挥成效,但中国也在调整

从最直观的指标来看--即中国相对于美国的算力差距--美国出口管制似乎正在产生实质效果。

外交关系协会的麦奎尔告诉美国之音,美国人工智能实验室目前拥有的算力,大约是中国同行的五至十倍。他认为,这一差距是中国模型持续落后美国前沿水平约六至七个月的最直接原因。“如果中国能够获得最好的芯片,如果中国能拥有全球最大的数据中心,他们的模型一定会更好,”他说,“这一点是无可争辩的。”

阿尔佩罗维奇在委员会听证中也表示,他与多位美国前沿实验室的顶尖人工智能研究人员深入交流后得出结论:中国之所以能够在模型研发上取得一定进展,主要依赖两条路径--对美国知识产权的蒸馏(distillation)攻击,以及通过合法采购、云端租用和违反出口管制等方式获取美国算力。切断这两条通道,中国的发展轨迹将大为改变。

白宫上星期(4月23日)发布了一份备忘录,指控中国以“工业规模”窃取美国人工智能实验室的知识产权。这份题为《美国AI模型的对抗性蒸馏》(Adversarial Distillation of American AI Models)的备忘录指称,“美国掌握的证据显示,某些外国实体,主要位于中国,正在开展工业规模的‘蒸馏’行动,企图窃取美国的AI技术。我们将采取行动,以保护美国的创新成果。”

中国的芯片走私行为也可视为管制政策有效性的旁证--恰恰是因为受限芯片供不应求、价值高昂,才催生了铤而走险的走私动机。司法部上月宣布了一起涉案金额高达25亿美元的芯片走私案,据称是美国历史上规模最大的出口管制违规案件。

分析人士指出,出口管制对中国国内半导体生态系统产生了“倒逼效应”--通过迫使中国模型开发者与硬件制造商更紧密地协同合作,化解了此前长期存在的协调难题。陈凯欣在众议院中国问题特设委员会的听证中指出“面对可能失去英伟达芯片的前景,他们感到别无选择,只能转向国产硬件。”他说。

他还说,这种压力正在促使中国半导体体系在其他方向上加快创新,例如通过把多枚芯片打包成更大的集群,或者在互连、光学技术等领域寻找新的突破口。

麦奎尔则提醒说,这种适应不应被误读为中国已经与美国“齐头并进”。他表示,英伟达芯片依然更强,“所有人都知道它更好”,如果可以选择,中国企业当然仍会优先使用英伟达。他认为,美国真正的杠杆不在于中国能否把部分工作负载迁移到国产芯片上,而在于华盛顿能否维持一个尽可能大的AI领先优势。

华盛顿面对新的政策难题?

如果目前的限制措施确实仍在帮助美国维持前沿算力优势,那么下一步是否应该继续加码,还是说,这种加码本身也在推动一个平行于美国体系之外的中国AI生态加速成形?

对于陈凯欣来说,更为深层的担忧是:中国正在系统性地构建其下方的完整技术栈,从芯片设计、半导体设备到先进封装、互连技术和光子技术。“出口管制不是万能药,”他在中国问题特设委员会听证中说,“它为我们争取了时间,但问题是,我们如何利用好这段时间。”

与此同时,是否允许任何先进英伟达芯片向中国出售的争论,在华盛顿内部依然悬而未决。科技业界部分人士认为,向中国出售先进芯片可能会制造依赖,从而形成长期战略杠杆。阿尔佩罗维奇对此断然拒绝:“芯片不是可卡因,没有成瘾性,”他在听证中说,美国人工智能实验室只需不到十几名工程师和几个月时间,就能将训练迁移至非英伟达架构。

麦奎尔认为,美国政策仍有相当大的补强空间,尤其是在堵住芯片走私和远程云端算力获取两大漏洞方面。他对美国之音表示,中国企业即使买不到芯片,仍可以通过云服务商租用算力,这使它们在一定程度上绕开了出口管制本来的效果。他还指出,“蒸馏”(distillation)正成为华盛顿越来越重视的政策焦点。美方担心,中国AI企业可能正通过不正当手段,以极低成本复制美国模型的部分核心能力。

据路透社获得的一份国务院电报,美国已指示驻全球各地外交官向所在国对口官员传达美方立场,指控中国人工智能企业--包括深度求索、月之暗面(Moonshot AI)和MiniMax--对美国人工智能实验室实施未经授权的蒸馏攻击,以极低成本窃取美国企业耗费数亿乃至数十亿美元研发费用所形成的知识产权。

麦奎尔预计蒸馏问题将成为特朗普总统下月访华期间与习近平会谈的核心议题之一。“我认为中国人恐怕不会收手,为了保持对美国的竞争力,他们必须这么做,”他说,“但如果这种现象不停止,美国政府确实需要采取严厉措施,即对参与其中的企业施以相当严厉的处罚。”

This item is part of

评论区

XS
SM
MD
LG