美国人工智能(AI)初创公司Anthropic指称,该公司发现三家中国人工智能公司使用蒸馏手段,以工业级别的规模从其语言模型Claude窃取能力,以改进他们自身的模型。
总部在加利福尼亚州旧金山的Anthropic星期一(2月23日)在一篇博文中说,三家中国人工智能公司DeepSeek(深度求索)、Moonshot(月之暗面)与MiniMax(稀宇科技)通过大约2.4万虚假账户,与Claude进行了超过1600万次互动,违反了Anthropic的服务条款和地区访问限制。
Anthropic表示,“出于国家安全原因,”该公司目前不在中国提供Claude的商业访问权限,也不向中国公司的境外子公司提供该权限,但是中国的人工智能开发公司使用商业性质的代理服务,大规模获取了对“Claude 和其他前沿AI模型”的访问权限。
Anthropic说,这三家中国公司使用了被称为“蒸馏”的技术。这是一种人工智能语言模型的压缩技术,通过训练能力较弱的模型学习能力较强的模型所生成的结果,进行知识迁移。
Anthropic在博文中提到,蒸馏是一种普遍使用的合法训练方式,但它可被用于非法目的:竞争者以远低于独立研发所需的时间和成本,从其他开发者那里获取强大能力。
目前还没有看到这三家中国公司就这一指称做出公开回应。
就在本月早些时候,另一家总部位于旧金山的美国人工智能公司、Anthropic的竞争者OpenAI写信给国会众议院美国与中国共产党战略竞争特设委员会,谈到了中国公司DeepSeek如何使用蒸馏技术提取OpenAI和其他美国人工智能开发公司的能力。
这封信对议员们说:“OpenAI认为,最好的未来是我们推进民主AI--一种由美国一贯挺身捍卫的原则所塑造的AI。在推进民主AI的过程中,美国正与决心在2030年前成为全球AI领导者的中国共产党展开竞争。”
DeepSeek在一年前的农历新年之际发布的人工智能模型在全球引起轰动。但是OpenAI随后声称有迹象显示DeepSeek不恰当地蒸馏了OpenAI的产品模型。OpenAI发言人在去年2月给美国之音(VOA)的电邮中说,OpenAI正在“采取积极、主动的对策来保护我们的技术,并将继续与美国政府密切合作。”
Anthropic在星期一的博文中也将问题提到美国与中国共产党的人工智能竞争层面。这篇博文说:“Anthropic一向支持出口管制,以帮助维持美国的AI领先地位。蒸馏攻击破坏了这些管制,它使得外国实验室,包括那些受中国共产党控制的实验室,通过其它手段消除出口管制旨在维持的竞争优势。”
Anthropic表示,虽然该公司加强了防御,然而,任何一家公司都无法独自解决这个问题,“如此规模的蒸馏攻击需要AI行业、云服务提供商和政策制定者的协调应对。”
评论区