TMGM官网

Anthropic与OpenAI共同指控中国AI企业开展“工业级”模型蒸馏行动

TMGM

周一,Anthropic指控三家中国人工智能公司协同窃取其模型信息 ,成为继OpenAI提出类似指控后,最新一家提出此类主张的美国科技公司 。

Anthropic在一份声明中称,深度求索(DeepSeek) 、月之暗面(Moonshot AI)、MiniMax这三家公司开展了协同式的“模型蒸馏攻击” ,向Claude发送大量精心设计的提示词 ,用于训练自有模型。

通过模型蒸馏,小型AI模型可以从更成熟的预训练大模型中提取知识,从而模仿其表现 ,这种技术对资源较少的小型团队尤其有用。

尽管Anthropic的服务限制禁止在中国地区商业使用Claude,但这三家公司据称通过商业代理服务绕过限制,使用数万个Claude账号同时访问其系统 。

Anthropic在声明中表示:“一旦获得访问权限 ,这些实验室就会生成大量精心设计的提示词,旨在从模型中提取特定能力 。 ”

Claude对这些提示词的回复被大规模收集,要么直接用于训练中国公司的模型 ,要么用于强化学习——一种无需人工干预、让AI通过反复试错学习决策的数据密集型方法。

Anthropic估计,这三家中国公司通过约2.4万个虚假创建的账号,与Claude产生了总计超过1600万次交互。其中MiniMax产生的流量最多 ,超过1300万次 。

截至目前,DeepSeek 、月之暗面 、MiniMax尚未回复CNBC的置评请求。

*并非首次*

Anthropic加入了越来越多美国公司的行列,对中国AI企业的模型蒸馏行为表达担忧。

本月早些时候 ,奥特曼执掌的OpenAI向美国议员发表公开信 ,称发现相关活动“显示DeepSeek持续尝试蒸馏OpenAI及其他美国前沿实验室的模型,包括使用新型隐蔽手段” 。

据《金融时报》2025年1月援引OpenAI内部人士消息,自去年初中国首个DeepSeek模型发布以来 ,OpenAI就已指出中国企业进行模型蒸馏的证据,用户发现该模型与ChatGPT惊人相似。

不过,模型蒸馏在行业内并不罕见。Anthropic在周一的声明中也承认 ,AI公司“通常会对自有模型进行蒸馏,以打造更小、成本更低的版本” 。

伦理咨询机构EITIC创始人利亚·拉克尔·内维斯表示,Anthropic的指控与其说是行业不当行为 ,不如说是违反服务条款。

“如果Anthropic自己也承认蒸馏是合法且广泛使用的做法……那么争议的核心就不仅在于技术本身,而在于所谓的欺诈性访问,以及可能违反合同条款与访问限制。 ”

但Anthropic对竞争对手由此获得的竞争优势表示担忧 ,称这种做法可以“以远低于自主研发的时间和成本,从其他实验室获取强大能力 ” 。

Anthropic和OpenAI在各自声明中,均将这些中国企业的蒸馏行为描述为国家安全威胁。

与OpenAI将DeepSeek的行为称为“对抗性蒸馏”一样 ,Anthropic担忧“威权政府可能将前沿AI用于攻击性网络行动、虚假信息宣传和大规模监控”。

*叙事之争*

但专家表示 ,目前尚不清楚这些声明在多大程度上反映了真实的安全担忧,又或是为了维护美国AI企业的领先优势 。

新加坡南洋理工大学人工智能教授埃里克·坎布里亚对CNBC表示,鉴于蒸馏在AI行业被普遍视为合法做法 ,“合法使用与对抗性利用之间的界限往往模糊不清 ” 。

一些网友很快指出,Anthropic的指控与其自身使用蒸馏训练自有模型的行为存在相似之处。

精品咨询公司Tech Buzz China的马睿(Rui Ma)表示,Anthropic长期将“算力领先视为国家安全优先事项” ,一贯主张对中国加强先进AI芯片出口管制。

“无论是否有意,非法能力转移的叙事都为更严格的芯片限制提供了理由 。”

EITIC的内维斯称,在全球竞争和AI巨额投资的大背景下 ,讨论国家安全与出口管制时,必须区分真实安全风险与更广泛的战略叙事。

“这并非否认真实风险的存在,但确实需要审慎分析 ,以区分不同叙事。 ”

就在Anthropic发布声明的同一天,路透社援引匿名高级官员报道称,美国已找到证据 ,显示DeepSeek使用英伟达旗舰Blackwell芯片训练AI模型 ,明显违反出口管制 。

此类报道进一步加剧了美国政府对中国人工智能(AI)行业快速发展的焦虑,尤其是在相关进展据称依赖美国系统的情况下。

上周五,白宫宣布成立“和平队AI计划” ,旨在海外推广美国AI利益,帮助伙伴国家采用前沿系统。