Anthropic指控中国DeepSeek”盗用”AI模型,AI版权之争再起波澜
人工智能领域的版权之争再度升温。当地时间4月28日,Anthropic正式向美国法院提起诉讼,指控中国AI初创公司DeepSeek非法复制其Claude模型的训练数据与架构设计。这是继OpenAI诉GPT-DOOR之后,AI行业最具影响力的知识产权纠纷案。
📌 事件起因
据诉状内容,Anthropic指控DeepSeek在2025年底发布的DeepSeek-R1模型中,使用了与Claude相似的数据处理流程和指令微调方法。Anthropic法务团队表示,DeepSeek工程师涉嫌通过”逆向蒸馏”(reverse distillation)技术,从Claude输出中提取模型行为模式,用于训练自有模型。
• DeepSeek-R1 参数规模:6710亿
• Claude 3.5 Sonnet 发布时间:2024年10月
• 诉讼索赔金额:逾50亿美元
🔬 技术层面:什么是”逆向蒸馏”?
“逆向蒸馏”是一种模型压缩技术的变体。传统蒸馏是让小模型学习大模型输出;而逆向蒸馏则试图从目标模型的API输出中反推其内部逻辑。这一技术此前在学术圈存在争议,但用于商业竞争在法律上尚属灰色地带。
Anthropic诉状指出,DeepSeek使用了约4200万条Claude对话记录进行指令微调,这些数据据称来自第三方数据 marketplace,Anthropic已对相关数据商提起连带诉讼。
🌐 行业影响与各方回应
“这是对原创研究的系统性盗窃。我们别无选择,只能寻求法律救济。”
回应称相关指控”毫无根据”,并表示其模型完全基于开源数据和自主研发技术训练,已委托美国知名律所反诉Anthropic”不正当竞争”。
💡 分析:AI版权困境的深层矛盾
这起诉讼折射出AI行业的一个根本矛盾:当训练数据本身来自互联网,而互联网内容又大量包含AI生成文本时,”原创”与”复制”的边界在哪里?
从法律角度,美国现行版权法对AI训练数据的使用尚无明确规定。2025年多起相关案件的判决结果,将为全球AI产业的版权规范提供重要参照。
- Anthropic正式起诉DeepSeek模型盗窃,索赔50亿美元
- “逆向蒸馏”技术成争议焦点,法律灰色地带待厘清
- 案件结果将深远影响全球AI知识产权规范走向
