AI前线

国家网信部门罕见出手：AI Agent”技能包”安全警报拉响，越狱挖矿洗钱——”智能体生态”的暗面正在浮现

36氪·AI前线 | 2026年6月11日

📌核心要点

国家互联网应急中心（CNCERT）正式发布公告，警告智能体技能包（Skills）存在大模型越狱和非法挖矿风险，这是中国最高级别网络安全机构首次针对AI Agent生态安全发出公开预警
恶意Skills以”大模型越狱”、”挖矿赚钱”为噱头，诱导用户突破安全限制，可能导致模型生成违法信息、账号被封禁、设备性能下降
CNCERT警告的潜在后果已延伸至洗钱等违法犯罪活动——AI技能包不再是简单的”工具”，而是可能成为网络犯罪的载体
这一警告发布的时机正值全球AI Agent生态爆发式增长：Anthropic发布Claude Fable 5、Google推出Gemini 3.5实时翻译、小米MiMo推理速度突破1000 tokens/s，Agent能力快速进化

从”工具”到”载体”：AI Agent安全边界在哪里？

6月9日，国家互联网应急中心（CNCERT）发布了一则看似简短、实则分量极重的公告。在中国网络安全监管体系中，CNCERT是最高级别的技术预警机构，其公告通常只对严重网络威胁和重大安全事件做出。而这一次，它锁定的目标不再是病毒或黑客组织——而是AI智能体技能包（Skills）。

公告指出，近期CNCERT综合研判发现，部分智能体技能包以”大模型越狱”、”挖矿赚钱”等名义公开传播，诱导用户突破大模型安全限制，或占用设备资源进行非法挖矿。这些恶意Skills可能导致：模型生成违法信息、用户账号被依法封禁、设备性能下降，甚至使用户被动卷入洗钱等违法犯罪活动。

请注意最后这条——”被动卷入洗钱”。这不是传统意义上恶意软件感染电脑那么简单，而是AI Agent在用户不知情的情况下，可能成为犯罪资金链路的组成部分。

💡 为什么这件事重要

过去我们讨论AI安全，聚焦的是”AI会不会生成有害内容”。但现在的问题更深层——AI的能力越强，它被利用来”帮坏人干活”的可能性就越大。一个Skill可以操控模型执行复杂操作，从绕过安全限制到调用API、执行代码，这些能力本身不违法，但一旦落入恶意开发者手中，就能变成”合法的犯罪工具”。

AI Agent生态爆发式增长，安全却成”最后一公里”

CNCERT发出警告的时机并非偶然。2026年上半年，AI Agent生态系统经历了爆炸式增长，几乎所有主流玩家都在加码：

公司	最新Agent/技能生态动态	发布时间
Anthropic	Claude Fable 5 上线，配套Mythos 5面向安全防御方开放；Agent能力成为核心竞争力	2026年6月9日
Google	Gemini 3.5实时翻译模型发布，70+语言自动检测；DeepMind在欧洲启动机器人加速器项目	2026年6月9日
小米	MiMo-V2.5-Pro-UltraSpeed模式上线，推理速度突破1000 tokens/s，无需定制芯片	2026年6月8日
OpenAI	Codex白领工具集持续扩展，Agent正式接管办公室工作流	2026年6月
微信	开放AI生态接入能力，滴滴率先将核心网约车服务融入微信AI Agent	2026年6月

Agent生态正在经历”前互联网时代”式的野蛮生长——能力快速迭代，但安全框架、监管标准、责任边界尚未建立。CNCERT的公告正是对这一”安全真空”的直接回应。

三大风险层级：从”调皮”到”犯罪”

CNCERT公告中描述的恶意Skills风险，实际上可以拆解为三个层层递进的危险层级：

第一层：模型越狱——”让AI说它不该说的话”

这是最基础的风险层级。恶意Skill通过精心构造的提示词绕过模型安全限制，让AI生成原本被拒绝的内容。这类攻击已被广泛研究和公开演示，但关键在于——Skill的形态让越狱攻击变得更隐蔽、更自动化。攻击者不再需要手动写prompt，而是分发一个”技能包”，用户安装后自动生效。

第二层：设备劫持——”让你的电脑替我挖矿”

Skill可以请求执行代码、访问系统资源，这意味着恶意Skill本质上是一个”合法的挖矿程序”。用户的CPU/GPU在不知不觉中为攻击者的加密货币挖矿任务提供算力，而用户自己对此毫无察觉。这类攻击对设备性能的影响可能非常明显——风扇狂转、电池快速耗尽、设备变慢。

第三层：犯罪工具化——”你不知道自己在帮谁洗钱”

这是最危险的层级。如果一个恶意Skill操控AI Agent调用了支付API、加密转账接口、或者在社交平台执行自动化操作，用户可能在完全不知情的情况下成为犯罪资金链的一部分。CNCERT特别强调这一点，意味着监管机构已经意识到AI Agent不再是”工具”，而可能成为”犯罪执行者”。

70+

AI Agent生态支持的语言

1000

tokens/s推理速度突破

∞

安全边界的模糊性

全球都在面对的”最后一公里”难题

CNCERT的这次警告并非孤立事件。事实上，全球AI安全监管者都在面对同一个核心问题：当AI Agent的能力足以自主执行复杂任务时，谁来为”Agent的行为”负责？

– 美国：Anthropic一边发布最强AI模型，一边呼吁全球暂停AI开发——”安全追赶不上速度”已成为行业共识
– 欧洲：Google DeepMind在欧洲启动机器人加速器项目，但同时也面临AI伦理审查的严格要求
– 中国：CNCERT首次公开针对AI Agent生态发出安全警告，监管思路正从”管模型”转向”管生态”

值得注意的一个趋势是：监管的重心正在从AI模型本身，转向AI的”生态”——即围绕模型的第三方开发、插件、技能包、API调用链。这意味着未来的监管将更加复杂，因为安全边界不再局限于单一公司，而是延伸到整个开发者生态。

对用户意味着什么？

CNCERT给出的建议很明确：提高警惕，加强Skills来源审查与行为监控，及时清除可疑组件。但对于普通用户来说，这听起来像是”不要随便下载不明来源的软件”——道理简单，执行困难。

在AI Agent生态快速发展的当下，”Skill”可能以各种形式出现：浏览器扩展、手机App插件、桌面应用的功能模块、甚至社交媒体上的”自动化工具”。用户很难辨别哪些是正经工具，哪些是披着”AI”外衣的恶意代码。

一个更务实的做法是：优先使用来自可信平台（如微信、Anthropic、Google等）官方认证的Skill，而非直接安装来源不明的第三方组件。正如CNCERT所警告的——在AI Agent时代，”安装一个Skill”的风险可能远超”安装一个App”。

📌小结

CNCERT首次公开警告AI Agent技能包（Skills）的安全风险，涵盖越狱、挖矿、洗钱三大层级
AI Agent生态爆发式增长，但安全框架、监管标准、责任边界尚未建立
风险从”让AI说错话”升级到”让用户卷入洗钱”，监管重心从”管模型”转向”管生态”
普通用户应优先使用官方认证Skill，警惕来源不明的第三方组件

🔔 关注 xlb.baby

AI Agent的安全边界正在被重新定义。我们是 xlb.baby，持续追踪AI前沿动态与深度分析。关注获取更多独家报道。

信息来源：国家互联网应急中心（CNCERT）公告、界面新闻、36氪、IT之家、证券时报

国家网信部门罕见出手：AI Agent”技能包”安全警报拉响，越狱挖矿洗钱——”智能体生态”的暗面正在浮现

国家网信部门罕见出手：AI Agent”技能包”安全警报拉响，越狱挖矿洗钱——”智能体生态”的暗面正在浮现

📌核心要点

从”工具”到”载体”：AI Agent安全边界在哪里？

💡 为什么这件事重要

AI Agent生态爆发式增长，安全却成”最后一公里”

三大风险层级：从”调皮”到”犯罪”

第一层：模型越狱——”让AI说它不该说的话”

第二层：设备劫持——”让你的电脑替我挖矿”

第三层：犯罪工具化——”你不知道自己在帮谁洗钱”

全球都在面对的”最后一公里”难题

对用户意味着什么？

📌小结

🔔 关注 xlb.baby

评论

发表回复 取消回复

更多文章

10亿订单、芯片巨头下场、朱啸虎第五次加注——这家’海底AI公司’凭什么让华尔街沉默了？

智谱单日暴涨47.6%、成交520亿港元创新高——Anthropic被美国封杀后，中国AI模型成了全球最紧俏的’替代品’

小红书秘密递表港股IPO，500亿美元估值集结半个创投圈——这家“种草第一股”到底值不值？

支付宝政务AI突破1亿次、微信支付AI卡本周上线——同一个超级App时代，两条截然不同的AI活法

发表回复取消回复