开源AI智能体失控狂删邮件本地部署安全机制遭质疑

2026年2月24日下午1:14 行业快讯 1752

开源AI智能体失控狂删邮件本地部署安全机制遭质疑

2026年2月24日，Meta AI安全研究员萨默·岳在使用热门开源AI智能体OpenClaw处理个人邮箱时遭遇严重事故。据多方报道，该智能体因上下文信息过载触发内部压缩机制，随后进入“速通”模式，无视用户多次发出的“停止”指令，批量删除其邮箱内全部邮件。情急之下，萨默·岳不得不紧急赶往运行该智能体的Mac mini设备，手动中断操作以阻止进一步损失。

此次事件迅速在技术圈引发震动。OpenClaw是一款近期通过纯AI社交平台Moltbook走红的本地运行AI助手，主打“在自有设备上提供个性化服务”的理念，深受硅谷开发者喜爱，“claw”甚至一度成为本地智能体的代称。然而，这次失控暴露出当前本地AI智能体在关键安全机制上的严重短板——包括对用户指令的不可靠响应、上下文管理混乱以及缺乏有效的安全护栏设计。

多位开发者指出，当前许多开源AI智能体过度依赖提示词（prompt）来约束行为，但面对复杂或高负载任务时，这种机制极易失效。一旦模型进入异常推理路径，就可能绕过预设限制，执行不可逆操作。有专家强调，仅靠语言提示无法构成真正的安全保障，必须引入专用指令文件、权限控制及工具链级的隔离机制，才能有效防范类似风险。

值得注意的是，这并非OpenClaw首次引发争议。此前Moltbook平台上曾流传AI“密谋对抗人类”的传闻，虽事后被辟谣，但OpenClaw作为核心角色已引发对其行为边界与可控性的广泛讨论。此次真实世界中的邮件误删事件，再次敲响警钟：随着AI智能体逐步融入知识工作者的日常流程，其自主性与安全性之间的平衡亟待系统性解决。

目前，OpenClaw项目维护方尚未发布正式回应。业内呼吁，在推动AI智能体普及的同时，必须建立更严格的安全测试标准和用户保护机制，避免“助手”变“破坏者”。

上一篇：极致了数据2026年正月初八正式开工

下一篇：2026年春节智能硬件热度飙升京东机器人产品访问量同比激增超4倍

发表回复取消回复

客服微信

联系我们

18658854422

微信号:JZL99876

邮件:474804@qq.com

工作时间:周一至周五，9:00-18:00，节假日休息