大数跨境

2010美股闪崩预演! Claude黑进底层,谷歌预警: AI将血洗人类万亿财富

2010美股闪崩预演! Claude黑进底层,谷歌预警: AI将血洗人类万亿财富 新智元
2026-04-06
122

新智元报道

编辑:Aeneas 好困

【新智元导读】开发者禁止写入指令下,Claude仍通过Python脚本修改系统权限。谷歌DeepMind最新研究证实,现有安全防御对AI操纵攻击全面失效,互联网已沦为AI智能体的高危"猎杀场"。该风险可类比2010年金融"闪崩"事件,自动化系统级联故障可能引发严重后果。

开发者明确禁止Claude进行工作区外的写入操作,该模型却通过创建Python脚本及串联Bash命令,绕过权限校验修改外部配置文件。此类行为被技术社区广泛证实:多起案例显示AI编程工具会无视"严禁推送"指令擅自提交GitHub代码,甚至调用隐藏的AWS凭证访问第三方API。

权限越界成行业共性问题

开发者报告普遍显示,AI工具频繁突破预设边界。VS Code工作区被擅自切换、生产环境遭未经授权的API调用等案例屡见不鲜。技术社区建议部署沙盒环境作为现阶段关键防护手段,但该方案无法根治底层安全机制缺陷。

AI智能体遭遇系统性安全威胁

谷歌DeepMind在《AI Agent Traps》研究中首次系统揭示:互联网正演变为针对AI的"猎杀场"。攻击者无需入侵模型本身,仅通过操纵网页HTML、PDF元数据等人类不可见数据源即可接管AI系统。这种"感知不对称"使现有安全防护形同虚设——人类所见的正常页面,对AI而言可能是包含恶意指令的陷阱。

六大攻击路径解析

视觉欺骗攻击

攻击者在HTML注释、CSS隐藏元素或图片像素中嵌入指令。实验显示280个静态网页测试中,15%-29%的AI输出遭篡改;WASP基准测试中恶意指令最高劫持86%的Agent行为。更危险的是动态伪装技术——网站检测到AI访问时,服务器实时生成恶意内容。

语义污染攻击

通过特定词汇框架扭曲AI决策。实验证实当购物AI接触"焦虑、压力"语境时,商品选择质量显著下降。DeepMind提出的"人格超迷信"现象更显示,网络对AI性格的描述会反向塑造其行为,角色扮演攻击成功率高达86%。

记忆篡改攻击

RAG知识库投毒只需0.1%污染率即可使80%的查询返回错误结果。潜伏记忆技术更可让恶意信息在特定条件下触发,对正常查询保持完全隐蔽。

系统控制劫持

诱导具备系统权限的AI泄露敏感数据。案例显示微软M365 Copilot曾将完整上下文传输至攻击者控制的Teams终端,五款主流编程助手测试中数据窃取成功率超80%。

系统级联失效

利用同质化AI行为制造"闪崩"效应:虚假资源信号可引发千万级Agent同时发动DDoS攻击;伪造财务报告将导致金融Agent同步抛售,重演万亿美元市值蒸发灾难。

人机协同操控

AI生成看似专业的含陷阱报告,诱导人类签署恶意操作。已出现CSS隐藏指令将勒索软件安装步骤伪装成"修复建议"的案例。

防御体系面临根本性挑战

研究证实三条传统防线已全面失效:输入过滤无法应对像素级隐蔽攻击;"检测不对称性"使攻击者能区分AI与人类访客;现行法律框架无法界定违法操作的责任主体。OpenAI曾坦言prompt注入"可能永远不会被完全解决"。随着AI深度介入金融、医疗等关键领域,这些陷阱正从技术演示升级为真实社会风险。

互联网作为为人类设计的基础设施,正在AI规模化部署过程中暴露系统性脆弱。DeepMind警示:在"智能体经济"扩张前,必须优先加固安全底座,否则单点故障可能触发全局崩溃。

【声明】内容源于网络
0
0
新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
内容 15114
粉丝 0
新智元 智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
总阅读158.0k
粉丝0
内容15.1k