AI幻觉代码依赖成为新型软件供应链威胁

随着生成式AI编程工具的幻觉普及,以及AI模型容易"幻觉"出不存在软件包的代码特性,一种名为"垃圾包抢注"(slopsquatting)的依赖新型供应链攻击正在浮现。

安全研究员Seth Larson创造了这个术语,新型胁它衍生于"拼写错误抢注"(typosquatting)攻击手法——通过注册与热门库名称相似的软件恶意软件包来诱骗开发者安装。

幻觉包名的链威攻击原理

与拼写错误抢注不同,垃圾包抢注不依赖拼写错误。幻觉攻击者会在PyPI和npm等软件仓库中,代码注册那些AI模型在代码示例中经常虚构的依赖包名。

2025年3月发布的新型胁研究论文显示,在分析的软件57.6万个Python和JavaScript代码样本中,约20%案例推荐的链威依赖包并不存在。开源大模型如CodeLlama、幻觉DeepSeek、代码WizardCoder和Mistral的依赖情况更严重,b2b供应网而ChatGPT-4等商业工具的幻觉率仍达5%。

各大型语言模型的幻觉率来源:arxiv.org

幻觉包名的可预测性

研究发现,虽然记录的独特幻觉包名超过20万个,但其中43%会在相似提示词下重复出现,58%在十次运行中至少重复一次。这些包名中,38%受真实包名启发,13%源于拼写错误,51%则完全虚构。

尽管尚未发现攻击者利用此漏洞的实际案例,但网络安全公司Socket的研究人员警告称,这些幻觉包名具有常见性、可重复性和语义合理性,形成了可预测的攻击面。

"58%的幻觉包会重复出现,说明它们不是b2b信息网随机噪声,而是模型对特定提示的可重复反应。"Socket团队解释道,"这种可重复性提升了攻击价值,观察少量模型输出就能锁定有效攻击目标。"

供应链风险概览来源:arxiv.org

风险缓解措施

目前唯一有效的防范方法是人工验证每个包名,切勿假设AI生成的代码片段中提到的依赖包真实存在或安全可靠。其他防护措施包括:

使用依赖扫描工具锁定文件(lockfiles)管理哈希验证确保使用可信版本

研究还表明,降低AI的"温度"参数(减少随机性)能有效减少幻觉。若采用AI辅助编程,这成为重要考量因素。最根本的防护措施是:所有AI生成的代码都应在隔离的安全环境中测试,再部署到生产环境。站群服务器

人工智能
上一篇:莱斯硬盘分区教程(详解莱斯硬盘分区方法,让你的数据有序有力)
下一篇:手机进水了怎么办?(教你快速排水的方法,让手机重获新生!)