巨人网
产经 科技 企业 数据 峰会 快讯

新型GPT越狱攻击手法曝光:研究人员突破GPT-4o安全防线,编写恶意程序

2024-11-04来源:ITBEAR编辑:瑞雪

网络安全领域近日传出警讯,0Din公司的研究员Marco Figueroa揭示了一种针对GPT-4o的新型越狱攻击方法。此方法能成功规避GPT-4o内置的安全防护措施,诱导其编写出具有恶意攻击性的程序。

据OpenAI官方介绍,GPT-4o原本配备了一套“安全护栏”系统,旨在防止用户滥用该AI技术。这套系统会分析用户输入的文本提示,以识别并阻止恶意内容的生成。

然而,Marco Figueroa发现了一种新技巧,他通过将恶意指令转换成十六进制格式,巧妙地绕过了GPT-4o的安全检查。这意味着,即使面对防护措施,GPT-4o仍可能被诱导执行攻击者的恶意指令。

在实验中,研究人员先要求GPT-4o对十六进制字符串进行解码。随后,他向GPT-4o发送了一条隐藏有恶意意图的十六进制指令,该指令的实际内容是要求GPT-4o利用互联网资源研究CVE-2024-41110漏洞,并使用Python编写相应的恶意程序。令人震惊的是,GPT-4o在短短1分钟内就完成了任务,成功利用该漏洞编写出攻击代码。

Marco Figueroa解释说,GPT系列模型在设计上遵循自然语言指令进行编码和解码操作,但它们缺乏对整体情境的安全评估能力。因此,黑客经常利用这一弱点,诱导模型执行不当操作。此次发现的越狱攻击方法,再次暴露了AI模型在安全性方面的脆弱性。

研究人员强调,这一发现应被视为对AI模型开发者的警钟。为了防范此类基于上下文理解的攻击,开发者需要进一步加强模型的安全防护措施。

神舟十八号载人飞船成功返回!科技圈还有哪些大事件?
微信纯血鸿蒙 1.0.1.34版现已上线华为应用商店尝鲜区,增加了个人名片、位置等功能,同时支持了各类文件的收取、查看功能。官方表示,由于技术限制,预计 12 月发布的 MyBMW App 版本的部分页…

2024-11-04

法国航空公司宣布暂停飞越红海地区的航班
据央视新闻,由于当地时间11月3日当天在苏丹上空监测到一个“高空发光物体”,法国航空公司(Air France)数架飞往东非地区的航班更改飞行路线,部分航班掉头返航,在航班始发地机场降落。法国航空公司随后发布…

2024-11-04

国泰君安:AI Agent加速落地,智能终端化身个人助理
据国泰君安研报称,AI Agent正在加速落地,显著提升智能终端的语音交互能力。AutoGLM通过增强的语言和视觉理解能力,支持多种应用间的跨页面操作,用户无需第三方App适配即可完成常规任务。荣耀Magic…

2024-11-04

神舟十八号载人飞船成功返回,航天员刷新出舱活动时间纪录!
感谢网友 的线索投递! 11 月 4 日消息,据央视新闻报道,今日(11 月 4 日)1 时 24 分,神舟十八号载人飞船返回舱在东风着陆场成功着陆,现场医监医保人员确认航天员叶光富、李聪、李广苏身…

2024-11-04