Close Menu
  • 首页
  • Web3
  • 政策
    • 审查
    • 法规
    • 交流
    • 隐私
    • 法律
  • Macro
  • Layer2
  • 比特币
    • NFTs
    • DeFi
    • 稳定币
    • 狗狗币
    • 以太坊
  • AI
  • 银行业
  • 游戏
  • 破产
  • 全部文章
热门内容

狗狗币与XRP下跌严重:底部在哪里?

2025年8月21日

比特币算力和挖矿难度飙升,手续费下降:BlocksBridge

2025年8月21日

塔吉克斯坦和哈萨克斯坦非法比特币挖矿现象上升

2025年8月21日
Facebook X (Twitter) Instagram
X (Twitter) Telegram
加密专场
Subscribe
  • 首页
  • Web3
  • 政策
    • 审查
    • 法规
    • 交流
    • 隐私
    • 法律
  • Macro
  • Layer2
  • 比特币
    • NFTs
    • DeFi
    • 稳定币
    • 狗狗币
    • 以太坊
  • AI
  • 银行业
  • 游戏
  • 破产
  • 全部文章
加密专场
首页 » OpenAI的新模型“防越狱”功能?首日即被破解
AI

OpenAI的新模型“防越狱”功能?首日即被破解

By admin2025年8月9日没有评论1 Min Read
OpenAI的新模型“防越狱”功能?首日即被破解
OpenAI的新模型“防越狱”功能?首日即被破解
Share
Facebook Twitter LinkedIn Pinterest Email Copy Link

OpenAI发布了自2019年以来的首个开源权重模型——GPT-OSS-120b和GPT-OSS-20b

OpenAI刚刚发布了自2019年以来的首个开源权重模型——GPT-OSS-120b和GPT-OSS-20b,并宣称这些模型快速、高效,并通过严格的对抗训练增强了对越狱的抵抗能力。这一声明的有效期与地狱中的雪球差不多。

Pliny the Liberator成功破解GPT-OSS

臭名昭著的LLM越狱者Pliny the Liberator于周二晚在X上宣布,他成功破解了GPT-OSS。他发布道:“OPENAI: PWNED GPT-OSS: LIBERATED”,并附上截图显示模型吐露出制造甲基苯丙胺、莫洛托夫鸡尾酒、VX神经毒剂和恶意软件的说明。

“这需要一些调整!”Pliny说。

对于OpenAI来说时机特别尴尬

这个时机对于OpenAI来说尤其尴尬,因为他们曾大肆宣扬这些模型的安全测试,并且即将推出备受期待的升级版GPT-5。

根据该公司的说法,他们对GPT-OSS-120b进行了所谓的“最坏情况下的微调”,涵盖生物和网络领域。OpenAI甚至让他们的安全顾问小组审查了测试,并得出结论认为这些模型没有达到高风险阈值。

该公司表示,模型经过了“标准拒绝与越狱抵抗测试”,并且GPT-OSS在像StrongReject这样的越狱抵抗基准测试中表现与他们的o4-mini模型相当。

该公司甚至在发布时推出了50万美元的红队挑战,邀请全球研究人员帮助发现新风险。不幸的是,Pliny似乎并不符合资格。这并不是因为他给OpenAI带来了麻烦,而是因为他选择公开发布他的发现,而不是私下与OpenAI分享他的结果。(这只是推测——Pliny和OpenAI都没有分享任何信息或回应评论请求。)

社区享受AI抵抗力量的“胜利”

社区正在享受这一AI抵抗力量对大型科技霸主的“胜利”。“目前所有实验室都可以关闭他们的安全团队了,”一位用户在X上发布。“好吧,我需要这个越狱。不是因为我想做坏事,而是OpenAI对这些模型的限制太严了,”另一位用户说。

Pliny的越狱技术

Pliny使用的越狱技术遵循了他典型的模式——一个多阶段提示,首先看似拒绝,然后插入一个分隔符(他标志性的“LOVE PLINY”标记),接着转向生成无限制的内容,以隐蔽检测。这是他自一年半前开始这一切以来,用于破解GPT-4o、GPT-4.1以及几乎每个主要OpenAI模型的基本方法。

对于那些在家中关注进展的人来说,Pliny现在几乎在每个主要的OpenAI发布后数小时或数天内就进行了越狱。他的GitHub库L1B3RT4S,包含各种AI模型的越狱提示,拥有超过10,000个星标,继续成为越狱社区的首选资源。

Share. Facebook Twitter Pinterest LinkedIn Tumblr Email Copy Link

Related Posts

经过数月的猜测,OpenAI终于发布了GPT-5

2025年8月15日

立法者呼吁对中国DeepSeek进行国家安全和数据风险调查

2025年8月13日

苹果公司在美国再投资1000亿美元,寻求人工智能转型

2025年8月10日

埃隆·马斯克的xAI工具制作了泰勒·斯威夫特的裸体深度伪造视频,绕过了自身规则。

2025年8月8日

Cloudflare指控Perplexity AI使用隐秘爬虫绕过网站封锁

2025年8月7日

在一个对速度极为痴迷的市场中,这位加密AI助手希望你放慢脚步

2025年8月7日
Add A Comment
Leave A Reply Cancel Reply

最新文章

狗狗币与XRP下跌严重:底部在哪里?

2025年8月21日

比特币算力和挖矿难度飙升,手续费下降:BlocksBridge

2025年8月21日

塔吉克斯坦和哈萨克斯坦非法比特币挖矿现象上升

2025年8月21日

尽管近期回调,Cardano和XRP鲸鱼活动达到数月以来的高点

2025年8月20日
保持联系
  • Facebook
  • Twitter
  • Pinterest
  • Instagram
  • YouTube
  • Vimeo
别错过

狗狗币与XRP下跌严重:底部在哪里?

2025年8月21日

加密市场继续下滑,从火热的七月中降温比特币当然是引领潮流,今天再次下跌,创下近三周低点。但今天两种主要加密货币的表现尤其糟糕:狗狗币和XRP。总市值今天暴跌3.4%,降至低于3.9万亿美元,仅在数周前…

比特币算力和挖矿难度飙升,手续费下降:BlocksBridge

2025年8月21日

塔吉克斯坦和哈萨克斯坦非法比特币挖矿现象上升

2025年8月21日
网站简介

加密专场

发现加密专场,一个引领您进入加密货币领域的门户网站。从最新的加密货币新闻到深度分析,我们为您提供全面的覆盖,帮助您了解加密货币的世界。

X (Twitter) Telegram
我们的精选

狗狗币与XRP下跌严重:底部在哪里?

2025年8月21日

比特币算力和挖矿难度飙升,手续费下降:BlocksBridge

2025年8月21日

塔吉克斯坦和哈萨克斯坦非法比特币挖矿现象上升

2025年8月21日
最受欢迎

Kraken的以太坊二层网络Ink Network即将推出代币

2025年6月19日

Lido发布Lido联盟提案,旨在构建基于stETH的以太坊生态系统。

2024年5月11日

A股重返3000点比特币重返65000

2024年9月19日
©Copyright 2024 加密专场 版权所有.
  • 首页
  • Web3
  • 政策
    • 审查
    • 法规
    • 交流
    • 隐私
    • 法律
  • Macro
  • Layer2
  • 比特币
    • NFTs
    • DeFi
    • 稳定币
    • 狗狗币
    • 以太坊
  • AI
  • 银行业
  • 游戏
  • 破产
  • 全部文章

Type above and press Enter to search. Press Esc to cancel.