
持马!向来标榜安全的 Claude,居然把自家模子表现了!?
新模子代号" Mythos ",又叫" Capybara(卡皮巴拉)",比当下 Claude 最强的 Opus 模子还大还强。

甚是离谱的是,这波曝光,甚而不是外部波折,而是一次权限树立苟且。
一篇 Anthropic 自家博客草稿,被罪状设为公开,于是,这只"卡皮巴拉"就这样水汪汪地被全网围不雅了。
更让东说念主绷不住的是,CEO 也没能逃过这场风云,他的度假算计,也被这位马大哈职工公开到了网上??

(你说这事儿闹的 ...)
比 Opus 4.6 更夯的 Claude Mythos
事情的启事,源于一场乖谬的手艺性「手滑」。(doge)
几天前,Anthropic 里面的本色责罚系统(CMS)在进行版块迁转眼,出现了一个致命的树立轻薄。
将一个存储公司中枢财富的数据库权限,从里面特有错点成了完全公开,径直把里面奥秘财富的数据库权限径直「开盒」。
而且如故完全莫得加密的那种,效果可思而知——多数图片、PDF 和博客草案径直在互联网上《裸奔》。
好巧不巧,这个随意碰劲被剑桥大学盘问员和网络安全公司 LayerX Security 的在扫描经由中发现。
不看不知说念,一看吓一跳,里的本色不错说是让盘问东说念主员径直倒吸一口寒气——
3000 份Anthropic 里面守密未公开的财富档案,昭着呈目前目前。(瞪大眼 .jpg)

而其中的一篇守密但没守密奏效的数据贵寓里,径直爆出了还在测试的深重模子—— Claude Mythos。
有网友在著作下架之前把 A 社的两篇博客草稿保存了下来,这两篇一篇管这个模子叫 Mythos,另一篇则称之为 Capybara,但除了称呼除外,这两篇草稿的其他本色基本不异。

在表现文献中,曾屡次使用质的飞跃这种说法来刻画 Mythos,甚而外传比目前的最强模子 Opus 更大且更智能。
莫得看法不遑急,东说念主家贵寓里径直拿对比话语了:
在具体才气上,相较于 Claude Opus 4.6,Mythos 在软件编码、学术推理和网络安全等测试中的得分显耀更高。
不仅如斯,泄漏文献中还提到,目前 Anthropic 已完成了关于该模子的关系考研。
何况还说了这样一句话:
Claude Mythos,便是迄今为止公司开发过的最宏大的 AI 模子!!!
嚯!比 Opus4.6 还宏大的模子,何意味?
要知说念,目前 Claude 主要有三款模子:差异是轻量级模子 Haiku、中量级模子 Sonnet,以及旗舰型模子 Opus。
在具体进展上,不久前发布的 Opus 4.6,BSports在复杂长文本处理和推理才气上一经处在现时模子第一梯队。
在 GDPval-AA(一项评估金融、法律和其他规模经济价值学问责任任务的性能想法上),Opus 4.6 比 GPT-5.2 当先 144 个 Elo!!!

如若真要像文献里所说的,Mythos 能比 Opus 4.6 还强。
那么,这事儿还真就不太好说了。
归正我意象近邻 OpenAI 真得瑟瑟发抖了 ...
奥特曼:正本以为群众还在一个量级里切磋,谁知说念东说念主家暗里搞这一套深重玩法啊??
安全风险让 A 社我方齐发怵
Anthropic 承认,其本色责罚系统树立中的"东说念主为罪状"导致草稿博客著作变得可拜访。
按照 A 社的说法,这些材料属于"考虑发布的本色的早期草稿",也便是说晨夕会公开,但因为表现被提前了。
有网友锐评,因为有了 Claude Code,导致被公开的文献更容易被发现,A 社这波是被我方家的居品反噬了??

(有点太鲨东说念主诛心了啊 ... )
事儿越闹越大,再不站出来说两句齐不太好了。
东说念主家 A 社发言东说念主也承认了,他们如实正在考研和测试一款新模子。
咱们正在开发一款通用模子,它在推理、编码和网络安全方面齐有显耀进步。
鉴于其宏大的功能,咱们正在严慎地发布这款模子。按照行业成例,咱们正在与一小部分早期用户勾通测试该模子。咱们合计这款模子是一次飞跃,亦然咱们迄今为止构建的最宏大的模子。
由于该模子在代码和网络安全规模的才气远超现存水平,甚而可能被用于发起大范围网络波折,公司将其限度在小数数早期拜访客户范围内进行阻塞测试。
这种分阶段露馅的作念法是为了给网络谛视组织留出提前量,让他们大约诓骗模子的才气先行加固代码库,以应付未来可能出现的 AI 波折。
有东说念主更是号召,这样的模子不管如何齐不应该公开,因为根底不存在通盘坚固的谛视系统。

其实,目前一经有的 Opus 4.6,就一经具备了发现分娩代码库中此前未知随意的才气。
A 社一经承认,这项功能具有双重用途,这意味着它既不错匡助黑客,也不错匡助网络安全谛视者发现并开发代码中的随意。
还有近邻 OpenAI,在发布 GPT-5.3-Codex 时,也称其是凭证"网络安全准备框架"评定的首个"高才气"网络安全关系任务模子,亦然首个径直考研用于识别软件随意的模子。
也便是说,不管 Anthropic 如故 OpenAI,它们最新一代的绪论模子,齐一经破了某个门槛,将带来新的网络安全风险。
不外也有东说念主合计,表现的信息并不等于 100% 的事实,无法放弃炒作要素,是以如故静瞻念其变最终委用的居品究竟如何。

(让咱们小小期待一下模子的亮相吧~)
参考知道:
[ 1 ] https://x.com/ns123abc/status/2037379495376642481
[ 2 ] https://x.com/AiBattle_/status/2037372470232006699
[ 3 ] https://x.com/MarioNawfal/status/2037371145075167391
[ 4 ] https://x.com/Yuchenj_UW/status/2037387996694200509
— 接待 AI 居品从业者共建 —
� �「AI 居品学问库」是量子位智库基于遥远居品库跟踪和用户活动数据推出的飞书学问库,旨在成为 AI 行业从业者、投资者、盘问者的中枢信息舛错与方案救济平台。
一键热心 � � 点亮星标
科技前沿进展逐日见B体育(BSports)
亚搏体育官方网站 - YABO

备案号: