开云kaiyun(中国)官方网站

发布日期:2026-04-13 08:25    点击次数:61

九游体育app官网防火墙和要津基建全靠它续命-开云kaiyun(中国)官方网站

今夜之间,你的手机、电脑、路由器,甚而智能马桶,可能王人要汗漫打补丁修粗心了。

这不是我们胡扯的,就在今天,Anthropic 发布了自家有史以来最强的模子 Claude Mythos Preview。

今夜之间 你的手机电脑要冒出无数bug了?

这个船新版块的新模子,能我方找到 0-day 粗心(也即是拓荒者根柢不知谈、零时刻注主义致命粗心),还能顺遂给你写一套无缺的挫折代码。

眼看这才能确切太刑了,Anthropic 我方王人哆嗦了,于是就以“过于先进未便展示”的事理给锁起来了,只提供给亚马逊、苹果、微软、谷歌等 12 家正派大厂用。

今夜之间 你的手机电脑要冒出无数bug了?

与此同期,他们还组团非常搞了一个名叫 Project Glasswing(玻璃翼蝶)缱绻,号召群众先用 Mythos 作念集合安全退守。

其实这波新模子我们之前也听过风声,上个月底,Anthropic 家后院动怒,露馅了 3000 多份奥妙文档。那时就有东谈主发现,在蓝本的超大杯 Opus 之上,果然还藏着一个代号“卡皮巴拉”。

今夜之间 你的手机电脑要冒出无数bug了?

揣度是以为这名字太萌了,是以持重发布时径直更名叫 Mythos(神话,金色传奇的嗅觉)。

天然我们吃瓜环球暂时摸不到这玩意,但光看官方给出的数据,也实足让东谈主头皮发麻了。

搁曩昔,各家大模子的新品频频只可把基准测试的收货提高个 3%、5% 。

但 Mythos 此次径直即是一个降维打击:

USAMO(好意思国数学奥林匹克竞赛): 得分从上一代的 42.3% 径直暴涨到 97.6%;

今夜之间 你的手机电脑要冒出无数bug了?

Cybench(集合安全基准测试): 100% 满分通关,Anthropic 官方甚而有点凡尔赛:现存的 Cybench 基准测试太没难度了,对新模子来说依然失去了测试兴味兴味。

今夜之间 你的手机电脑要冒出无数bug了?

CyberGym(专科粗心复现测试)上,它的得分是 83.1%,相对比,此前的最强的公开模子 Opus 4.6 仅仅 66.6%。

Firefox JS shell(粗心运用测试),这个最离谱,粗心运用才能比 Opus 4.6 提高了近 80 倍。。。

今夜之间 你的手机电脑要冒出无数bug了?

濒临两位数、甚而几十倍的增长,也难怪 Anthropic 放出话来,说 Mythos 依然能和“最顶尖的东谈主类安全众人”掰手腕了。

看到这里,差友们详情也和我们想的相同,好强啊,太牛了。。。但这脚本怎样有点熟练?

先是“不贯注”露馅风声,然后官方下场甩几组炸裂数据,终末话锋一溜:“哎呀,我家模子太强了,怕烧毁宇宙,是以弗成给你们用哦”。

上一个这样干的是 GPT-5 吧?再上一个好像是 Sora?

今夜之间 你的手机电脑要冒出无数bug了?

OpenAI 天天搞谜语东谈主套路,现时风评王人成啥了,怎样 Anthropic 浓眉大眼的,也玩这套了?

更不要说,Anthropic 要在本年 IPO 了。

是以网友们一下子就炸锅了,有东谈主喷这是在为了上市造势吹过劲;有东谈主骂得更直白,说这帮作念大模子的,根柢岂论浅显用户存一火。

有名拓荒者 Simon Willison 王人出来阴阳怪气,“我们的模子太危急了弗成发布”,的确是 AI 圈的流量密码。

今夜之间 你的手机电脑要冒出无数bug了?

不外,网友骂归骂,但当你看了它推行的操作,可能也会以为,这玩意儿现时放出来,如实罕见于去幼儿园发 AK 了。

我们从两个官方的案例就能品出味来。

第一个即是,Mythos 在 OpenBSD 里,找到了一个 1998 年的邃古粗心。

这是啥主见?OpenBSD 然而堪称全球最着重安全加固的系统之一,防火墙和要津基建全靠它续命。

限制东谈主类顶级众人用显微镜盯了 27 年王人没看出来的破绽,被 AI 喝着茶就给挑出来了。。。

今夜之间 你的手机电脑要冒出无数bug了?

另一个强有劲的讲解案例即是 FFmpeg ,简直通盘视频播放器和浏览器底层王人有它。

Mythos 在这内部找到了一个藏了 16 年的粗心,而包含这个粗心的代码,早就被东谈主类反复测试了进步 500 万次,却一起绿灯。

Mythos 示意:什么叫国服 AI,战绩可查啊?

何况,你还别小看 AI 找到的粗心,就拿 FFmpeg 来说,这个粗心乍一看无关进击,平时简直不会被触发,我们联系到的某信息安全从业东谈主士文安(假名)却以为,这属于典型相配规的输入导致的预期外的问题。

现实糊口中,未必有多半近似的案例,你弗成说触发几率小就总共疏远。

更进一步说,现时这个小粗心可能仅仅让标准闪退或者报错,但若是再和一些随心地址(罕见于黑客有了你电脑的全能钥匙)读写时间纠合起来,那即是个危害级别比拟高的粗心了。

是以,文何在看完这些新闻径直来了句:“若是这个著述全是真实,嗅觉(从事集合)安全一半(东谈主)不错跳河了”。

今夜之间 你的手机电脑要冒出无数bug了?

随后,文安示意跳河仅仅夸张修辞,也安危我们说这些粗心,暂时还没到,“我的支付宝会不会被篡夺、微信聊天纪录会不会满天飞”的级别。

但问题的中枢在于,官方放出这些案例,不是为了骄傲“粗心有多毒”,而是证实 AI 无用任何外挂用具,纯靠我方的学问储备和跨维度推理,就能挖出新粗心。

是以,在文安看来,现阶段的 Mythos 并不是“更强的黑客用具”,而是把集合挫折门槛给镌汰了。

曩昔岂论是正经安全东谈主员照旧黑灰产,起码得有个懂行的东谈主镇守,真要搞一次像样的集合挫折,还得小黑屋里熬上几个月。

但以后,可能村口的小黑胖抠着脚,对着 AI 喊两句麦就行。

这种有手就行的低门槛,例必会引来无数乐子东谈主和法外狂徒,玩一把、试一试。

是以文安以为,Anthropic 先整出个 Glasswing 缱绻挺合理的。

今夜之间 你的手机电脑要冒出无数bug了?

毕竟,传统安全用具就像拘泥的门卫,只会查有莫得带犯禁品,管不了熟东谈主作案;而 AI 能拔树搜根看懂业务逻辑,更能发现那种张三拿着我方的钥匙,却去开李四的门的操作。

提前让大厂们进行自我审查、试用,能够更先一步构筑集合保护、进行粗心筛查,驻防于未然。

至于 AI 期间的集合安全,文安照旧比拟乐不雅的。

一来,现时的 AI 还没成精,搞不定罕见复杂的连环挫折链。你暂时无用惦记,有东谈主靠 AI,盗走你支付宝里那仅剩的 9 块 2 毛 5。

另一方面,AI 能找洞,天然也能补洞,有了它,扫洞后果径直拉满,还能趁便率领下拓荒粗心该怎样修。

是以,文安的判断是,改日的集合攻防,约略率即是“东谈主类教授官 + AI 特种兵”的夹杂双打。

今夜之间 你的手机电脑要冒出无数bug了?

何况吧,差评君仔细看了看最新的时间文档,也以为 Anthropic 还真不像是在搞噱头,不光是前边说的集合安全才能出色,Mythos 展现出其它方面的才能,也罕见惊东谈主。

比如在一次测试中,Mythos 发现莫得造访权限,正常的响应是说出来:"我没权限,臣妾作念不到啊"。

可它偏不这样干,径直去读取沙箱底层,试图从内存里径直把造访令牌搞出来。

今夜之间 你的手机电脑要冒出无数bug了?

还有次测试中,模子运用了一个文献权限粗心,对敏锐文献握手握脚了。

作念完这一切,Mythos 还顺遂修改了我方的历史提交纪录,把这事儿给抹去了。

鉴定到我方作念了不该作念的事,然后它选拔了毁尸灭迹。。。

还有一次,Mythos 在进行测试,不贯注把书翻到终末一页搞到了谜底,这操作其实是被敕令温暖的。

可征询东谈主员翻看它的念念维链时才发现,它不仅没告发我方,还想着我方的标准好像和限制对不上,得在最终谜底里引入一个小无理,看起来是我方作念出来的题,而不是抄到了谜底。

今夜之间 你的手机电脑要冒出无数bug了?

我说真话,这个操作,比当年抄我数学试卷的同桌精粹多了,否则我俩也不会被罚去扫茅厕了。

不外这也不是外界传的那么玄乎,什么通盘这个词硅谷王人发怵了,Anthropic 雇主吓得瘫坐在椅子上了。。。

征询东谈主员也出来澄莹了,依然搞明晰了这些心计操作的原因,根本不是 AI 有什么粗野标的或者自主筹备才能。

他们还通过反复强化试验,把近似算作的发生率降至百万分之一以下了。

但咱就有计划着,百万分之一听起来很低,但若是这个模子每天被调用几十亿次呢?

今夜之间 你的手机电脑要冒出无数bug了?

是以,回突出来看,与其骂 Anthropic 搞 Glasswing 缱绻是搞营销,我们倒是更答允信服,他们是真以为自家的 AI 有点强了。

天然就像文安说的那样,浅显东谈主现时如实还无用惦记我方的微信被黑、余额被盗。

但当挫折的本钱无尽趋近于零,我们独一能指望的九游体育app官网,现存的退守机制,能再完善一些。