克拉玛依隔热条设备 公开版Mythos上线,Claude强模子运转分层发售

文 | 字母 AI克拉玛依隔热条设备
Anthropic 终于把 Mythos 向了公开阛阓,但分层发售。
凌晨,Anthropic 崇拜发布 Claude Fable 5 和 Claude Mythos 5。前者面向世俗用户敞开,后者则络续扬弃在"受信任的安全作伙伴"范围内。
新模子的定名不错说很符 Claude 贯的立场。
从 Haiku(俳句)到 Sonnet(十四行诗)再到 Opus(艺术巨著),Anthropic 直在用文体和艺术成见给模子分层,到了 Mythos,名字仍是从文体作品延长到"听说"自己。
Fable 来自拉丁语 fabula,好奇羡慕是"被讲述之物",和希腊语 mythos 同源,直译过来的话般被称为"寓言"。这个名字正如新模子的定位,个" Mythos "的模子,个"公开的听说"。
按照 Anthropic 的刻画,Fable 5 和 Mythos 5 分享同个底层模子,仅仅被装进了适公开分发的安全壳里。在官给出的模子才略上,它们两个被放在同个位置。
但跑分归跑分,若是 Fable 和 Mythos 的阐扬样,我思应该也无谓分红两个名字了。
01 被改写的"听说"
听说被改写、被压缩、被加上教训之后,形成了寓言。
按照官文档,Fable 5 是公开版块。它面向世俗用户和开拓者敞开,但在汇集安全、生物、化学以及模子蒸馏等风险域,会由疏淡的安全分类器介入。旦系统判断恳求可能触及这些明锐向,回话就不会由 Fable 5 络续完成,而是自动回退到 Claude Opus 4.8。
Mythos 5 基于一样的底层模子,但在部分域肃清了 Fable 5 的护栏。Anthropic 称,Project Glasswing 里的汇集安全作伙伴不错使用"满版" Mythos 5;改日,部分生命科学究诘者也可能通过受信任捕快方针,使用肃清生物和化学扬弃的版块。
用不到的 Mythos 咱们暂时不提,先看点确实的东西。
先是订价,个字,贵。
Fable 5 的订价是输入 10 好意思元 / 百万 token,输出 50 好意思元 / 百万 token。开拓者当今就不错通过 Claude API 调用 claude-fable-5(模子名)。
这个价钱刚好是 Opus 4.8 的两倍,和 Opus 4.8 的 fast mode 相易,Anthropic 显著把它放在了比 Opus 档的价钱层里。
不外 Anthropic 称,这价钱不到此前 Claude Mythos Preview 的半——但由于 Mythos Preview 并非公开 API 模子,官并未给露面向公众的尺度价,这句话也从考证。
订阅用户也需要详实,Fable 5 不定会始终平直包含在基础订阅包里。
Anthropic 在官领悟中提到,6 月 23 日以后,即使用户仍是订阅 Claude,Fable 5 也可能根据算力情况按量提供,不定会平直包含在基础订阅做事中。
这公司越来越悭吝了,不外好赖还留了小半个月试用期。官也留了点余步:若是 6 月 23 日以后算力资源弥散,Anthropic 会尽量把 Fable 5 络续包含在 Pro、Max 等订阅做事里。
订价自己并捏造以相识,但它好保证它的才略配得上它的价钱。
从跑分上看克拉玛依隔热条设备,Fable 5/Mythos 5 基本是 Anthropic 咫尺公开内外强的档。
不外官表格有个领悟,Claude Fable 5 和 Claude Mythos 5 的分数般只差 1 – 3 个百分点(除了带星号的汇集安全、生物关联测试),是以内外泄露的是两者的分数。这点很难不让东谈主思要吐槽。
Anthropic 把 Fable 5 的放在几个向:软件工程、学问职责、视觉、长险阻文回首和生命科学究诘。
软件工程是凸起的场景之,根据表格,Fable/Mythos 5 在 SWE-Bench Pro 上达到 80.3,显著于 Opus 4.8 的 69.2;在难的 FrontierCode Diamond 上,它拿到 29.3,而 Opus 4.8 只须 13.4,GPT-5.5 只须 5.7。
学问职责和视觉任务上,Anthropic 给出了两类字据。
类是尺度化 benchmark。官表格泄露,Fable/Mythos 5 在 GDPval-AA 上得分 1932,于 Opus 4.8、GPT-5.5 和 Gemini 3.1 Pro;在 GDP.pdf 这种带视觉相识的文档任务上,它达到 29.8,也过其他主要模子。
另类是早期客户测试。Anthropic 称,Fable 5 在 Hebbia 的金融理基准上赢得分,势聚会在文档理、图表和表格相识、问题求解;IMC 也反应,它在往来分析评估中简直通过。
为了展示 Fable 5 的视觉才略,Anthropic 举的例子是:此前 Claude 模子需要复杂赞成用具才气玩《宝可梦 火红》,而 Fable 5 只靠视觉输入就不错通关。
长任务和回首才略上,Anthropic 称,Fable 5 不错在数百万 token 的始终任务中保捏注,并应用我方的条记雠校输出。
在《戮塔》这类需要纠合方案和始终战术的游戏里,若是给 Fable 5 接入捏久文献回首,让它能纪录前边的聘用和履历,它的阐扬会显著晋升。晋升幅度是 Opus 4.8 的三倍,到达终关卡的次数也提了三倍。
趁便提,Fable 亦然款经典 RPG 游戏的名字,汉文译作《神鬼寓言》——好像某天咱们能看到 Fable 玩《Fable》。
另外,汇集安全才略面,Fable/Mythos 5 在 ExploitBench Cap 上达到 78.0,隔热条设备过 Claude Mythos Preview 的 69.0,接近 Opus 4.8 的两倍。
这里用的应该是 Mythos 5 的得分,因为 Fable 5 在风险恳求上会回退到 Opus 4.8。
02 精深的模子须分层
Anthropic 此次把模子才略的直不雅展示放到了个近似"作品集"的滑页里,况且每个 demo 只给了小段疑望。
比如,Fable 5 写了个太阳系模拟,从物理道理行星轨谈通顺,并用它瞻望日食。
又比如,它不错自主玩《异星工场》。这是款工程师很的工场自动化游戏,玩要齐集资源、筹谋坐褥线、搭建物流和动力系统。
Anthropic 用这个例子领悟,Fable 5 不错在个敞开环境里制定战术,并捏续进个复杂系统的配置。
在另个 demo 里,Fable 5 先作念了个基于浏览器的 CAD 剪辑器,然后又使用这个由我方开拓的 CAD 用具,缱绻了个不错 3D 印的齐全模子。这个剪辑器里还内置了 AI copilot,用来赞成建模。
这个 demo 的在于 Fable 5 完成了个闭环:先创造用具,再使用用具,后完成个实体缱绻任务。
后个 demo,Anthropic 展示了个由 Fable 5 写出来的流体模拟,通顺节律和段古典音乐 EDM remix 同步。官还畸形提到,音乐亦然 Fable 5 用代码生成的。
这些案例看起来挺花哨,但好奇羡慕是样的:Fable 5 很擅长把代码、视觉、物理、缱绻和始终筹谋混在起作念任务。
若是说这部分展示的照旧 Fable 5 在开拓者手里能作念到什么进度,背面的部分说的即是 Mythos 5 在究诘者手里能作念什么——以及 Anthropic 为什么要把 Fable 和 Mythos 分开。
Anthropic 称,在里面卵白缱绻的评估中,Mythos 5 把药物缱绻历程中的部分设施加快了梗概 10 倍。其中个案例里,Mythos 5 接入卵白缱绻和生物信息学用具、莫得东谈主类匡助,就不错匹配以至过熟悉东谈主类操作员。
在该任务中,Mythos 5 作念的不是简短问答,而是完成整套科学职责流:聘用结位点,聘用并运行卵白缱绻用具,在失败后我方收复。官称,在这项究诘的 14 个卵白靶点中,有 9 个产生了强候选分子,咫尺正在逾越究诘。
Anthropic 还提到,Mythos 5 不错踏实忽视新颖、有眩惑力的分子生物学假定。在和 Opus 模子的盲测对比中,里面科学梗概 80 的时候偏好 Mythos 忽视的假定,其中些仍是插足实验评估。
与此同期,Mythos 5 的个对于大肠杆菌卵白的新机制的假定,在另立究诘同问题的实验室的究诘中得到了证明。
它以至还作念了项基因组学究诘。
Anthropic 称,Mythos 5 在周多的时辰里,简直自主完成了项新的基因组学究诘。它整理了横跨 138 种动物、数百万个细胞的单细胞数据,并缱绻、考验了个定制机器学习模子,用来识别不同物种中施行相易角的细胞。
夸张的是,Anthropic 称,Mythos 5 考验出的模子能过了近期发表在《Science》上的个模子,尽管它的范围只须后者的百分之。Anthropic 示意,方针在改日几个月发表这些后果。
诚然,这部分还需要恭候论文和外部复核。但若是只看 Anthropic 官给出的信息,Mythos 5 在生命科学里展示的才略仍是接近科研 Agent:能读问题、用用具、管制数据、考验模子、忽视假定,并把项究诘进到不错发表的进度。
而旦模子不错在药物缱绻、病毒载体、卵白缱绻、基因组学究诘这些向里真实进任务,它就具备双重用途。
不错以为,生命科学这部分不是 Fable 5 的世俗演示,而是 Mythos 5 的才略上限展示。
但它被展示出来,是为了领悟 Anthropic 手里的这套底层模子,仍是强到了须通过受信任捕快来分发。
有好奇羡慕的是,往常的模子发布像是件时代家具的事:参数、跑分、价钱、险阻文长度、API 称号。强即是强,发布即是发布。
但到了 Mythos 这里,事情运滚动得复杂。同个底层模子被分为两个版块,世俗用户拿到的是 Fable 5,安全究诘者和部分生命科学究诘者拿到的是 Mythos 5;前者被装进严格的护栏里,后者则需要受信任捕快。
模子才略不再只须低之分,也运转有权限、场景和牵累之分。
某种道理上来讲,不错看作前沿模子贸易化插足新阶段的信号——越强的模子,越不可能平直扔给统统东谈主。它们会被拆成不同版块,放进不同安全范围,再交给不同类型的用户。
Anthropic 先这样作念了,因为它们的模子"强到弗成公开"。改日其它思要讲故事的公司,思要解说我方的模子也很强,好像也会仿这种式。手机:18631662662(同微信号)相关词条:玻璃棉毡 塑料挤出机 预应力钢绞线 铁皮保温 万能胶生产厂家
1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。
