2025-08-09 07:09:24

GROK 4：推动基准的人工智能

xAI 跳过了 3.5 直接进入 Grok 4，数字显示了原因。

基准测试将其置于该领域的顶端，单代理模型的人类最后考试得分为38.6%，而Grok 4 Heavy的得分为44.4%。

ARC-AGI 结果也设定

GROK5.32%

XAI6.46%

WHY1.37%

H14.72%

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

8人点赞了这条动态

0/400

Crypto历史课

· 8小时前

啊，是的……来自互联网泡沫时代的经典“跳过版本”剧本。摇头，这些指标让我有严重的1999年思科的感觉。

查看原文回复0

FUD_Whisperer

· 8小时前

啊马斯克牛批起飞咯

不明觉厉老张

· 8小时前

直接无视3.5这操作可以

SerumSurfer

· 8小时前

这飞了一步说明马斯克真急啊

WalletsWatcher

· 8小时前

这是啥玩意啊数字好高啊

治理投票从不参与

· 8小时前

离谱真就直接跳到4.0了