GROK 4:推动基准的人工智能



xAI 跳过了 3.5 直接进入 Grok 4,数字显示了原因。

基准测试将其置于该领域的顶端,单代理模型的人类最后考试得分为38.6%,而Grok 4 Heavy的得分为44.4%。

ARC-AGI 结果也设定
GROK5.32%
XAI6.46%
WHY1.37%
H14.72%
查看原文
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 转发
  • 分享
评论
0/400
Crypto历史课vip
· 8小时前
啊,是的……来自互联网泡沫时代的经典“跳过版本”剧本。摇头,这些指标让我有严重的1999年思科的感觉。
查看原文回复0
FUD_Whisperervip
· 8小时前
啊 马斯克牛批 起飞咯
回复0
不明觉厉老张vip
· 8小时前
直接无视3.5这操作可以
回复0
SerumSurfervip
· 8小时前
这飞了一步说明马斯克真急啊
回复0
WalletsWatchervip
· 8小时前
这是啥玩意啊 数字好高啊
回复0
治理投票从不参与vip
· 8小时前
离谱 真就直接跳到4.0了
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)