Grok-3发布,刷新LLM天花板Grok-3发布,成为ArenaLMSYS

莉莉聊科技 2025-02-18 21:20:53

Grok-3 发布,刷新LLM天花板

Grok-3发布,成为Arena LMSYS 首个超过1400 分的模型

Grok3 比 Grok2 多了十倍的计算量,而且支持推理

Grok 3 推理测试版的 AIME 和 GPQA 分别达到 96 分和 85 分,与完整版 o3 相当。

Grok 3 在 AIME 2025(几天前刚刚结束的数学竞赛)上的表现非常出色 。

Grok3在今年1月初完成pretrain,现在依旧在持续训练。

0 阅读:44

评论列表

Dreamway

Dreamway

2
2025-02-19 08:30

免费吗?

莉莉聊科技

莉莉聊科技

感谢大家的关注