马斯克 xAI 推出 Grok-1.5 大语言模型!升级推理能力

导读  3 月 29 日消息,马斯克旗下人工智能公司xAI今天在官方博客中宣布,即将正式推出Grok-1.5 大语言模型。  据介绍,Grok-1.5

   3 月 29 日消息,马斯克旗下人工智能公司xAI今天在官方博客中宣布,即将正式推出Grok-1.5 大语言模型。

  据介绍,Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和现有的 Grok 用户推出。

_url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F0329%2F3091007aj00sb39cp00bgd0014000hng

  在官方测试中,Grok-1.5 在 MATH 基准上取得了 50.6% 的成绩,在 GSM8K 基准上取得了 90% 的成绩,这两个数学基准涵盖了广泛的小学到高中竞赛问题。此外,它在评估代码生成和解决问题能力的 Humaneval 基准测试中得分为 74.1%。

  据介绍,Grok-1.5 构建在基于 JAX、Rust 和 Kubernetes 的自定义分布式训练框架之上。自定义训练协调器可确保自动检测到有问题的节点并将其从训练作业中剔除。xAI还优化了检查点、数据加载和训练作业重新启动,以最大限度减少发生故障时的停机事时间。

免责声明:本文章由会员“刘龙林”发布如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系