【[117星]nanoAhaMoment:单文件强化学习库,专为LLM设计,不到

爱生活爱珂珂 2025-04-05 08:38:09

【[117星]nanoAhaMoment:单文件强化学习库,专为LLM设计,不到700行代码即可实现高效训练。亮点:1. 单GPU即可训练3B参数模型;2. 从零开始的详细视频教程,快速上手;3. 高效训练,10小时内完成R1-zero倒计时任务】

'Introducing nanoAhaMoment: Karpathy-style, single file RL for LLM library (

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注