【[69星]Agentica-project/verl-pipeline:为大规

爱生活爱珂珂 2025-05-08 20:56:53

【[69星]Agentica-project/verl-pipeline:为大规模语言模型(LLM)的强化学习训练提供高效、灵活的解决方案。亮点:1. 支持高达70B参数模型和数百个GPU的扩展;2. 集成多种主流LLM框架,如PyTorch FSDP、Megatron-LM和vLLM;3. 提供多种强化学习算法,如PPO、GRPO和ReMax】

'Async pipelined version of Verl'

GitHub: github.com/agentica-project/verl-pipeline

强化学习 大规模语言模型 高效训练 AI创造营

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注