一张图看QLoRAQLoRA通过结合NF4量化(一种考虑权重分布的4位

又仁看科技 2025-04-05 20:52:13

一张图看QLoRA

QLoRA 通过结合 NF4 量化(一种考虑权重分布的 4 位量化)、双重量化(进一步压缩量化常数)和 LoRA(只训练少量适配器参数)来实现高效微调。其核心优势在于,它显著降低了存储模型权重所需的内存,并且在反向传播(梯度计算和参数更新)期间,冻结的基础模型权重保持低精度(NF4)状态,从而大幅减少了训练过程中的显存占用,使得在有限的硬件资源(如单个 GPU)上微调非常大的模型成为可能。

图自TheAiEdge.io

0 阅读:0
又仁看科技

又仁看科技

感谢大家的关注