这个类比有点意思。
在学校学习知识,有点像模型的预训练,而步入社会的实践和成长,这像后训练的微调。
所以我们现在说模型的预训练依然重要,基石模型依然重要,而光有 RL,光有微调是不够的。
也就是我们要有更科学的教育方法,本科完了研究生,研究生完了博士,持续提升一个人的上限,提升学习能力、思辨能力。太早的毕业,高中毕业,大专毕业,哪怕极为丰富的社会历练,也是不够的。
这个类比有点意思。
在学校学习知识,有点像模型的预训练,而步入社会的实践和成长,这像后训练的微调。
所以我们现在说模型的预训练依然重要,基石模型依然重要,而光有 RL,光有微调是不够的。
也就是我们要有更科学的教育方法,本科完了研究生,研究生完了博士,持续提升一个人的上限,提升学习能力、思辨能力。太早的毕业,高中毕业,大专毕业,哪怕极为丰富的社会历练,也是不够的。
猜你喜欢
作者最新文章
热门分类
汽车TOP
汽车最新文章