斯坦福新研究：用强化学习提升LLM汇编能力，性能超过了gcc-O3。他们用了

量子位来谈科技 2025-05-20 18:14:54

斯坦福新研究：用强化学习提升LLM汇编能力，性能超过了gcc -O3。他们用了一种叫PPO（Proximal Policy Optimization）的强化学习方法，让模型像游戏一样“闯关”，每次输出一个新版本的汇编代码，如果跑得更快、测试不报错，就能拿到“奖励”，从而不断提升奖励分数。整个过程可以理解为三步走： 1、准备数据：整理了一个超大的训练集，包含8072个真实世界的C程序、它们的gcc -O3汇编版本，以及一套专门的测试用例。 2、模型选型：用Qwen2.5-Coder-7B-Instruct模型作为基模型。 3、强化训练：让模型在生成汇编代码时不断试错，又对又快才得分，逐步学会哪些修改才是真的“性能提升”。训练结果非常硬核： - 测试通过率从原始的61%提升到96% - 平均加速比达到 1.47×，明显超过 gcc -O3 - 模型能主动做出类似“用popcnt指令替代循环”这样的语义级优化，而不是简单套模板值得注意的是，这套机制强调的是“优化”而不是“生成”： - 研究发现，完全让模型从头写汇编，LLM表现一般 - 但只要给它一个gcc的输出作参考，它就能在此基础上进一步提速，类似人类“看着编译器输出再调一调”的做法总结来看，这项研究的亮点在于： - 用强化学习提升LLM汇编能力，不再只追求语言理解，而是走向实用层面的系统性能优化 - 它不是替代编译器，而是在编译器之后再进一步提升，是一种新的优化“后处理”思路 - 长远看，大模型未来可能成为编译器工具链中的一环，接手人类最难调的代码瓶颈未来搞极限性能优化时，也许不需要硬核工程师手改汇编了，直接把任务甩给一个强化学习过的LLM，它就能把gcc编出来的程序优化得飞起。感兴趣的小伙伴可以查看论文：

0 阅读：0

量子位来谈科技

感谢大家的关注

作者最新文章

1

Qwen新功能：一句话生成网站，支持直接部署上线，也就是“写一句话，出一个站”。

2

斯坦福新研究：用强化学习提升LLM汇编能力，性能超过了gcc -O3。他们用了

3

抖音黑板报发布公告，启动针对“AI起号”的专项治理行动，整顿借助AI技术批量运营

4

两种主流生成模型Flow Matching和Diffusion有啥区别？从结果

5

微软推出AI科研平台Microsoft Discovery，它能用AI智能体加速

6

在Build 2025大会上，微软宣布：Windows 11将原生支持 MCP（

7

继OpenAI发布编程智能体CodeX后，GitHub也上新了他们的编程智能体—

8

可以正式在手机上访问NotebookLM啦！适用于安卓和苹果系统的Notebo

9

号称支持无限上下文的AI智能体Neo，一经上线就引爆了众人的关注！这款智能体来

10

WSL（Windows Subsystem for Linux）终于开源啦！现

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

说刘强东作秀的，你们让王兴也秀一个噻，或者你们自己做一天体验一下。一个千亿身价的

2

目前接近完美的6部手机，有你在用的嘛？

3

昨天，华为终端发布华为nova全球代言人易烊千玺手持华为nova14系列的海报

4

国外拆解Mate30，零部件国产率仅为30%，国外拆解Mate30 5G，零部

5

618手机大促，不同价位手机，超值推荐！你觉得618购买手机性价比高吗？

6

格力电器董明珠董事长的“海归论”，遭到一些人的批评和质疑，个人觉得大可不必。

7

刚刚！#一加13T#首销10分钟破两亿！这手机我也用了几天，最大的感受是真爽，单

8

网传华为nova14部分规格曝光：全系内存12GB，超大杯麒麟9系芯片+红枫多光

9

2025年国产四款手机对比：性能与拍照大比拼！你更喜欢哪款手机拍照呢？

10

一加手机设计不套娃了，上回13T是一个样，现在Ace5至尊又另一个样。至于金色机

科技最新文章

1

一加Ace5至尊系列官宣5月27日发布，竞速版搭载天玑9400e处理器，至尊版搭

2

一加手机设计不套娃了，上回13T是一个样，现在Ace5至尊又另一个样。至于金色机

3

我问我老公:小米花135亿就造出了3纳米芯片，是真的吗？老公斜我一眼:如果从

4

华为nova1412+256GB2699元12+512GB2999元12+5

5

气死个人，首发9899买的三星S25Ultra，现在跌成这个样子不过说真的，现

6

OPPOReno14、vivoS30、荣耀400怎么选？看来5月份不少厂商

7

目前京东自营平台，销量累计排行榜，iPhone四款机型全部名列前茅这是意料之中的

8

vivoS30小屏新机：能否力压X200mini成真香之选？不少人在讨论

9

6.5寸的屏幕塞进了7200mh高硅超大电池，这次不仅听劝给你金属边框，还把金属

10

618手机大促，不同价位手机，超值推荐！你觉得618购买手机性价比高吗？

随机资讯

1

高薪低能？保罗乔治的挣扎与快船的明智选择——NBA球星价值何在？

2

逆转之谜：王祉怡如何在领先后痛失好局？

3

中超转会风云再起：莱昂纳多加盟上海海港，能否重燃夺冠希望？

4

曼城豪掷1.5亿欧元签下4大巨星，能否逆转英超争冠局势？

5

洛夫顿缺阵，上海男篮如何保持连胜势头？揭秘霍金斯的生涯之夜！

6

福建队如何在逆境中逆袭新疆队？揭秘篮球赛场上的惊天逆转！

7

CBA裁判会议聚焦张宁与徐杰：公正判罚还是过度针对？

8

西班牙足球的巅峰对决：皇马与巴萨，谁能主宰国家德比？

9

上海男篮能否在缺少双核的情况下战胜江苏队？

10

北控男篮关键时刻罚球失误，广东男篮能否延续连胜纪录？