标签: 强化学习

包含标签 "强化学习" 的所有文章：

代码效率优化的新突破：强化学习如何帮助大语言模型实现自我进化
发表:2025年6月27日 at 11:00
大型语言模型（LLMs）已经在代码生成领域取得了显著进步，但生成的代码虽然功能正确，却往往存在效率低下的问题。这一研究缺口正是由南洋理工大学、新加坡国立大学、香港大学、西安交通大学和字节跳动的联合研究团队着手解决的。在最近发表的论文《Afterburner: Reinforcement Learning Facilitates Self-Improving Code Efficiency Optimization》中，研究团队提出了一种创新的迭代优化框架，通过闭环系统让大语言模型不断改进代码效率。
MLNLP社区发布《动画中学强化学习笔记》项目！
发表:2025年3月30日 at 12:00
本项目旨在通过动画的形式，生动地展示强化学习的核心概念和算法，使学习者能够更直观地理解强化学习的原理。项目内容包括详细的动画演示以及相关的学习资源。

代码效率优化的新突破：强化学习如何帮助大语言模型实现自我进化