<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>GRPO on Text Matrix</title><link>https://155a386f.text-matrix.pages.dev/tags/grpo/</link><description>Recent content in GRPO on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Wed, 08 Apr 2026 23:16:10 +0800</lastBuildDate><atom:link href="https://155a386f.text-matrix.pages.dev/tags/grpo/index.xml" rel="self" type="application/rss+xml"/><item><title>Agent Lightning：微软 AI 智能体强化学习训练框架完全指南</title><link>https://155a386f.text-matrix.pages.dev/posts/tech/ai-agent/agent-lightning-microsoft-ai-agent-training-guide/</link><pubDate>Wed, 01 Apr 2026 01:20:00 +0800</pubDate><guid>https://155a386f.text-matrix.pages.dev/posts/tech/ai-agent/agent-lightning-microsoft-ai-agent-training-guide/</guid><description>&lt;h1 id="agent-lightning微软-ai-智能体强化学习训练框架完全指南">Agent Lightning：微软 AI 智能体强化学习训练框架完全指南&lt;/h1>
&lt;h2 id="1-学习目标">§1 学习目标&lt;/h2>
&lt;p>完成本文档后，你将能够：&lt;/p>
&lt;ul>
&lt;li>✅ 理解 Agent Lightning 的核心定位与设计理念&lt;/li>
&lt;li>✅ 掌握 Agent Lightning 的安装与基本使用方法&lt;/li>
&lt;li>✅ 理解 Agent Lightning 的架构设计与 LightningStore 原理&lt;/li>
&lt;li>✅ 使用 Agent Lightning 训练任意框架的智能体&lt;/li>
&lt;li>✅ 配置强化学习、自动提示优化、监督微调等算法&lt;/li>
&lt;li>✅ 利用轨迹级聚合（TLA）加速训练&lt;/li>
&lt;li>✅ 构建生产级别的智能体训练流程&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="2-项目概述">§2 项目概述&lt;/h2>
&lt;h3 id="21-什么是-agent-lightning">2.1 什么是 Agent Lightning？&lt;/h3>
&lt;p>&lt;strong>Agent Lightning&lt;/strong>（&lt;a href="https://github.com/microsoft/agent-lightning" target="_blank" rel="noopener noreffer ">GitHub 仓库&lt;/a>）是微软研究院开发的 AI 智能体训练框架，核心理念是「The absolute trainer to light up AI agents」。&lt;/p></description></item></channel></rss>