<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>阿里巴巴 on Text Matrix</title><link>https://155a386f.text-matrix.pages.dev/tags/%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4/</link><description>Recent content in 阿里巴巴 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Wed, 08 Apr 2026 23:16:10 +0800</lastBuildDate><atom:link href="https://155a386f.text-matrix.pages.dev/tags/%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4/index.xml" rel="self" type="application/rss+xml"/><item><title>Page Agent：阿里巴巴开源的网页内置 GUI Agent</title><link>https://155a386f.text-matrix.pages.dev/posts/tech/page-agent-alibaba-gui-agent-guide/</link><pubDate>Mon, 06 Apr 2026 21:20:00 +0800</pubDate><guid>https://155a386f.text-matrix.pages.dev/posts/tech/page-agent-alibaba-gui-agent-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解 Page Agent 的项目定位、技术架构和设计理念&lt;/li>
&lt;li>掌握在网页中集成 Page Agent 的两种方式（CDN 一行代码 + NPM）&lt;/li>
&lt;li>学会使用文本化 DOM 操作进行自然语言浏览器控制&lt;/li>
&lt;li>理解 MCP Server 的架构和外部控制能力&lt;/li>
&lt;li>掌握 Chrome 扩展实现多页面 Agent 的方法&lt;/li>
&lt;li>理解与 browser-use 的差异化定位&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>Page Agent 是阿里巴巴开源的&lt;strong>网页内置 GUI Agent&lt;/strong>，核心理念是：&lt;strong>The GUI Agent Living in Your Webpage&lt;/strong>——让网页拥有自己的 AI Agent，通过自然语言控制网页界面。&lt;/p></description></item></channel></rss>