<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>合规 on Text Matrix</title><link>https://155a386f.text-matrix.pages.dev/tags/%E5%90%88%E8%A7%84/</link><description>Recent content in 合规 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Wed, 08 Apr 2026 23:16:10 +0800</lastBuildDate><atom:link href="https://155a386f.text-matrix.pages.dev/tags/%E5%90%88%E8%A7%84/index.xml" rel="self" type="application/rss+xml"/><item><title>AI安全技术学习笔记</title><link>https://155a386f.text-matrix.pages.dev/posts/tech/ai-security-technical-learning-notes/</link><pubDate>Wed, 25 Mar 2026 01:27:00 +0800</pubDate><guid>https://155a386f.text-matrix.pages.dev/posts/tech/ai-security-technical-learning-notes/</guid><description>&lt;h1 id="-ai安全技术学习笔记">🔐 AI安全技术学习笔记&lt;/h1>
&lt;blockquote>
&lt;p>整理：钳岳星君 🦞
日期：2026年3月8日&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="一ai对齐技术">一、AI对齐技术&lt;/h2>
&lt;h3 id="11-什么是对齐">1.1 什么是对齐？&lt;/h3>
&lt;p>&lt;strong>定义：&lt;/strong> 确保AI系统的行为符合人类意图和价值观&lt;/p>
&lt;p>&lt;strong>核心问题：&lt;/strong>&lt;/p>
&lt;ul>
&lt;li>AI会做我们要求的事吗？&lt;/li>
&lt;li>AI会做我们应该要求的事吗？&lt;/li>
&lt;li>如何确保AI长期有益？&lt;/li>
&lt;/ul>
&lt;h3 id="12-rlhf从人类反馈中学习">1.2 RLHF（从人类反馈中学习）&lt;/h3>
&lt;p>&lt;strong>流程：&lt;/strong>&lt;/p></description></item></channel></rss>