<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Agent on Code Plato</title><link>https://CodePlato3721.github.io/zh/tags/agent/</link><description>Recent content in Agent on Code Plato</description><generator>Hugo -- gohugo.io</generator><language>zh</language><lastBuildDate>Thu, 28 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://CodePlato3721.github.io/zh/tags/agent/index.xml" rel="self" type="application/rss+xml"/><item><title>Agent Skill 制作手册 01：入门篇</title><link>https://CodePlato3721.github.io/zh/post/agent-skill-%E5%88%B6%E4%BD%9C%E6%89%8B%E5%86%8C-01-%E5%85%A5%E9%97%A8%E7%AF%87/</link><pubDate>Thu, 28 May 2026 00:00:00 +0000</pubDate><guid>https://CodePlato3721.github.io/zh/post/agent-skill-%E5%88%B6%E4%BD%9C%E6%89%8B%E5%86%8C-01-%E5%85%A5%E9%97%A8%E7%AF%87/</guid><description>&lt;img src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/agent-skill-handbook-01-getting-started/banner.png" alt="Featured image of post Agent Skill 制作手册 01：入门篇" /&gt;&lt;p&gt;Agent Skill 制作手册是一个系列教程。这是第一篇。&lt;/p&gt;
&lt;h2 id="什么是-skill"&gt;什么是 skill
&lt;/h2&gt;&lt;p&gt;很多程序员问，Agent Skill 是什么？我敢说，Agent Skill 是你们学习编程以来能学到的最简单的技术之一。&lt;/p&gt;
&lt;h3 id="skill-是怎么发展出来的"&gt;skill 是怎么发展出来的
&lt;/h3&gt;&lt;p&gt;就像跟人一起工作一样。你有一个新入职的同事，就算他技术再好，也总要先看一些你们公司的 how to 文档，才能开始做事。人们发现，跟 LLM 工作也有同样的模式。你让 LLM 直接做事情，那多半会做出一件偏离你预期的漂亮事，这就很尴尬了。&lt;/p&gt;
&lt;p&gt;然后就有人发现，如果先在提示词里面加上做事情的步骤，LLM 就做得好。所以大家就一直给 LLM 喂 how to 手册。&lt;/p&gt;
&lt;p&gt;但是 LLM 的上下文有限啊，而且你每次塞这么多上下文，你的钱包先爆了。于是人们又想，其实我们自己工作的时候也记不住 how to 的内容。我们大概记得有那么个 how to 教了我做这件事情，但具体内容不记得了。没关系啊，我们到时候再去 wiki 看看不就得了。那我们也可以让 LLM 只记住这个 how to 是做什么的，具体需要的时候再看呗。于是我们可以把每一个 how to 的描述喂给 LLM，LLM 看描述就知道，需要做事情的时候要找哪个 how to 了。&lt;/p&gt;
&lt;p&gt;到这里，我们已经可以推导出一个简单的、给 LLM 量身定做的 how to 了。它只有两个重要属性：&lt;code&gt;name&lt;/code&gt; 和 &lt;code&gt;description&lt;/code&gt;，剩下的就是正文了。每次加载只加载 &lt;code&gt;name&lt;/code&gt; 和 &lt;code&gt;description&lt;/code&gt;，LLM 自己会判断是否需要读取这个 how to 的正文。&lt;/p&gt;
&lt;p&gt;&lt;img alt="skill 结构示意图" class="gallery-image" data-flex-basis="320px" data-flex-grow="133" height="1086" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/agent-skill-handbook-01-getting-started/01.png" srcset="https://CodePlato3721.github.io/01_17950217286682826352_hu_ad092d28159b7ab2.png 800w, https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/agent-skill-handbook-01-getting-started/01.png 1448w" width="1448"&gt;&lt;/p&gt;
&lt;p&gt;这就是 skill。其实这个东西叫什么不重要，它可以叫 howto、guide、manual 都可以，但是大家觉得 skill 这个名字够短、好记，还自解释，就用它了。可能在别的平行宇宙里，它叫 guide。&lt;/p&gt;
&lt;h3 id="skill-是哪家的"&gt;skill 是哪家的？
&lt;/h3&gt;&lt;p&gt;这种 &lt;code&gt;SKILL.md&lt;/code&gt; 形态的 Agent Skill，最早是 Anthropic 系统公开推广的；但 skill 这个词和&amp;quot;让 AI 学技能&amp;quot;的思想并不属于某家公司。OpenAI、OpenClaw、Hermes Agent 都有自己实现的 skill。这只是一个概念，各家有各家自己的实现，这些实现在细节上有些区别，但都是指同一个事情。&lt;/p&gt;
&lt;h2 id="怎么写-skill"&gt;怎么写 skill
&lt;/h2&gt;&lt;h3 id="skill-通用规范"&gt;skill 通用规范
&lt;/h3&gt;&lt;p&gt;各家的 skill 规范的共同点是：skill 是一个文件夹。结构是：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;my-skill/
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; SKILL.md # 必须：元数据 + 指令
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; scripts/ # 可选：可执行脚本
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; references/ # 可选：文档、说明、规范
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;而其中的 &lt;code&gt;scripts&lt;/code&gt;、&lt;code&gt;references&lt;/code&gt; 都不是必须的，只是大家习惯的一种最佳实践而已。最重要的是 &lt;code&gt;SKILL.md&lt;/code&gt;。有的 skill 只有这一个文件，而这个文件的结构也很简单。&lt;/p&gt;
&lt;p&gt;一个最小的 &lt;code&gt;SKILL.md&lt;/code&gt;，在元数据层面只需要 &lt;code&gt;name&lt;/code&gt; 和 &lt;code&gt;description&lt;/code&gt;。正文可以很短，但最好写清楚 agent 被触发后到底要做什么。&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-yaml" data-lang="yaml"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;---
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#f92672"&gt;name&lt;/span&gt;: &lt;span style="color:#ae81ff"&gt;skill的名字&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#f92672"&gt;description&lt;/span&gt;: &lt;span style="color:#ae81ff"&gt;解释这个skill是干嘛的，什么时候应该被触发，什么时候不应该被触发等&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;---
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;当你的 skill 比较复杂，需要一些结构化的数据和逻辑的时候，就可以考虑建立 &lt;code&gt;scripts&lt;/code&gt; 文件夹，然后在里面写代码。当你的 skill 引用的文档比较多，你怕把上下文给撑爆了，就可以把大部分文档移到 &lt;code&gt;references&lt;/code&gt; 里面。&lt;/p&gt;
&lt;h3 id="写一个-skill"&gt;写一个 skill
&lt;/h3&gt;&lt;p&gt;来动手写一个 skill 吧。我保证这是你看到的最短的教程。这个 skill 会在你说三次 Hello 的时候回复三个 World。新建 &lt;code&gt;SKILL.md&lt;/code&gt;，并在里面写：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-yaml" data-lang="yaml"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;---
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#f92672"&gt;name&lt;/span&gt;: &lt;span style="color:#ae81ff"&gt;hello-world&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#f92672"&gt;description&lt;/span&gt;: &lt;span style="color:#ae81ff"&gt;当用户说三次&amp;#34;Hello&amp;#34;（例如&amp;#34;Hello Hello Hello&amp;#34;）时，回复三次&amp;#34;World&amp;#34;：&amp;#34;World World World&amp;#34;。&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;---
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# Hello World&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#ae81ff"&gt;当用户的消息中包含恰好三个&amp;#34;Hello&amp;#34;时，只回复：&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#ae81ff"&gt;World World World&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#ae81ff"&gt;不说其他任何内容，只有这三个字。&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;然后安装到你的 AI agent 里面。你问我怎么安装？这都什么年代了，你问你自己的 AI agent 怎么安装，它自会告诉你的。&lt;/p&gt;
&lt;p&gt;安装好后就试试吧。&lt;/p&gt;
&lt;h2 id="skill-规范"&gt;skill 规范
&lt;/h2&gt;&lt;p&gt;Codex、Claude Code、OpenClaw、Hermes Agent 它们都对 skill 有自己的一些细节上的规范，我就不在此赘述。不过有几点我觉得有必要提。&lt;/p&gt;
&lt;h3 id="skill-防触发机制"&gt;Skill 防触发机制
&lt;/h3&gt;&lt;p&gt;基本上，是否触发 Skill 是看 LLM 自己决定的。这其实带来另外一个问题，就是 skill 经常被误触发，或者不被触发。对此各家都有各自的措施。&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;
&lt;p&gt;禁止自动触发，但允许手动触发&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Claude / OpenClaw: &lt;code&gt;disable-model-invocation: true&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;Codex: &lt;code&gt;agents/openai.yaml&lt;/code&gt; 里的 &lt;code&gt;allow_implicit_invocation: false&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;彻底禁用 skill&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Codex: &lt;code&gt;[[skills.config]] enabled = false&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;OpenClaw: &lt;code&gt;skills.entries.&amp;lt;skillKey&amp;gt;.enabled = false&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;从这里可以看出，skill 的优点在于自由，但缺点也是自由。有时候你想触发，却触发不了；不想触发，它却一直被触发。不过在之后的教程中我会介绍一些范式来解决这个问题。&lt;/p&gt;
&lt;h3 id="skill-的分类"&gt;Skill 的分类
&lt;/h3&gt;&lt;p&gt;在 skill 慢慢被越来越多的人使用后，skill 也开始出现一些分类方式。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;skill 和 command&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;在 OpenClaw 和 Claude 桌面版中，skill 是可以用斜杠（&lt;code&gt;/&lt;/code&gt;）调用的。区别在于，在 Claude 桌面版中，你安装了 Skill 后，按 &lt;code&gt;/&lt;/code&gt; + &lt;code&gt;&amp;lt;skill名&amp;gt;&lt;/code&gt; 就可以触发 skill；而在 OpenClaw 中，你是通过设置 &lt;code&gt;user-invocable: true&lt;/code&gt; 来让这个 skill 可以用斜杠触发的。&lt;/p&gt;
&lt;p&gt;在 OpenClaw 里，一部分 skill 可以被暴露成 slash command。command 是调用方式，不一定是独立分类。这就引发了一个有趣的思考：当你建立一个新 skill 的时候，你可以思考一下，你这个 skill 是一个普通的 skill，还是一个 command。毕竟在手机上找到斜杠，并不像在电脑上这样容易。有些生活类的 skill，你可以依赖 LLM 去猜测；而有些需要精确被触发的，就可以用斜杠。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;工作流式和应用式&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;你会发现，有些 skill 仅仅只是定义了一件事情该怎么做，而有些 skill 更像是一个你自己定义的 app。定义了该怎么做的，可以被称为工作流式。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;比如你让 LLM 帮你归纳一下会议纪要。这样的 skill 就只需要 &lt;code&gt;SKILL.md&lt;/code&gt; 就够了。如果流程比较复杂，那就把流程抽取到 &lt;code&gt;references&lt;/code&gt; 里面。&lt;/li&gt;
&lt;li&gt;如果是应用式的，比如你要做一个购物清单，你需要比较复杂的逻辑和比较规范的数据存储。你就需要将某些逻辑抽取出来写成 &lt;code&gt;scripts&lt;/code&gt;。但是 &lt;code&gt;scripts&lt;/code&gt; 不是越多越好，只有需要确定性行为或外部工具时才用 &lt;code&gt;scripts&lt;/code&gt;。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;img alt="skill 分类示意图" class="gallery-image" data-flex-basis="320px" data-flex-grow="133" height="1086" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/agent-skill-handbook-01-getting-started/02.png" srcset="https://CodePlato3721.github.io/02_18422898844138254243_hu_ce56d308cb564460.png 800w, https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/agent-skill-handbook-01-getting-started/02.png 1448w" width="1448"&gt;&lt;/p&gt;</description></item><item><title>AI时代应该怎么写代码：督导和编排</title><link>https://CodePlato3721.github.io/zh/post/ai%E6%97%B6%E4%BB%A3%E5%BA%94%E8%AF%A5%E6%80%8E%E4%B9%88%E5%86%99%E4%BB%A3%E7%A0%81-%E7%9D%A3%E5%AF%BC%E5%92%8C%E7%BC%96%E6%8E%92/</link><pubDate>Wed, 20 May 2026 00:00:00 +0000</pubDate><guid>https://CodePlato3721.github.io/zh/post/ai%E6%97%B6%E4%BB%A3%E5%BA%94%E8%AF%A5%E6%80%8E%E4%B9%88%E5%86%99%E4%BB%A3%E7%A0%81-%E7%9D%A3%E5%AF%BC%E5%92%8C%E7%BC%96%E6%8E%92/</guid><description>&lt;img src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/coding-in-ai-era-supervision-and-orchestration/banner.png" alt="Featured image of post AI时代应该怎么写代码：督导和编排" /&gt;&lt;h2 id="程序员的迷茫"&gt;程序员的迷茫
&lt;/h2&gt;&lt;p&gt;程序员这个行业从来没有像现在这么迷茫过。我看到太多不同的说法：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;有个老板要求员工的 AI 写代码率必须超过 70%&lt;/li&gt;
&lt;li&gt;有的人手写代码，然后让 AI 来写单元测试、做测试&lt;/li&gt;
&lt;li&gt;有人在面试时被问到是否用过 Claude Code，会觉得很生气&lt;/li&gt;
&lt;li&gt;有人说 vibe coding 是一场赌博&lt;/li&gt;
&lt;li&gt;有人说程序员要失业了，我们不再需要程序员了&lt;/li&gt;
&lt;li&gt;有人说只要用 TDD、BDD 写出来的项目就会很稳定&lt;/li&gt;
&lt;li&gt;有人说 AI 写出来的代码，测试都能通过，但实际一运行就挂掉&lt;/li&gt;
&lt;li&gt;有人说 AI 编程是个骗局，只是各大厂商为了卖 token 的营销手段&lt;/li&gt;
&lt;/ol&gt;
&lt;hr&gt;
&lt;h2 id="2-个坏消息"&gt;2 个坏消息
&lt;/h2&gt;&lt;p&gt;其实这些说法都对了一部分，也错了一部分。我想说两个坏消息：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Cursor 会死，JetBrains 会死，甚至 Copilot 也会死，几乎整个 IDE 产业最后可能都不存在&lt;/li&gt;
&lt;li&gt;虽然已经裁了很多程序员了，但裁得还不够&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;我不喜欢坏消息，但我也不喜欢假装一切都很好。这就像你明明有重大疾病，却不去体检一样。这样只会害了你。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="ai-编程的极限"&gt;AI 编程的极限
&lt;/h2&gt;&lt;p&gt;这几个月 AI 编程领域高歌猛进。看起来它似乎是无敌的，最终会统治世界。确实，我们现在对 AI 编程的开发还远远没有到极限。&lt;/p&gt;
&lt;p&gt;但是，AI 编程是有极限的。&lt;/p&gt;
&lt;p&gt;我们要知道，我们现在用来编程的 AI，其实不是 AGI。我们既然是专业人士，就不要再用&amp;quot;AI&amp;quot;这个笼统的词了。我们真正使用的是大语言模型（LLM）。&lt;/p&gt;
&lt;p&gt;大语言模型的工作原理，本质上是预测下一个 token。这跟抽象思维、大局思维、创造力并不是一回事。&lt;/p&gt;
&lt;p&gt;所以，大语言模型有几个非常致命的问题：架构偏移、软件熵增、上下文困境、token 滥用。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;架构偏移&lt;/strong&gt;：如果你让 LLM 长时间独立完成一件事情，它最终可能会偏离轨道，走到一个你完全想不到的方向。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;软件熵增&lt;/strong&gt;：如果你让 LLM 自己写一个大型项目，最终很可能会生成屎山代码。实际上甚至不需要大型项目，只要让它写一个稍微复杂一点的模块，都可能出现代码质量失控。我甚至发现，让它帮我写一个类的单元测试，它也能写出屎山代码。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;上下文困境&lt;/strong&gt;：当上下文过长时，LLM 的工作效率会明显下降，因为过长的上下文会让它&amp;quot;分心&amp;quot;。于是你会陷入两难：压缩上下文，会丢失信息；不压缩上下文，LLM 又几乎无法高效工作。你当然可以通过摘要、归档以及渐进式披露来缓解这个问题，但代价就是性能下降。LLM 每做一次修改，都可能需要思考很久。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;token 滥用&lt;/strong&gt;：这是一个非常现实的问题。token 是要付费的，而且并不便宜。你没有无限的 token 可以挥霍。但由于缺乏监管的 AI 容易写出糟糕的逻辑和单元测试，最终会导致你修改逻辑时的 token 消耗越来越高，让维护成本变得越来越昂贵。&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="程序员的作用"&gt;程序员的作用
&lt;/h2&gt;&lt;p&gt;程序员不会失业，但&amp;quot;写代码的程序员&amp;quot;这个职业会逐渐消失。&lt;/p&gt;
&lt;p&gt;写代码的方式会彻底改变，而且会分成两个阶段：督导和编排。&lt;/p&gt;
&lt;hr&gt;
&lt;h3 id="督导"&gt;督导
&lt;/h3&gt;&lt;p&gt;有人问，用 AI 写代码的比例多少比较合适。&lt;/p&gt;
&lt;p&gt;我的答案是：100%。&lt;/p&gt;
&lt;p&gt;当人类开始使用拖拉机播种之后，人工播种的比例是多少？是 0%。&lt;/p&gt;
&lt;p&gt;用了 AI 写代码之后，人类已经没有必要继续用缓慢、而且容易拼写错误的方式手写代码。你真正要做的事情，是&amp;quot;督导&amp;quot;。&lt;/p&gt;
&lt;p&gt;督导的作用，就是克服 LLM 的那 4 个核心问题。&lt;/p&gt;
&lt;p&gt;程序员的大部分时间，将不再是写代码，而是审核 AI 写的代码、提出修改意见，并防止 AI 下次再犯同样的错误。或者指导 AI 用更好的实践去管理代码。&lt;/p&gt;
&lt;p&gt;所以，设计模式、代码整洁、代码品味、重构、如何写好的单元测试——这些以前看起来很高级的东西，现在会变成基础能力。&lt;/p&gt;
&lt;p&gt;原因很简单，不是为了&amp;quot;优雅&amp;quot;，而是为了一个很现实的目标：&lt;/p&gt;
&lt;p&gt;写出可维护、bug 更少、并且节省 token 的代码。&lt;/p&gt;
&lt;p&gt;&lt;img alt="督导示意图" class="gallery-image" data-flex-basis="426px" data-flex-grow="177" height="941" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/coding-in-ai-era-supervision-and-orchestration/01.png" srcset="https://CodePlato3721.github.io/01_10761045703228026991_hu_f131ead4f1609b5f.png 800w, https://CodePlato3721.github.io/01_10761045703228026991_hu_2c9732facb6fc0b.png 1600w, https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/coding-in-ai-era-supervision-and-orchestration/01.png 1672w" width="1672"&gt;&lt;/p&gt;
&lt;h4 id="ide-的终结"&gt;IDE 的终结
&lt;/h4&gt;&lt;p&gt;但这样一来，其实已经不太需要传统 IDE 了。&lt;/p&gt;
&lt;p&gt;因为 IDE 本质上是为了&amp;quot;人类写代码&amp;quot;而诞生的。&lt;/p&gt;
&lt;p&gt;如果 AI 写的代码不会出现低级错误，也不需要 auto-complete，而人类自己又不再直接写代码，那么 IDE 中那些辅助人类编写代码、重构代码的功能，其意义就会大幅下降。&lt;/p&gt;
&lt;p&gt;未来也许还会有 IDE，但会是非常轻量级的 IDE：秒开、功能简单，只保留一些最基础的能力。&lt;/p&gt;
&lt;p&gt;而且这种东西很难再形成高利润产业，因为它太简单了，最终一定会出现大量开源、免费的替代方案。&lt;/p&gt;
&lt;p&gt;就像胶卷和录像带租赁行业一样，这个产业最终会逐渐消失。&lt;/p&gt;
&lt;hr&gt;
&lt;h3 id="编排"&gt;编排
&lt;/h3&gt;&lt;p&gt;单独开一个 agent 写代码，效率其实还是不够高。&lt;/p&gt;
&lt;p&gt;你可以回忆一下，当你拿到一个新的 requirement 时，你是怎么工作的。&lt;/p&gt;
&lt;p&gt;你肯定不是直接开始写代码。&lt;/p&gt;
&lt;p&gt;你会先细化需求、设计实现方案，有时候甚至还需要先做 POC 验证方案，然后才开始真正写代码、测试功能。&lt;/p&gt;
&lt;p&gt;所以，最终整个软件开发流程都会 AI 化。&lt;/p&gt;
&lt;p&gt;但由于上下文问题的存在，又无法让一个 agent 完成所有事情。&lt;/p&gt;
&lt;p&gt;注意：这并不是&amp;quot;上下文长度限制&amp;quot;这种可以单纯靠技术升级解决的问题，而是 LLM 工作原理本身带来的限制。&lt;/p&gt;
&lt;p&gt;所以，未来真正的开发环境，很可能会变成一个完整的 AI 工作流。&lt;/p&gt;
&lt;p&gt;整个工作流中，会有多个不同角色的 AI 工作者：&lt;/p&gt;
&lt;p&gt;开发方案设计者 + N 个开发者 + 测试方案设计者 + N 个测试者&lt;/p&gt;
&lt;p&gt;&lt;img alt="AI 工作流编排示意图" class="gallery-image" data-flex-basis="426px" data-flex-grow="177" height="941" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/coding-in-ai-era-supervision-and-orchestration/02.png" srcset="https://CodePlato3721.github.io/02_6372375247115853071_hu_750315681e442483.png 800w, https://CodePlato3721.github.io/02_6372375247115853071_hu_9b85f138481e496b.png 1600w, https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/coding-in-ai-era-supervision-and-orchestration/02.png 1672w" width="1672"&gt;&lt;/p&gt;
&lt;p&gt;之所以没有&amp;quot;需求分析者&amp;quot;这个角色，是因为这部分最好仍然由人类亲自完成。&lt;/p&gt;
&lt;p&gt;因为需求分析只要偏移一点点，后面的整个架构就可能彻底偏掉。&lt;/p&gt;
&lt;p&gt;但这个工作流并不是搭建完就没事了。&lt;/p&gt;
&lt;p&gt;因为如果你让它自己无限制地运行，它绝对会耗费大量 token，最终给你生成一个不可维护的屎山代码库。这就是架构偏移。&lt;/p&gt;
&lt;p&gt;虽然 OpenAI 和 Anthropic 都在研究长时间运行的 AI 项目开发，但你可以把这些研究理解成&amp;quot;实验室中的理想环境&amp;quot;。&lt;/p&gt;
&lt;p&gt;它们不需要太在意 token 消耗，但你需要。&lt;/p&gt;
&lt;p&gt;而且我相信，它们所谓的&amp;quot;长时间运行项目&amp;quot;，本质上也是有督导存在的。人工需要不断增加规则、纠正 AI 的工作方式。&lt;/p&gt;
&lt;p&gt;这其实也就是现在越来越多人提到的 Harness Engineering。&lt;/p&gt;
&lt;p&gt;于是，程序员最终的工作，就会变成：&lt;/p&gt;
&lt;p&gt;搭建、调试并使用这个 AI 工作流。&lt;/p&gt;
&lt;p&gt;因为你仍然需要督导 AI。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="总结"&gt;总结
&lt;/h2&gt;&lt;p&gt;因为 LLM 在原理上存在一些暂时无法解决的问题，所以程序员这个职业，短时间内仍然会以另一种形态继续存在。&lt;/p&gt;
&lt;p&gt;直到真正的 AGI 出现的那一天。&lt;/p&gt;
&lt;p&gt;但我还是希望大家尽快开始转型，否则很可能会被这个时代淘汰。&lt;/p&gt;</description></item><item><title>实例讲解什么是上下文治理</title><link>https://CodePlato3721.github.io/zh/post/%E5%AE%9E%E4%BE%8B%E8%AE%B2%E8%A7%A3%E4%BB%80%E4%B9%88%E6%98%AF%E4%B8%8A%E4%B8%8B%E6%96%87%E6%B2%BB%E7%90%86/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://CodePlato3721.github.io/zh/post/%E5%AE%9E%E4%BE%8B%E8%AE%B2%E8%A7%A3%E4%BB%80%E4%B9%88%E6%98%AF%E4%B8%8A%E4%B8%8B%E6%96%87%E6%B2%BB%E7%90%86/</guid><description>&lt;img src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/what-is-context-governance/banner.png" alt="Featured image of post 实例讲解什么是上下文治理" /&gt;&lt;p&gt;上下文治理（Context Governance）是上下文工程（Context Engineering）中的一个部分。但我觉得，上下文治理是上下文工程里最有意思的部分。&lt;/p&gt;
&lt;p&gt;光这么说，你肯定会像我一开始一样，觉得这个概念很抽象。但是，如果你跟我一样，了解了几种主流智能体（Agent）的上下文治理之后，你一定会对&amp;quot;上下文治理&amp;quot;有一个非常直观的理解。&lt;/p&gt;
&lt;p&gt;接下来，我会通过比较 4 种智能体的上下文治理方式，让你直观地理解什么是上下文治理。以下四种工具的上下文治理，从简单到复杂、从低级到高级。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="codex"&gt;Codex
&lt;/h2&gt;&lt;p&gt;首先是 OpenAI 的 Codex。虽然 OpenAI 是第一个做出 LLM 的公司，但是它们的智能体产品反而最年轻。&lt;/p&gt;
&lt;p&gt;虽然它最年轻，但它的上下文治理也是最简单的。在 &lt;code&gt;.codex/&lt;/code&gt; 目录下，有一个叫 &lt;code&gt;AGENTS.md&lt;/code&gt; 的文件。这是一个简单的 &lt;code&gt;AGENTS.md&lt;/code&gt; 文件示例：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-md" data-lang="md"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;# 仓库规范
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;## 项目结构
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#66d9ef"&gt;-&lt;/span&gt; &lt;span style="color:#e6db74"&gt;`src/`&lt;/span&gt; 存放应用代码
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#66d9ef"&gt;-&lt;/span&gt; &lt;span style="color:#e6db74"&gt;`tests/`&lt;/span&gt; 存放测试代码
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;## 常用命令
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#66d9ef"&gt;-&lt;/span&gt; 运行测试：&lt;span style="color:#e6db74"&gt;`npm test`&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#66d9ef"&gt;-&lt;/span&gt; 运行代码检查：&lt;span style="color:#e6db74"&gt;`npm run lint`&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;## 编码规范
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#66d9ef"&gt;-&lt;/span&gt; 优先使用 TypeScript
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#66d9ef"&gt;-&lt;/span&gt; 避免使用 default export（默认导出）
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#66d9ef"&gt;-&lt;/span&gt; 使用 async/await，而不是直接使用原始 Promise
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;Codex 在开始工作之前，会先读取这个文件的内容。这个文件需要你手动维护，不断往里面添加规则。&lt;/p&gt;
&lt;p&gt;除了这个文件以外，还有一个文件夹：&lt;code&gt;~/.codex/memories/&lt;/code&gt; 顾名思义，就是&amp;quot;记忆&amp;quot;。Codex 会自动往里面写文件。&lt;/p&gt;
&lt;p&gt;大概的结构如下：&lt;/p&gt;
&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;类型&lt;/th&gt;
					&lt;th&gt;可能内容&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;summaries&lt;/td&gt;
					&lt;td&gt;session 摘要&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;durable&lt;/td&gt;
					&lt;td&gt;长期稳定记忆&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;recent&lt;/td&gt;
					&lt;td&gt;最近上下文&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;evidence&lt;/td&gt;
					&lt;td&gt;来源证据&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;可以看到，Codex 的上下文治理其实非常轻量。&lt;/p&gt;
&lt;p&gt;它本质上还是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;
&lt;p&gt;一个规则文件&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;一个自动记忆目录&lt;/p&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;仅此而已。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="claude-code"&gt;Claude Code
&lt;/h2&gt;&lt;p&gt;Claude Code 的上下文治理很特别。&lt;/p&gt;
&lt;p&gt;官方支持的其实跟 Codex 差不多：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;
&lt;p&gt;&lt;code&gt;CLAUDE.md&lt;/code&gt;&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;code&gt;~/.claude/projects/&amp;lt;project&amp;gt;/memory/&lt;/code&gt;&lt;/p&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;就这两个东西。你一看名字基本就懂了。但是，Claude Code 的社区自己增强了它的上下文治理，逐渐演化成了这样：&lt;/p&gt;
&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;名字&lt;/th&gt;
					&lt;th&gt;类型&lt;/th&gt;
					&lt;th&gt;作用&lt;/th&gt;
					&lt;th&gt;人工/自动&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;CLAUDE.md&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件&lt;/td&gt;
					&lt;td&gt;项目规则、Agent 行为规则&lt;/td&gt;
					&lt;td&gt;人工&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;MEMORY.md&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件&lt;/td&gt;
					&lt;td&gt;长期记忆、长期偏好、长期经验&lt;/td&gt;
					&lt;td&gt;半自动&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;NOTES.md&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件&lt;/td&gt;
					&lt;td&gt;临时工作笔记、scratchpad&lt;/td&gt;
					&lt;td&gt;人工&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;DECISIONS.md&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件&lt;/td&gt;
					&lt;td&gt;关键架构/技术决策历史&lt;/td&gt;
					&lt;td&gt;人工&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;ARCHITECTURE.md&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件&lt;/td&gt;
					&lt;td&gt;系统结构、模块关系、数据流&lt;/td&gt;
					&lt;td&gt;人工&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;LEARNINGS.md&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件&lt;/td&gt;
					&lt;td&gt;踩坑经验、经验总结&lt;/td&gt;
					&lt;td&gt;半自动&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;TASKS.md&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件&lt;/td&gt;
					&lt;td&gt;当前任务列表、待办事项&lt;/td&gt;
					&lt;td&gt;人工&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;SESSION.md&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件&lt;/td&gt;
					&lt;td&gt;当前 session 工作记录&lt;/td&gt;
					&lt;td&gt;半自动&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;docs/&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件夹&lt;/td&gt;
					&lt;td&gt;长文档上下文来源&lt;/td&gt;
					&lt;td&gt;人工&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;memory/&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件夹&lt;/td&gt;
					&lt;td&gt;memory 分类存储&lt;/td&gt;
					&lt;td&gt;半自动&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;prompts/&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件夹&lt;/td&gt;
					&lt;td&gt;prompt 模板、workflow prompt&lt;/td&gt;
					&lt;td&gt;人工&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;code&gt;.cursorrules&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;文件&lt;/td&gt;
					&lt;td&gt;Cursor 兼容规则&lt;/td&gt;
					&lt;td&gt;人工&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;这下就比 Codex 复杂很多了。但是你会发现，这里面有大量文件都需要人工维护。而且整个结构特别像我们以前做项目时写的 Wiki 文档结构。&lt;/p&gt;
&lt;p&gt;其实，为了让 Agent 更好地工作，它也应该像我们一样，先看看项目 Wiki。人们现在只是把 Wiki 文档，变成了上下文 Markdown 文件而已。这样理解就很容易了。Claude Code 在这些上下文文档的基础上，工作的方式越来越像一个真正的程序员。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="open-claw"&gt;Open Claw
&lt;/h2&gt;&lt;p&gt;Open Claw 的定位跟 Claude Code 不太一样。它更偏向生活助手。而且 Claude Code 社区版的上下文治理，需要管理的文件太多了。不同于 Claude Code，Open Claw 的用户更多是普通人。很多用户其实并不会直接编辑 Open Claw 的上下文文件，甚至都不知道这些文件需要人工维护。&lt;/p&gt;
&lt;p&gt;但是，Open Claw 的上下文设计其实比 Claude Code 社区版更&amp;quot;Agent 化&amp;quot;。因为 Claude Code 社区版的上下文结构，还是带有很强的人类项目管理思维。但在 Agent 面前，其实并不一定需要拆成那么多文档。&lt;/p&gt;
&lt;p&gt;Open Claw 的上下文治理更偏向&amp;quot;角色&amp;quot;和&amp;quot;人格&amp;quot;。它有这些上下文文件：&lt;/p&gt;
&lt;h3 id="核心指令层静态你手动维护"&gt;核心指令层（静态，你手动维护）
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;SOUL.md&lt;/code&gt;&lt;/strong&gt; — 人格、价值观、边界。回答&amp;quot;你是谁&amp;quot;。定义语气、性格、不可违反的约束。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;AGENTS.md&lt;/code&gt;&lt;/strong&gt; — 操作流程和规则。回答&amp;quot;你做什么、怎么做&amp;quot;。最大也最重要的文件，放复杂工作流和步骤化指令。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;USER.md&lt;/code&gt;&lt;/strong&gt; — 用户信息。你的名字、时区、偏好、工作背景。相当于个性化层。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;IDENTITY.md&lt;/code&gt;&lt;/strong&gt; — 结构化身份档案（名称、角色、目标、语气）。用于一致性地重新应用已知身份。（其实我觉得这个有点多余。）&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;TOOLS.md&lt;/code&gt;&lt;/strong&gt; — 工具文档。不控制权限（权限是 config 管的），而是告诉 Agent 如何使用已有工具。&lt;/p&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="自动化层"&gt;自动化层
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;HEARTBEAT.md&lt;/code&gt;&lt;/strong&gt; — 定时任务，相当于用自然语言写的 cron。比如&amp;quot;每 30 分钟检查一次&amp;quot;&amp;ldquo;每周一 8 点生成报告&amp;rdquo;。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;BOOTSTRAP.md&lt;/code&gt;&lt;/strong&gt; — 首次运行的初始化脚本。setup 完成后会自动删除。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;BOOT.md&lt;/code&gt;&lt;/strong&gt; — 每次启动时执行的 hook。&lt;/p&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="记忆层"&gt;记忆层
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;MEMORY.md&lt;/code&gt;&lt;/strong&gt; — 长期记忆。持久化的事实、偏好、决策摘要，跨周跨月生效。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;memory/YYYY-MM-DD.md&lt;/code&gt;&lt;/strong&gt; — 每日笔记。当天和昨天的笔记自动加载，更早的内容通过 &lt;code&gt;memory_search&lt;/code&gt; 检索。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;DREAMS.md&lt;/code&gt;&lt;/strong&gt; — dreaming 系统的日记，记录从短期记忆向长期记忆的&amp;quot;晋升过程&amp;quot;，供人类审阅。这是一个实验性功能。&lt;/p&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;可以看出，Open Claw 已经比前两个系统复杂很多了。所以你在使用 Open Claw 的时候，会明显觉得它&amp;quot;更聪明&amp;quot;。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="hermes-agent"&gt;Hermes Agent
&lt;/h2&gt;&lt;p&gt;接下来就是重头戏了。如果你不理解上下文治理，你可能会觉得 Hermes Agent 跟 Open Claw 没什么区别。但不知道你有没有发现：Open Claw 里仍然有很多文件需要你手动维护。&lt;/p&gt;
&lt;p&gt;甚至就算是我，用了这么久 Open Claw，也是最近才知道这些文件需要人工维护。这就导致 Open Claw 设计的很多上下文，其实一直都没有真正被使用起来。Hermes Agent 的上下文治理跟 Open Claw 和 Claude Code 都不太一样。它的核心设计理念是：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&amp;ldquo;自我进化&amp;rdquo;——Agent 自己写自己的记忆和技能。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;整个体系住在 &lt;code&gt;~/.hermes/&lt;/code&gt; 目录下。&lt;/p&gt;
&lt;h3 id="身份层静态"&gt;身份层（静态）
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;&lt;code&gt;SOUL.md&lt;/code&gt;&lt;/strong&gt; — system prompt 的第一个 slot，定义人格、语气、价值观、行为边界。这是全局的，从 &lt;code&gt;HERMES_HOME&lt;/code&gt; 加载。这个文件你仍然可以手动编辑。&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="项目上下文层按优先级只加载第一个匹配的"&gt;项目上下文层（按优先级，只加载第一个匹配的）
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;
&lt;p&gt;&lt;code&gt;.hermes.md&lt;/code&gt;&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;code&gt;AGENTS.md&lt;/code&gt;&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;code&gt;CLAUDE.md&lt;/code&gt;&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;code&gt;.cursorrules&lt;/code&gt;&lt;/p&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;先找到谁就用谁。&lt;/p&gt;
&lt;p&gt;这意味着 Hermes 同时兼容 Claude Code 和 Cursor 的项目配置文件。&lt;/p&gt;
&lt;h3 id="记忆层三层agent-自己维护"&gt;记忆层（三层，Agent 自己维护）
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;MEMORY.md&lt;/code&gt;&lt;/strong&gt; — 长期记忆。存环境信息、项目惯例、工具使用经验。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;USER.md&lt;/code&gt;&lt;/strong&gt; — 用户档案。存你的名字、沟通偏好、技能水平。注意，这回 &lt;code&gt;USER.md&lt;/code&gt; 已经变成自动维护了。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;&lt;strong&gt;&lt;code&gt;state.db&lt;/code&gt;&lt;/strong&gt; — SQLite 数据库，带 FTS5 全文索引，存所有历史消息。Agent 不会默认全部加载，而是在需要时通过 &lt;code&gt;session_search&lt;/code&gt; 按需检索。&lt;/p&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这时候，记忆已经开始进入数据库时代了。因为只有数据库，才能真正支撑长期上下文检索。&lt;/p&gt;
&lt;h3 id="技能层hermes-最独特的部分"&gt;技能层（Hermes 最独特的部分）
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;&lt;code&gt;skills/&lt;/code&gt; 目录&lt;/strong&gt; — 每个技能都是一个文件夹，里面包含一个 &lt;code&gt;SKILL.md&lt;/code&gt;（带 YAML frontmatter），以及可选的模板和脚本。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;关键区别在于：&lt;/p&gt;
&lt;p&gt;技能不是人类写的。Agent 在完成非平凡任务之后，会通过 &lt;code&gt;skill_manage&lt;/code&gt; 工具自己创建技能。同样，记忆也不再主要依赖人类维护。Agent 会在对话间隙，自己编辑 &lt;code&gt;MEMORY.md&lt;/code&gt; 和 &lt;code&gt;USER.md&lt;/code&gt;。而且技能是按需加载的。不用的技能不会进入上下文。这其实已经开始接近真正的&amp;quot;上下文自动治理&amp;quot;了。&lt;/p&gt;
&lt;h3 id="调度层"&gt;调度层
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;cron jobs&lt;/strong&gt; — 定时任务，类似 Open Claw 的 &lt;code&gt;HEARTBEAT.md&lt;/code&gt;。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;到了这一步，上下文治理不仅变复杂了，还开始自动化了。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="总结"&gt;总结
&lt;/h2&gt;&lt;p&gt;AI 是否真的能干活、干得好不好，已经不仅仅是模型之间的区别了。很多时候，更好的上下文治理，对智能体工作效率的提升，甚至比你换一个更强的模型还明显。&lt;/p&gt;
&lt;h3 id="电子脑"&gt;电子脑
&lt;/h3&gt;&lt;p&gt;随之而来的，还有一个很有意思的问题：上下文，其实就是智能体的&amp;quot;电子脑&amp;quot;。一个 Agent 用久了，那份上下文就会逐渐变成独一无二的它。只要上下文还在，就算换了一个&amp;quot;壳&amp;quot;，你的小助手还是你的小助手。如果智能体坏了需要重装，或者你想迁移到另一个智能体平台，只要把上下文迁移走，你的助手理论上就还能继续存在。&lt;/p&gt;
&lt;p&gt;于是，一个新的问题出现了：
如何安全地迁移上下文？&lt;/p&gt;
&lt;p&gt;但现在的问题是：
各家之间的文件名、结构、格式都完全不同。这就导致上下文迁移非常麻烦。我相信，未来一定会出现更统一、更标准化的上下文协议。而&amp;quot;上下文治理&amp;quot;，也会逐渐成为 AI Agent 最核心的能力之一。&lt;/p&gt;</description></item><item><title>基于 LLM 的 AI 智能体架构：一台长在你设备里的新型电脑</title><link>https://CodePlato3721.github.io/zh/post/%E5%9F%BA%E4%BA%8Ellm%E7%9A%84ai%E6%99%BA%E8%83%BD%E4%BD%93%E6%9E%B6%E6%9E%84/</link><pubDate>Tue, 05 May 2026 00:00:00 +0000</pubDate><guid>https://CodePlato3721.github.io/zh/post/%E5%9F%BA%E4%BA%8Ellm%E7%9A%84ai%E6%99%BA%E8%83%BD%E4%BD%93%E6%9E%B6%E6%9E%84/</guid><description>&lt;img src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/banner.png" alt="Featured image of post 基于 LLM 的 AI 智能体架构：一台长在你设备里的新型电脑" /&gt;&lt;h1 id="基于-llm-的-ai-智能体架构一台长在你设备里的新型电脑"&gt;基于 LLM 的 AI 智能体架构：一台长在你设备里的新型电脑
&lt;/h1&gt;&lt;p&gt;过去，我们一直把 AI 理解成一个&amp;quot;聊天机器人&amp;quot;。&lt;/p&gt;
&lt;p&gt;但如果从系统架构角度重新观察，会发现未来真正成熟的 AI 智能体，更像是一台安装在你设备里的新型个人电脑。&lt;/p&gt;
&lt;p&gt;它拥有：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;计算核心&lt;/li&gt;
&lt;li&gt;内存&lt;/li&gt;
&lt;li&gt;文件系统&lt;/li&gt;
&lt;li&gt;软件系统&lt;/li&gt;
&lt;li&gt;输入输出设备&lt;/li&gt;
&lt;li&gt;长期存储&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;只是：&lt;/p&gt;
&lt;p&gt;它的核心不再是传统 CPU，而是 LLM。&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="一llm-引擎没有记忆的cpu"&gt;一、LLM 引擎：没有记忆的&amp;quot;CPU&amp;quot;
&lt;/h1&gt;&lt;p&gt;LLM 本身其实没有长期记忆。&lt;/p&gt;
&lt;p&gt;它更像一个推理引擎：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;接收输入&lt;/li&gt;
&lt;li&gt;读取上下文&lt;/li&gt;
&lt;li&gt;进行推理&lt;/li&gt;
&lt;li&gt;输出结果&lt;/li&gt;
&lt;li&gt;然后&amp;quot;失忆&amp;quot;&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;它无法天然记住过去发生的事情。&lt;/p&gt;
&lt;p&gt;因此：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;LLM 本身更像 CPU，而不是完整的智能体。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;它只负责计算。&lt;/p&gt;
&lt;p&gt;真正让 AI &amp;ldquo;看起来认识你&amp;quot;的，是外部为它提供的上下文。&lt;/p&gt;
&lt;p&gt;&lt;img alt="LLM CPU" class="gallery-image" data-flex-basis="360px" data-flex-grow="150" height="1024" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/01_llm_cpu.png" srcset="https://CodePlato3721.github.io/01_llm_cpu_18372079591755365085_hu_588b3268f55695d5.png 800w, https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/01_llm_cpu.png 1536w" width="1536"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="二上下文ai-智能体的内存"&gt;二、上下文：AI 智能体的内存
&lt;/h1&gt;&lt;p&gt;如果 LLM 是 CPU，&lt;br&gt;
那么 Context（上下文）就是 AI 的内存。&lt;/p&gt;
&lt;p&gt;而这个内存，其实应该分成两层。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="1-全局上下文global-context"&gt;1. 全局上下文（Global Context）
&lt;/h2&gt;&lt;p&gt;这一层属于整个智能体。&lt;/p&gt;
&lt;p&gt;它记录：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用户偏好&lt;/li&gt;
&lt;li&gt;长期目标&lt;/li&gt;
&lt;li&gt;常用习惯&lt;/li&gt;
&lt;li&gt;人格设定&lt;/li&gt;
&lt;li&gt;长期规则&lt;/li&gt;
&lt;li&gt;历史知识&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&amp;ldquo;用户喜欢 Markdown&amp;rdquo;&lt;/li&gt;
&lt;li&gt;&amp;ldquo;用户正在学习 AI Agent&amp;rdquo;&lt;/li&gt;
&lt;li&gt;&amp;ldquo;用户习惯使用中文写作&amp;rdquo;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这些信息会长期影响智能体行为。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="2-会话上下文session-context"&gt;2. 会话上下文（Session Context）
&lt;/h2&gt;&lt;p&gt;这一层只属于当前对话。&lt;/p&gt;
&lt;p&gt;例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;当前正在讨论的话题&lt;/li&gt;
&lt;li&gt;当前文章结构&lt;/li&gt;
&lt;li&gt;最近几轮对话&lt;/li&gt;
&lt;li&gt;临时推理结果&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它更像程序运行时的临时内存。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="上下文窗口本质上是内存限制"&gt;上下文窗口，本质上是&amp;quot;内存限制&amp;rdquo;
&lt;/h2&gt;&lt;p&gt;LLM 的 Context Window 并不是无限的。&lt;/p&gt;
&lt;p&gt;这意味着：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;历史不能无限累积&lt;/li&gt;
&lt;li&gt;信息会越来越贵&lt;/li&gt;
&lt;li&gt;超过限制后必须被压缩&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;于是：&lt;/p&gt;
&lt;p&gt;智能体必须像操作系统一样管理内存：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;压缩历史&lt;/li&gt;
&lt;li&gt;总结摘要&lt;/li&gt;
&lt;li&gt;清理低优先级信息&lt;/li&gt;
&lt;li&gt;转移长期信息&lt;/li&gt;
&lt;li&gt;动态加载需要的数据&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;因此：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;Context Window 本质上就是 AI 的内存容量。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;&lt;img alt="Context Memory" class="gallery-image" data-flex-basis="280px" data-flex-grow="117" height="435" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/02_context_memory.png" width="509"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="三markdown-文件智能体的硬盘"&gt;三、Markdown 文件：智能体的硬盘
&lt;/h1&gt;&lt;p&gt;长期数据不应该一直放在上下文里。&lt;/p&gt;
&lt;p&gt;否则：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;成本会越来越高&lt;/li&gt;
&lt;li&gt;推理速度会下降&lt;/li&gt;
&lt;li&gt;Context 会迅速膨胀&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;因此：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;长期记忆应该存在文件系统中。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;而一种非常自然的形式，就是 Markdown 文件。&lt;/p&gt;
&lt;p&gt;例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;笔记&lt;/li&gt;
&lt;li&gt;项目资料&lt;/li&gt;
&lt;li&gt;日记&lt;/li&gt;
&lt;li&gt;世界观&lt;/li&gt;
&lt;li&gt;用户档案&lt;/li&gt;
&lt;li&gt;写作素材&lt;/li&gt;
&lt;li&gt;长期知识库&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;都可以直接存成 Markdown。&lt;/p&gt;
&lt;p&gt;这意味着：&lt;/p&gt;
&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;传统电脑&lt;/th&gt;
					&lt;th&gt;AI 智能体&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;硬盘&lt;/td&gt;
					&lt;td&gt;Markdown 文件系统&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;Markdown 有一个巨大优势：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;它既能被 AI 阅读，也能被人类直接阅读。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;因此：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;人类可以编辑&lt;/li&gt;
&lt;li&gt;AI 可以处理&lt;/li&gt;
&lt;li&gt;Git 可以版本管理&lt;/li&gt;
&lt;li&gt;文件可以同步&lt;/li&gt;
&lt;li&gt;即使脱离 AI 依然存在&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这会形成一种：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&amp;ldquo;人与 AI 共用的知识空间&amp;rdquo;。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;&lt;img alt="Markdown Storage" class="gallery-image" data-flex-basis="289px" data-flex-grow="120" height="425" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/03_markdown_storage.png" width="512"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="四skill安装在-ai-上的软件"&gt;四、Skill：安装在 AI 上的软件
&lt;/h1&gt;&lt;p&gt;未来的 AI 智能体，不会只有&amp;quot;知识&amp;quot;。&lt;/p&gt;
&lt;p&gt;它还会拥有&amp;quot;技能&amp;quot;。&lt;/p&gt;
&lt;p&gt;例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;写作 Skill&lt;/li&gt;
&lt;li&gt;编程 Skill&lt;/li&gt;
&lt;li&gt;视频剪辑 Skill&lt;/li&gt;
&lt;li&gt;数据分析 Skill&lt;/li&gt;
&lt;li&gt;项目管理 Skill&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这些 Skill 可能由：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Prompt&lt;/li&gt;
&lt;li&gt;工作流&lt;/li&gt;
&lt;li&gt;Python 代码&lt;/li&gt;
&lt;li&gt;MCP 配置&lt;/li&gt;
&lt;li&gt;Tool 调用规则&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;共同组成。&lt;/p&gt;
&lt;p&gt;它们就像：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;安装在 AI 身上的软件。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;因此：&lt;/p&gt;
&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;传统电脑&lt;/th&gt;
					&lt;th&gt;AI 智能体&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;软件 / App&lt;/td&gt;
					&lt;td&gt;Skill&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;Skill 可以：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;安装&lt;/li&gt;
&lt;li&gt;卸载&lt;/li&gt;
&lt;li&gt;更新&lt;/li&gt;
&lt;li&gt;共享&lt;/li&gt;
&lt;li&gt;组合&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;未来甚至可能出现：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Skill Store&lt;/li&gt;
&lt;li&gt;Skill Marketplace&lt;/li&gt;
&lt;li&gt;开源 Skill 社区&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;img alt="Skill Software" class="gallery-image" data-flex-basis="293px" data-flex-grow="122" height="418" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/04_skill_software.png" width="512"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="五输入输出不只是文字"&gt;五、输入输出：不只是文字
&lt;/h1&gt;&lt;p&gt;传统聊天机器人最大的误导之一，是大家以为 AI 只有文字交互。&lt;/p&gt;
&lt;p&gt;实际上未来的 AI 智能体，会拥有完整的多模态输入输出系统。&lt;/p&gt;
&lt;h2 id="输入"&gt;输入
&lt;/h2&gt;&lt;p&gt;AI 可以读取：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;文字&lt;/li&gt;
&lt;li&gt;语音&lt;/li&gt;
&lt;li&gt;图片&lt;/li&gt;
&lt;li&gt;视频&lt;/li&gt;
&lt;li&gt;摄像头&lt;/li&gt;
&lt;li&gt;文件&lt;/li&gt;
&lt;li&gt;屏幕内容&lt;/li&gt;
&lt;li&gt;设备状态&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="输出"&gt;输出
&lt;/h2&gt;&lt;p&gt;AI 可以生成：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;文本&lt;/li&gt;
&lt;li&gt;语音&lt;/li&gt;
&lt;li&gt;图像&lt;/li&gt;
&lt;li&gt;视频&lt;/li&gt;
&lt;li&gt;自动化操作&lt;/li&gt;
&lt;li&gt;控制指令&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;因此：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;AI 智能体本质上是一种新的交互层。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;&lt;img alt="Multimodal IO" class="gallery-image" data-flex-basis="240px" data-flex-grow="100" height="512" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/05_multimodal_io.png" width="512"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="电脑整机一种类冯诺依曼结构的-ai-计算机"&gt;电脑整机：一种&amp;quot;类冯诺依曼结构&amp;quot;的 AI 计算机
&lt;/h1&gt;&lt;p&gt;如果把整个架构放在一起：&lt;/p&gt;
&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;传统计算机&lt;/th&gt;
					&lt;th&gt;AI 智能体&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;CPU&lt;/td&gt;
					&lt;td&gt;LLM 引擎&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;内存&lt;/td&gt;
					&lt;td&gt;Context&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;硬盘&lt;/td&gt;
					&lt;td&gt;Markdown 文件系统&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;软件&lt;/td&gt;
					&lt;td&gt;Skill&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;输入设备&lt;/td&gt;
					&lt;td&gt;多模态输入&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;输出设备&lt;/td&gt;
					&lt;td&gt;多模态输出&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;你会发现：&lt;/p&gt;
&lt;p&gt;它已经越来越像一台真正的计算机。&lt;/p&gt;
&lt;p&gt;只是：&lt;/p&gt;
&lt;p&gt;这台计算机不是围绕 GUI 构建的。&lt;/p&gt;
&lt;p&gt;而是围绕：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&amp;ldquo;语言理解与推理&amp;rdquo;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;构建的。&lt;/p&gt;
&lt;p&gt;&lt;img alt="AI Computer Architecture" class="gallery-image" data-flex-basis="289px" data-flex-grow="120" height="425" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/06_ai_computer_architecture.png" width="512"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="操作系统个人-ai-操作系统"&gt;操作系统：个人 AI 操作系统
&lt;/h1&gt;&lt;p&gt;未来每个人设备中，都可能长期存在一个 AI Agent。&lt;/p&gt;
&lt;p&gt;它：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;理解你&lt;/li&gt;
&lt;li&gt;记住你&lt;/li&gt;
&lt;li&gt;帮助你工作&lt;/li&gt;
&lt;li&gt;管理你的知识&lt;/li&gt;
&lt;li&gt;调度你的 Skills&lt;/li&gt;
&lt;li&gt;操作你的设备&lt;/li&gt;
&lt;li&gt;与你长期共同成长&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;那时：&lt;/p&gt;
&lt;p&gt;我们使用的可能不再只是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Windows&lt;/li&gt;
&lt;li&gt;macOS&lt;/li&gt;
&lt;li&gt;Android&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;而是：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;一个以 LLM 为核心的新型个人 AI 操作系统。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;而今天的聊天框，&lt;/p&gt;
&lt;p&gt;可能只是这个新时代最早期的雏形。&lt;/p&gt;
&lt;p&gt;&lt;img alt="Personal AI OS" class="gallery-image" data-flex-basis="280px" data-flex-grow="116" height="438" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/07_personal_ai_os.png" width="512"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="参考资料"&gt;参考资料
&lt;/h1&gt;&lt;ol&gt;
&lt;li&gt;
&lt;p&gt;Park, Joon Sung et al.&lt;br&gt;
&lt;strong&gt;MemGPT: Towards LLMs as Operating Systems&lt;/strong&gt;&lt;br&gt;
arXiv:2310.08560&lt;br&gt;
&lt;a class="link" href="https://arxiv.org/abs/2310.08560" target="_blank" rel="noopener"
 &gt;https://arxiv.org/abs/2310.08560&lt;/a&gt;&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;Wang, Lei et al.&lt;br&gt;
&lt;strong&gt;LLM as OS, Agents as Apps: Envisioning AIOS, Agents and the AIOS-Agent Ecosystem&lt;/strong&gt;&lt;br&gt;
arXiv:2312.03815&lt;br&gt;
&lt;a class="link" href="https://arxiv.org/abs/2312.03815" target="_blank" rel="noopener"
 &gt;https://arxiv.org/abs/2312.03815&lt;/a&gt;&lt;/p&gt;
&lt;/li&gt;
&lt;/ol&gt;</description></item></channel></rss>