<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Architecture on Code Plato</title><link>https://CodePlato3721.github.io/zh/tags/architecture/</link><description>Recent content in Architecture on Code Plato</description><generator>Hugo -- gohugo.io</generator><language>zh</language><lastBuildDate>Tue, 05 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://CodePlato3721.github.io/zh/tags/architecture/index.xml" rel="self" type="application/rss+xml"/><item><title>基于 LLM 的 AI 智能体架构：一台长在你设备里的新型电脑</title><link>https://CodePlato3721.github.io/zh/post/%E5%9F%BA%E4%BA%8Ellm%E7%9A%84ai%E6%99%BA%E8%83%BD%E4%BD%93%E6%9E%B6%E6%9E%84/</link><pubDate>Tue, 05 May 2026 00:00:00 +0000</pubDate><guid>https://CodePlato3721.github.io/zh/post/%E5%9F%BA%E4%BA%8Ellm%E7%9A%84ai%E6%99%BA%E8%83%BD%E4%BD%93%E6%9E%B6%E6%9E%84/</guid><description>&lt;img src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/banner.png" alt="Featured image of post 基于 LLM 的 AI 智能体架构：一台长在你设备里的新型电脑" /&gt;&lt;h1 id="基于-llm-的-ai-智能体架构一台长在你设备里的新型电脑"&gt;基于 LLM 的 AI 智能体架构：一台长在你设备里的新型电脑
&lt;/h1&gt;&lt;p&gt;过去，我们一直把 AI 理解成一个&amp;quot;聊天机器人&amp;quot;。&lt;/p&gt;
&lt;p&gt;但如果从系统架构角度重新观察，会发现未来真正成熟的 AI 智能体，更像是一台安装在你设备里的新型个人电脑。&lt;/p&gt;
&lt;p&gt;它拥有：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;计算核心&lt;/li&gt;
&lt;li&gt;内存&lt;/li&gt;
&lt;li&gt;文件系统&lt;/li&gt;
&lt;li&gt;软件系统&lt;/li&gt;
&lt;li&gt;输入输出设备&lt;/li&gt;
&lt;li&gt;长期存储&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;只是：&lt;/p&gt;
&lt;p&gt;它的核心不再是传统 CPU，而是 LLM。&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="一llm-引擎没有记忆的cpu"&gt;一、LLM 引擎：没有记忆的&amp;quot;CPU&amp;quot;
&lt;/h1&gt;&lt;p&gt;LLM 本身其实没有长期记忆。&lt;/p&gt;
&lt;p&gt;它更像一个推理引擎：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;接收输入&lt;/li&gt;
&lt;li&gt;读取上下文&lt;/li&gt;
&lt;li&gt;进行推理&lt;/li&gt;
&lt;li&gt;输出结果&lt;/li&gt;
&lt;li&gt;然后&amp;quot;失忆&amp;quot;&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;它无法天然记住过去发生的事情。&lt;/p&gt;
&lt;p&gt;因此：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;LLM 本身更像 CPU，而不是完整的智能体。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;它只负责计算。&lt;/p&gt;
&lt;p&gt;真正让 AI &amp;ldquo;看起来认识你&amp;quot;的，是外部为它提供的上下文。&lt;/p&gt;
&lt;p&gt;&lt;img alt="LLM CPU" class="gallery-image" data-flex-basis="360px" data-flex-grow="150" height="1024" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/01_llm_cpu.png" srcset="https://CodePlato3721.github.io/01_llm_cpu_18372079591755365085_hu_588b3268f55695d5.png 800w, https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/01_llm_cpu.png 1536w" width="1536"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="二上下文ai-智能体的内存"&gt;二、上下文：AI 智能体的内存
&lt;/h1&gt;&lt;p&gt;如果 LLM 是 CPU，&lt;br&gt;
那么 Context（上下文）就是 AI 的内存。&lt;/p&gt;
&lt;p&gt;而这个内存，其实应该分成两层。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="1-全局上下文global-context"&gt;1. 全局上下文（Global Context）
&lt;/h2&gt;&lt;p&gt;这一层属于整个智能体。&lt;/p&gt;
&lt;p&gt;它记录：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用户偏好&lt;/li&gt;
&lt;li&gt;长期目标&lt;/li&gt;
&lt;li&gt;常用习惯&lt;/li&gt;
&lt;li&gt;人格设定&lt;/li&gt;
&lt;li&gt;长期规则&lt;/li&gt;
&lt;li&gt;历史知识&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&amp;ldquo;用户喜欢 Markdown&amp;rdquo;&lt;/li&gt;
&lt;li&gt;&amp;ldquo;用户正在学习 AI Agent&amp;rdquo;&lt;/li&gt;
&lt;li&gt;&amp;ldquo;用户习惯使用中文写作&amp;rdquo;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这些信息会长期影响智能体行为。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="2-会话上下文session-context"&gt;2. 会话上下文（Session Context）
&lt;/h2&gt;&lt;p&gt;这一层只属于当前对话。&lt;/p&gt;
&lt;p&gt;例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;当前正在讨论的话题&lt;/li&gt;
&lt;li&gt;当前文章结构&lt;/li&gt;
&lt;li&gt;最近几轮对话&lt;/li&gt;
&lt;li&gt;临时推理结果&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它更像程序运行时的临时内存。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="上下文窗口本质上是内存限制"&gt;上下文窗口，本质上是&amp;quot;内存限制&amp;rdquo;
&lt;/h2&gt;&lt;p&gt;LLM 的 Context Window 并不是无限的。&lt;/p&gt;
&lt;p&gt;这意味着：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;历史不能无限累积&lt;/li&gt;
&lt;li&gt;信息会越来越贵&lt;/li&gt;
&lt;li&gt;超过限制后必须被压缩&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;于是：&lt;/p&gt;
&lt;p&gt;智能体必须像操作系统一样管理内存：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;压缩历史&lt;/li&gt;
&lt;li&gt;总结摘要&lt;/li&gt;
&lt;li&gt;清理低优先级信息&lt;/li&gt;
&lt;li&gt;转移长期信息&lt;/li&gt;
&lt;li&gt;动态加载需要的数据&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;因此：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;Context Window 本质上就是 AI 的内存容量。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;&lt;img alt="Context Memory" class="gallery-image" data-flex-basis="280px" data-flex-grow="117" height="435" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/02_context_memory.png" width="509"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="三markdown-文件智能体的硬盘"&gt;三、Markdown 文件：智能体的硬盘
&lt;/h1&gt;&lt;p&gt;长期数据不应该一直放在上下文里。&lt;/p&gt;
&lt;p&gt;否则：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;成本会越来越高&lt;/li&gt;
&lt;li&gt;推理速度会下降&lt;/li&gt;
&lt;li&gt;Context 会迅速膨胀&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;因此：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;长期记忆应该存在文件系统中。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;而一种非常自然的形式，就是 Markdown 文件。&lt;/p&gt;
&lt;p&gt;例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;笔记&lt;/li&gt;
&lt;li&gt;项目资料&lt;/li&gt;
&lt;li&gt;日记&lt;/li&gt;
&lt;li&gt;世界观&lt;/li&gt;
&lt;li&gt;用户档案&lt;/li&gt;
&lt;li&gt;写作素材&lt;/li&gt;
&lt;li&gt;长期知识库&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;都可以直接存成 Markdown。&lt;/p&gt;
&lt;p&gt;这意味着：&lt;/p&gt;
&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;传统电脑&lt;/th&gt;
					&lt;th&gt;AI 智能体&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;硬盘&lt;/td&gt;
					&lt;td&gt;Markdown 文件系统&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;Markdown 有一个巨大优势：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;它既能被 AI 阅读，也能被人类直接阅读。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;因此：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;人类可以编辑&lt;/li&gt;
&lt;li&gt;AI 可以处理&lt;/li&gt;
&lt;li&gt;Git 可以版本管理&lt;/li&gt;
&lt;li&gt;文件可以同步&lt;/li&gt;
&lt;li&gt;即使脱离 AI 依然存在&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这会形成一种：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&amp;ldquo;人与 AI 共用的知识空间&amp;rdquo;。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;&lt;img alt="Markdown Storage" class="gallery-image" data-flex-basis="289px" data-flex-grow="120" height="425" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/03_markdown_storage.png" width="512"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="四skill安装在-ai-上的软件"&gt;四、Skill：安装在 AI 上的软件
&lt;/h1&gt;&lt;p&gt;未来的 AI 智能体，不会只有&amp;quot;知识&amp;quot;。&lt;/p&gt;
&lt;p&gt;它还会拥有&amp;quot;技能&amp;quot;。&lt;/p&gt;
&lt;p&gt;例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;写作 Skill&lt;/li&gt;
&lt;li&gt;编程 Skill&lt;/li&gt;
&lt;li&gt;视频剪辑 Skill&lt;/li&gt;
&lt;li&gt;数据分析 Skill&lt;/li&gt;
&lt;li&gt;项目管理 Skill&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这些 Skill 可能由：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Prompt&lt;/li&gt;
&lt;li&gt;工作流&lt;/li&gt;
&lt;li&gt;Python 代码&lt;/li&gt;
&lt;li&gt;MCP 配置&lt;/li&gt;
&lt;li&gt;Tool 调用规则&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;共同组成。&lt;/p&gt;
&lt;p&gt;它们就像：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;安装在 AI 身上的软件。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;因此：&lt;/p&gt;
&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;传统电脑&lt;/th&gt;
					&lt;th&gt;AI 智能体&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;软件 / App&lt;/td&gt;
					&lt;td&gt;Skill&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;Skill 可以：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;安装&lt;/li&gt;
&lt;li&gt;卸载&lt;/li&gt;
&lt;li&gt;更新&lt;/li&gt;
&lt;li&gt;共享&lt;/li&gt;
&lt;li&gt;组合&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;未来甚至可能出现：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Skill Store&lt;/li&gt;
&lt;li&gt;Skill Marketplace&lt;/li&gt;
&lt;li&gt;开源 Skill 社区&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;img alt="Skill Software" class="gallery-image" data-flex-basis="293px" data-flex-grow="122" height="418" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/04_skill_software.png" width="512"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="五输入输出不只是文字"&gt;五、输入输出：不只是文字
&lt;/h1&gt;&lt;p&gt;传统聊天机器人最大的误导之一，是大家以为 AI 只有文字交互。&lt;/p&gt;
&lt;p&gt;实际上未来的 AI 智能体，会拥有完整的多模态输入输出系统。&lt;/p&gt;
&lt;h2 id="输入"&gt;输入
&lt;/h2&gt;&lt;p&gt;AI 可以读取：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;文字&lt;/li&gt;
&lt;li&gt;语音&lt;/li&gt;
&lt;li&gt;图片&lt;/li&gt;
&lt;li&gt;视频&lt;/li&gt;
&lt;li&gt;摄像头&lt;/li&gt;
&lt;li&gt;文件&lt;/li&gt;
&lt;li&gt;屏幕内容&lt;/li&gt;
&lt;li&gt;设备状态&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="输出"&gt;输出
&lt;/h2&gt;&lt;p&gt;AI 可以生成：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;文本&lt;/li&gt;
&lt;li&gt;语音&lt;/li&gt;
&lt;li&gt;图像&lt;/li&gt;
&lt;li&gt;视频&lt;/li&gt;
&lt;li&gt;自动化操作&lt;/li&gt;
&lt;li&gt;控制指令&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;因此：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;AI 智能体本质上是一种新的交互层。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;&lt;img alt="Multimodal IO" class="gallery-image" data-flex-basis="240px" data-flex-grow="100" height="512" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/05_multimodal_io.png" width="512"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="电脑整机一种类冯诺依曼结构的-ai-计算机"&gt;电脑整机：一种&amp;quot;类冯诺依曼结构&amp;quot;的 AI 计算机
&lt;/h1&gt;&lt;p&gt;如果把整个架构放在一起：&lt;/p&gt;
&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;传统计算机&lt;/th&gt;
					&lt;th&gt;AI 智能体&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;CPU&lt;/td&gt;
					&lt;td&gt;LLM 引擎&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;内存&lt;/td&gt;
					&lt;td&gt;Context&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;硬盘&lt;/td&gt;
					&lt;td&gt;Markdown 文件系统&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;软件&lt;/td&gt;
					&lt;td&gt;Skill&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;输入设备&lt;/td&gt;
					&lt;td&gt;多模态输入&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;输出设备&lt;/td&gt;
					&lt;td&gt;多模态输出&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;你会发现：&lt;/p&gt;
&lt;p&gt;它已经越来越像一台真正的计算机。&lt;/p&gt;
&lt;p&gt;只是：&lt;/p&gt;
&lt;p&gt;这台计算机不是围绕 GUI 构建的。&lt;/p&gt;
&lt;p&gt;而是围绕：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&amp;ldquo;语言理解与推理&amp;rdquo;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;构建的。&lt;/p&gt;
&lt;p&gt;&lt;img alt="AI Computer Architecture" class="gallery-image" data-flex-basis="289px" data-flex-grow="120" height="425" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/06_ai_computer_architecture.png" width="512"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="操作系统个人-ai-操作系统"&gt;操作系统：个人 AI 操作系统
&lt;/h1&gt;&lt;p&gt;未来每个人设备中，都可能长期存在一个 AI Agent。&lt;/p&gt;
&lt;p&gt;它：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;理解你&lt;/li&gt;
&lt;li&gt;记住你&lt;/li&gt;
&lt;li&gt;帮助你工作&lt;/li&gt;
&lt;li&gt;管理你的知识&lt;/li&gt;
&lt;li&gt;调度你的 Skills&lt;/li&gt;
&lt;li&gt;操作你的设备&lt;/li&gt;
&lt;li&gt;与你长期共同成长&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;那时：&lt;/p&gt;
&lt;p&gt;我们使用的可能不再只是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Windows&lt;/li&gt;
&lt;li&gt;macOS&lt;/li&gt;
&lt;li&gt;Android&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;而是：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;一个以 LLM 为核心的新型个人 AI 操作系统。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;而今天的聊天框，&lt;/p&gt;
&lt;p&gt;可能只是这个新时代最早期的雏形。&lt;/p&gt;
&lt;p&gt;&lt;img alt="Personal AI OS" class="gallery-image" data-flex-basis="280px" data-flex-grow="116" height="438" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://pub-deacd49348914a49b1254b01f351ef0d.r2.dev/2026/05/llm-agent-architecture-a-new-kind-of-personal-computer/cn/07_personal_ai_os.png" width="512"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h1 id="参考资料"&gt;参考资料
&lt;/h1&gt;&lt;ol&gt;
&lt;li&gt;
&lt;p&gt;Park, Joon Sung et al.&lt;br&gt;
&lt;strong&gt;MemGPT: Towards LLMs as Operating Systems&lt;/strong&gt;&lt;br&gt;
arXiv:2310.08560&lt;br&gt;
&lt;a class="link" href="https://arxiv.org/abs/2310.08560" target="_blank" rel="noopener"
 &gt;https://arxiv.org/abs/2310.08560&lt;/a&gt;&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;Wang, Lei et al.&lt;br&gt;
&lt;strong&gt;LLM as OS, Agents as Apps: Envisioning AIOS, Agents and the AIOS-Agent Ecosystem&lt;/strong&gt;&lt;br&gt;
arXiv:2312.03815&lt;br&gt;
&lt;a class="link" href="https://arxiv.org/abs/2312.03815" target="_blank" rel="noopener"
 &gt;https://arxiv.org/abs/2312.03815&lt;/a&gt;&lt;/p&gt;
&lt;/li&gt;
&lt;/ol&gt;</description></item></channel></rss>