<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>AI工具 on KnightLi的博客</title>
        <link>https://www.knightli.com/tags/ai%E5%B7%A5%E5%85%B7/</link>
        <description>Recent content in AI工具 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Wed, 22 Apr 2026 23:05:00 +0800</lastBuildDate><atom:link href="https://www.knightli.com/tags/ai%E5%B7%A5%E5%85%B7/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>2026 年嵌入式开发环境怎么选：Keil、STM32CubeIDE、VS Code 与 AI 协作</title>
        <link>https://www.knightli.com/2026/04/22/embedded-development-environment-keil-vscode-ai-2026/</link>
        <pubDate>Wed, 22 Apr 2026 23:05:00 +0800</pubDate>
        
        <guid>https://www.knightli.com/2026/04/22/embedded-development-environment-keil-vscode-ai-2026/</guid>
        <description>&lt;p&gt;只要你还在做单片机或者嵌入式开发，很快就会遇到一个很现实的问题：到了 2026 年，在 AI 写代码已经越来越普遍的情况下，开发环境到底应该怎么选？&lt;/p&gt;
&lt;p&gt;这个问题表面上像是在比较几个 IDE，实际讨论的却是另一件事：你到底是要一个“能把工程跑起来的工具”，还是一套“兼顾生态、编码体验和 AI 协作能力”的工作流。&lt;/p&gt;
&lt;p&gt;如果按这个角度去看，答案往往就不是简单地在 &lt;code&gt;Keil&lt;/code&gt;、&lt;code&gt;STM32CubeIDE&lt;/code&gt;、&lt;code&gt;VS Code&lt;/code&gt;、&lt;code&gt;CLion&lt;/code&gt; 里选一个，而是重新组合它们各自最擅长的部分。&lt;/p&gt;
&lt;h2 id=&#34;先看几个主流选项各自解决什么问题&#34;&gt;先看几个主流选项，各自解决什么问题
&lt;/h2&gt;&lt;p&gt;嵌入式领域这些年常见的环境，基本还是那几类：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;Keil&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;STM32CubeIDE&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;VS Code&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;CLion&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果再往前追，当然还会有人提 &lt;code&gt;IAR&lt;/code&gt;。只是从今天的讨论出发，更值得看的已经不是“谁资格最老”，而是谁更适合当前这套开发现实。&lt;/p&gt;
&lt;p&gt;&lt;img src=&#34;https://www.knightli.com/2026/04/22/embedded-development-environment-keil-vscode-ai-2026/embedded-ide-comparison.svg&#34;
	
	
	
	loading=&#34;lazy&#34;
	
		alt=&#34;嵌入式开发环境横向对比图&#34;
	
	
&gt;&lt;/p&gt;
&lt;h2 id=&#34;keil生态强上手稳但编辑体验已经明显落后&#34;&gt;Keil：生态强、上手稳，但编辑体验已经明显落后
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;Keil&lt;/code&gt; 到今天仍然很难绕开，原因不复杂：它用得实在太广了。&lt;/p&gt;
&lt;p&gt;无论是公司里留下来的老工程，还是网上大量教程、资料、示例工程，很多都还是围绕 &lt;code&gt;Keil&lt;/code&gt; 组织的。它在编译、下载、调试这一整套流程上依然成熟，尤其是你真的要把板子跑起来时，它的路径非常短。&lt;/p&gt;
&lt;p&gt;它的问题也同样明显：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;界面老&lt;/li&gt;
&lt;li&gt;编辑体验一般&lt;/li&gt;
&lt;li&gt;不擅长承担 AI 辅助编码的主场&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以 &lt;code&gt;Keil&lt;/code&gt; 更像是一个“工程入口和调试底座”，而不是一个面向 2026 年编码体验的理想编辑环境。&lt;/p&gt;
&lt;h2 id=&#34;stm32cubeide对-stm32-友好但更多是学习和快速起步工具&#34;&gt;STM32CubeIDE：对 STM32 友好，但更多是学习和快速起步工具
&lt;/h2&gt;&lt;p&gt;如果你主要在 &lt;code&gt;STM32&lt;/code&gt; 生态里活动，&lt;code&gt;STM32CubeIDE&lt;/code&gt; 很容易成为第一个接触到的环境。&lt;/p&gt;
&lt;p&gt;它的优点很明确：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;上手友好&lt;/li&gt;
&lt;li&gt;外设配置和工程生成方便&lt;/li&gt;
&lt;li&gt;调试链路相对完整&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;对学生、新手和刚起步的项目来说，这套体验确实足够直接。&lt;/p&gt;
&lt;p&gt;但一旦进入更长期、更多协作、更多定制的工程环境，它的局限也会慢慢暴露出来。尤其是在商业项目或者更复杂的团队工作流里，它未必是那个最舒服的主环境。&lt;/p&gt;
&lt;p&gt;所以它更适合“快速启动”和“STM32 生态内的一体化体验”，不一定适合作为长期主力编辑器。&lt;/p&gt;
&lt;h2 id=&#34;vs-code严格说不是-ide但在-ai-时代优势越来越明显&#34;&gt;VS Code：严格说不是 IDE，但在 AI 时代优势越来越明显
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;VS Code&lt;/code&gt; 严格来说并不是传统意义上的 IDE，更准确地说，它是一个可扩展的代码编辑器。&lt;/p&gt;
&lt;p&gt;这也意味着它天然有两面性。&lt;/p&gt;
&lt;p&gt;它的弱点是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;需要插件和配置&lt;/li&gt;
&lt;li&gt;对新手不够友好&lt;/li&gt;
&lt;li&gt;不能开箱即用地替代嵌入式 IDE 全流程&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;但它真正强的地方，恰恰也在这里：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;可扩展性强&lt;/li&gt;
&lt;li&gt;编码体验明显更现代&lt;/li&gt;
&lt;li&gt;语法高亮、跳转、搜索、重构体验更好&lt;/li&gt;
&lt;li&gt;对 AI 工具和 Agent 工作流支持更积极&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;在今天这个阶段，很多人真正需要的已经不只是“能写代码”，而是“写代码时能不能顺手把 AI 协作接进来”。从这个角度看，&lt;code&gt;VS Code&lt;/code&gt; 的优势几乎是肉眼可见的。&lt;/p&gt;
&lt;h2 id=&#34;clion体验不错但在嵌入式场景里不够主流&#34;&gt;CLion：体验不错，但在嵌入式场景里不够主流
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;CLion&lt;/code&gt; 经常会被提到，因为它的 C/C++ 编码体验一直不差。&lt;/p&gt;
&lt;p&gt;但对很多嵌入式开发者来说，它的问题不一定出在“好不好用”，而是“值不值得切过去”：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用的人相对少&lt;/li&gt;
&lt;li&gt;与现有嵌入式工程生态连接不如 &lt;code&gt;Keil&lt;/code&gt; 直接&lt;/li&gt;
&lt;li&gt;在 AI 协作这件事上，也未必比 &lt;code&gt;VS Code&lt;/code&gt; 更有现实优势&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以它更像是一个“理论上也能做得不错”的选项，但在今天的嵌入式主流工作流里，并不是最自然的那个核心。&lt;/p&gt;
&lt;h2 id=&#34;更现实的答案keil-负责编译调试vs-code-负责写代码&#34;&gt;更现实的答案：Keil 负责编译调试，VS Code 负责写代码
&lt;/h2&gt;&lt;p&gt;如果把上面这些工具拆开看，很容易得到一个更务实的结论：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用 &lt;code&gt;Keil&lt;/code&gt; 保留现有工程生态、编译、下载和调试能力&lt;/li&gt;
&lt;li&gt;用 &lt;code&gt;VS Code&lt;/code&gt; 承担日常编码、搜索、跳转和 AI 协作&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这套组合的价值在于，它不是试图用一个工具包打天下，而是让每个工具回到自己最擅长的位置。&lt;/p&gt;
&lt;p&gt;对很多嵌入式工程来说，&lt;code&gt;Keil&lt;/code&gt; 的生态根本绕不开。既然如此，与其强行把所有工作都塞回 &lt;code&gt;Keil&lt;/code&gt;，不如承认它更适合作为后端编译调试入口；而真正的编辑体验，则交给 &lt;code&gt;VS Code&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;&lt;img src=&#34;https://www.knightli.com/2026/04/22/embedded-development-environment-keil-vscode-ai-2026/keil-vscode-ai-workflow.svg&#34;
	
	
	
	loading=&#34;lazy&#34;
	
		alt=&#34;Keil 与 VS Code 组合工作流示意图&#34;
	
	
&gt;&lt;/p&gt;
&lt;h2 id=&#34;为什么这套组合在-ai-时代更有优势&#34;&gt;为什么这套组合在 AI 时代更有优势
&lt;/h2&gt;&lt;p&gt;到了今天，开发环境的分界线已经不只是“编辑器顺不顺手”，而是“它能不能自然接入 AI”。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;VS Code&lt;/code&gt; 在这件事上有几个很现实的优势：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;AI 插件和 Agent 支持更活跃&lt;/li&gt;
&lt;li&gt;代码浏览体验更适合让 AI 读工程、改工程&lt;/li&gt;
&lt;li&gt;更容易和现代插件生态结合&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这意味着你可以把嵌入式开发里最痛苦的一部分工作，开始交给 AI 帮你分担：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;在现有工程里找函数和调用链&lt;/li&gt;
&lt;li&gt;快速生成一段初始化代码&lt;/li&gt;
&lt;li&gt;帮你补一个串口打印&lt;/li&gt;
&lt;li&gt;解释旧工程结构&lt;/li&gt;
&lt;li&gt;在已有文件里做小范围修改&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这些事情过去不是不能做，而是做起来不顺。&lt;code&gt;VS Code&lt;/code&gt; 的意义不只是“更好看”，而是它更容易成为 AI 协作的工作台。&lt;/p&gt;
&lt;h2 id=&#34;关键补丁用插件把-vs-code-和-keil-工程接起来&#34;&gt;关键补丁：用插件把 VS Code 和 Keil 工程接起来
&lt;/h2&gt;&lt;p&gt;这套工作流能不能成立，核心不在口号，而在你能不能把 &lt;code&gt;VS Code&lt;/code&gt; 和 &lt;code&gt;Keil&lt;/code&gt; 工程接起来。&lt;/p&gt;
&lt;p&gt;比较实用的一类插件思路，是让 &lt;code&gt;VS Code&lt;/code&gt; 直接读取 &lt;code&gt;Keil&lt;/code&gt; 工程结构，并在编辑器内部调用 &lt;code&gt;Keil&lt;/code&gt; 后台程序完成：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;打开工程&lt;/li&gt;
&lt;li&gt;编译&lt;/li&gt;
&lt;li&gt;下载&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这样一来，你日常写代码不用频繁在两个界面之间来回切，只有到了更重的调试环节，再回到 &lt;code&gt;Keil&lt;/code&gt; 里做单步、断点和寄存器观察。&lt;/p&gt;
&lt;p&gt;这类插件真正有价值的地方，不只是“少切几个窗口”，而是它让工作流连续起来了。&lt;/p&gt;
&lt;h2 id=&#34;不要忽视-cc-基础插件配置&#34;&gt;不要忽视 C/C++ 基础插件配置
&lt;/h2&gt;&lt;p&gt;如果你打算把 &lt;code&gt;VS Code&lt;/code&gt; 当作嵌入式主编辑器，一个非常基础但常被忽略的点是：一定要把 C/C++ 基础插件和工程索引配置好。&lt;/p&gt;
&lt;p&gt;否则你会遇到一系列很影响体验的问题：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;跳转不到定义&lt;/li&gt;
&lt;li&gt;红线误报&lt;/li&gt;
&lt;li&gt;补全不准&lt;/li&gt;
&lt;li&gt;头文件关系混乱&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;很多人会误以为是 &lt;code&gt;VS Code&lt;/code&gt; 不适合嵌入式，实际上往往只是工程索引和插件配置没接好。&lt;/p&gt;
&lt;p&gt;一旦这部分配置完整，&lt;code&gt;VS Code&lt;/code&gt; 才能真正发挥出它在阅读大型工程、搜索符号、配合 AI 辅助修改代码上的优势。&lt;/p&gt;
&lt;h2 id=&#34;这套工作流最适合谁&#34;&gt;这套工作流最适合谁
&lt;/h2&gt;&lt;p&gt;我觉得下面这几类人，会特别适合这种组合式环境：&lt;/p&gt;
&lt;h3 id=&#34;1-已经有大量-keil-工程的人&#34;&gt;1. 已经有大量 Keil 工程的人
&lt;/h3&gt;&lt;p&gt;如果你公司项目、课程资料或者历史代码都围绕 &lt;code&gt;Keil&lt;/code&gt; 展开，那就没必要为了“现代化”硬切掉原有生态。保留 &lt;code&gt;Keil&lt;/code&gt;，再补一个 &lt;code&gt;VS Code&lt;/code&gt; 前端，是迁移成本最低的做法。&lt;/p&gt;
&lt;h3 id=&#34;2-想用-ai-辅助写嵌入式代码的人&#34;&gt;2. 想用 AI 辅助写嵌入式代码的人
&lt;/h3&gt;&lt;p&gt;如果你已经习惯让 AI 帮你解释函数、补样板代码、改局部逻辑，那么 &lt;code&gt;VS Code&lt;/code&gt; 会比传统嵌入式 IDE 更自然地承接这件事。&lt;/p&gt;
&lt;h3 id=&#34;3-想同时兼顾学习资料和真实项目的人&#34;&gt;3. 想同时兼顾学习资料和真实项目的人
&lt;/h3&gt;&lt;p&gt;很多学习资料仍然建立在 &lt;code&gt;Keil&lt;/code&gt; 上，但你自己的工作流未必要停留在那个年代。把 &lt;code&gt;Keil&lt;/code&gt; 作为工程兼容层，把 &lt;code&gt;VS Code&lt;/code&gt; 作为生产力层，会更平衡。&lt;/p&gt;
&lt;h2 id=&#34;结语&#34;&gt;结语
&lt;/h2&gt;&lt;p&gt;到了 2026 年，嵌入式开发环境的关键问题，已经不再只是“哪个 IDE 功能更多”，而是“哪种组合最符合今天的工作方式”。&lt;/p&gt;
&lt;p&gt;如果你只想快速起步，&lt;code&gt;STM32CubeIDE&lt;/code&gt; 依然有它的位置；如果你要稳定接住大量既有工程，&lt;code&gt;Keil&lt;/code&gt; 依然绕不开；但如果你还想把现代编辑体验和 AI 协作一起接进来，那么更现实的答案，往往是：&lt;/p&gt;
&lt;p&gt;&lt;code&gt;Keil&lt;/code&gt; 负责编译和调试，&lt;code&gt;VS Code&lt;/code&gt; 负责写代码。&lt;/p&gt;
&lt;p&gt;这不一定是唯一答案，但很可能是当下最不拧巴的一种答案。&lt;/p&gt;
</description>
        </item>
        <item>
        <title>Claude Code 多 Agent 协作：Subagents 和 Agent Teams 怎么选</title>
        <link>https://www.knightli.com/2026/04/22/claude-code-subagents-vs-agent-teams/</link>
        <pubDate>Wed, 22 Apr 2026 21:35:52 +0800</pubDate>
        
        <guid>https://www.knightli.com/2026/04/22/claude-code-subagents-vs-agent-teams/</guid>
        <description>&lt;p&gt;Claude Code 里和多 Agent 协作相关的能力，最容易混淆的就是 &lt;code&gt;Subagents&lt;/code&gt; 和 &lt;code&gt;Agent Teams&lt;/code&gt;。它们看起来都像“多开几个 Agent 一起做事”，但定位并不一样。简单说，前者更适合把独立任务分出去做，后者更适合让多个 Agent 围绕同一件事持续协作、互相验证。&lt;/p&gt;
&lt;p&gt;如果你之前用过 Skill，也可以先这样理解：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Skill 负责定义流程和规则&lt;/li&gt;
&lt;li&gt;Subagent 或 Agent teammate 负责实际执行任务&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以问题不在于“哪个更高级”，而在于你要解决的是哪一类协作。&lt;/p&gt;
&lt;h2 id=&#34;subagents把支线任务分出去&#34;&gt;Subagents：把支线任务分出去
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;Subagents&lt;/code&gt; 更像是在当前会话里临时派出去的分身。每个分身都有自己的上下文窗口，做完之后只把结果摘要带回来，主对话不会被大量中间输出塞满。&lt;/p&gt;
&lt;p&gt;这类能力的优势很直接：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;主线对话更干净，不容易被测试日志、搜索结果或长输出污染&lt;/li&gt;
&lt;li&gt;可以把相互独立的研究或执行任务并行化&lt;/li&gt;
&lt;li&gt;适合“给我结果就行”的任务，不需要持续讨论&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;原文提到，Claude Code 内置了三类 Subagent：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;Explore&lt;/code&gt;：只读、适合快速搜索代码库&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Plan&lt;/code&gt;：只读、适合在 plan mode 下后台收集信息&lt;/li&gt;
&lt;li&gt;&lt;code&gt;General-purpose&lt;/code&gt;：可读可写，适合同时探索和修改的任务&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id=&#34;自定义-subagent&#34;&gt;自定义 Subagent
&lt;/h3&gt;&lt;p&gt;如果内置能力不够，可以自己定义一个 Subagent。方式也不复杂，本质上就是写一个 Markdown 文件：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;.claude/agents/&lt;/code&gt;：只对当前项目生效&lt;/li&gt;
&lt;li&gt;&lt;code&gt;~/.claude/agents/&lt;/code&gt;：对所有项目生效&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;文件格式类似这样：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt; 1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 5
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 6
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 7
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 8
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 9
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;10
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;11
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;12
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;13
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;14
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;15
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;16
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;17
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;18
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;19
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;20
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;21
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;22
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;23
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;24
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;25
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;26
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;27
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;28
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;29
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;30
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;31
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-markdown&#34; data-lang=&#34;markdown&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;---
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;name: code-reviewer
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;description: Expert code review specialist. Proactively reviews code for quality, security, and maintainability. Use immediately after writing or modifying code.
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;tools: Read, Grep, Glob, Bash
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;model: inherit
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;---
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;You are a senior code reviewer ensuring high standards of code quality and security.
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;When invoked:
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;1.&lt;/span&gt; Run git diff to see recent changes
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;2.&lt;/span&gt; Focus on modified files
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;3.&lt;/span&gt; Begin review immediately
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Review checklist:
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; Code is clear and readable
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; Functions and variables are well-named
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; No duplicated code
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; Proper error handling
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; No exposed secrets or API keys
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; Input validation implemented
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; Good test coverage
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; Performance considerations addressed
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Provide feedback organized by priority:
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; Critical issues (must fix)
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; Warnings (should fix)
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; Suggestions (consider improving)
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Include specific examples of how to fix issues.
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;这里最关键的是 &lt;code&gt;description&lt;/code&gt;。Claude 会根据这段描述判断什么时候应该调用这个 Subagent，所以写得越清楚，触发越准。&lt;/p&gt;
&lt;p&gt;另外几个常见配置项也很实用：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;tools&lt;/code&gt;：限制它能用哪些工具&lt;/li&gt;
&lt;li&gt;&lt;code&gt;model&lt;/code&gt;：决定使用 &lt;code&gt;sonnet&lt;/code&gt;、&lt;code&gt;opus&lt;/code&gt;、&lt;code&gt;haiku&lt;/code&gt; 或 &lt;code&gt;inherit&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;permissionMode&lt;/code&gt;：控制编辑权限和权限提示行为&lt;/li&gt;
&lt;li&gt;&lt;code&gt;memory&lt;/code&gt;：给 Subagent 配跨对话记忆目录&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果只是临时用一次，也可以直接通过 CLI 注入：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;5
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;6
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;7
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;8
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;claude --agents &lt;span class=&#34;s1&#34;&gt;&amp;#39;{
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;s1&#34;&gt;  &amp;#34;code-reviewer&amp;#34;: {
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;s1&#34;&gt;    &amp;#34;description&amp;#34;: &amp;#34;Expert code reviewer. Use proactively after code changes.&amp;#34;,
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;s1&#34;&gt;    &amp;#34;prompt&amp;#34;: &amp;#34;You are a senior code reviewer. Focus on code quality, security, and best practices.&amp;#34;,
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;s1&#34;&gt;    &amp;#34;tools&amp;#34;: [&amp;#34;Read&amp;#34;, &amp;#34;Grep&amp;#34;, &amp;#34;Glob&amp;#34;, &amp;#34;Bash&amp;#34;],
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;s1&#34;&gt;    &amp;#34;model&amp;#34;: &amp;#34;sonnet&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;s1&#34;&gt;  }
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;s1&#34;&gt;}&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id=&#34;subagents-适合什么场景&#34;&gt;Subagents 适合什么场景
&lt;/h3&gt;&lt;p&gt;最适合 &lt;code&gt;Subagents&lt;/code&gt; 的，通常是这些任务：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;跑测试并返回失败摘要，而不是把几千行日志全塞回主会话&lt;/li&gt;
&lt;li&gt;并行调查几个互不依赖的模块&lt;/li&gt;
&lt;li&gt;把“检查问题”和“修问题”拆成两步流水线&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;例如：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-md&#34; data-lang=&#34;md&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Research the authentication, database, and API modules in parallel using separate subagents
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-md&#34; data-lang=&#34;md&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Use the code-reviewer subagent to find performance issues, then use the optimizer subagent to fix them
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;但如果任务需要频繁来回修正、多个阶段共享大量上下文，或者改动高度集中在少数几个文件里，那么直接在主对话里做，往往比派 Subagent 更省事。&lt;/p&gt;
&lt;h2 id=&#34;agent-teams多个独立会话一起协作&#34;&gt;Agent Teams：多个独立会话一起协作
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;Agent Teams&lt;/code&gt; 是另一个层级的能力。它不是在一个会话里派出分身，而是启动多个彼此独立的 Claude Code 实例，让它们围绕共享任务列表协作，还可以互相发消息。&lt;/p&gt;
&lt;p&gt;这意味着它更像一个真正的小团队，而不只是“分出去做个支线”。&lt;/p&gt;
&lt;p&gt;原文提到，这项能力目前还是实验功能，需要先开启：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;5
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-json&#34; data-lang=&#34;json&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;p&#34;&gt;{&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;    &lt;span class=&#34;nt&#34;&gt;&amp;#34;env&amp;#34;&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;:&lt;/span&gt; &lt;span class=&#34;p&#34;&gt;{&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;        &lt;span class=&#34;nt&#34;&gt;&amp;#34;CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS&amp;#34;&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;:&lt;/span&gt; &lt;span class=&#34;s2&#34;&gt;&amp;#34;1&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;    &lt;span class=&#34;p&#34;&gt;}&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;p&#34;&gt;}&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;把它加到 &lt;code&gt;settings.json&lt;/code&gt; 后，就可以让 Claude 按你的要求组织一个 team。比如：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-md&#34; data-lang=&#34;md&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;I&amp;#39;m designing a CLI tool that helps developers track TODO comments across
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;their codebase. Create an agent team to explore this from different angles: one
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;teammate on UX, one on technical architecture, one playing devil&amp;#39;s advocate.
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id=&#34;agent-teams-的组成&#34;&gt;Agent Teams 的组成
&lt;/h3&gt;&lt;p&gt;一个 Agent Team 主要由三部分组成：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Team lead：你当前正在使用的主会话，负责组队、分派和汇总&lt;/li&gt;
&lt;li&gt;Teammates：多个独立的 Claude Code 实例&lt;/li&gt;
&lt;li&gt;Task list 和 Mailbox：共享任务列表与消息通道&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;和 Subagents 最大的不同在于，teammates 之间可以直接沟通，不需要每次都经过 lead 中转。任务状态通常会在 &lt;code&gt;pending&lt;/code&gt;、&lt;code&gt;in progress&lt;/code&gt;、&lt;code&gt;completed&lt;/code&gt; 之间流转，成员完成一个任务后，还可以继续认领下一个任务。&lt;/p&gt;
&lt;h3 id=&#34;agent-teams-适合什么场景&#34;&gt;Agent Teams 适合什么场景
&lt;/h3&gt;&lt;p&gt;当任务需要多角度讨论、互相挑战结论、或者拆成多个模块并行推进时，&lt;code&gt;Agent Teams&lt;/code&gt; 会更合适。&lt;/p&gt;
&lt;p&gt;原文给了几个很典型的场景：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;多人并行审查同一个 PR，但每个人关注不同维度&lt;/li&gt;
&lt;li&gt;围绕同一个 bug 提出不同假设，并互相反驳&lt;/li&gt;
&lt;li&gt;前端、后端、测试分别推进不同模块&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;比如并行代码审查：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;5
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-md&#34; data-lang=&#34;md&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Create an agent team to review PR &lt;span class=&#34;ni&#34;&gt;#142&lt;/span&gt;. Spawn three reviewers:
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; One focused on security implications
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; One checking performance impact
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;-&lt;/span&gt; One validating test coverage
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Have them each review and report findings.
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;再比如竞争假说式调试：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-md&#34; data-lang=&#34;md&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Users report the app exits after one message instead of staying connected.
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Spawn 5 agent teammates to investigate different hypotheses. Have them talk to
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;each other to try to disprove each other&amp;#39;s theories, like a scientific
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;debate. Update the findings doc with whatever consensus emerges.
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;这类任务的共性是：不是只要一个结果，而是需要不同 Agent 之间不断交换判断、修正方向，最后再形成比较可靠的结论。&lt;/p&gt;
&lt;h2 id=&#34;两者怎么选&#34;&gt;两者怎么选
&lt;/h2&gt;&lt;p&gt;如果要快速区分，可以直接记这条：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;做完给结果，用 &lt;code&gt;Subagents&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;需要讨论和相互验证，用 &lt;code&gt;Agent Teams&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;再展开一点，区别主要在这几个维度：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;通信方式：&lt;code&gt;Subagents&lt;/code&gt; 主要把结果回传给主对话；&lt;code&gt;Agent Teams&lt;/code&gt; 的成员之间可以直接通信&lt;/li&gt;
&lt;li&gt;协调模式：&lt;code&gt;Subagents&lt;/code&gt; 更依赖主会话统一调度；&lt;code&gt;Agent Teams&lt;/code&gt; 有共享任务列表，成员可以自己认领任务&lt;/li&gt;
&lt;li&gt;Token 成本：&lt;code&gt;Subagents&lt;/code&gt; 更省；&lt;code&gt;Agent Teams&lt;/code&gt; 成本更高，因为每个 teammate 都是独立实例&lt;/li&gt;
&lt;li&gt;适合任务：&lt;code&gt;Subagents&lt;/code&gt; 更适合独立、结果导向的任务；&lt;code&gt;Agent Teams&lt;/code&gt; 更适合需要讨论、交叉验证的任务&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;使用时要注意什么&#34;&gt;使用时要注意什么
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;Agent Teams&lt;/code&gt; 虽然更强，但并不意味着任何任务都值得开 team。原文特别提醒了几个现实问题：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;token 消耗明显更高&lt;/li&gt;
&lt;li&gt;同时让多个 teammate 改同一个文件，很容易互相覆盖&lt;/li&gt;
&lt;li&gt;teammate 太多会增加协调成本，收益未必继续增长&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;因此，比较稳妥的做法通常是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;3 到 5 个 teammate 作为起点&lt;/li&gt;
&lt;li&gt;按模块或文件拆任务，避免写入冲突&lt;/li&gt;
&lt;li&gt;如果 lead 过早接手了 teammate 的任务，要明确告诉它先等队友完成&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;另外，当前实验能力还有一些限制，例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;不支持 &lt;code&gt;/resume&lt;/code&gt; 和 &lt;code&gt;/rewind&lt;/code&gt; 恢复 in-process teammates&lt;/li&gt;
&lt;li&gt;任务状态偶尔会滞后，需要人工提醒更新&lt;/li&gt;
&lt;li&gt;一个 lead 一次只能管理一个 team&lt;/li&gt;
&lt;li&gt;teammate 不能再继续派子 team&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;简单结论&#34;&gt;简单结论
&lt;/h2&gt;&lt;p&gt;这两个能力并不是替代关系，而是分别解决两类协作问题。&lt;/p&gt;
&lt;p&gt;如果你的需求是“把支线任务并行做掉，别污染主上下文”，优先用 &lt;code&gt;Subagents&lt;/code&gt;。如果你的需求是“让几个 Agent 像一个小团队一样协作、讨论、交叉验证”，再考虑 &lt;code&gt;Agent Teams&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;先用一个真实场景试一次，通常很快就能体会到差别：一个强调上下文隔离和结果回收，另一个强调多视角协同和持续互动。&lt;/p&gt;
&lt;h2 id=&#34;相关链接&#34;&gt;相关链接
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;原文链接：&lt;a class=&#34;link&#34; href=&#34;https://cloud.tencent.com/developer/article/2652960&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://cloud.tencent.com/developer/article/2652960&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>GPT Image 2 正式发布：从能生成到能商用的跨越</title>
        <link>https://www.knightli.com/2026/04/22/gpt-image-2-from-generation-to-commercial-use/</link>
        <pubDate>Wed, 22 Apr 2026 20:08:22 +0800</pubDate>
        
        <guid>https://www.knightli.com/2026/04/22/gpt-image-2-from-generation-to-commercial-use/</guid>
        <description>&lt;p&gt;OpenAI 的下一代图像生成模型 &lt;code&gt;GPT Image 2&lt;/code&gt; 已经正式面向 ChatGPT 用户开放。结合社区在泄露测试阶段的反馈，以及公开可见的实际效果，这一代模型的变化不像一次常规迭代，更像是 AI 生图从“能看”走向“能用”的一次明显推进。&lt;/p&gt;
&lt;p&gt;如果说上一阶段的图像模型，更多还是用来做灵感图、概念图和试玩性质的生成，那么 &lt;code&gt;GPT Image 2&lt;/code&gt; 最突出的地方，是它开始接近生产级工具。无论是可读文字、界面截图、营销海报，还是更逼真的商业摄影风格图片，它都比过去更接近“直接拿去用”的状态。&lt;/p&gt;
&lt;h2 id=&#34;一核心升级五个最值得注意的点&#34;&gt;一、核心升级：五个最值得注意的点
&lt;/h2&gt;&lt;h3 id=&#34;1-文字渲染终于进入可用区间&#34;&gt;1. 文字渲染终于进入可用区间
&lt;/h3&gt;&lt;p&gt;AI 生图过去最难啃的一块，就是文字。乱码、拼写错误、长文本崩坏、字体变形，这些几乎是所有模型都会碰到的问题。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT Image 2&lt;/code&gt; 在这方面的提升非常明显。它不仅能处理更清晰的英文和中文文字，还能应对更复杂的排版、更长的段落，以及一定程度上的多语言混排。这意味着很多原本必须靠后期修字的场景，现在可以直接在生成阶段完成。&lt;/p&gt;
&lt;p&gt;比较典型的用法包括：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;海报&lt;/li&gt;
&lt;li&gt;社交媒体封面&lt;/li&gt;
&lt;li&gt;带标题与说明文字的宣传页&lt;/li&gt;
&lt;li&gt;PPT 配图&lt;/li&gt;
&lt;li&gt;带真实文案和界面元素的 App 截图&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;对实际工作流来说，这一步很重要。因为只要文字能稳定可读，图像生成就不再只是“出一张背景图”，而开始具备承接营销物料和产品展示图的能力。&lt;/p&gt;
&lt;h3 id=&#34;2-照片级真实感明显提升&#34;&gt;2. 照片级真实感明显提升
&lt;/h3&gt;&lt;p&gt;从社区并排对比来看，&lt;code&gt;GPT Image 2&lt;/code&gt; 的整体画质更锐利，材质纹理更细，光线一致性也更强。过去最容易露出 AI 痕迹的人脸、手部、边缘细节，这一代都明显更稳定。&lt;/p&gt;
&lt;p&gt;更准确地说，它不是完全没有破绽，而是“AI 味”显著下降。很多图第一次看上去，已经会让人直接把它当作真实照片、商业摄影样片或者游戏截图。&lt;/p&gt;
&lt;p&gt;这也是为什么很多人对它的第一反应不再是“画得不错”，而是“这张图已经很像真的了”。&lt;/p&gt;
&lt;h3 id=&#34;3-世界知识整合能力更强&#34;&gt;3. 世界知识整合能力更强
&lt;/h3&gt;&lt;p&gt;这是一个不那么显眼，但非常实用的升级。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT Image 2&lt;/code&gt; 给人的感觉，不只是会拼图块、凑风格，而是更像“知道自己在画什么”。原文里提到的几个方向很有代表性：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;手表表盘时间逻辑更合理&lt;/li&gt;
&lt;li&gt;品牌细节和角色特征还原更准确&lt;/li&gt;
&lt;li&gt;Minecraft 这类游戏截图或软件界面的逻辑结构更像真的&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这意味着它在处理现实物体、数字界面、游戏画面这类需要常识和结构感的内容时，成功率更高。对用户来说，这种提升往往比单纯的“更高清”更有价值。&lt;/p&gt;
&lt;h3 id=&#34;4-ui-与截图生成能力很强&#34;&gt;4. UI 与截图生成能力很强
&lt;/h3&gt;&lt;p&gt;从泄露期到正式上线，&lt;code&gt;GPT Image 2&lt;/code&gt; 最出圈的一个方向，就是生成软件界面、网页截图和 App mockup。&lt;/p&gt;
&lt;p&gt;这类任务过去很难做，因为它们同时要求：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;文字清楚&lt;/li&gt;
&lt;li&gt;布局规整&lt;/li&gt;
&lt;li&gt;按钮、卡片、导航条等元素对齐&lt;/li&gt;
&lt;li&gt;配色和层级像真实产品&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;而这次模型在这些方面的表现已经相当成熟。对于产品经理、独立开发者和设计师来说，这意味着可以更快做出高保真原型图，用于提案、演示甚至用户测试。&lt;/p&gt;
&lt;h3 id=&#34;5-局部编辑更接近实用工作流&#34;&gt;5. 局部编辑更接近实用工作流
&lt;/h3&gt;&lt;p&gt;按原文整理的信息，&lt;code&gt;GPT Image 2&lt;/code&gt; 支持更精准的局部编辑能力，也就是只修改画面中的特定区域，而不是每次整张图推倒重来。&lt;/p&gt;
&lt;p&gt;这类能力对创意工作流非常关键。因为实际设计场景里，很多时候不是“重做一张”，而是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;改一个按钮&lt;/li&gt;
&lt;li&gt;换一段文字&lt;/li&gt;
&lt;li&gt;调整某个物体的位置&lt;/li&gt;
&lt;li&gt;修一块背景&lt;/li&gt;
&lt;li&gt;替换局部元素&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果局部编辑足够稳定，AI 生图的价值就不只是第一次出图，而是能真正参与到反复迭代中。&lt;/p&gt;
&lt;h2 id=&#34;二怎么使用-gpt-image-2&#34;&gt;二、怎么使用 GPT Image 2
&lt;/h2&gt;&lt;h3 id=&#34;在-chatgpt-里使用&#34;&gt;在 ChatGPT 里使用
&lt;/h3&gt;&lt;p&gt;目前 &lt;code&gt;GPT Image 2&lt;/code&gt; 已经集成在 ChatGPT 里，普通用户可以直接通过图像生成功能调用。&lt;/p&gt;
&lt;p&gt;常见操作流程是：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;打开 ChatGPT 网页版或 App&lt;/li&gt;
&lt;li&gt;在输入框点击 &lt;code&gt;+&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;选择“创建图片”&lt;/li&gt;
&lt;li&gt;输入提示词并提交&lt;/li&gt;
&lt;li&gt;系统调用 &lt;code&gt;GPT Image 2&lt;/code&gt; 生成结果&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;原文还提到，不同订阅等级对应的可用额度不同，免费用户和 &lt;code&gt;Plus&lt;/code&gt; / &lt;code&gt;Pro&lt;/code&gt; 用户在生成次数上会有差别。具体额度规则建议以当时 ChatGPT 产品内显示为准，因为这类限制后续可能调整。&lt;/p&gt;
&lt;h3 id=&#34;在-api-中使用&#34;&gt;在 API 中使用
&lt;/h3&gt;&lt;p&gt;如果是开发者场景，也可以通过 OpenAI API 调用图像生成模型。原文里提到的模型名写法是 &lt;code&gt;gpt-image-2&lt;/code&gt;，但实际接入时仍建议以官方文档中的最新名称和参数为准。&lt;/p&gt;
&lt;p&gt;文中列出的几个常见分辨率如下：&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;分辨率&lt;/th&gt;
          &lt;th&gt;适用场景&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;1024×1024&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;通用方图、头像、社交媒体图片&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;1536×1024&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;横版封面、幻灯片、宽屏壁纸&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;1024×1536&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;竖版海报、手机壁纸、故事配图&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;2048×2048&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;高清印刷、大幅展示、精细插画&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;三几个代表性使用场景&#34;&gt;三、几个代表性使用场景
&lt;/h2&gt;&lt;p&gt;原文列了不少案例，这里整理出最有代表性的几类。&lt;/p&gt;
&lt;h3 id=&#34;1-app-界面截图&#34;&gt;1. App 界面截图
&lt;/h3&gt;&lt;p&gt;这一类提示词非常适合产品原型、设计演示、需求讨论。&lt;/p&gt;
&lt;p&gt;示例特点通常是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;指定平台风格，例如 iOS&lt;/li&gt;
&lt;li&gt;写清页面结构&lt;/li&gt;
&lt;li&gt;列出核心数据卡片&lt;/li&gt;
&lt;li&gt;指定底部导航栏&lt;/li&gt;
&lt;li&gt;说明配色与字体风格&lt;/li&gt;
&lt;li&gt;强调文字必须清晰、元素要对齐&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这种写法的重点不是“画面好看”，而是尽量减少模型发挥空间，让结果更像一个真的界面。&lt;/p&gt;
&lt;h3 id=&#34;2-电商产品图&#34;&gt;2. 电商产品图
&lt;/h3&gt;&lt;p&gt;像香水、耳机、手表、化妆品这类商品图，很适合 &lt;code&gt;GPT Image 2&lt;/code&gt; 发挥。&lt;/p&gt;
&lt;p&gt;因为它现在对以下内容的处理已经更稳定：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;玻璃、金属、液体等材质质感&lt;/li&gt;
&lt;li&gt;柔和阴影和反射&lt;/li&gt;
&lt;li&gt;商业摄影常见的布光逻辑&lt;/li&gt;
&lt;li&gt;简洁背景下的高端展示感&lt;/li&gt;
&lt;li&gt;少量品牌文字&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果生成结果稳定，很多电商详情图、营销页主图、社交媒体产品视觉，都能把试错成本压低很多。&lt;/p&gt;
&lt;h3 id=&#34;3-文字海报&#34;&gt;3. 文字海报
&lt;/h3&gt;&lt;p&gt;海报是最能体现这一代文字能力的场景之一。&lt;/p&gt;
&lt;p&gt;原文给出的方向很典型：在一个黄昏城市剪影背景上，明确写出主标题、时间地点、艺人名单，并要求：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;文字清晰可读&lt;/li&gt;
&lt;li&gt;无拼写错误&lt;/li&gt;
&lt;li&gt;中英文混排稳定&lt;/li&gt;
&lt;li&gt;风格统一&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这类任务过去通常要先生成背景图，再人工补字。现在如果模型能一次完成大部分工作，它的实用价值就会大很多。&lt;/p&gt;
&lt;h3 id=&#34;4-游戏概念图和假截图&#34;&gt;4. 游戏概念图和“假截图”
&lt;/h3&gt;&lt;p&gt;这是 &lt;code&gt;GPT Image 2&lt;/code&gt; 在社交媒体上最容易传播的一类内容。&lt;/p&gt;
&lt;p&gt;比如第三人称游戏截图、霓虹街道、雨后积水反射、景深、颗粒感、PS5 实机风格，这种提示词组合出来的结果，很容易让人第一眼误判为游戏泄露画面。&lt;/p&gt;
&lt;p&gt;从传播角度看，这类图很吸睛；从风险角度看，也说明以假乱真的门槛已经明显下降，用户对图片真实性的判断需要更谨慎。&lt;/p&gt;
&lt;h3 id=&#34;5-拟真人像与创意肖像&#34;&gt;5. 拟真人像与创意肖像
&lt;/h3&gt;&lt;p&gt;人像一直是 AI 图像能力最直观的测试题。&lt;/p&gt;
&lt;p&gt;原文里的示例聚焦在自然光、咖啡馆、逆光边缘、针织衫、暖色背景虚化这类细节组合。它们背后的重点其实是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;皮肤纹理自然&lt;/li&gt;
&lt;li&gt;发丝细节完整&lt;/li&gt;
&lt;li&gt;手部结构不崩&lt;/li&gt;
&lt;li&gt;光线逻辑合理&lt;/li&gt;
&lt;li&gt;整体氛围不带明显 AI 痕迹&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果这几点能稳定做到，人像生成才算真正进入可用阶段。&lt;/p&gt;
&lt;h3 id=&#34;6-美食摄影&#34;&gt;6. 美食摄影
&lt;/h3&gt;&lt;p&gt;原文还给了一个非常长的英文提示词，用来生成高端餐厅风格的豚骨拉面照片。这个例子说明了一个很现实的趋势：当模型足够强时，提示词可以写得像摄影脚本。&lt;/p&gt;
&lt;p&gt;这种写法会细到：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;菜品构成&lt;/li&gt;
&lt;li&gt;餐具材质&lt;/li&gt;
&lt;li&gt;汤底光泽&lt;/li&gt;
&lt;li&gt;叉烧的脂肪层和焦边&lt;/li&gt;
&lt;li&gt;溏心蛋状态&lt;/li&gt;
&lt;li&gt;背景景深和散景&lt;/li&gt;
&lt;li&gt;光源方向&lt;/li&gt;
&lt;li&gt;镜头型号与光圈&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;对于餐饮品牌、菜单设计、外卖平台主图和社交媒体内容，这种生成能力已经非常接近商业摄影替代方案。&lt;/p&gt;
&lt;h3 id=&#34;7-教育插图&#34;&gt;7. 教育插图
&lt;/h3&gt;&lt;p&gt;另一个很有代表性的方向，是带标注的科学教育图。&lt;/p&gt;
&lt;p&gt;原文示例是一张植物细胞剖面图，要求模型同时处理：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;结构正确&lt;/li&gt;
&lt;li&gt;标签位置准确&lt;/li&gt;
&lt;li&gt;引导线清晰&lt;/li&gt;
&lt;li&gt;字体统一&lt;/li&gt;
&lt;li&gt;配色有层次&lt;/li&gt;
&lt;li&gt;整体适合教材或课件使用&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这说明 &lt;code&gt;GPT Image 2&lt;/code&gt; 的价值不只是做“好看”的图，还包括做“信息型”的图。&lt;/p&gt;
&lt;h2 id=&#34;四对普通用户最实际的意义&#34;&gt;四、对普通用户最实际的意义
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;GPT Image 2&lt;/code&gt; 真正值得关注的地方，不只是它又把画质往前推了一步，而是它把 AI 生图从娱乐型、试玩型工具，进一步推向了可商用、可交付的生产工具。&lt;/p&gt;
&lt;p&gt;具体体现在几个层面：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;文字终于开始靠谱&lt;/li&gt;
&lt;li&gt;界面和海报更像真实物料&lt;/li&gt;
&lt;li&gt;商业摄影风格图更可用&lt;/li&gt;
&lt;li&gt;教育类、信息类图片也能做&lt;/li&gt;
&lt;li&gt;局部编辑让它更适合迭代&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;当然，这并不代表它已经完全替代设计师、摄影师或插画师。真正的商业项目仍然需要审美判断、品牌控制、版权意识和人工复核。&lt;/p&gt;
&lt;p&gt;但至少从这次更新能看出来，AI 图像生成的竞争点已经不只是“能不能出图”，而是“能不能更稳定地进入真实工作流”。&lt;/p&gt;
&lt;h2 id=&#34;相关链接&#34;&gt;相关链接
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;原文提到的参考链接：&lt;a class=&#34;link&#34; href=&#34;https://getgpt.pro/blog/gpt-image-2-release&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://getgpt.pro/blog/gpt-image-2-release&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;原文提到的体验站点：&lt;a class=&#34;link&#34; href=&#34;https://getgpt.pro&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://getgpt.pro&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;原文提到的邀请码链接：&lt;a class=&#34;link&#34; href=&#34;https://getgpt.pro/i/ig2&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://getgpt.pro/i/ig2&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>OpenAI 发布 ChatGPT Images 2.0：图像生成开始走向可直接交付</title>
        <link>https://www.knightli.com/2026/04/22/openai-chatgpt-images-2-0-deliverable-image-generation/</link>
        <pubDate>Wed, 22 Apr 2026 14:19:53 +0800</pubDate>
        
        <guid>https://www.knightli.com/2026/04/22/openai-chatgpt-images-2-0-deliverable-image-generation/</guid>
        <description>&lt;p&gt;OpenAI 在 2026 年 4 月 21 日发布了 &lt;a class=&#34;link&#34; href=&#34;https://openai.com/index/introducing-chatgpt-images-2-0/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Introducing ChatGPT Images 2.0&lt;/a&gt;。从官方页面来看，这次更新想强调的并不只是“图片更好看了”，而是图像生成正在往“更可控、可排版、可直接交付”的方向走。&lt;/p&gt;
&lt;p&gt;如果只看这篇发布页，它更像一组高密度能力展示，而不是传统意义上的技术说明。页面几乎没有展开模型结构、训练细节或基准测试，而是用大量示例图直接回答一个问题：现在的 ChatGPT 图像生成，能不能把过去还要靠设计师反复修图、补字、调版式的活，进一步前移到生成阶段。&lt;/p&gt;
&lt;h2 id=&#34;01-这次更新最明显的信号&#34;&gt;01 这次更新最明显的信号
&lt;/h2&gt;&lt;p&gt;官方页面里最醒目的几个关键词，其实已经把重点说得很清楚：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;Greater precision and control&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Stronger across languages&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Stylistic sophistication and realism&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这三点放在一起看，含义很明确。&lt;/p&gt;
&lt;p&gt;第一，不再只强调“想象力”，而是强调控制力。页面里出现了大量海报、杂志页、宣传页、信息图、角色设定页、分镜漫画、印刷书签这类示例。它们的共同点不是单张视觉冲击力，而是需要同时处理文字、层级、留白、构图、风格统一和输出比例。这说明 OpenAI 在刻意把产品定位从“生成一张图”往“生成一份可以拿去用的视觉成品”推进。&lt;/p&gt;
&lt;p&gt;第二，多语言文字能力被单独拎出来做展示。页面里不仅有多语种海报、书籍封面、韩文旅宿宣传页、日文漫画，还有专门强调 typography 的示例。这很关键，因为过去图像模型最容易翻车的地方之一，就是一旦涉及长文本、复杂版式或非英语文字，稳定性会明显下降。现在 OpenAI 把它放到发布页核心位置，本身就是在传递一个信号：文字渲染和跨语言排版，已经成为它们认为值得正面展示的能力。&lt;/p&gt;
&lt;p&gt;第三，风格覆盖面被拉得很宽。官方示例同时覆盖了写实摄影、复古拼贴、Bauhaus 海报、时尚大片、黑白纪实、儿童绘本、日漫、青年漫画、教育信息图、产品网格图、角色设定页等多种形式。这里想表达的不是“模型能模仿很多画风”这么简单，而是它正在尝试从单一美术风格输出，走向更完整的视觉任务适配。&lt;/p&gt;
&lt;h2 id=&#34;02-为什么说它在走向可直接交付&#34;&gt;02 为什么说它在走向“可直接交付”
&lt;/h2&gt;&lt;p&gt;从这页内容来看，ChatGPT Images 2.0 更像一个“图像制作工作台”能力升级，而不只是更强的文生图模型。&lt;/p&gt;
&lt;p&gt;过去很多模型虽然也能生成漂亮图片，但一旦用户需求变成下面这些任务，体验就会迅速下降：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;做一张带完整标题、副标题和说明文字的海报&lt;/li&gt;
&lt;li&gt;做一页信息密度较高的杂志或宣传页&lt;/li&gt;
&lt;li&gt;做带连续角色和连续叙事的漫画页&lt;/li&gt;
&lt;li&gt;做需要固定比例、特定版式和明确品牌感的营销物料&lt;/li&gt;
&lt;li&gt;做包含多语言文字的正式视觉内容&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;而 OpenAI 这次展示的例子，几乎都在正面回应这些老问题。&lt;/p&gt;
&lt;p&gt;例如页面里有教育信息图、设计趋势海报、书签印刷稿、咖啡店开业海报、旅游宣传页、产品周边展示图、论文海报重制图。这类内容有一个共同特征：它们不是“给人看一眼觉得不错”就结束，而是更接近真实工作流里的半成品甚至成品。&lt;/p&gt;
&lt;p&gt;换句话说，这次更新真正重要的地方，可能不是单张图质量又提升了多少，而是模型开始更像一套可用于内容生产、品牌物料、教育传播和轻量设计工作的生成系统。&lt;/p&gt;
&lt;h2 id=&#34;03-这对-chatgpt-产品定位意味着什么&#34;&gt;03 这对 ChatGPT 产品定位意味着什么
&lt;/h2&gt;&lt;p&gt;从发布页组织方式也能看出一些产品层面的变化。&lt;/p&gt;
&lt;p&gt;OpenAI 没有把 ChatGPT Images 2.0 包装成一个只服务创意圈的图像模型，而是不断用“研究、推理、资料转化、版面整理、知识表达、营销输出”这些场景去展示它。页面里甚至还有把数学证明、设计趋势、历史笔记、学术论文可视化的例子。&lt;/p&gt;
&lt;p&gt;这意味着图像生成在 ChatGPT 里的角色，已经不只是“给聊天配图”或“生成一张插画”，而是在向更通用的表达层靠拢。它想做的是：当用户已经在 ChatGPT 里思考、查资料、整理内容、写文案之后，最后一步连视觉产出也一起完成。&lt;/p&gt;
&lt;p&gt;如果这个方向继续推进，图像功能的竞争点就不再只是审美和写实程度，而会越来越依赖下面这些能力：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;是否能稳定处理复杂文字&lt;/li&gt;
&lt;li&gt;是否能维持跨页面或多面板的一致性&lt;/li&gt;
&lt;li&gt;是否能生成更接近真实工作物料的版式&lt;/li&gt;
&lt;li&gt;是否能在研究、写作、营销、教学这些任务里自然接上前面的上下文&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;04-这篇发布页没有说什么&#34;&gt;04 这篇发布页没有说什么
&lt;/h2&gt;&lt;p&gt;当然，发布页的写法也决定了它更适合“看方向”，不太适合“看细节”。&lt;/p&gt;
&lt;p&gt;截至官方页面 2026 年 4 月 21 日的内容，它主要展示的是结果，而不是方法。页面没有详细展开：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;模型与上一代相比的量化提升&lt;/li&gt;
&lt;li&gt;文字准确率或多语言渲染的明确指标&lt;/li&gt;
&lt;li&gt;复杂版式任务的失败边界&lt;/li&gt;
&lt;li&gt;API、价格、调用方式或企业侧接入细节&lt;/li&gt;
&lt;li&gt;安全策略和生成限制的具体更新&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以更准确地说，这篇文章传递的是产品信号，而不是完整技术规格。&lt;/p&gt;
&lt;h2 id=&#34;05-简单结论&#34;&gt;05 简单结论
&lt;/h2&gt;&lt;p&gt;如果只用一句话概括 ChatGPT Images 2.0，这次更新最值得注意的不是“更会画”，而是“更会做成品”。&lt;/p&gt;
&lt;p&gt;OpenAI 显然希望把图像生成从灵感型工具，往可执行、可排版、可沟通、可交付的生产工具推进。文字控制、多语言、版式、风格跨度、长页面内容组织，这些原本最容易暴露短板的地方，现在反而成了它主动展示的卖点。&lt;/p&gt;
&lt;p&gt;这不代表图像生成已经完全解决了设计工作里的所有问题，但至少从这次发布页可以看出，竞争重心正在变化。未来谁更强，可能不只是看谁能出一张更惊艳的图，而是看谁能更稳定地做出一份真的能拿去用的视觉内容。&lt;/p&gt;
&lt;h2 id=&#34;相关链接&#34;&gt;相关链接
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://openai.com/index/introducing-chatgpt-images-2-0/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Introducing ChatGPT Images 2.0 - OpenAI&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
