Codex App 保姆级上手:安装、沙盒、并行任务、Skills 与 MCP

Codex App 完整上手指南:安装登录、项目与任务管理、沙盒权限、上下文、模型选择、Git、worktree、云端运行、AGENTS.md、插件、Skills、MCP 和电脑自动化。

Codex App 可以理解成一个面向 AI 编程的任务工作台。它不是传统 IDE,也不是单纯聊天窗口,而是把多任务、项目管理、沙盒权限、Git、云端运行、插件、Skills、MCP 和自动化集中到一个界面里。

如果你已经在用 Codex CLI、Claude Code、Cursor 或其他 coding agent,Codex App 最值得关注的地方,是它把“多个 agent 并行干活”做成了一个更清晰的桌面工作流。

Codex App 适合做什么

Codex App 的核心价值不是让 AI 回答问题,而是让 AI 在项目目录里持续执行任务:

  • 修改代码、运行命令、启动开发服务。
  • 管理多个项目和多个任务。
  • 在本地或云端执行长任务。
  • 调用插件、Skills 和 MCP 扩展能力。
  • 通过 Git、worktree 和 PR 管理改动。

OpenAI 官方也把 Codex App 定位成一个用于管理多个 coding agent 的界面。它适合需要同时推进多个代码任务的人,尤其适合前端页面、脚本工具、小型应用、文档整理和自动化工作流。

安装前准备

使用 Codex App 前,建议先准备好三个基础工具:

  1. Git
  2. Node.js
  3. VS Code 或你常用的 IDE

Codex App 支持 macOS 和 Windows。安装后使用 ChatGPT 账号登录,首次进入时可以选择主要使用场景,例如编程或日常工作。Codex 会根据选择预装一部分插件和 Skills,后续也可以在设置和插件市场里调整。

Windows 和 macOS 的主要功能大体一致,但部分电脑自动化能力可能依赖具体平台和插件支持,实际以你当前版本显示为准。

界面结构:项目、任务和对话

Codex App 是典型的三栏布局:

  • 左侧:项目、任务、历史对话、插件和自动化入口。
  • 中间:当前对话窗口。
  • 右侧:文件、浏览器、终端、运行结果等多功能区域。

一个项目通常对应一个本地文件夹。你可以在同一个项目里开多个对话,也可以同时打开多个项目,让不同 agent 并行执行任务。

任务列表会显示不同状态:

  • 正在运行:agent 仍在执行。
  • 等待批准:需要你确认权限、联网、安装依赖或执行高风险操作。
  • 已完成:任务已经结束,可以查看结果或继续追问。

这比在多个终端窗口里来回切换更直观,也更适合同时管理多个 AI 任务。

沙盒与权限控制

Codex App 的权限体系围绕沙盒展开。默认情况下,当前项目文件夹会成为 agent 的主要工作范围。

常见权限边界包括:

  • 可以读取和修改项目目录内的文件。
  • 默认不能随意修改项目外文件。
  • 默认会限制联网或高风险命令。
  • 需要越权时,会向用户申请批准。

比较实用的模式是“自动审查”:低风险操作由系统自动放行,高风险操作再交给用户确认。这样既能减少频繁弹窗,又能避免 agent 在不知情的情况下执行危险操作。

“完全访问”要谨慎开启。它适合你明确知道 agent 要做什么,并且项目已经有 Git 备份、重要文件也有额外备份的场景。日常使用不建议长期保持完全访问。

上下文、模型和额度

Codex App 会显示当前对话的上下文使用情况。对话越长,历史内容越多,模型需要处理的上下文也越大。

实用建议是:

  • 一个任务完成后,优先开新对话。
  • 长对话可以手动压缩,但不要把压缩当成万能记忆。
  • 复杂任务先写清楚目标、边界和验收标准。
  • 不要把大量无关日志、报错和文件一次性塞进对话。

模型选择上,可以根据任务复杂度调整思考强度。简单修改、文案整理、重复任务不一定需要最高规格模型;架构迁移、疑难 bug、跨文件重构则更适合使用更强模型。

如果界面里有快速模式,也要注意它通常会带来更高的额度消耗。赶时间时可以开,日常不必默认开启。

图片生成与多模态输入

Codex App 可以接收图片和文件作为上下文,也可以在合适场景中调用图像生成能力。

这对前端和内容类项目很有用。例如你可以让 Codex:

  • 根据截图修正页面样式。
  • 替换网页中的不合适配图。
  • 生成产品图、轮播图或页面素材。
  • 根据 UI 截图指出需要修改的位置。

更高效的用法是:不要只说“改好看一点”,而是结合截图指出具体问题,例如“这个卡片间距太大”“这里的图和服务场景不匹配”“把地图区域做得更清楚”。

Steer:任务执行中及时纠偏

Steer 可以理解成“执行中接管方向”。当 agent 已经开始执行,但你发现它理解错了方向,不应该等它全部跑完再改。

这时可以使用引导功能,把新的指令插入当前执行流程,让 Codex 及时修正路线。

适合使用 Steer 的场景包括:

  • agent 误解了需求。
  • 生成的页面风格明显不对。
  • 正在执行的方案成本太高。
  • 你临时补充了关键约束。

一般建议保留默认排队行为,只在确实需要干预时手动使用 Steer。这样既不会打乱正常任务,也能在关键时刻把方向拉回来。

计划模式和内置浏览器

复杂任务建议先开计划模式。计划模式下,Codex 不会马上改代码,而是先输出方案,必要时还会用卡片形式追问关键选择。

适合开计划模式的任务:

  • 框架迁移,例如从普通 React 项目迁到 Next.js。
  • 大范围重构。
  • 涉及数据库、认证、部署的功能。
  • 你还没想清楚技术路线的需求。

Codex App 的右侧区域可以打开内置浏览器,用来预览本地开发服务。你可以在页面上做批注,让 Codex 按具体 UI 位置修改问题。这种“看页面、点位置、让 AI 改”的流程,比纯文字描述更适合前端调试。

Git、IDE 和代码回滚

Codex App 不是完整 IDE。它可以查看代码、批注代码,但真正的手写编辑仍然更适合交给 VS Code、Cursor、Windsurf 等 IDE。

建议每个 Codex 项目都尽早初始化 Git:

  1. 让 Codex 创建或检查 .gitignore
  2. 在完成一个可用状态后提交一次。
  3. 每次大改前确保有干净提交点。
  4. 不满意时用 Git 回滚代码。

如果只回滚对话历史,代码不会自动跟着回滚。比较稳的做法是:对话层面回到合适节点,代码层面用 Git commit hash 回到对应状态。

Worktree:并行开发多个方向

git worktree 是 Codex App 里非常适合并行 agent 的能力。

它的本质是:基于同一个仓库创建多个独立工作目录,每个目录对应不同分支。这样你可以让不同 agent 在不同文件夹里同时开发,不互相覆盖。

典型用法:

  • 一个 worktree 优化客户评价组件。
  • 一个 worktree 调整门店信息和地图布局。
  • 两个任务完成后分别合并回主干。
  • 合并完成后删除临时 worktree。

这比在同一个目录里让多个 agent 同时改代码稳得多。遇到冲突时,也可以按正常 Git 流程 review 和合并。

云端运行环境

Codex 不只能在本机工作,也可以把任务委托到云端环境执行。

云端运行适合这些场景:

  • 出门在外,手边只有手机。
  • 希望 agent 在后台跑长任务。
  • 代码已经同步到 GitHub,需要让 Codex 基于远端仓库修改。
  • 希望通过 PR 形式审查和合并改动。

典型流程是:先把本地代码推到 GitHub,再让 Codex 在云端环境中拉取仓库、执行任务、生成改动,最后以 PR 或 diff 的方式交给你审核。

本地继续开发时,要记得把远端最新改动同步回来。

记忆系统:写好 AGENTS.md

新对话默认没有完整历史记忆。项目一复杂,如果每次都重新解释背景,会很浪费。

最通用的做法,是在项目根目录维护 AGENTS.md。这个文件可以记录:

  • 项目目标和主要技术栈。
  • 常用命令。
  • 目录结构说明。
  • 代码风格和命名约定。
  • 禁止事项,例如不要批量删除文件。
  • 测试、构建和部署规则。

你也可以让 Codex 先通读项目,再生成一版 AGENTS.md,然后人工审一遍。复杂项目里,这个文件非常值得维护。

全局规则也要谨慎。适合写入所有项目都通用的安全约束,例如“不要递归删除目录”“执行破坏性操作前必须确认”。不要把某个项目的细节写进全局规则,否则会污染其他项目。

插件和自动化

插件用于把外部服务接入 Codex,例如 GitHub、Gmail、Google Drive、数据库、部署平台等。

插件的价值在于减少复制粘贴。比如你可以让 Codex:

  • 查看某个 GitHub 仓库的 star 趋势。
  • 整理邮件内容并发给自己。
  • 定期执行某个检查任务。
  • 把结果写成摘要。

自动化则适合重复任务。例如每周五下午检查一次仓库数据,并发送邮件报告。简单自动化任务通常不需要最高规格模型,选择较轻量的模型即可。

Skills:把工作流变成可复用能力

Skills 是 Codex 的“专业说明书”。它不是单次提示词,而是把某类任务的流程、规范、脚本和注意事项沉淀下来,让 Codex 后续稳定复用。

常见来源有三类:

  • 官方 Skills。
  • 第三方 Skills。
  • 自己编写的 Skills。

适合做成 Skill 的工作:

  • 把字幕整理成图文笔记。
  • 按公司规范写周报。
  • 批量处理图片或文档。
  • 固定格式的代码审查。
  • 特定框架的项目初始化。

如果某个提示词你已经复制粘贴了很多次,就值得考虑把它做成 Skill。

MCP:接入外部工具和数据库

MCP 可以理解成给大模型使用的标准化工具协议。通过 MCP,Codex 可以调用外部服务完成更具体的任务。

例如接入 Supabase 后,可以让 Codex:

  • 创建数据表。
  • 读取数据库结构。
  • 修改后端接口。
  • 把前端表单提交到数据库。
  • 根据数据库状态调试问题。

这类能力很强,但也要注意权限边界。数据库、生产环境、部署平台、邮件账号都属于高风险资源。第一次接入时,最好使用测试项目和低权限账号。

部署插件

部署平台插件可以让 Codex 直接完成构建和发布,例如把前端项目部署到 Netlify 一类平台。

这类插件适合小型网站、原型页面、内部工具和展示项目。实际使用时建议注意:

  • 部署前先跑本地构建。
  • 环境变量不要直接写进代码。
  • 发布后检查页面是否能正常访问。
  • 生产项目要保留人工 review。

AI 可以帮你打通发布流程,但发布权限仍然要谨慎管理。

电脑自动化

在支持的平台和插件环境里,Codex 还可以操作浏览器或桌面应用,完成更接近 RPA 的任务。

例如:

  • 打开聊天软件并准备一条消息。
  • 浏览项目看板,汇总任务状态。
  • 生成英文简报。
  • 在你确认后发送给指定对象。
  • 把这套流程做成定时自动化。

这类功能很有想象力,但也最需要安全边界。凡是涉及发消息、发邮件、提交表单、付款、删除数据的操作,都应该保留人工确认。

使用建议

Codex App 的正确打开方式,不是让它一次性全自动接管一切,而是把任务拆清楚,让它在受控环境里高效执行。

推荐习惯:

  • 每个项目先初始化 Git。
  • 复杂任务先开计划模式。
  • 并行任务优先用 worktree。
  • 项目规则写进 AGENTS.md
  • 高风险操作保留人工确认。
  • 重复流程沉淀成 Skill 或自动化。
  • 插件和 MCP 先在测试环境验证。

参考资料

小结

Codex App 的重点不是“多一个 AI 聊天窗口”,而是把 AI 编程变成一个可管理的工作台:本地项目、云端任务、Git、worktree、插件、Skills、MCP 和自动化都能串起来。

真正用好它的关键,是在“放权”和“控制”之间找到平衡。小任务可以大胆交给 Codex,复杂任务先让它计划,高风险动作必须确认。这样它才会从一个会写代码的助手,变成可以长期协作的工程工具。

记录并分享
使用 Hugo 构建
主题 StackJimmy 设计