Codex App 从0到1完整入门教程:把这个超级APP的每一个细节抽丝剥茧讲清楚

最近我发现,很多人第一次接触 Codex App 的反应不是"哇,好强",而是:

这玩意儿到底从哪开始使用?需不需要我配置一大堆东西?

左边一堆入口,中间是聊天,右边又会弹出网页、图片、文档、来源、代码变化。设置里还有一堆看起来很技术的东西。

作为小白,困住你的大概率不是不想用Codex,而是压根不知道如何第一次上手Codex。

所以这篇文章不是技术类文章,我会按一个普通人的使用路线抽丝剥茧地来讲清楚:

  1. Codex App 到底是什么。
  2. 本地 App、云端 Codex、普通 ChatGPT 的区别。
  3. 打开 App 后,左边、中间、右边分别是干什么的。
  4. 设置页每个目录到底管什么。
  5. 普通对话和项目对话有什么区别。
  6. 插件、技能、MCP、自动化、Git 这些词怎么理解。
  7. 哪些地方小白最容易点错。

本文基于 Mac 版 Codex App 实测整理。 Codex版本:Codex 26.429.30905。 Codex App 更新很快,你看到的按钮名称和位置可能会有一点变化,但核心逻辑基本一样。

一、Codex App 到底是什么

一句话:Codex App 是一个把 AI Agent 放进你电脑里的工作台,只要你能在电脑上做的操作,它基本上也都能做,而且它会做的更完美、更高效。

说白了,它不是一个你问一句,它答一句的普通聊天框。Codex App 更像是你的助理,它可以:

  • 和你聊天。
  • 读你指定的本地文件。
  • 搜索网页。
  • 打开内置浏览器。
  • 生成图片、文档、PPT、网页、代码等结果。
  • 用插件连接 Gmail、GitHub、Google Drive、Slack 等外部工具。
  • 设置自动化,定期帮你检查、总结或继续任务。

如果你是非程序员,可以先把它理解成:

一个更偏"做事"的 ChatGPT。

它不是只回答"怎么做",而是很多时候可以直接帮你"做一遍"。

但也正因为它能做事,所以你必须理解它的界面和权限。不然你会不知道它到底是在本地电脑上做事,还是在云端任务里做事,也不知道它什么时候会碰到你的文件。

先看一张打开后的整体界面。

这张图先不用看细节。你只要记住:左边是导航栏,中间是你和 Codex 对话的地方,右边有时会出现结果、来源、预览和代码变化。

这就是 Codex App 和普通聊天框最大的差别:它不是只有"问答",它还有"工作现场"。

二、下载和登录

Mac 用户建议只从 OpenAI 官方入口下载 Codex App: https://openai.com/codex/

OpenAI Codex 官网下载页面
OpenAI 官方 Codex 下载页面

安装方式和普通 Mac App 差不多:

  1. 下载 Codex App。
  2. 打开安装包。
  3. 把 Codex 拖进"应用程序"。
  4. 从启动台或应用程序里打开 Codex。
  5. 用你的 ChatGPT / OpenAI 账号登录(普通账号也有一定的免费额度)
Codex App 登录界面
Codex App 登录界面

三、本地 Codex App、云端 Codex、普通 ChatGPT 有什么区别

在开始介绍Codex App之前,我把Codex App和云端Codex以及普通Chatgpt的区别先理一下,因为很多人一直没搞清楚这三者的区别。

名字大白话解释适合做什么
ChatGPT普通对话,一个网页或 App 里的助手问问题、写文案、解释概念、生成文件、生成图片
Codex App 本地版装在你电脑上的 AI 工作台普通ChatGPT能做的都能做,最大的区别就是能轻松地读取本地的文件。
云端 Codex在云端环境里跑的 AI Agent有时候电脑关机了本地Codex APP就用不了了,如果在云端上跑任务,那就不受本地电源的限制,因为是跑在官方服务器上面的。

小白先记住一个判断标准就够了:

  • 一般任务:用普通对话。
  • 要处理本地文件或项目:用 Codex App 里的项目。
  • 要让 Codex 在远程环境里持续跑任务:用云端 Codex。
Codex App 与 ChatGPT 对比
Codex App 与 ChatGPT 功能对比

四、主界面地图:左边、中间、右边

第一次打开 Codex App,可能有点懵逼,因为上面的功能还是有点多的,毕竟人家是"超级工作台"嘛!

区域它是干什么的小白最常用的动作
左边导航栏找入口、找项目、找对话新对话、切换对话、连接插件和设置自动化任务
中间对话区你和 Codex 真正交流的地方输入需求、让Codex开始工作
右边结果区展示证据和产物看来源、预览网页/图片/PDF、看代码变化

下面这张图是插件页,但它很适合看 Codex 的整体布局:左边是导航,中间是主要内容,右边这次没有打开额外预览(一般有生成图片、代码或者网页,就可以在右边预览)。

五、左侧导航栏:你从这里进入不同工作流

左边是 Codex 的入口区。常见入口包括:

1. 新对话

大白话:开一个全新的聊天任务

适用时机:不想沿用旧上下文、清空之前聊天记录重新提问时

2. 搜索

大白话:查找历史对话、命令以及相关文件

适用时机:忘记之前聊过的内容,需要回溯查看记录时

3. 插件

大白话:给 Codex 增加外部拓展能力

适用时机:需要连接 Gmail、GitHub、Drive、Slack 等第三方工具时

4. 自动化

大白话:让 Codex 定时或延后自动执行任务

适用时机:想要每日自动总结、定期检查内容、延后继续处理任务时

5. 项目

大白话:让 Codex 针对指定文件夹、代码仓库开展工作

适用时机:需要它读取文件、修改文件、运行本地命令时

6. 普通对话

大白话:不绑定任何项目的纯聊天模式

适用时机:查询概念、撰写文案、梳理思路、日常简单提问时

六、搜索:找回你之前做过的事

点左侧"搜索",会弹出一个搜索浮层。

它的作用很简单:

  • 找历史对话。
  • 找之前跑过的项目任务。
  • 找你忘记名字的上下文。

七、插件:给 Codex 装能力包

点左侧"插件",会进入插件页。

插件其实就是给 Codex 装能力包。比如:

  • Browser Use:让 Codex 操作内置浏览器。
  • Computer Use:让 Codex 操作 Mac 上的 App。
  • Spreadsheets:让 Codex 处理表格。
  • Presentations:让 Codex 做演示文稿。
  • GitHub:让 Codex 和 GitHub 工作流配合。
  • Gmail / Google Drive / Slack 这类:让 Codex 连接外部账号。

这里顺便把几个词讲清楚。

名词大白话解释例子
Plugin插件,给 Codex 装一个能力包装了表格插件,它就更会处理表格
Connector连接器,连接外部账号或服务连接 Gmail、GitHub、Google Drive
Skill技能,一套固定工作流说明书"写教程时按我的风格来写"
MCP一种让外部工具接入 Codex 的方式让 Codex 调用某个本地服务或工具

小白不用纠结这些名词的具体细节,只需要大概理解:

插件是能力包,连接器是接账号,技能是工作流说明书,MCP 是接工具的通道。

什么时候需要插件?

  • 你想让 Codex 读 Gmail。
  • 你想让 Codex 操作浏览器。
  • 你想让 Codex 做 PPT、表格、文档。
  • 你想让 Codex 和 GitHub、Slack、Linear 等工具协作。

小白建议:刚开始只用官方已经内置好的插件,不要急着装一堆,后续熟练了可以慢慢添加

八、自动化:让 Codex 稍后或定期帮你做事

点左侧"自动化",会看到自动化页面。

自动化就是让 Codex 在某个时间点,或按某个频率,自动执行一件你提前设置好的任务。

常见场景:

  • 每天早上帮你整理某个项目状态。
  • 每周检查一次某个仓库有没有问题。
  • 半小时后继续当前线程。
  • 定期监控某个网页、邮箱、任务列表。
  • 定时生成日报、周报、复盘。
自动化页面
自动化任务设置
自动化任务设置示例

九、右侧结果区:产出物

Codex 的右侧区域可能出现:

  • 生成出来的文件。
  • 搜索来源。
  • 网页预览。
  • 图片预览。
  • PDF / 文档预览。
  • 内置浏览器。
  • 代码差异。
  • Git 变化。
右侧结果区展示
右侧结果区:Codex 交作业的地方

你可以把右侧理解成:Codex 交作业的地方。

中间告诉你"Codex到底做了什么",右边让你看"Codex到底产出了什么"。

十、设置入口:让Codex更好用

左下角有"设置"入口,这里面可能有很多小白陌生的设置,但是挨个认真看完,其实也能设置好,把Codex设置的更加好用。下面逐个介绍:👇

十一、设置页 1:常规

设置页 - 常规
设置页 - 常规选项

常规管的是 App 的基础使用习惯。常见内容包括:

  • 工作模式:更偏日常工作,还是更偏编程。
  • 默认权限。
  • 自动审核。
  • 完全访问权限。
  • 默认打开目标。
  • 语言。
  • 菜单栏显示。
  • 运行时防止系统休眠。
  • 长文本发送快捷键。

小白最应该关注四个地方。

第一个是工作模式。如果你不是程序员,优先选更偏"日常工作"的模式。这样 Codex 的表达会少一点工程黑话。

第二个是权限。权限越大,Codex 能做的事越多,但风险也越大。如果你还不熟,别一上来就开最大权限,但是熟练了之后发现权限给的用多,需要操心的越少,使用Codex越丝滑,这个因人而异,大家可以按照自己的习惯设置。

第三个是发送方式。长文本是否需要 Command + Enter 发送,这个会影响你写长需求时会不会误触,因为很多朋友不小心点击Enter就会发送,比如我。。。

第四个是语音输入

语音输入设置
语音输入全局快捷键设置

这个相当于全局键,打开了之后,不止是在Codex App内部,可以在电脑上任意一个对话框调用Codex的语音输入法。但是如果习惯了比如Typeless、豆包输入法的朋友就没有必要切换了。

十二、设置页 2:外观

设置页 - 外观
设置页 - 外观选项

外观管的是界面长什么样。常见内容包括:

  • 主题。
  • 字体。
  • 颜色。
  • 代码展示样式。
  • 差异对比样式。
  • 字号或界面密度。

这个页面基本不影响 Codex 能不能完成任务,它只影响你看界面UI的时候舒不舒服。

但是有个新功能大家也许会感兴趣:可以在这个界面选择一只桌宠,然后再Codex对话框输入/宠物就能唤起一只陪伴大家工作的小可爱!

桌宠功能
桌宠功能展示

十三、设置页 3:配置

设置页 - 配置
设置页 - 配置选项

保持默认即可,不需要改。

十四、设置页 4:个性化

个性化管的是 Codex 怎么理解你。这里通常会出现类似:

  • 个人偏好。
  • 自定义说明。
  • 记忆或偏好相关设置。
  • 让 Codex 按某种风格回答的规则。

你可以在这里写:

  • 我更喜欢中文回答。
  • 我不是程序员,请少用术语。
  • 给我教程时要写成功标志和排查步骤。
  • 修改代码前先解释影响。
  • 涉及隐私文件时先提醒我。

小白建议写这种:

哪些别乱写?

  • 不要把 API Key、密码、Cookie 写进去。
  • 不要把私人身份证、银行卡、公司机密写进去。
  • 不要写互相矛盾的规则。

十五、设置页 5:MCP 服务器

MCP 对小白来说第一次听见会有点懵,但是简单理解就是MCP 是让 Codex 连接外部工具的一条通道,大概意义和插件没啥区别。

比如某个工具提供了 MCP,Codex 就可以通过它读取数据、调用功能、执行操作。

一般不需要添加,就是用Codex内置的插件已经能满足99%的日常工作生活需求了。

MCP 服务器设置
MCP 服务器设置页面

十六、设置页 6:Git

Git 是代码世界里的"版本记录系统"。如果你不是程序员,可以先这样理解:

Git 像一个项目的时间机器,记录每次改了什么。

因为你需要知道:

  • 它改了哪些文件。
  • 哪些改动是新增的。
  • 哪些改动是删除的。
  • 能不能回退。
  • 要不要提交。

但是总而言之,这些都是技术相关,小白第一次上手把这页的设置保持默认即可,不需要改变。

十七、设置页 7和8:环境和工作树

小白保持默认即可!

环境和工作树设置
环境和工作树设置

十八、设置页 9和10:浏览器使用和电脑操作

浏览器使用是指 Codex 能操作内置浏览器,这个功能非常实用,Codex 可以用它来:

  • 打开网页。
  • 搜索资料。
  • 登录某些网站。
  • 查看本地网页。
  • 测试前端页面。
  • 截图或检查页面效果。

直接在Codex App内部就完成相关操作,不需要再跳转到别的网页,十分便捷。

浏览器使用设置
浏览器使用设置页面

十九、设置页 10:电脑操控

电脑操控是让 Codex 操作 Mac 上的应用。比如:

  • 打开某个 App。
  • 点击按钮。
  • 查看界面。
  • 处理一些可视化任务。
  • 帮你在软件里完成一些流程。

这功能很非常非常强,可以说是我觉得Codex App最牛逼的一个功能,前端时间我才让它帮我从零到一写了一份法律检索报告(我只完成了登录几个网站的操作,别的搜索、探究网站内部结构、点击、整理资料全是它一次性完成),但是,也更需要谨慎。

因为它可能碰到:

  • 微信。
  • 邮箱。
  • 浏览器。
  • 文件管理器。
  • 付费软件。
  • 公司工具。
  • 私人资料。

小白建议:第一次用电脑操控,最好只让它操作无风险 App,特别记住不要操作社媒账号和微信!!!!!

二十、设置页 11:已归档对话

已归档对话就是被你收起来的历史对话,它不是删除,更像是:一个没有时间限制的回收站,不会过期清理,想要找回来的时候随时在这里找回就行。

适合归档的内容:

  • 已经完成的任务。
  • 暂时不用的项目对话。
  • 不想占用左侧列表的旧记录。
  • 需要保留但不常看的过程。

二十一、跑一个普通对话:先从低风险任务开始

刚开始用 Codex,不建议直接让它改项目,先开启一个普通对话。特别建议打开"完全访问权限",那一刻,会发现真的很爽,小白应该不会一上来就做什么惊人的操作,所以也不会有太大的安全风险,吧。。。

比如输入:

如果是做一个比较复杂的任务,建议打开"计划模式",先梳理清楚思路,再开始做。

二十二、权限确认:非常重要!

Codex 可能会请求不同权限,你可以这样理解:

权限类型意味着什么小白怎么判断
文件访问Codex 要读或改某个文件夹看清楚路径是不是你允许的项目
终端命令Codex 要在电脑上运行命令不懂就让它先解释
浏览器Codex 要打开网页或操作网页避免付款、删除、发布类操作
第三方账号Codex 要连接 Gmail、GitHub 等看清楚授权范围
电脑操控Codex 要操作 Mac App边界一定要说清楚

小白最容易犯的错:看到确认按钮就点。千万不要这样,如果你看不懂,就问:

权限确认弹窗

Codex 本身也可以帮你解释权限滴!~

Codex 解释权限
让 Codex 帮你解释权限请求

二十三、常见踩坑和排查

1. Codex 一直在跑,不知道是不是卡了

先看左边对话状态,是在转圈还是蓝色的不动的点。如果它显示转圈,那就是没有结束。如果它显示蓝色的点,就代表任务已经结束了

2. 它请求权限,我不知道能不能点

不要直接点,让它解释:

3. 它改了项目,我看不懂

让它解释 Git diff:

Git diff 解释
让 Codex 解释代码改动

4. 生成结果不满意

不要重开。直接基于结果继续改:

基于结果继续修改
基于已有结果继续迭代优化

5. 插件太多,不知道装哪个

先别装,先用官方内置能力。等你明确知道"我要让 Codex 连接某个工具",再去插件页找。

6. 自动化跑偏

大概率是你的任务描述太泛,把任务精细化描述一下:

  • 什么时候执行。
  • 执行对象是什么。
  • 输出什么。
  • 不要做什么。
  • 遇到问题怎么处理。

二十四、我的推荐使用路线

如果你是第一次用 Codex App,我建议按这个顺序来:

  1. 打开 App,先熟悉左侧导航。
  2. 新建一个普通对话,问一个低风险问题。
  3. 打开设置页,只看不改。
  4. 建一个干净演示项目,不要用私人项目。
  5. 让 Codex 读取项目,并生成一个简单 Markdown。
  6. 看右侧结果区。
  7. 让它解释它做了什么。
  8. 再尝试插件页和自动化页。
  9. 最后再碰 Git、MCP、电脑操控这些高级功能。

二十六、写在最后

Codex App 是一个非常牛逼、而且非常适合普通人上手的超级APP,他比Claude Code的CLI界面更加好上手,非常符合小白的使用习惯。而且他能够操控电脑、读取本地文件,基本上只要是人类能做的软件操作他都能完成。

它的功能非常广泛:

  • 聊天。
  • 文件。
  • 项目。
  • 网页。
  • 浏览器。
  • 自动化。
  • Git。
  • 第三方账号。
  • 本地电脑权限。

所以小白第一次打开会懵,是很正常的,但是你要习惯使用它,慢慢地给他加插件、加Skill,最后把它培养成最合适的超级助手。

最后,祝你使用Codex愉快!