Codex App 从0到1完整入门教程:把这个超级APP的每一个细节抽丝剥茧讲清楚

Codex App 从 0 到 1 入门教程封面

最近我发现,很多人第一次接触 Codex App 的反应不是"哇,好强",而是:

这玩意儿到底从哪开始使用?需不需要我配置一大堆东西?

左边一堆入口,中间是聊天,右边又会弹出网页、图片、文档、来源、代码变化。设置里还有一堆看起来很技术的东西。

作为小白,困住你的大概率不是不想用Codex,而是压根不知道如何第一次上手Codex。

所以这篇文章不是技术类文章,我会按一个普通人的使用路线抽丝剥茧地来讲清楚:

  1. Codex App 到底是什么。
  2. 本地 App、云端 Codex、普通 ChatGPT 的区别。
  3. 打开 App 后,左边、中间、右边分别是干什么的。
  4. 设置页每个目录到底管什么。
  5. 普通对话和项目对话有什么区别。
  6. 插件、技能、MCP、自动化、Git 这些词怎么理解。
  7. 哪些地方小白最容易点错。

本文基于 Mac 版 Codex App 实测整理。 Codex版本:Codex 26.429.30905。 Codex App 更新很快,你看到的按钮名称和位置可能会有一点变化,但核心逻辑基本一样。

一、Codex App 到底是什么

一句话:Codex App 是一个把 AI Agent 放进你电脑里的工作台,只要你能在电脑上做的操作,它基本上也都能做,而且它会做的更完美、更高效。

说白了,它不是一个你问一句,它答一句的普通聊天框。Codex App 更像是你的助理,它可以:

  • 和你聊天。
  • 读你指定的本地文件。
  • 搜索网页。
  • 打开内置浏览器。
  • 生成图片、文档、PPT、网页、代码等结果。
  • 用插件连接 Gmail、GitHub、Google Drive、Slack 等外部工具。
  • 设置自动化,定期帮你检查、总结或继续任务。

如果你是非程序员,可以先把它理解成:

一个更偏"做事"的 ChatGPT。

它不是只回答"怎么做",而是很多时候可以直接帮你"做一遍"。

但也正因为它能做事,所以你必须理解它的界面和权限。不然你会不知道它到底是在本地电脑上做事,还是在云端任务里做事,也不知道它什么时候会碰到你的文件。

先看一张打开后的整体界面。

Codex App 整体界面
Codex App 整体界面

这张图先不用看细节。你只要记住:左边是导航栏,中间是你和 Codex 对话的地方,右边有时会出现结果、来源、预览和代码变化。

这就是 Codex App 和普通聊天框最大的差别:它不是只有"问答",它还有"工作现场"。

二、下载和登录

Mac 用户建议只从 OpenAI 官方入口下载 Codex App: https://openai.com/codex/

安装方式和普通 Mac App 差不多:

  1. 下载 Codex App。
  2. 打开安装包。
  3. 把 Codex 拖进"应用程序"。
  4. 从启动台或应用程序里打开 Codex。
  5. 用你的 ChatGPT / OpenAI 账号登录(普通账号也有一定的免费额度)

三、本地 Codex App、云端 Codex、普通 ChatGPT 有什么区别

在开始介绍Codex App之前,我把Codex App和云端Codex以及普通Chatgpt的区别先理一下,因为很多人一直没搞清楚这三者的区别。

名字大白话解释适合做什么
ChatGPT普通对话,一个网页或 App 里的助手问问题、写文案、解释概念、生成文件、生成图片
Codex App 本地版装在你电脑上的 AI 工作台普通ChatGPT能做的都能做,最大的区别就是能轻松地读取本地的文件。
云端 Codex在云端环境里跑的 AI Agent有时候电脑关机了本地Codex APP就用不了了,如果在云端上跑任务,那就不受本地电源的限制,因为是跑在官方服务器上面的。

小白先记住一个判断标准就够了:

  • 一般任务:用普通对话。
  • 要处理本地文件或项目:用 Codex App 里的项目。
  • 要让 Codex 在远程环境里持续跑任务:用云端 Codex。

四、主界面地图:左边、中间、右边

第一次打开 Codex App,可能有点懵逼,因为上面的功能还是有点多的,毕竟人家是"超级工作台"嘛!

区域它是干什么的小白最常用的动作
左边导航栏找入口、找项目、找对话新对话、切换对话、连接插件和设置自动化任务
中间对话区你和 Codex 真正交流的地方输入需求、让Codex开始工作
右边结果区展示证据和产物看来源、预览网页/图片/PDF、看代码变化

下面这张图是插件页,但它很适合看 Codex 的整体布局:左边是导航,中间是主要内容,右边这次没有打开额外预览(一般有生成图片、代码或者网页,就可以在右边预览)。

Codex 主界面布局
Codex 主界面布局

五、左侧导航栏:你从这里进入不同工作流

左边是 Codex 的入口区。

左侧导航栏入口
左侧导航栏入口

常见入口包括:

1. 新对话

大白话:开一个全新的聊天任务

适用时机:不想沿用旧上下文、清空之前聊天记录重新提问时

2. 搜索

大白话:查找历史对话、命令以及相关文件

适用时机:忘记之前聊过的内容,需要回溯查看记录时

3. 插件

大白话:给 Codex 增加外部拓展能力

适用时机:需要连接 Gmail、GitHub、Drive、Slack 等第三方工具时

4. 自动化

大白话:让 Codex 定时或延后自动执行任务

适用时机:想要每日自动总结、定期检查内容、延后继续处理任务时

5. 项目

大白话:让 Codex 针对指定文件夹、代码仓库开展工作

适用时机:需要它读取文件、修改文件、运行本地命令时

6. 普通对话

大白话:不绑定任何项目的纯聊天模式

适用时机:查询概念、撰写文案、梳理思路、日常简单提问时

六、搜索:找回你之前做过的事

点左侧"搜索",会弹出一个搜索浮层。

搜索浮层
搜索浮层

它的作用很简单:

  • 找历史对话。
  • 找之前跑过的项目任务。
  • 找你忘记名字的上下文。

七、插件:给 Codex 装能力包

点左侧"插件",会进入插件页。

插件页
插件页

插件其实就是给 Codex 装能力包。比如:

  • Browser Use:让 Codex 操作内置浏览器。
  • Computer Use:让 Codex 操作 Mac 上的 App。
  • Spreadsheets:让 Codex 处理表格。
  • Presentations:让 Codex 做演示文稿。
  • GitHub:让 Codex 和 GitHub 工作流配合。
  • Gmail / Google Drive / Slack 这类:让 Codex 连接外部账号。

这里顺便把几个词讲清楚。

名词大白话解释例子
Plugin插件,给 Codex 装一个能力包装了表格插件,它就更会处理表格
Connector连接器,连接外部账号或服务连接 Gmail、GitHub、Google Drive
Skill技能,一套固定工作流说明书"写教程时按我的风格来写"
MCP一种让外部工具接入 Codex 的方式让 Codex 调用某个本地服务或工具

小白不用纠结这些名词的具体细节,只需要大概理解:

插件是能力包,连接器是接账号,技能是工作流说明书,MCP 是接工具的通道。

什么时候需要插件?

  • 你想让 Codex 读 Gmail。
  • 你想让 Codex 操作浏览器。
  • 你想让 Codex 做 PPT、表格、文档。
  • 你想让 Codex 和 GitHub、Slack、Linear 等工具协作。

小白建议:刚开始只用官方已经内置好的插件,不要急着装一堆,后续熟练了可以慢慢添加

八、自动化:让 Codex 稍后或定期帮你做事

点左侧"自动化",会看到自动化页面。

自动化页面入口
自动化页面入口

自动化就是让 Codex 在某个时间点,或按某个频率,自动执行一件你提前设置好的任务。

常见场景:

  • 每天早上帮你整理某个项目状态。
  • 每周检查一次某个仓库有没有问题。
  • 半小时后继续当前线程。
  • 定期监控某个网页、邮箱、任务列表。
  • 定时生成日报、周报、复盘。

九、右侧结果区:产出物

Codex 的右侧区域可能出现:

  • 生成出来的文件。
  • 搜索来源。
  • 网页预览。
  • 图片预览。
  • PDF / 文档预览。
  • 内置浏览器。
  • 代码差异。
  • Git 变化。
右侧结果区
右侧结果区

你可以把右侧理解成:Codex 交作业的地方。

中间告诉你"Codex到底做了什么",右边让你看"Codex到底产出了什么"。

十、设置入口:让Codex更好用

左下角有"设置"入口,这里面可能有很多小白陌生的设置,但是挨个认真看完,其实也能设置好,把Codex设置的更加好用。下面逐个介绍:👇

十一、设置页 1:常规

常规设置页面
常规设置页面

常规管的是 App 的基础使用习惯。常见内容包括:

  • 工作模式:更偏日常工作,还是更偏编程。
  • 默认权限。
  • 自动审核。
  • 完全访问权限。
  • 默认打开目标。
  • 语言。
  • 菜单栏显示。
  • 运行时防止系统休眠。
  • 长文本发送快捷键。

小白最应该关注四个地方。

第一个是工作模式。如果你不是程序员,优先选更偏"日常工作"的模式。这样 Codex 的表达会少一点工程黑话。

第二个是权限。权限越大,Codex 能做的事越多,但风险也越大。如果你还不熟,别一上来就开最大权限,但是熟练了之后发现权限给的用多,需要操心的越少,使用Codex越丝滑,这个因人而异,大家可以按照自己的习惯设置。

第三个是发送方式。长文本是否需要 Command + Enter 发送,这个会影响你写长需求时会不会误触,因为很多朋友不小心点击Enter就会发送,比如我。。。

第四个是语音输入

语音输入设置说明
语音输入设置说明

这个相当于全局键,打开了之后,不止是在Codex App内部,可以在电脑上任意一个对话框调用Codex的语音输入法。但是如果习惯了比如Typeless、豆包输入法的朋友就没有必要切换了。

十二、设置页 2:外观

外观设置页面
外观设置页面

外观管的是界面长什么样。常见内容包括:

  • 主题。
  • 字体。
  • 颜色。
  • 代码展示样式。
  • 差异对比样式。
  • 字号或界面密度。

这个页面基本不影响 Codex 能不能完成任务,它只影响你看界面UI的时候舒不舒服。

但是有个新功能大家也许会感兴趣:可以在这个界面选择一只桌宠,然后再Codex对话框输入/宠物就能唤起一只陪伴大家工作的小可爱!

桌宠功能展示
桌宠功能展示

十三、设置页 3:配置

配置设置页面
配置设置页面

保持默认即可,不需要改。

十四、设置页 4:个性化

个性化设置页面
个性化设置页面

个性化管的是 Codex 怎么理解你。这里通常会出现类似:

  • 个人偏好。
  • 自定义说明。
  • 记忆或偏好相关设置。
  • 让 Codex 按某种风格回答的规则。

你可以在这里写:

  • 我更喜欢中文回答。
  • 我不是程序员,请少用术语。
  • 给我教程时要写成功标志和排查步骤。
  • 修改代码前先解释影响。
  • 涉及隐私文件时先提醒我。

小白建议写这种:

哪些别乱写?

  • 不要把 API Key、密码、Cookie 写进去。
  • 不要把私人身份证、银行卡、公司机密写进去。
  • 不要写互相矛盾的规则。

十五、设置页 5:MCP 服务器

MCP 服务器设置页面
MCP 服务器设置页面

MCP 对小白来说第一次听见会有点懵,但是简单理解就是MCP 是让 Codex 连接外部工具的一条通道,大概意义和插件没啥区别。

比如某个工具提供了 MCP,Codex 就可以通过它读取数据、调用功能、执行操作。

一般不需要添加,就是用Codex内置的插件已经能满足99%的日常工作生活需求了。

十六、设置页 6:Git

Git 设置页面
Git 设置页面

Git 是代码世界里的"版本记录系统"。如果你不是程序员,可以先这样理解:

Git 像一个项目的时间机器,记录每次改了什么。

因为你需要知道:

  • 它改了哪些文件。
  • 哪些改动是新增的。
  • 哪些改动是删除的。
  • 能不能回退。
  • 要不要提交。

但是总而言之,这些都是技术相关,小白第一次上手把这页的设置保持默认即可,不需要改变。

十七、设置页 7和8:环境和工作树

环境设置页面
环境设置页面

小白保持默认即可!

十八、设置页 9和10:浏览器使用和电脑操作

浏览器使用设置页面
浏览器使用设置页面

浏览器使用是指 Codex 能操作内置浏览器,这个功能非常实用,Codex 可以用它来:

  • 打开网页。
  • 搜索资料。
  • 登录某些网站。
  • 查看本地网页。
  • 测试前端页面。
  • 截图或检查页面效果。

直接在Codex App内部就完成相关操作,不需要再跳转到别的网页,十分便捷。

十九、设置页 10:电脑操控

电脑操控是让 Codex 操作 Mac 上的应用。比如:

  • 打开某个 App。
  • 点击按钮。
  • 查看界面。
  • 处理一些可视化任务。
  • 帮你在软件里完成一些流程。

这功能很非常非常强,可以说是我觉得Codex App最牛逼的一个功能,前端时间我才让它帮我从零到一写了一份法律检索报告(我只完成了登录几个网站的操作,别的搜索、探究网站内部结构、点击、整理资料全是它一次性完成),但是,也更需要谨慎。

因为它可能碰到:

  • 微信。
  • 邮箱。
  • 浏览器。
  • 文件管理器。
  • 付费软件。
  • 公司工具。
  • 私人资料。

小白建议:第一次用电脑操控,最好只让它操作无风险 App,特别记住不要操作社媒账号和微信!!!!!

二十、设置页 11:已归档对话

已归档对话页面
已归档对话页面

已归档对话就是被你收起来的历史对话,它不是删除,更像是:一个没有时间限制的回收站,不会过期清理,想要找回来的时候随时在这里找回就行。

适合归档的内容:

  • 已经完成的任务。
  • 暂时不用的项目对话。
  • 不想占用左侧列表的旧记录。
  • 需要保留但不常看的过程。

二十一、跑一个普通对话:先从低风险任务开始

刚开始用 Codex,不建议直接让它改项目,先开启一个普通对话。特别建议打开"完全访问权限",那一刻,会发现真的很爽,小白应该不会一上来就做什么惊人的操作,所以也不会有太大的安全风险,吧。。。

可以先输入一个低风险问题试试。

如果是做一个比较复杂的任务,建议打开"计划模式",先梳理清楚思路,再开始做。

二十二、权限确认:非常重要!

Codex 可能会请求不同权限,你可以这样理解:

权限类型意味着什么小白怎么判断
文件访问Codex 要读或改某个文件夹看清楚路径是不是你允许的项目
终端命令Codex 要在电脑上运行命令不懂就让它先解释
浏览器Codex 要打开网页或操作网页避免付款、删除、发布类操作
第三方账号Codex 要连接 Gmail、GitHub 等看清楚授权范围
电脑操控Codex 要操作 Mac App边界一定要说清楚

小白最容易犯的错:看到确认按钮就点。千万不要这样,如果你看不懂,就问:

Codex 本身也可以帮你解释权限滴!~

二十三、常见踩坑和排查

1. Codex 一直在跑,不知道是不是卡了

先看左边对话状态,是在转圈还是蓝色的不动的点。如果它显示转圈,那就是没有结束。如果它显示蓝色的点,就代表任务已经结束了

2. 它请求权限,我不知道能不能点

不要直接点,可以先让它解释。

3. 它改了项目,我看不懂

可以让它解释 Git diff。

4. 生成结果不满意

不要重开,直接基于结果继续改。

5. 插件太多,不知道装哪个

先别装,先用官方内置能力。等你明确知道"我要让 Codex 连接某个工具",再去插件页找。

6. 自动化跑偏

大概率是你的任务描述太泛,把任务精细化描述一下:

  • 什么时候执行。
  • 执行对象是什么。
  • 输出什么。
  • 不要做什么。
  • 遇到问题怎么处理。

二十四、我的推荐使用路线

如果你是第一次用 Codex App,我建议按这个顺序来:

  1. 打开 App,先熟悉左侧导航。
  2. 新建一个普通对话,问一个低风险问题。
  3. 打开设置页,只看不改。
  4. 建一个干净演示项目,不要用私人项目。
  5. 让 Codex 读取项目,并生成一个简单 Markdown。
  6. 看右侧结果区。
  7. 让它解释它做了什么。
  8. 再尝试插件页和自动化页。
  9. 最后再碰 Git、MCP、电脑操控这些高级功能。

二十五、写在最后

Codex App 是一个非常牛逼、而且非常适合普通人上手的超级APP,他比Claude Code的CLI界面更加好上手,非常符合小白的使用习惯。而且他能够操控电脑、读取本地文件,基本上只要是人类能做的软件操作他都能完成。

它的功能非常广泛:

  • 聊天。
  • 文件。
  • 项目。
  • 网页。
  • 浏览器。
  • 自动化。
  • Git。
  • 第三方账号。
  • 本地电脑权限。

所以小白第一次打开会懵,是很正常的,但是你要习惯使用它,慢慢地给他加插件、加Skill,最后把它培养成最合适的超级助手。

最后,祝你使用Codex愉快!