停止「氛围编程」：AI 时代的工程师分水岭

你以为自己在用 AI 编程。

实际上，AI 在用你。

这不是修辞。当你把 AI 当作代码生成器——输入需求、接收代码、提交上线——你正在把自己训练成 AI 工作流中最没价值的环节：一个人肉回车键。

2025 年 2 月，Andrej Karpathy 在 X 上发了一条帖子，给这种编程方式起了个名字：Vibe Coding（氛围编程）——“完全沉浸在感觉中，依靠 LLM 生成代码，而不需要真正理解输出”。这个词后来被柯林斯词典选为 2025 年度词汇。

一年后的今天，行业的对话已经翻篇了。问题不再是"要不要用 AI 编程"，而是"你在 AI 工作流中扮演什么角色"。

这篇文章要说的，就是这条分水岭两边的区别。

一、你用 AI 写代码很快，但你不踏实

GitHub 的一项研究给出了一个具体数字：使用 Copilot 的开发者完成任务的速度比未使用的快 55%。实验场景是用 JavaScript 写一个 HTTP 服务器——使用 Copilot 的组平均用时 1 小时 11 分钟，对照组 2 小时 41 分钟。

55% 的提速。听起来像是一个值得庆祝的数字。

这也只是故事的一半。

另一半是你在日常工作中已经感受到的：AI 产出的代码越来越多，但你对项目代码库的掌控感在下降。你不确定那段 AI 生成的逻辑是否覆盖了所有边界情况。你不确定那个自动补全的错误处理是否真的合理。你不确定三个月后回来看这段代码，还能不能读懂。

一天产出过去一周的代码量，这在 AI 辅助开发中很常见。代价是这些代码的可维护性、安全性、性能可能都成问题。

代码审查的压力也随之而来。AI 生成的代码需要更仔细的审查，因为你不是写它的人，你不知道它的隐含假设是什么。产出量上去了，审查量也跟着上去。

这种"速度提升但掌控感下降"的体验，不是你的错觉。

它有一个准确的诊断：你在做 Vibe Coding。

划重点：速度提升是真实的（55% 有研究支撑），但掌控感下降也是真实的。如果你只感受到了前者而忽略了后者，你可能正在用一种注定不可持续的方式和 AI 协作。

二、Vibe Coding 和 Agentic SE：不是工具的区别，是方法论的质变

先把两个概念说清楚。

Vibe Coding（氛围编程）——用直觉和提示词驱动的 AI 编程方式。你说一句话，AI 生成一段代码。你觉得差不多，提交。没有系统性的测试、没有架构审查、没有明确的质量门禁。核心特征是"快，但不可控"。

Agentic Software Engineering（智能体软件工程）——人定义目标、约束和质量标准，AI Agent 在结构化监督下自主完成从设计到提交的完整流程。核心特征是"人管方向，AI 管执行"。

两者的区别不在于你用了什么工具。用 Cursor 可以做 Vibe Coding，也可以做 Agentic SE。用 Claude Code 同样如此。

区别在方法论。

想象你管理一个实习生。Vibe Coding 相当于你口头说一句"帮我写个用户注册功能"，然后实习生闷头写了两天交给你，你看了一眼就合并了。Agentic SE 相当于你给实习生一份完整的需求文档、架构规范、测试标准和验收清单，实习生按照流程逐步完成，每个环节都有质量检查点。

同一个实习生，两种管理方式，产出的质量天差地别。

Vibe Coding vs Agentic SE 对比信息图

Agentic SE 的典型工作流分 6 步：

理解需求——AI 分析上下文，明确要做什么、不做什么
设计方案——AI 生成实现方案，人确认后再动手
代码实现——AI 按方案编写代码
自动测试——AI 编写并运行测试用例
质量审计——AI 检查代码规范、安全漏洞、性能问题
提交 PR——AI 生成变更说明，人做最终审查

每一步都有人的监督接入点。这和 Vibe Coding 的"一步到位"模式有本质区别。

Agentic 工作流 6 步

你只需要知道：Vibe Coding 和 Agentic SE 的核心差异是"人在 AI 工作流中的位置"。前者中人是被动接收者（“AI 写了什么我就用什么”），后者中人是主动设计者（“我定义 AI 怎么工作”）。

三、2026 年的三个分水岭信号

“从 Vibe Coding 到 Agentic Engineering"这个判断不是我的发明，它正在被学术界、企业界和行业观察者同时验证。

信号一：学术界已经点名。

智谱 AI 和清华大学联合发布了 GLM-5（744B 参数），这篇论文的标题直接用了 “From Vibe Coding to Agentic Engineering”。当一个顶级研究团队把这个叙事写进论文标题，说明它已经从社交媒体上的流行语变成了学术界认可的范式描述。

信号二：企业级已经落地。

JPMorgan 在 AI Agent 领域的标杆技术会议 LangChain Interrupt 上展示了 “Ask David”——一个多智能体 AI 系统，用于处理复杂的投资研究分析。不是原型，不是 demo，是在生产环境中服务金融专业人士的系统。多个专业 Agent 各司其职，人类专家在关键节点做决策。

这就是 Agentic SE 在企业级的样子。

信号三：行业共识正在成型。

MIT Technology Review 在一篇深度分析中指出，2025 年软件工程领域最大的转变是从"追求速度和规模"到"管理上下文”。原文的表述是：“The fact the conversation has moved from questions of speed and scale to context puts software engineers right at the heart of things.”

一句话说：当 AI 的瓶颈从算力变成了上下文理解，工程师的价值不是降低了，而是被重新定义了。

2026 年三个分水岭信号

信号	来源	核心信息
学术界点名	GLM-5 论文（智谱 AI / 清华）	论文标题直接使用 “From Vibe Coding to Agentic Engineering”
企业级落地	JPMorgan “Ask David”	多 Agent 系统在金融生产环境中运行
行业共识成型	MIT Technology Review	软件工程核心转变：从追求速度到管理上下文

三个信号指向同一个结论。

2026 年，工程师的分水岭不是"会不会用 AI"，而是"你在 AI 工作流中扮演什么角色"。

一句话总结：这不是一家之言。学术论文、企业实践、行业媒体从不同角度验证了同一个判断——Vibe Coding 到 Agentic Engineering 的转变正在发生。

四、Agentic Engineer 的三个核心能力

认清分水岭之后，下一个问题是：从 Vibe Coding 这一侧走到 Agentic SE 那一侧，你需要什么。

答案可以压缩成三个维度的能力转型。

三维度能力转型路线图

从"写提示词"到"设计上下文"：上下文工程

MIT Technology Review 把这个能力叫 Context Engineering（上下文工程）。

最直观的例子：在项目根目录维护一个 CLAUDE.md 文件（如果你用 Claude Code 的话），把项目的技术栈、编码规范、禁止事项、测试要求写清楚。每次 AI 开始工作时自动读取这个文件，相当于给 AI 配了一份"项目记忆"。

这和"写一个好的提示词"是不同级别的事情。提示词解决的是"这次对话让 AI 做什么"，上下文工程解决的是"AI 在这个项目中的所有行为都遵循什么规则"。

一个是单次对话的输入，一个是持久化的工作环境设计。

前者是 Vibe Coding 的天花板。后者才是 Agentic SE 的起点。

从"手动调试"到"设计质量门禁"：测试设计

有完善测试的代码库，AI 做了改动后可以立刻验证是否破坏了现有行为。没有测试的代码库，AI 的每一次改动都是一次赌博。

这个逻辑在传统开发中就成立。在 AI 辅助开发中，它被放大了十倍——因为 AI 产出的代码量远超人类手写，如果没有自动化测试作为安全网，技术债的累积速度会让你绝望。

Agentic Engineer 的测试策略不只是"写单元测试"。它包括为 AI 的输出设计验收标准，定义什么样的代码可以自动合并、什么样的必须人工审查。

这是在给 AI 设计质量门禁。

从"一问一答"到"多 Agent 协作"：Agent 编排

Simon Willison 在他的 Agentic Engineering Patterns 系列中提出了一个核心原则：Agent 系统的最大敌人不是 LLM 的能力不够，而是不可调试性——如果你不知道 Agent 为什么做了某个决定，你就无法改进它，也无法信任它。

MCP（Model Context Protocol）正在成为 Agent 工具连接的事实标准。一个被广泛引用的类比是：MCP 对 Agent 工程的意义，类似于 REST 对 Web API 的意义——不是唯一方案，但正在成为行业默认选择。

对于大多数后端工程师来说，Agent 编排不需要你从零构建框架。它需要你理解 Agent 的协作模式，能把复杂任务分解成多个 Agent 各自负责的子任务，能设计 Agent 之间的通信和监督机制。

这些技能，和你在微服务架构中做服务编排的经验是相通的。

三个转型方向：（1）上下文工程：从写提示词到设计 AI 的工作环境；（2）测试设计：从手动调试到设计 AI 的质量门禁；（3）Agent 编排：从一问一答到多 Agent 协作流水线。这不是要你学全新的东西，而是把已有的工程思维应用到 AI 协作场景中。

五、从今天开始的三件事

如果你读到这里，认同这条分水岭确实存在，下一步不是等，是动手。

三件具体的事，每件都可以在 5 分钟内起步——起步，不是完成。从 Vibe Coding 到 Agentic SE 是一个持续的过程，这三件事只是你迈出的第一步。

第一件：给你最重要的项目加一个上下文文件。

如果你用 Claude Code，创建一个 CLAUDE.md。如果你用 Cursor，创建一个 .cursorrules。写上四样东西：技术栈说明、编码规范、禁止事项、测试要求。

不需要写很长。“这个项目用 Go 1.22，数据库是 PostgreSQL，所有 API 都要有对应的单元测试，禁止使用全局变量”——30 个字，已经比没有上下文文件的项目领先了一步。

第二件：为 AI 产出的代码补一个测试。

从最危险的模块开始——支付、权限、数据处理。不需要追求 100% 覆盖率，先给最关键的路径加上安全网。

有了测试之后，AI 的每一次改动都可以被自动验证。这是从 Vibe Coding 到 Agentic SE 最小的一步，也是最关键的一步。

第三件：改变你和 AI 对话的方式。

把"帮我写一个用户注册功能"改成"按照以下规范实现用户注册功能：接口定义见 API 文档，错误处理使用项目预定义的错误类型，需要包含输入校验和单元测试"。

前者是 Vibe Coding。后者是 Agentic SE 的起手式。

区别不在字数，在意图的精确度。

从今天开始的三件事

分水岭的意义不在于你站在哪一侧，而在于你是否意识到这条线的存在。

2026 年，最大的风险不是"不会用 AI"，而是"以为自己在用 AI，实际上被 AI 用"。

从今天开始，做 AI 的架构师，不是 AI 的回车键。

本文是"AI 时代工程师进化"系列的第一篇。下一篇将深入实操：Agentic Engineering Patterns——从单 Agent 到多 Agent 的可复用设计模式。

从今天开始：（1）加上下文文件（5 分钟起步）；（2）补关键路径测试；（3）升级你和 AI 对话的精确度。不需要一步到位，但需要从现在开始。

参考资料

Andrej Karpathy 关于 Vibe Coding 的原帖 — Vibe Coding 概念的起源（2025.2）
GitHub Copilot 效率研究 — 55% 速度提升的原始研究数据
GLM-5 论文 (arXiv:2602.15763) — 智谱 AI / 清华大学，标题呼应"From Vibe Coding to Agentic Engineering"
MIT Technology Review: From vibe coding to context engineering — Context Engineering 概念的行业分析
Simon Willison: Agentic Engineering Patterns — 可复用的 Agent 工程模式与实践
The Bootstrapped Founder: How to Actually Use Claude Code — Claude Code 工程化使用的最佳实践