Featured image of post 停止「氛围编程」:AI 时代的工程师分水岭

停止「氛围编程」:AI 时代的工程师分水岭

Vibe Coding 让你写代码更快,但也在把你训练成 AI 工作流中最没价值的环节。这篇文章划出 AI 时代工程师的分水岭:你是在驾驭 AI,还是在被 AI 驾驭?

你以为自己在用 AI 编程。

实际上,AI 在用你。

这不是修辞。当你把 AI 当作代码生成器——输入需求、接收代码、提交上线——你正在把自己训练成 AI 工作流中最没价值的环节:一个人肉回车键。

2025 年 2 月,Andrej Karpathy 在 X 上发了一条帖子,给这种编程方式起了个名字:Vibe Coding(氛围编程)——“完全沉浸在感觉中,依靠 LLM 生成代码,而不需要真正理解输出”。这个词后来被柯林斯词典选为 2025 年度词汇。

一年后的今天,行业的对话已经翻篇了。问题不再是"要不要用 AI 编程",而是"你在 AI 工作流中扮演什么角色"。

这篇文章要说的,就是这条分水岭两边的区别。


一、你用 AI 写代码很快,但你不踏实

GitHub 的一项研究给出了一个具体数字:使用 Copilot 的开发者完成任务的速度比未使用的快 55%。实验场景是用 JavaScript 写一个 HTTP 服务器——使用 Copilot 的组平均用时 1 小时 11 分钟,对照组 2 小时 41 分钟。

55% 的提速。听起来像是一个值得庆祝的数字。

这也只是故事的一半。

另一半是你在日常工作中已经感受到的:AI 产出的代码越来越多,但你对项目代码库的掌控感在下降。你不确定那段 AI 生成的逻辑是否覆盖了所有边界情况。你不确定那个自动补全的错误处理是否真的合理。你不确定三个月后回来看这段代码,还能不能读懂。

一天产出过去一周的代码量,这在 AI 辅助开发中很常见。代价是这些代码的可维护性、安全性、性能可能都成问题。

代码审查的压力也随之而来。AI 生成的代码需要更仔细的审查,因为你不是写它的人,你不知道它的隐含假设是什么。产出量上去了,审查量也跟着上去。

这种"速度提升但掌控感下降"的体验,不是你的错觉。

它有一个准确的诊断:你在做 Vibe Coding。

划重点:速度提升是真实的(55% 有研究支撑),但掌控感下降也是真实的。如果你只感受到了前者而忽略了后者,你可能正在用一种注定不可持续的方式和 AI 协作。


二、Vibe Coding 和 Agentic SE:不是工具的区别,是方法论的质变

先把两个概念说清楚。

Vibe Coding(氛围编程)——用直觉和提示词驱动的 AI 编程方式。你说一句话,AI 生成一段代码。你觉得差不多,提交。没有系统性的测试、没有架构审查、没有明确的质量门禁。核心特征是"快,但不可控"。

Agentic Software Engineering(智能体软件工程)——人定义目标、约束和质量标准,AI Agent 在结构化监督下自主完成从设计到提交的完整流程。核心特征是"人管方向,AI 管执行"。

两者的区别不在于你用了什么工具。用 Cursor 可以做 Vibe Coding,也可以做 Agentic SE。用 Claude Code 同样如此。

区别在方法论。

想象你管理一个实习生。Vibe Coding 相当于你口头说一句"帮我写个用户注册功能",然后实习生闷头写了两天交给你,你看了一眼就合并了。Agentic SE 相当于你给实习生一份完整的需求文档、架构规范、测试标准和验收清单,实习生按照流程逐步完成,每个环节都有质量检查点。

同一个实习生,两种管理方式,产出的质量天差地别。

Vibe Coding vs Agentic SE 对比信息图

Agentic SE 的典型工作流分 6 步:

  1. 理解需求——AI 分析上下文,明确要做什么、不做什么
  2. 设计方案——AI 生成实现方案,人确认后再动手
  3. 代码实现——AI 按方案编写代码
  4. 自动测试——AI 编写并运行测试用例
  5. 质量审计——AI 检查代码规范、安全漏洞、性能问题
  6. 提交 PR——AI 生成变更说明,人做最终审查

每一步都有人的监督接入点。这和 Vibe Coding 的"一步到位"模式有本质区别。

Agentic 工作流 6 步

你只需要知道:Vibe Coding 和 Agentic SE 的核心差异是"人在 AI 工作流中的位置"。前者中人是被动接收者(“AI 写了什么我就用什么”),后者中人是主动设计者(“我定义 AI 怎么工作”)。


三、2026 年的三个分水岭信号

“从 Vibe Coding 到 Agentic Engineering"这个判断不是我的发明,它正在被学术界、企业界和行业观察者同时验证。

信号一:学术界已经点名。

智谱 AI 和清华大学联合发布了 GLM-5(744B 参数),这篇论文的标题直接用了 “From Vibe Coding to Agentic Engineering”。当一个顶级研究团队把这个叙事写进论文标题,说明它已经从社交媒体上的流行语变成了学术界认可的范式描述。

信号二:企业级已经落地。

JPMorgan 在 AI Agent 领域的标杆技术会议 LangChain Interrupt 上展示了 “Ask David”——一个多智能体 AI 系统,用于处理复杂的投资研究分析。不是原型,不是 demo,是在生产环境中服务金融专业人士的系统。多个专业 Agent 各司其职,人类专家在关键节点做决策。

这就是 Agentic SE 在企业级的样子。

信号三:行业共识正在成型。

MIT Technology Review 在一篇深度分析中指出,2025 年软件工程领域最大的转变是从"追求速度和规模"到"管理上下文”。原文的表述是:“The fact the conversation has moved from questions of speed and scale to context puts software engineers right at the heart of things.”

一句话说:当 AI 的瓶颈从算力变成了上下文理解,工程师的价值不是降低了,而是被重新定义了。

2026 年三个分水岭信号

信号 来源 核心信息
学术界点名 GLM-5 论文(智谱 AI / 清华) 论文标题直接使用 “From Vibe Coding to Agentic Engineering”
企业级落地 JPMorgan “Ask David” 多 Agent 系统在金融生产环境中运行
行业共识成型 MIT Technology Review 软件工程核心转变:从追求速度到管理上下文

三个信号指向同一个结论。

2026 年,工程师的分水岭不是"会不会用 AI",而是"你在 AI 工作流中扮演什么角色"。

一句话总结:这不是一家之言。学术论文、企业实践、行业媒体从不同角度验证了同一个判断——Vibe Coding 到 Agentic Engineering 的转变正在发生。


四、Agentic Engineer 的三个核心能力

认清分水岭之后,下一个问题是:从 Vibe Coding 这一侧走到 Agentic SE 那一侧,你需要什么。

答案可以压缩成三个维度的能力转型。

三维度能力转型路线图

从"写提示词"到"设计上下文":上下文工程

MIT Technology Review 把这个能力叫 Context Engineering(上下文工程)

最直观的例子:在项目根目录维护一个 CLAUDE.md 文件(如果你用 Claude Code 的话),把项目的技术栈、编码规范、禁止事项、测试要求写清楚。每次 AI 开始工作时自动读取这个文件,相当于给 AI 配了一份"项目记忆"。

这和"写一个好的提示词"是不同级别的事情。提示词解决的是"这次对话让 AI 做什么",上下文工程解决的是"AI 在这个项目中的所有行为都遵循什么规则"。

一个是单次对话的输入,一个是持久化的工作环境设计。

前者是 Vibe Coding 的天花板。后者才是 Agentic SE 的起点。

从"手动调试"到"设计质量门禁":测试设计

有完善测试的代码库,AI 做了改动后可以立刻验证是否破坏了现有行为。没有测试的代码库,AI 的每一次改动都是一次赌博。

这个逻辑在传统开发中就成立。在 AI 辅助开发中,它被放大了十倍——因为 AI 产出的代码量远超人类手写,如果没有自动化测试作为安全网,技术债的累积速度会让你绝望。

Agentic Engineer 的测试策略不只是"写单元测试"。它包括为 AI 的输出设计验收标准,定义什么样的代码可以自动合并、什么样的必须人工审查。

这是在给 AI 设计质量门禁。

从"一问一答"到"多 Agent 协作":Agent 编排

Simon Willison 在他的 Agentic Engineering Patterns 系列中提出了一个核心原则:Agent 系统的最大敌人不是 LLM 的能力不够,而是不可调试性——如果你不知道 Agent 为什么做了某个决定,你就无法改进它,也无法信任它。

MCP(Model Context Protocol)正在成为 Agent 工具连接的事实标准。一个被广泛引用的类比是:MCP 对 Agent 工程的意义,类似于 REST 对 Web API 的意义——不是唯一方案,但正在成为行业默认选择。

对于大多数后端工程师来说,Agent 编排不需要你从零构建框架。它需要你理解 Agent 的协作模式,能把复杂任务分解成多个 Agent 各自负责的子任务,能设计 Agent 之间的通信和监督机制。

这些技能,和你在微服务架构中做服务编排的经验是相通的。

三个转型方向:(1)上下文工程:从写提示词到设计 AI 的工作环境;(2)测试设计:从手动调试到设计 AI 的质量门禁;(3)Agent 编排:从一问一答到多 Agent 协作流水线。这不是要你学全新的东西,而是把已有的工程思维应用到 AI 协作场景中。


五、从今天开始的三件事

如果你读到这里,认同这条分水岭确实存在,下一步不是等,是动手。

三件具体的事,每件都可以在 5 分钟内起步——起步,不是完成。从 Vibe Coding 到 Agentic SE 是一个持续的过程,这三件事只是你迈出的第一步。

第一件:给你最重要的项目加一个上下文文件。

如果你用 Claude Code,创建一个 CLAUDE.md。如果你用 Cursor,创建一个 .cursorrules。写上四样东西:技术栈说明、编码规范、禁止事项、测试要求。

不需要写很长。“这个项目用 Go 1.22,数据库是 PostgreSQL,所有 API 都要有对应的单元测试,禁止使用全局变量”——30 个字,已经比没有上下文文件的项目领先了一步。

第二件:为 AI 产出的代码补一个测试。

从最危险的模块开始——支付、权限、数据处理。不需要追求 100% 覆盖率,先给最关键的路径加上安全网。

有了测试之后,AI 的每一次改动都可以被自动验证。这是从 Vibe Coding 到 Agentic SE 最小的一步,也是最关键的一步。

第三件:改变你和 AI 对话的方式。

把"帮我写一个用户注册功能"改成"按照以下规范实现用户注册功能:接口定义见 API 文档,错误处理使用项目预定义的错误类型,需要包含输入校验和单元测试"。

前者是 Vibe Coding。后者是 Agentic SE 的起手式。

区别不在字数,在意图的精确度。

从今天开始的三件事


分水岭的意义不在于你站在哪一侧,而在于你是否意识到这条线的存在。

2026 年,最大的风险不是"不会用 AI",而是"以为自己在用 AI,实际上被 AI 用"。

从今天开始,做 AI 的架构师,不是 AI 的回车键。

本文是"AI 时代工程师进化"系列的第一篇。下一篇将深入实操:Agentic Engineering Patterns——从单 Agent 到多 Agent 的可复用设计模式。

从今天开始:(1)加上下文文件(5 分钟起步);(2)补关键路径测试;(3)升级你和 AI 对话的精确度。不需要一步到位,但需要从现在开始。


参考资料