从便利贴 prompt 到标准化工具箱,AI 的"配置文件"悄悄走过了五代演进。ETH Zurich 实证数据揭示反直觉真相:给 AI 写规则,精准约束比全面描述管用——限制越精确,执行越可靠。
同一个模型差了 6 个百分点——Auggie 和 Cursor 的成绩差距揭示了一个被忽略的事实:决定 AI 编程工具能力上限的是 Harness 框架而非底层模型。Context Rot、中间遗忘、工具歧义,三重问题全是 Harness 的工程挑战。评估 AI 工具,该问「Context Engine 怎么设计」,不是「用了什么模型」。
OpenClaw 不是又一个聊天 AI,而是能走出沙箱、到你电脑上干活的「管家」。顾问 vs 管家的核心隐喻、龙虾适用三角判断法、三文件最小起步——帮你判断要不要养一只龙虾。
拆解 Claude Skills 背后的架构逻辑——一个 Markdown 文件、三层渐进加载、与 MCP 和 Subagent 的分工——这不是又一个提示词管理工具。