止语Lab

技术实践与思考

Tags

18 个页面

AI Agent

$Featured image of post 从一个 Markdown 文件说起：AI 时代的\$

从一个 Markdown 文件说起：AI 时代的"配置文件革命"

从便利贴 prompt 到标准化工具箱，AI 的"配置文件"悄悄走过了五代演进。ETH Zurich 实证数据揭示反直觉真相：给 AI 写规则，精准约束比全面描述管用——限制越精确，执行越可靠。

AI Agent 的生产力悖论

同一个模型差了 6 个百分点——Auggie 和 Cursor 的成绩差距揭示了一个被忽略的事实：决定 AI 编程工具能力上限的是 Harness 框架而非底层模型。Context Rot、中间遗忘、工具歧义，三重问题全是 Harness 的工程挑战。评估 AI 工具，该问「Context Engine 怎么设计」，不是「用了什么模型」。

个人 AI 助理的下一步，是「更强的工具」，还是「人与人之间的新接口」？

AI 自审查为什么会失效？——分离上下文窗口的设计哲学

让 AI 写完代码再自己审查，它对明显错误视而不见。问题不是模型不够聪明，而是上下文窗口被自己的输出占满了。分离上下文窗口是解法。

普通人的龙虾指南：OpenClaw 从理解到上手

OpenClaw 不是又一个聊天 AI，而是能走出沙箱、到你电脑上干活的「管家」。顾问 vs 管家的核心隐喻、龙虾适用三角判断法、三文件最小起步——帮你判断要不要养一只龙虾。

Agentic Engineering Patterns——从单 Agent 到多 Agent 的可复用设计模式

Agent 工程不是玄学，是工程。本文给出从 ReAct 到 Skills 模块化到 Supervisor 编排到 MCP 集成的四段位进阶框架，每个 Level 对应一个可复用的设计模式。

Claude Agent Teams 实战手册：从零开始搭建多 Agent 系统

用 Claude API + Python 从零搭建多 Agent 系统。涵盖 ReAct 循环、编排器-子 Agent 架构、上下文隔离，附完整代码和避坑指南。

Claude Agent Teams 是什么：从单体到多智能体的架构演进

多智能体系统比单 Opus 4 强 90.2%，但成本高 15 倍。这篇文章用通俗语言拆解 Claude Agent Teams 的核心原理、工作流程和适用场景，帮你判断什么时候该用、什么时候不该用。