AI编程的杠杆,正在从"写prompt"转移到"设计循环系统"

前沿资讯 1782010136更新

0

Anthropic一位研究负责人表示:

"Anthropic 99%的工程师在跑300多个自改进agent集群。形成agent反馈闭环,给模型一个验证自己输出的方式。"

Claude加循环、加计划模式、加动态工作流——这,就是秘诀。

过去两年,你是怎么用AI编程工具的?

打开工具,写一个prompt,等它返回结果,读diff,觉得哪里不对,再写下一个,再等,再读,再改。

这个过程里,你始终是那个在驾驶座上的人。Agent只是你的工具,你全程握着方向盘。

写prompt,等结果,调prompt,再等结果。杠杆在prompt那端

但现在,杠杆在转移

有个新词开始在圈子里流传,Loop Engineering,循环工程。

说白了就是,你不再一个一个写prompt去驱动agent了,而是设计一个小的自动化系统,让这个系统替你做这件事。

我举个例子。

以前你是出租车司机,乘客说去哪你就去哪。现在呢,你现在成了设计自动驾驶路线的人。你设计好规则,设计好验证机制,然后车子自己跑。

区别在哪?你是设计规则的人,而不是执行规则的人。

有数据显示,Anthropic的工程师们现在每天合并的代码量,是2024年的八倍。杠杆已经转移了,从「提示词」转移到了「设计」。

但先别急着兴奋。这事不是谁都能玩的

有经验显示,Loop Engineering只在这四个条件都满足的时候才值得做。

第一个,任务要重复。循环的价值在于摊平成本,如果工作不重复,这个成本永远摊不下去。

第二个,验证要自动化。循环得有个自动的守门员,能在没人的时候判断输出是不是有问题。测试套件、类型检查、linter、构建脚本,有一个就行。没有这个守门员,你就得自己坐在那读每一个diff,那循环帮你省的事就全还回去了。

第三个,预算能撑得住。循环要重读上下文,要重试,要探索,token在烧。对于一个月50元套餐的人来说,这就像月薪五千硬供法拉利,财务会爆。

第四个,agent得有senior engineer水平的工具。能运行自己写的代码,有日志,有复现环境。没有这些,循环就是在黑暗里摸索。

缺少任何一个,循环的成本就会超过收益。说实话,Loop Engineering是真的,但大多数开发者或许现在还不需要它

好,假设四个条件都满足了,怎么创建?

循环系统有六个核心组件。但建议是,先用最少的组件搭一个最小可用的循环,跑通再说。

第一个是自动化,这是心跳,让循环真正跑起来的东西,不是你手动按一次执行一次。

第二个是worktree,并行不乱。如果你同时跑两个agent,它们可能会修改同一个文件,这就跟两个工程师没商量就commit到同一行代码一样痛苦。Git worktree给你一个独立的checkout,让它们在各自的目录里工作,一个agent的改动物理上不可能碰到另一个。

第三个是skill,知识的复用。把项目上下文写一次,每次循环都读它。convention是什么,build步骤是什么,为什么这事我们不这么做,全写在外面。有skill,每一轮都会在前一轮的基础上继续,不会每次从零推导

第四个是连接器,让循环能真正跑在你的真实环境里。通过MCP协议,agent可以读issue tracker,往Slack发消息。一个连接器,让你不用手动传达agent的进展。

第五个是子agent,也就是maker和checker的分离。写代码的那个模型是「当事人」,它给自己的作业打分永远有偏心。另一个agent用不同的指令,能捕获第一个agent说服了自己但其实不对的那些东西。

还有个组件,听起来简单,但实际上是每个真正跑起来的循环的脊梁——状态文件

可以是markdown,可以是Linear board,可以是JSON,任何能活在单次对话之外、能记录「什么做完了」和「下一步是什么」的东西。

为什么重要?因为agent默认是短期记忆。这次会话学到的东西,明天就没了,除非你写下来。

没有持久状态的循环每次运行都从零开始,有状态的循环,才能接着上次的继续跑。

最后说两句。

杠杆已经转移了。你的工作也是。

但这句话不是说给所有人的。

任务要重复,验证要自动化,预算要撑得住,agent要有senior工具。

四个条件,少一个就不值得。

过了这个门槛的话,记住一点:顺序很重要

先把手动的跑通,再变成skill,再用自动化包裹,然后才能schedule。

阅读原文: https://mp.weixin.qq.com/s/1gyyWacdXX0AV-7fLujBTQ