🔥 编程 Agent 的遮羞布,被一群硬核黑客扯掉了
George Hotz 用了六个月,给 AI 编程 Agent 写下墓志铭。
17 岁破解 iPhone、后来创办 comma.ai 的传奇黑客 George Hotz,过去半年把市面上所有叫得上名字的 AI 编程 Agent 全部测了一遍:不同模型、不同 harness、不同提示词,全试了个遍。
他的结论写在一篇叫《永恒的 Sloptember》的博客里——结论是:Agent 不是程序员,而且我们正在越来越难意识到这件事。
“它们生成的东西就是坏的,只是坏得越来越隐蔽、越来越难查出来。而这,正是一个越来越精确的统计模型会带来的结果。”
🔥 核心三连暴击
① “10 倍工程师” 的幻觉
Hotz 在真实项目里用了 Agent:给 Tinygrad 写代码、完整逆向一个 USB-PCIe 芯片。结论是——每次他都本可以手工做得更好更快。
Agent 的套路是:把进展全堆在前面,然后递给你一个老虎机拉杆,指望它把最后的打磨搞定。但它总是差那么一点。
② 大公司才是最大受害者
高绩效的人有纠错能力,能看出来什么时候代码就是垃圾。但大公司里那些反馈循环慢、对齐程度低的”低绩效选手”,才是大规模使用 Agent 的主力。
这会是一个垃圾代码成吨涌出的黄金时代,也是高质量精品的黑暗时代。
③ Token 烧光,却换不来等比产出
Uber CTO 今年 4 月说:公司提前花光了 2026 年的 Claude Code 预算。COO 后来说:”很难把 token 消耗和’我们实际交付了 25% 更多有用功能’对应起来。这个关联,现在还不存在。”
英伟达应用深度学习副总裁也证实:在他的团队里,计算成本远远超过员工成本。
🤔 真正的问题是什么?
不是”人写烂代码,AI 也写烂代码”。
区别在于:过去再差的代码,至少写它的人心里有一个粗糙的心智模型。但现在,大量 AI 生成的代码被快速提交、合并、发布——很多人并没有真正理解它,只是看到它通过了测试。
坏代码从来不新鲜。新鲜的是,坏想法现在可以以更快的速度变成 commit,而理解、审查和责任,却没有同步变快。
📎 来源: InfoQ 整理
