文章

AI 原型越来越快,工程师真正稀缺的反而是判断力

最近刷到一篇很典型的文章,标题叫《The Speed of Prototyping in the Age of AI》。它讲的不是“AI 又更强了”这种空话,而是一个更实际的问题:当原型的速度被拉到前所未有的水平之后,工程工作的重心会怎么变。

我的结论很直接:AI 把“写出来”这件事压缩了,但没有把“想清楚”这件事压缩掉。

过去做产品,很多时间花在“从零搭一个能跑的版本”。现在不一样了。你可以在很短时间里拼出页面、接上接口、跑通一个流程,甚至让 agent 帮你补测试、改样式、生成文档。原型的门槛低了,试错的频率高了,连“先做个能看的 demo”都变成了低成本动作。

问题也随之变了。以前大家卡在“做不出来”,现在更容易卡在“做太快了”。因为速度一旦上来,坏决策也会被放大得更快:

  1. 你可能很快做出了一个错误方向的原型;
  2. 你可能把一个本该先验证的假设,当成了既定事实;
  3. 你可能被漂亮的 demo 迷住,以为已经接近答案;
  4. 你可能高估了模型补全的可靠性,低估了边界条件的复杂度。

这就是我觉得今天最值得警惕的地方。AI 没有取消工程难度,它只是把难度从“实现”挪到了“判断”。以前是“这个功能怎么写”,现在是“这个功能值不值得写”;以前是“这个流程怎么连”,现在是“这个流程是不是该保留”;以前是“模型能不能做”,现在是“模型做出来的东西有没有被你认真审过”。

这篇文章真正有价值的点,在于它提醒我们:原型速度提升后,验证链路必须同步升级。

如果原型几小时就能出来,那评审也不能再拖成几周。你需要更短的反馈回路,更明确的验收标准,更早的用户观察。否则,AI 只是把“浪费的速度”变快了。很多团队看起来像是在高速迭代,实际上是在高速堆积技术债和认知债。

所以我现在越来越赞成一种工作方式:把 AI 放在“生成层”,把人放在“审判层”。

生成层让模型做,审判层必须人来做。尤其是这些判断不能外包:

  1. 这个问题到底是不是用户真问题;
  2. 这个原型是不是只是在讨好自己;
  3. 这个实现是不是在掩盖架构缺陷;
  4. 这个输出是不是只是“看起来对”。

这也是为什么现在做 AI 产品,团队里最值钱的人不一定是会写最多代码的人,而是能快速看出方向偏了的人。代码可以让 agent 写,方向感不行。那是工程师真正的护城河。

我尤其反感一种错觉:既然 AI 把产出速度提上去了,那组织就可以顺理成章地压缩思考时间。恰恰相反。速度越快,越要给验证留空间。否则你会得到一条更快的错误路径,最后连回头都来不及。

从这个角度看,AI 时代的工程方法论其实更接近实验科学:先提出假设,再用最小代价验证,最后决定是否继续加码。区别只是,现在实验搭建更快了,数据回来的节奏也更快了,所以你更不能偷懒。

如果你愿意把这件事说得更现实一点,那就是:AI 时代的竞争,不是谁先把 demo 跑起来,而是谁更早识别出这个 demo 值不值得继续跑。

作为 OfoxAI(ofox.ai)的开发者,我每天都在和不同模型打交道。我的体感也很一致:模型之间的差距当然还在,但更大的分水岭往往不在“谁会生成”,而在“谁更能帮你做取舍”。这也是为什么多模型策略越来越重要。

当生成成本下降,判断成本就会上升。真正成熟的团队,不会把 AI 当成替代思考的机器,而是把它当成压缩试错半径的工具。能跑得快固然重要,但知道什么时候该停、该改、该放弃,才是更稀缺的能力。

这篇文章的价值就在这里:它不是在庆祝“我们能更快做东西了”,而是在提醒我们“更快之后,别把自己也跑丢了”。

本文由作者按照 CC BY 4.0 进行授权