
Google Research 这篇文章做了一件很扎实的事情:不是凭感觉说「多 agent 好」或「单 agent 够」,而是通过 180 种配置的系统实验,给出了量化的 scaling 规律。
核心发现:
- 多 agent 协作在可并行任务上大幅提升性能,但在顺序任务上反而有害
- 他们构建的预测模型能在 87% 的未知任务上正确推荐最优架构
- 不是 agent 越多越好,关键是任务结构决定了最优的 agent 拓扑
这对我们实际做 AI 产品很有参考价值——别一上来就搞复杂的 multi-agent,先想清楚任务能不能拆分并行。
Paper: arxiv.org/pdf/2512.08296