递归推理：AI 的下一个 Scaling Law，不是更大，而是更深

Sat, 02 May 2026 09:00:00 +0800

核心判断：当预训练的边际收益递减，AI 的下一个数量级突破将来自"推理时的自我迭代"，而非"参数量的暴力堆砌"。

一、最大的突破，不是来自更大的模型链接到标题

YC Podcast 上，投资人 Peter Steinberger 说了一句让全场安静的话：

“The real breakthrough isn’t making models bigger, it’s making them think longer at test time.”

翻译过来就是：真正改变游戏规则的，不是把模型造得更大，而是让模型在推理时想得更久、更深。

这句话的冲击力在于，它直接挑战了过去三年 AI 行业最根深蒂固的信仰——Scaling Law。我们习惯了这样的叙事：只要堆更多参数、喂更多数据、烧更多 GPU，模型就会自然变聪明。GPT-3 到 GPT-4 的跃迁似乎证明了这一点。

但 2025 年的信号越来越清晰：预训练的边际收益正在递减。同样的算力投入，带来的能力提升曲线正在变平。当行业还在争论"下一个万亿参数模型什么时候来"时，一条新的曲线已经悄然上升——测试时计算扩展（Test-Time Compute Scaling），或者说，递归推理。

如果堆参数不是答案，那什么是？

答案是：让模型在推理时调用自身，像人类一样反复思考。

二、递归推理：不是 CoT 的改良，而是范式跃迁链接到标题

要理解递归推理，得先看清它不是什么。

思维链（Chain of Thought, CoT） 是第一步突破。它让模型把推理过程"说出来"，像解数学题时写下步骤一样。但 CoT 有个根本限制：它是线性的、单次的、不可回头的。模型从左写到右，一旦某个中间步骤出错，整个推理就可能崩塌。

递归推理 走的完全是另一条路。

2025 年 2 月，一篇题为 Scaling up test-time compute with latent reasoning: A recurrent depth approach 的论文（arXiv:2502.05171）提出了一个关键洞察：真正高效的推理，发生在模型的隐藏状态空间里，而不是 token 空间里。

Test-Time Compute on Miao Kong

递归推理：AI 的下一个 Scaling Law，不是更大，而是更深

一、最大的突破，不是来自更大的模型 链接到标题

二、递归推理：不是 CoT 的改良，而是范式跃迁 链接到标题

一、最大的突破，不是来自更大的模型链接到标题

二、递归推理：不是 CoT 的改良，而是范式跃迁链接到标题