这两天 AI 圈真正让我后背发凉的,不是什么融资,不是什么发布会。
而是一个消息:
OpenAI 一个未公开的通用推理模型,据说解决了 Erdős 1946 年提出的平面单位距离问题。
这是数学界几十年没人真正攻下来的老难题。
让我震撼的,不是"它做出来了"。
而是它怎么做出来的。
据说完整 chain of thought 打印出来长达 125 页。
里面不是电影里那种天才顿悟。
恰恰相反。
全是试错、绕路、反复推翻、弯路回退。
像一个精神快崩溃的研究生,在草稿纸堆里死磕。
但问题在于:
它最后居然真的摸到了门。
而且最有意思的是
这不是数学专用模型。
而是通用 reasoning model。
这件事的意义,很多人还没意识到。
过去几年,AI 圈一直有一种强烈的反主流声音。
其中最典型的就是 LeCun 那一路。
他们长期认为:
LLM 没有真正推理,只是语言统计。
后来眼看 reasoning 越来越强,又进一步解释说:
这些推理,不过是对人类推理的一种拙劣模仿。
这话其实不能说全错。
今天的大模型推理,确实像个漏洞百出的筛子。
经常胡思乱想,经常走错路,经常逻辑崩盘。
但 LeCun 那一路可能低估了一件事:
很多时候,智能未必需要"完美推理"。
只要规模足够大,搜索足够广,反思和修正能力足够强,
一种"粗糙但有效"的智能,也可能突然涌现。
而数学和编程,恰恰是这种能力最容易率先突破的地方。
因为这两个领域有一个关键特点:
可验证。
你可以乱试,可以疯狂生成,甚至可以"瞎蒙"。
但最后 verifier 会告诉你:
对,还是错。
于是 AI 第一次开始出现一种非常诡异的状态:
它可能并不真在"理解世界",
却已经能在某些人类知识头部附近,进行有效探索。
这一点其实已经非常惊人。
要说 LeCun,他也不是完全没道理。
他说:
现实世界不像数学。
现实世界很多问题不可验证、不可穷举、不可语言化。
这一点我同意。
但问题是:
他对 LLM 和 reasoning 的批判,太绝对了。
尤其这两年,主流路线一次次突破之后,
他那种"不破不立"的反潮流姿态,显得有点跟现实脱节。
更关键的是:
他这些年一直鼓吹的"绕过语言、优先视觉世界模型"的路线,
直到今天,还没有出现真正震撼行业的成果。
至少目前没有。
所以今天最值得关注的,已经不是:
"LLM 有没有真正智能"。
而是另一个更危险的问题:
如果这种"漏得跟筛子似的"推理系统,已经开始参与有效的数学发现,
那再 scaling 下去,它不就是超级智能吗?
by Tuya