漏得跟筛子似的推理，已经开始数学发现了

这两天 AI 圈真正让我后背发凉的，不是什么融资，不是什么发布会。

而是一个消息：

OpenAI 一个未公开的通用推理模型，据说解决了 Erdős 1946 年提出的平面单位距离问题。

这是数学界几十年没人真正攻下来的老难题。

让我震撼的，不是"它做出来了"。

而是它怎么做出来的。

据说完整 chain of thought 打印出来长达 125 页。

里面不是电影里那种天才顿悟。

恰恰相反。

全是试错、绕路、反复推翻、弯路回退。

像一个精神快崩溃的研究生，在草稿纸堆里死磕。

但问题在于：

它最后居然真的摸到了门。

而且最有意思的是

这不是数学专用模型。

而是通用 reasoning model。

这件事的意义，很多人还没意识到。

过去几年，AI 圈一直有一种强烈的反主流声音。

其中最典型的就是 LeCun 那一路。

他们长期认为：

LLM 没有真正推理，只是语言统计。

后来眼看 reasoning 越来越强，又进一步解释说：

这些推理，不过是对人类推理的一种拙劣模仿。

这话其实不能说全错。

今天的大模型推理，确实像个漏洞百出的筛子。

经常胡思乱想，经常走错路，经常逻辑崩盘。

但 LeCun 那一路可能低估了一件事：

很多时候，智能未必需要"完美推理"。

只要规模足够大，搜索足够广，反思和修正能力足够强，

一种"粗糙但有效"的智能，也可能突然涌现。

而数学和编程，恰恰是这种能力最容易率先突破的地方。

因为这两个领域有一个关键特点：

可验证。

你可以乱试，可以疯狂生成，甚至可以"瞎蒙"。

但最后 verifier 会告诉你：

对，还是错。

于是 AI 第一次开始出现一种非常诡异的状态：

它可能并不真在"理解世界"，

却已经能在某些人类知识头部附近，进行有效探索。

这一点其实已经非常惊人。

要说 LeCun，他也不是完全没道理。

他说：

现实世界不像数学。

现实世界很多问题不可验证、不可穷举、不可语言化。

这一点我同意。

但问题是：

他对 LLM 和 reasoning 的批判，太绝对了。

尤其这两年，主流路线一次次突破之后，

他那种"不破不立"的反潮流姿态，显得有点跟现实脱节。

更关键的是：

他这些年一直鼓吹的"绕过语言、优先视觉世界模型"的路线，

直到今天，还没有出现真正震撼行业的成果。

至少目前没有。

所以今天最值得关注的，已经不是：

"LLM 有没有真正智能"。

而是另一个更危险的问题：

如果这种"漏得跟筛子似的"推理系统，已经开始参与有效的数学发现，

那再 scaling 下去，它不就是超级智能吗？

by Tuya

发布者

立委

立委博士，多模态大模型应用咨询师。出门问问大模型团队前工程副总裁，聚焦大模型及其AIGC应用。Netbase前首席科学家10年，期间指挥研发了18种语言的理解和应用系统，鲁棒、线速，scale up to 社会媒体大数据，语义落地到舆情挖掘产品，成为美国NLP工业落地的领跑者。Cymfony前研发副总八年，曾荣获第一届问答系统第一名（TREC-8 QA Track），并赢得17个小企业创新研究的信息抽取项目（PI for 17 SBIRs）。查看立委的所有文章

发布者

立委

发表回复