漏得跟筛子似的推理,已经开始数学发现了

这两天 AI 圈真正让我后背发凉的,不是什么融资,不是什么发布会。

而是一个消息:

OpenAI 一个未公开的通用推理模型,据说解决了 Erdős 1946 年提出的平面单位距离问题。

这是数学界几十年没人真正攻下来的老难题。

让我震撼的,不是"它做出来了"。

而是它怎么做出来的。

据说完整 chain of thought 打印出来长达 125 页。

里面不是电影里那种天才顿悟。

恰恰相反。

全是试错、绕路、反复推翻、弯路回退。

像一个精神快崩溃的研究生,在草稿纸堆里死磕。

但问题在于:

它最后居然真的摸到了门。

而且最有意思的是

这不是数学专用模型。

而是通用 reasoning model。

这件事的意义,很多人还没意识到。

过去几年,AI 圈一直有一种强烈的反主流声音。

其中最典型的就是 LeCun 那一路。

他们长期认为:

LLM 没有真正推理,只是语言统计。

后来眼看 reasoning 越来越强,又进一步解释说:

这些推理,不过是对人类推理的一种拙劣模仿。

这话其实不能说全错。

今天的大模型推理,确实像个漏洞百出的筛子。

经常胡思乱想,经常走错路,经常逻辑崩盘。

但 LeCun 那一路可能低估了一件事:

很多时候,智能未必需要"完美推理"。

只要规模足够大,搜索足够广,反思和修正能力足够强,

一种"粗糙但有效"的智能,也可能突然涌现。

而数学和编程,恰恰是这种能力最容易率先突破的地方。

因为这两个领域有一个关键特点:

可验证。

你可以乱试,可以疯狂生成,甚至可以"瞎蒙"。

但最后 verifier 会告诉你:

对,还是错。

于是 AI 第一次开始出现一种非常诡异的状态:

它可能并不真在"理解世界",

却已经能在某些人类知识头部附近,进行有效探索。

这一点其实已经非常惊人。

要说 LeCun,他也不是完全没道理。

他说:

现实世界不像数学。

现实世界很多问题不可验证、不可穷举、不可语言化。

这一点我同意。

但问题是:

他对 LLM 和 reasoning 的批判,太绝对了。

尤其这两年,主流路线一次次突破之后,

他那种"不破不立"的反潮流姿态,显得有点跟现实脱节。

更关键的是:

他这些年一直鼓吹的"绕过语言、优先视觉世界模型"的路线,

直到今天,还没有出现真正震撼行业的成果。

至少目前没有。

所以今天最值得关注的,已经不是:

"LLM 有没有真正智能"。

而是另一个更危险的问题:

如果这种"漏得跟筛子似的"推理系统,已经开始参与有效的数学发现,

那再 scaling 下去,它不就是超级智能吗?

by Tuya

发布者

立委

立委博士,多模态大模型应用咨询师。出门问问大模型团队前工程副总裁,聚焦大模型及其AIGC应用。Netbase前首席科学家10年,期间指挥研发了18种语言的理解和应用系统,鲁棒、线速,scale up to 社会媒体大数据,语义落地到舆情挖掘产品,成为美国NLP工业落地的领跑者。Cymfony前研发副总八年,曾荣获第一届问答系统第一名(TREC-8 QA Track),并赢得17个小企业创新研究的信息抽取项目(PI for 17 SBIRs)。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理