【科普随笔:NLP的宗教战争?兼论深度学习】 屏蔽留存

【科普随笔:NLP的宗教战争?兼论深度学习】

屏蔽已有 12222 次阅读 2013-5-7 23:18 |个人分类:立委科普|系统分类:科研笔记| 机器学习, 自然语言处理, 深度学习, 规则系统, 深度分析

有回顾NLP(Natural Language Processing)历史的大牛介绍统计模型(通过所谓机器学习 machine learning)取代传统知识系统(又称规则系统 rule-based system)成为学界主流的掌故,说20多年前好像经历了一场惊心动魄的宗教战争。其实我倒觉得更像49年解放军打过长江去,传统NLP的知识系统就跟国民党一样兵败如山倒,大好江山拱手相让。文傻秀才遭遇理呆兵,有理无理都说不清,缴械投降是必然结果。唯一遗憾的也许是,统计理呆仗打得太过顺利,太没有抵抗,倒是可能觉得有些不过瘾,免不了有些胜之不武的失落。苍白文弱的语言学家也 太不经打了。

自从 20 年前统计学家势不可挡地登堂入室一统天下以后,我这样语言学家出身的在学界立马成为二等公民,一直就是敲边鼓,如履薄冰地跟着潮流走。走得烦了,就做一回阿桂。

NLP 这个领域,统计学家完胜,是有其历史必然性的,不服不行。虽然统计学界有很多对传统规则系统根深蒂固的偏见和经不起推敲但非常流行的蛮横结论(以后慢慢论,血泪账一笔一笔诉 :),但是机器学习的巨大成果和效益是有目共睹无所不在的:机器翻译,语音识别/合成,搜索排序,垃圾过滤,文档分类,自动文摘,知识习得,you name it

甚至可以极端一点这么说,规则系统的成功看上去总好像是个案,是经验,是巧合,是老中医,是造化和运气。而机器学习的成功,虽然有时也有 tricks,但总体而论是科学的正道,是可以重复和批量复制的。

不容易复制的成功就跟中国餐一样,同样的材料和recipe,不同的大厨可以做出完全不同的味道来。这就注定了中华料理虽然遍及全球,可以征服食不厌精的美食家和赢得海内外无数中餐粉丝,但中餐馆还是滥竽充数者居多,因此绝对形成不了麦当劳这样的巨无霸来。而统计NLP和机器学习就是麦当劳这样的巨无霸:味道比较单调,甚至垃圾,但绝对是饿的时候能顶事儿, fulfilling,最主要的是 no drama,不会大起大落。不管在世界哪个角落,都是一条流水线上的产品,其味道和质量如出一辙。

做不好主流,那就做个大厨吧。做个一级大厨感觉也蛮好。最终还是系统说了算。邓小平真是聪明,有个白猫黑猫论,否则我们这些前朝遗老不如撞墙去。

就说过去10多年吧,我一直坚持做多层次的 deep parsing,来支持NLP的各种应用。当时看到统计学家们追求单纯,追求浅层的海量数据处理,心里想,难怪有些任务,你们虽然出结果快,而且也鲁棒,可质量总是卡在一个口上就过不去。从“人工智能”的概念高度看,浅层学习(shallow learning)与深层分析(deep parsing)根本就不在一个档次上,你再“科学”也没用。可这个感觉和道理要是跟统计学家说,当时是没人理睬的,是有理说不清的,因为他们从本质上就鄙视或忽视语言学家 ,根本就没有那个平等对话的氛围(chemistry)。最后人家到底自己悟出来了,因此近来天上掉下个多层 deep learning,视为神迹,仿佛一夜间主导了整个机器学习领域,趋之者若鹜。啧啧称奇的人很多,洋洋自得的也多,argue 说,一层一层往深了学习是革命性的突破,质量自然是大幅度提升。我心里想,这个大道理我十几年前就洞若观火,殊途不还是同归了嘛。想起在深度学习风靡世界之前,曾有心有灵犀的老友这样评论过:

To me, Dr. Li is essentially the only one who actualy builds true industrial NLP systems with deep parsing. While the whole world is praised with heavy statistics on shallow linguistics, Dr. Li proved with excellent system performances such a simple truth: deep parsing is useful and doable in large scale real world applications.

我的预见,大概还要20年吧(不是说风水轮流转20年河东河西么),主流里面的偏见会部分得到纠正,那时也不会是规则和知识的春天重返,而是统计和规则比较地和谐合作。宗教式的交恶和贬抑会逐渐淡去。

阿弥陀佛!

【相关篇什】

【立委随笔:文傻和理呆的世纪悲剧(romance tragedy)】

[转载]ZT: 2013突破性科学技术之“深度学习”

【置顶:立委科学网博客NLP博文一览(定期更新版)】

http://blog.sciencenet.cn/blog-362400-687627.html

上一篇:解读“独立之精神、自由之思想”
下一篇:【科普笔记:没有语言结构可以解析语义么?(之二)】

 

26  蔣勁松 陈安 廖晓琳 赵星 张婷婷 彭思龙 李兵 徐晓 孙平 陈楷翰 李明富 崔小云 宋健敏 武夷山 王涛 李天成 岳金星 刘锋 何应林 邱嘉文 孙学军 李伟钢 何祥 李宇斌 bridgeneer yunmu

发表评论评论 (8 个评论)

删除 回复 |赞[8]胡上峰   2013-7-31 21:22
我可能算比较乐观的,个人认为对自然语言语义的深度理解,基于语义理解的机器学习,3-5年应该可以看到突破。5-10年可以体现在应用上。

删除 回复 |赞[7]胡上峰   2013-7-31 21:18
深度分析和统计方法其实不矛盾。最后解决问题需要靠把这两者良好地整合起来。

删除 回复 |赞[6]苏晓路   2013-5-9 03:13
解决了目的性和组合机制,统计学习就和规则接上了,或者换个说法,规则就是人脑以目的性为指导,自动组合统计学习模型形成的。说起来简单,我看没有十年搞不定。我还是比李老师乐观了 

删除 回复 |赞[5]袁贤讯   2013-5-8 19:46
这个也是没办法。rule-based有时也叫heuristic,但heuristic与eureka同根。好是好,就是让投资家觉得有点不太靠谱。所以,真正的专家也只好委屈一段时间了——尽管一段可能是20年,50年。

删除 回复 |赞[4]何伟   2013-5-8 11:31
哪个走到最深处是否会殊途同归?
统计要深入走,恐怕还是要多考虑四参数曲线法则,多多超越能级,而不是死循环浪费能量。

删除 回复 |赞[3]郭辉   2013-5-8 09:44
NLP是不是莱布尼茨提出的那个办法?学工科的不太懂,只是觉得莱布尼茨的方法虽匪夷所思,但总算没有明显的漏洞

删除 回复 |赞[2]李兵   2013-5-8 09:11
现在热门的大数据,貌似也是统计为王。

删除 回复 |赞[1]章成志   2013-5-7 23:52
貌似过于悲观,几年前国内NLP界关于规则和统计学习共生,基本上达成共识。不过说归说,目前在工业界和学术界,能出活的东西基本上貌似还是以统计为主。

发布者

立委

立委博士,问问副总裁,聚焦大模型及其应用。Netbase前首席科学家10年,期间指挥研发了18种语言的理解和应用系统,鲁棒、线速,scale up to 社会媒体大数据,语义落地到舆情挖掘产品,成为美国NLP工业落地的领跑者。Cymfony前研发副总八年,曾荣获第一届问答系统第一名(TREC-8 QA Track),并赢得17个小企业创新研究的信息抽取项目(PI for 17 SBIRs)。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据