遭遇脸书的 Deep Text - 立委NLP频道

前几天脸书发布 Deep Text 新闻，在AI和自然语言理解领域引起热议，媒体上也闹出很大的动静。昨天笔者第一次亲身遭遇脸书的 deep text, 确认了其浅层无结构的本质，甭管它训练了多少层。
我跟女儿对话总是用脸书，她的圈子都用脸书，基本不用微信。她遇到一个烦扰有点着急，我就告诉她 take a deep breath，没想到脸书立即跳出了 Uber 的链接：我只要一按钮出租车就会来。
天哪这就是所谓 deep？很可能不过是个基于 ngram 的分类系统，哪里有 deep nlp 和结构的影子？
大概训练集里有不少 Take a ride， Take a cab，结果 take a deep breath 就也成了“出行”类事件了。这种信息抽取要是在 parsing 的结构基础上，哪里会出这样的笑话。
报道说什么deep text理解语言接近人的水平，牛皮吹没边了。比我们 parsing 支持的抽取能力和精准相差何止以里计。
这其实不是意外的发现，因为机器学习界一直就是在浅层做NLP，没有深度，没有结构，没有理解，缺乏细线条的分析 (parsing) 能力，大多是粗线条的分类 (classification) 工作。
对于分类系统只有输入text大机器学习才有效。如果是短消息，基本就是瞎蒙，关键词密度在短消息中没有了优势，缺乏 data points 的证据。
事实上，迄今的几乎所有的nlp应用，基本局限于无结构，机器学习 deep 不 deep 没有改变这一点。这很可能是为什么深度学习（DL）在 text 方面似乎不给力的症结所在。
宋老师前两天说话，学习 deep 了的好处是可以消化更多的训练数据，但是数据的增加永远是线性的，而 text 里面的结构性决定了语言的组合爆炸，因此深度学习不会因为增加数据而根本改观，稀疏数据依然是挑战。ngram 与 bow（bag of word） model 不变，再深的训练依然是在语言浅层挣扎，只能做粗线条的 nlp，却难以胜任细线条nlp的任务。ngram 只是语言结构的拙劣近似，缺乏结构是迄今的死穴。
parsing 基础上的事件抽取（event extraction）比ngram上的事件分类（event classification）高出岂止一头，一细一粗，一精一庸。

发布者

立委

立委博士，多模态大模型应用咨询师。出门问问大模型团队前工程副总裁，聚焦大模型及其AIGC应用。Netbase前首席科学家10年，期间指挥研发了18种语言的理解和应用系统，鲁棒、线速，scale up to 社会媒体大数据，语义落地到舆情挖掘产品，成为美国NLP工业落地的领跑者。Cymfony前研发副总八年，曾荣获第一届问答系统第一名（TREC-8 QA Track），并赢得17个小企业创新研究的信息抽取项目（PI for 17 SBIRs）。查看立委的所有文章

发布者

立委

发表回复