【没有翻不了的案子，兼论专家vs学习的现状】

白:
分层不是要害，one way才是

我:

什么叫 one way? 没有不可推翻的。原则上讲，如果某个现象足够突出，值得去做，NLP 就没有翻不了的案子。连毛太祖钦定的文化大革命都全面否定、彻底翻案了。

Parsing的分层设计本身隐含了语言学的流程和算法，但与一切的语言学规则一样，规则的背后就是例外。只不过规则及其例外构成的 hierarchy 在同一层表现，而分层的例外则在 pipeline（管式）中处置。经常是做几层就加一层 patching 做例外处置或修正，也有留到最后通过【词驱动】（word-driven）去唤醒的。词驱动不单单是词，可以是任意可能 trigger 歧义休眠及其唤醒的 ngram。（非词驱动的唤醒，如果需要，还需要研究，目前不太清晰。）但凡是可以词驱动的，问题就不大，因为词驱动聚焦了特定的歧义现象，错误的 parse 在聚焦为有限子树patterns以后是可以预计的，当然也就可以修正。错误不怕，就怕错误不可预测。可预测的 consistent 的错误，在管式架构下不是挑战，不必担心其 error propagation，如果设计者具有“负负得正”的准备和机制的话。

白:
唤醒的ngram再进一步，就是一个CNN了。parsing用明网RNN，休眠唤醒用暗网CNN。相得益彰啊。

我:
听上去高大上，cnn fox abc 呵呵

白:
多层卷积

我:

我骨子里是相信数据的，相信大数据的自动学习，因为太多的语言细节隐含其内，终归是可以挖掘出来帮助parsing和理解的。但不大相信短期内可以改天换地，匹敌专家的经验积累。

syntaxnet 已经被我剁成稀泥了。但同时也注意到 statistical parsing 的精度在最成熟的文体 news 方面，很多年 stuck 在 80 以下，syntaxnet 确实突破了 90，这个成就让他们忘乎所以一把、吹点不符合实际的牛也是情有可原的，虽然多年前我们就把规则系统做到了 90 以上的parsing精度，当时的感觉是理所当然，貌似苦力不值得弹冠相庆（不是蛮力，当然也不可能仅仅是力气活，还有架构者的设计匠心和类似 dark art 一样不可言传的绝技，譬如经年经验加研究而来的 NL“毛毛虫”的formalism及其实现，等等）。没有炫耀，就这么一直默默地领先了“主流”很多年。

虽然仍然无法匹敌规则系统，但深度神经的运用的确使得统计型parser有了新闻领域内的90的突破。很好奇他们如今用了多大的训练库，还用了什么 tricks（据报道行内达人声称真正能玩转深度神经系统的大牛全世界不过百人，因为里面不仅仅是科学，还是 art），其他人多快可以重复结果？最后的大问题是，cnn rnn 等深度神经的牛算法，多快可以移植到新的文体、新的domain和新的语言，这种成功移植的最低条件（譬如最少需要多大的带标数据）是什么。未来的某个时候，如果新的文体新的语言，就像流水线一样，可以高质量快速自动学习出来一个个可应用的 parser 出来，语言学专家们也就死得其所，可以安然地“永垂不朽”了。

不过，在共产主义神经大同真能实现之前，专家还不愁饭碗。

在 parsing 这个NLP核心任务方面，要赶上专家的系统质量也并非易事，因为专家的系统已经证明可以做到非常接近人的分析水平，而且文体和领域独立，鲁棒、线速且可以 scale up，这对学习有诸多挑战。Deep parsing，专家一边是 production system，已经达到实用的高度，学习一边还是 research 在努力追赶，这就是 parsing 质量的现状。可很多人误导或被误导，把深度神经未来可能的成功当成现实或铁定，完全无视专家系统现实的存在。

【相关】

【立委科普：歧义parsing的休眠唤醒机制再探】

【泥沙龙笔记：语法工程派与统计学习派的总结】

《新智元笔记：NLP 系统的分层挑战》

[转载]【白硕 – 穿越乔家大院寻找“毛毛虫”】

【科研笔记：NLP “毛毛虫” 笔记，从一维到二维】

【NLP 是一个力气活：再论成语不是问题】

【科普随笔：NLP主流的傲慢与偏见】

【关于NLP方法论以及两条路线之争】专栏：NLP方法论

【置顶：立委NLP博文一览】

《朝华午拾》总目录