【立委按】很久很久以前,我发表过一篇世界语语言学特点的论文,后应邀扩展为一个 chapter,这段经历我在博客有记录。记得只看到样本,密密麻麻都是老先生对我论文的校对,但未等到付印我就出国了。后来流浪世界,一直没有顾上追踪这篇论文的下落,直到博士毕业来美国加入创业公司。我在公司做了主管以后,想到在世界语圈子的 Paul,他当时是加拿大世界语协会主席,也是我的兄弟学校的语言学博士候选人。Paul 苦读多年终于要毕业了,我就把他招来做了我的手下。有一天我提到这篇论文的事儿,他主动说我可以到图书馆查询,看到底发表了没有。后来他果然找到了,复印给我当年我呕心沥血写就的长篇论文。这篇论文的底稿早就不存了,只剩下这篇复印件,我一直想把这篇论文重新数字化,但还没找到合适的世界语文字识别软件,可是要是一字字地敲进去又没有这个耐心。在这喧嚣的世界里,我们越来越浮躁,很难静下心来。现在加入了这个群组,左右都是同仁和老师,感觉给了我动力。20多页密密麻麻,我就一点一点植字,也算是重温旧梦吧。
毕竟过去20多年了,回头看当年的文章,觉得的确有一些新意,但欠平实,也失之细琐,。感觉上是一个语言学学生“学习/探索/发现”一门新语言的过程实录。也的确是这么个背景。当年最震撼的一个“发现”是,世界语不过就 17 个词尾,居然会变出 112 个不同词形来。这大大出乎我的预料。当时手边的世界语文法书,只是讲解这些形态词尾的用法,我从来没看到有人指出到底能变出多少花样来。记得我跟我的语言学同学说,你猜猜一个词在世界语会有多少种变化?同学说,据她所知,世界语也不是形态特别丰富的语言,最多不过20-30种变化吧。后来就琢磨怎么回事?黏着(就是叠加)这种特点能有这么神奇的产生性吗?还真是如此。
17个形态不难记忆,112种形式怎么不把人整晕呢?靠的就是黏着的规则性。这些规则,文法书也没有写清楚,一切都是在例子中。但其实是可以总结出来的,到底有几种基本词尾形态,形态之间的粘着有什么限制?次序上,类型上,为什么?这些原来都是可以小葱拌豆腐讲清楚的。对形态词尾组合规律的穷尽式探索也是我所学的计算语言学的需要:所谓“削尾”算法就是要应对一个词的所有变形,这是自动形态分析的前提。没有它就查不到词典,没有词典信息加形态分析的信息,就无法做句子分析,也没办法往下走机器翻译规则系统。最后就把对于国际语的语言学研究,变成了一个机器翻译的应用课题。
有些东西是天生在这个语言中的,属于其语言学特点所决定的东西,但语言教科书上,包括柴门霍夫自己的实践都很少系统论述。譬如,复杂时态语态,通常的教学只教利用助动词 est- 的用法:estas studanta / estis studota / ... 等等,其实系统学习背后的语言学特性,会发现,这个助动词完全可以不用: studantas / studotis / ... (其实,即便保留助动词加中心动词的复杂分析形式,当年助动词词根 EST- 完全可以不用,让 EST- 只做系动词而不必兼做助动词,让三个时态词尾直接独立做助动词用即可:as studanta / is studota / ...)。。
Li, Ŭej (Wei) 1991. Lingvistikaj trajtoj de la lingvo internacia Esperanto.
In Serta gratulatoria in honorem Juan Rgulo, Vol. IV. pp. 707-723. La Laguna: Universidad de La Laguna
李维,1991:国际语世界语的语言学特征
1. 世界语的黏着性
1.0 众所周知,世界语在很大程度上是一种典型的黏着语,它的语素(
[说明] 本文中的术语“词尾”专指语法词尾,亦叫“形态”。
1.1 词尾黏着
一般而言,词尾用于表示语法信息:词类、格、数、时态、语态、
1.1.1 世界语中有多少个独立的形态语素?
其绝对数非常有限,只有17个,即:-o,-a,-e,-n,-
1.1.2 根据17个基本形态,
理论上的答案是112:42个动词,28个名词,
1.1.3. 形态语素黏合成词尾的规则
1.1.3.1. 每个单词只有一个词类。实词总是以其形态标示其词类:名词、
** -as-o / ** -e-i
【说明】 ** 表示不合法的语言形式(单词或短语),而 ?表示成问题的语言形式。
1.1.3.1.1. 词类不交叉是国际语很大的优势:世界语不存在词类同形现象,
1.1.3.1.2. 另一方面,上述特点也带来了世界语利用词尾任意转换词类的自由,
La flor-OJ glor-AS. (那花儿绽放了:“花儿” 与 “绽放/开花” 是同一个词根 flor- 只是词类词尾不同)
Li kan-AS italan popolan kant-ON. (他唱意大利民歌:“唱” 与 “歌” 是同一个词根 kant-,只是词类词尾不同)
Mi estas ĝoj-A. Mi ĝoj-AS. (他开心:“开心/高兴” 无论是动词谓语,还是做系动词后面的形容词标语,词根都是一样的 ĝoj- )
la propon-ITA propon-O (所提建议:“提议” 与 “建议” 同一个词根,只是词类词尾不同)
词类转变在古代汉语也有类似的自由度,叫做“词类活用”。但是,
1)三“人”行,必有我师。(Tri hom-OJ iras, inter kiuj nepre estus mia instruisto.)
(因为没有词尾形态,逐词直译就是:tri hom? ir?, nepr? est? mi? instruist?).
其狼“人”立而嗥。(La lupo hom-E staras kaj hurlas.)
(逐词直译:tiu? lup? hom? star? kaj hurl?).
2)其物“净”且清。(La aĵo pur-AS kaj klaras.)
(逐词直译:tiu? aĵ? pur? kaj klar?).
“净”其身,食其肉,乃去。(Pur-IG-IS la korpon, manĝis la viandon, kaj eliris. )
(逐词直译:pur? tiu? korp?, manĝ? tiu? viand?, kaj elir?).
1.1.3.2 表示词类的形态都可以黏合到 7 个“中缀”型形态上(中缀形态永远不会出现在单词的结尾),
1.1.3.3 动词的黏着规则
1.3.3.1 一个动词必须用以下词尾之一:-i / -u / -as / -is / -os / -us,它们之间不再存在黏着的可能性。这意味着,以 -i(不定式),-u(命令式) 或 -us (虚拟式)结尾的不再有时态的变化/含义,而 -as(现在时) / -is(过去时) / -os(未来时)不再有“时体” 的变化/含义。
1.1.3.3.2 世界语动词没有“数”与“格”的变化。因此,
Mi skrib-as. / ** Ni skrib-j-as. (au: ** Ni skrib-as-j.)
(即不存在其他语言那种主谓在数上的“一致关系”要求。)
1.1.3.3.3 表示时态(现在,过去和将来)和语气(不定式、命令式和虚拟式)
【问题探讨】不定式到底是语气(modo)还是独立的词类(
1.1.3.4 名词和形容词的黏着规则
1.1.3.4.1 名词和形容词有“数”(单数为零形式,-j 为复数形式)和“格”(主格为零形式,宾格形式为 -n)的形态变化。7个名词词尾 -o / -ant-o / -int-o / -ont-o / -at-o / it-o / ot-o,两个数变 (加 -j 或不加) 和两个格变(加 -n 或不加),最终形成 2*2*7 = 28 个名词形式(同理,有28个形容词形式)。
1.1.3.4.2 它们之间的顺序是:(词干)+ 分词 + 词类 + 数 + 格,其中词干 = 前缀+词根+后缀(前后缀可省)。例如:stud-ant-o-
sci-aj-n / ** sci-j-an
1.1.3.5 副词的黏着规则
与名词和形容词的规则非常相似,只是副词不包括“数”
1.1.3.6 关于黏着的词尾规则为建立用于“削尾”
1.1.4 世界语17个基本形态语素是否做到了在语义上的单纯,没有交叉?
1.1.4.1 可惜不是。这在【附录2】削尾算法中看得很明显(
1.1.4.2 语义不交叉的词尾只有5个:-o / -a / -e / -i / -n。应该说明的是,
1.1.4.3 在世界语中,没有单纯的基本形态语素来表示"动词"、"谓语"
【延伸讨论】 分词并不是独立的词类,它可以属于4个主要词类的任何一类。
1.1.4.4 有意思的是,即使在世界语不透明的混合形态中,
【延伸讨论】作为句法范畴,时态与时体显然彼此不同,
Verk-ONT-oj estas tiuj, kiuj verk-OS au verk-ONT-AS.
Stud-ANT-oj estas tiuj, kiuj stud-AS (ne nepre stud-ANT-AS!).
Hav-ANT-e multon da mono, mi ghojas.
= Ĉar mi hav-AS (neniel necese hav-ANT-AS) multon da mon, mi ghojas.
Li jam vid-IS/vid-INT-AS la filmon.
实际上,这两个词法范畴均与客观世界的时间维度相关,
1.1.4.5 然而,正因为世界语没有单纯的形态语素表示语态,
-as / -antas --> -atas; -as / estas -anta(j) --> estas -ata(j)
-is / -antis --> -atis; -is / estis -anta(j) --> estis -ata(j)
-os / -antos --> -atos; -os / estos -anta(j) --> estos -ata(j)
这个问题的本质是世界语实际上有四个时体:一般体(零形式),
1.1.4.6 【小结】理想的纯黏合语言是每个语素,至少每个词尾形态,
1.1.5 这 112 个单词形式都会用到吗?
1.1.5.1 在词法上,是的,所有这些形式都可能用到。实际中有一个限制:
? tabl-ant-i / tabl-ot-a / tabl-ant-a / tabl-int-o
这种限制是使用者自然遵守的,
1.1.5.2 尽管从实用角度来看,
尽管如此,
"Mi NUN stud-AS (au: Mi ESTAS stud-ANTA)" 代替 "Mi stud-ANT-AS".
"Ili JAM ir_IS (au: Ili ESTAS ir-INTAJ)" 代替 "Ili ir-INT-AS".
"veredir-E" 代替 "veredir-ANT-E"
因此,人们宁愿使用 “la parol-O far_E de Zamenhof(柴门霍夫做的演说)”,而不是“ la parol-ADO far-ITA de Zamenhof”,或将短语 FARE DE 简化为新的介词 FAR(la parolo FAR Zamenhof)。
因为人类思想本身就存在必要的模糊性,此外,上下文和功能词(
1.1.5.3 【小结】仅仅17个基本形态最终形成112个有效的词尾形式!
1.2 词缀的黏合
词缀主要用于表达单词的细微差别。
bon-a --> mal-bona --> malbon-ig-i --> pli-malbonigi
bon-a --> bon-ig-i --> pli-bonigi --> mal-plibonigi (aŭ: bon-a --> malpli-bon-a --> malplibon-ig-i)
1.2.1 词缀的抽象度有所不同。 最抽象也是最常用的词缀有 -et- (“小”,程度轻微)、-eg-(“大”,程度严重)、mal-
1.2.2 与多后缀黏着相比,前缀黏合或多或少受限,
mal-a-pe-ri / ** ma-la-pe-ri;
mal-an-tau-por-do / ** ma-lan-tau-por-do
1.2.3 后缀的黏合非常灵活自由:
rid-i --> rid-et-i --> ridet-em-a --> ridetem-et-a--> ridetemet-ul-o --> ridetemetul-in-o --> ridetemetulin-et-o --> ridetemetulinet-aĉ-o --> ridetemetulinetaĉ-et-o ...
= la ete aĉa eta knabino, kiu ete emas rideti
上面这个由一个词根一个词尾中间黏着了8个后缀的派生词词义组合
有意思的是,语缀(如 -et-)可以在一个单词中多次出现,这与形态语素完全不同。
另外,世界语中有两个特别的后缀 -ĉj-/-nj-,它们会更改与之黏合的前面的发音:
1.3 词根的黏合
词根黏合用来表达复杂概念,其黏合规则非常简单也很自然:
(1) akvo-fonto: 水/源
(2) varm-energio: 热/能
(3) arbo-branĉo: 树/枝
(4) surd-mut-ulo: 聋/哑/人
(5) blank-hara: 白/发
(6) nur-pieda: 光/脚
(7) bon-kora: 好/心
(8) fonto-lingvo: 源/语
(9) celo-lingvo: 目标/语
(10) naci-lingvo: 民族/语
(11) internaci-lingvo: 国际/语
【补记】还有些语言学特点文中没讲透,譬如实词的三大类别,可以在这里做个补述。词缀的创造中,词类本体化也很有意思:对应于动词概念的 -ad- (类似于英语的 -tion/-ing),对应于具体名词概念的 -ajh-(类似于中文的“东西”或类后缀“-品”),对应于形容词概念的 -ec- (类似于英语的 “-ness”)。这样一来,实际上世界语等于有了两套实词的大类:本体概念上的名词(-ajh-)、动词(-ad-)、形容词(-ec-),和句法上的名词(-o)、动词(-i/-u/-as/-is/-os/-us)、形容词(-a)。
其实三大类别不止于此。所有的实词词根,从概念上都隐含着三大类别之一:表示事物的名词性概念(譬如 hom-,kat-,tabl-),表示行为的动词性概念(如 traduk-,ir-,ven-),表示性状的形容词概念(bel-,ver-)。这样一来,世界语的实词有三套平行的大类,一个内核,一层内衣(可省),一层外衣。这三层大类交错黏合成词,使得世界语词汇的表达空间游刃有余。
为什么 tradukado 可以省略为 traduko?因为 traduk- 本来就是动词,-o 已经起到了名物化的效果了,就不必劳动 -ad- 这个后缀了。但这也不妨碍可以用它,来更加强调动作的过程性。同理,为什么可以用 belo 代替 beleco?因为 bel- 本来内核就是形容词,用 -o 的名物化自然表达了“性状”,就不必劳动后缀 -ec- 了。但这也不妨碍用它来加强对于“性状”的强调。可见,表达手段的丰富增加了词汇细微差别(nuance)的微妙,使得国际语比自然语言更加具有柔性和张力。
语言比较很有意思,特别是从语言学角度。譬如中文。前面说过,中文是“裸奔”的语言,语言学中叫“孤立语”。怎么讲?三层大类在中文,只剩下内核,既没有外衣(形态),也基本没有后缀(内衣)。一个概念既不穿内衣,也不穿外衣,就这样赤身裸体出来,与其他词组语成句。需要变类怎么办?靠上下文。古代汉语表现最突出,叫“词类活用”。所谓活用,就是不穿衣服,但是等于是穿了衣服。
“老吾老以及人之老。”
“老” 内核是形容词,到了所有格代词“吾”和助词“之”后成了名词,表示 “老人”。名词短语(“吾老”)前的“老”,则成了及物动词。所有这一切的词类转变,全部没有“穿衣服”明示。古汉语具有世界语类似的词类转变的灵活性,但因为不穿衣服,比世界语难太多了。现代汉语降低了灵活性,使用大得多的词汇量来弥补灵活性的不足,自然也比世界语难得多。
【相关】
Lingvistikaj Trajtoj De La Internacia Lingvo Esperanto
立委世界语文章 (1987): 《中国报道:通天塔必将建成》
立委世界语论文(1986): 《国际语到汉语和英语的自动翻译》
立委(1988)《世界科技:世界语到汉语和英语的自动翻译试验》