《人生记忆:老爸-回忆文革40周年》

我的人生回忆“风雨几春秋“续篇之三:回忆文革40周年

立委父

1966年中共中央“5.16”通知下达后,让全国人民“朦”了,国家发生了什么?所谓“四大”(大鸣、大放、大字报、大辩论)铺天盖地充斥全国城乡各个角落。6月1日人民日报发表社论,“横扫一切牛鬼神”,连篇累牍,兴师动众,刹时暴风骤雨、如火如荼。

直到“炮打司令部_我的一张大字报“出笼后,事主之“司马昭之心”昭然若揭,打倒中国“赫鲁晓夫”。然高层内幕有谁知晓?一言九鼎之“红太阳“把全国人民带入一场政治游戏泥潭之中,随之而来的“文斗”、“武斗”硝烟弥彻中华大地,煞有介事地陷入一场没有“敌军”的“人民战争”,真的是运动群众了。

此时正值“深挖洞,广积粮,不称霸”、备战备荒为人民,我被派往何湾创建一所“战备医院”。按当时反动“血统论“理念,对于我这样非“红五类”出身的人,料定是整肃对象。然,我逃出人声鼎沸的县医院,在这难得的世外桃源,躲过一劫。

我对这场莫名的“运动“和后来演变成全国性武斗格杀,没有兴趣和热情,也因为出身不”硬“,有点”明哲保身“,自己又处于事业初期,所以我,不”抓革命“,只”促生产“,埋头看书、开刀,日夜兼程,既治病又治伤,练就手术本领。

说说当时“运动“之深度、广度,我的三个孩子是4、6、8岁,我下乡,他们没有幼儿园上,老大、老二就一把掳进一年级,不久,停学闹革命,这些娃娃们没事干,也跟着大人“革命”了,老大也领着他们小伙伴,成立”匕首“小分队”革命组织“,被推任为“司令”。全社会无政府状态,没有任何人来管他们,老师、家长也不敢干预“革命”,居然,他们有自己的队旗、袖章、公章和办公室(记得那时上二年级的老大为此独自去县城刻章、做旗、串连、取经,住在他同学、好友杨国民家),也上街搞“四大”,还造他们校长的反,真的像模像样,光荣地自称“我们是毛主席的红小兵,要让江山万年红、代代红“(见《朝华午拾 -永做毛主席的红小兵》)。荒诞的岁月,造就奇事、怪才,这9岁的娃娃,也能独闯江山闹革命,超过了当年我11岁那次“鸡毛信”(见《人生记忆-风雨几春秋》)。

67年,弟弟妹妹趁着哥哥这司令,也挤了进去,人家贴大字报,他俩拎浆糊桶;人家造反,他俩听得也起劲。仨兄妹带上红袖章,英姿飒爽的风采(相片),40年啦,依然让人难忘当年的那场政治游戏。

“革命”闹了一年多,时至1967年夏,全社会瘫痪了,医院里的一派“扫黑线”,外出“革命大串连”;守家的另一派“批联部”,不能支撑开诊,尤其是外科,该派头头们就令当局将我从的乡下调回(原本我下乡一年,后来革命乱了没人管,至此我已离院一年半了,然我正好“蛰居”安稳。)主持外科病房工作。

武斗,就有“人为”伤员,让我有用武之地,为此,受到”敌对“双方的重用和保护。我”安分守己“,钻研业务,提高技术,成为名震一方“一把刀”、生命的守护神,多救了不少病弱,减少不少无辜因“革命”的牺牲者,真的功德无量。于公于私,两利双赢。

我仍然坚守“不革命、只生产”的自定准则和底线。不是我胆小怕事,当时,压根就没有悟出“斗争”有何价值?牺牲更不值得。发疯似的全国大宣传,也没能让我心服!但也只能消极怠慢,不敢顶撞,那是一场“史无前例”的政治高压,螳臂当车,不啻是自取灭亡。

那时光,人像疯了一样,昏天黑地,挂牌、游街、戴高帽、搞喷气式,除了地、富、反、坏、右这些阶级敌人,还有共产党的各级大小当权派,都是打击对象。多如牛毛的“革命”组织,“无法无天”,都声称“悍卫毛泽东思想”,后来大致都发展成对立的两派,各立据点,抡枪抡炮,真枪真弹,就我们那个小小的县城,武斗中就死了10个人,都是青年学生和工人,恒古没有结案,不了了之。这,何止是“触及灵魂”,更泯灭其躯体,真的攸关黎民百姓身家性命。然而人们的“热情”是空前绝后,火药味极浓,夫妻反目,父子成仇,前赴后继,死而后已。而我却“无动于衷”,虽然我也被卷进“批联部”一派,但连派会我也极少参加,更何况文斗、武斗,好友们戏称我是“逍遥派”。

1967年夏秋之交,武斗正酣,“工事、战壕”遍布,俨然是一场“人民战争”,处处是战场,枪声、炮声,弹痕累累,造反派可随意抓人、关人甚至杀人,一抹“红色恐怖”。武斗跟文斗不同,语言罪,文字狱,虽可无端,但还得批呀、斗呀。而武斗那怕是一人也可向你下手,让你瞬遭不测,人身安全,全无保障,比战乱更可怕,此乃知情人之间内讧,外加冷枪流弹,我虽素来与人为善,人缘不错,但也胆战心惊,人人自危。

一天傍晚时分,“批”派一个“便衣女战士”从我家后门直冲我内室,从鞋底里抠出一张纸条,是该派浦司令的手令,让我火速赶去大本营“救人”。当然是“天命”了(一则天命不可违抗,二则救人不得迟疑,再则保己也无二选),立马出家,可我家是“扫”派阵地,敌对双方,哪能包容此举,(就是正式战场上,还容“红十字”救人。)所以我的这一出诊,也是一次冒险。好在一出门,就有“便衣”一队护卫,以防堵截,火速抵达目的地。

一位中学生红卫兵战士受伤,子弹穿右胸伤肺致血气胸,诊断需X线检查,循着自己一派的后方送,专车直去泾县晏工煤矿医院,就地给予胸腔闭式引流,我,全程主治和护理,总算救回一命。

又一次是在我们院的扫派伤员,右股动脉子弹伤,患肢全无血供,苍白、灰冷,要是在6小时内手术修补,完全可以保肢,为争取这一时限,我奔走呼号,找派头头和院领导,终因种种原因而误时,高位截肢致残,可惜可悲。

还有一次是批派后方一家属难产,无处就医,乡里乡亲的,一个县城几十年相处,大都是熟人甚至过从,找了我,没办法,从院里悄悄地取出消毒包和器械,就在患家堂前大桌上作了剖腹产,救了母子。

武斗激烈时,医生和病人都不敢在病房里(人人总有敌对一派),自然散伙停诊,遇上急腹症,我只得携着病人,到处找地方开刀。一例阑尾炎带到弋江手术的,一例疝气跑到何湾开的刀。寻找一切可能的条件,为病人治病手术了。

何湾区委书记唐文秀,与我可谓至交,胃溃疡出血,无法输血,药品极为短缺,治疗条件极为简陋和不足,我给作了胃切除,术后6天,他就吵着要出院,并善意邀我一道到他乡下的家避一避,躲避风险。因为他是正中的当权派,在造反派眼中他当然是揪斗对象,他,闯过疾病关,只怕躲不过政治关,朝夕自危。重现当年地下游击战争年代“风范”。终于刀口没拆线就溜号了。若干年后,我们笑谈这一幕,不胜感慨。

此间,为武斗中伤员作过肺修补、肝修补、肠切除、骨、血管等手术。基本无死亡,拯救了不少生命。这不,特定的环境下,出给外科医生的课题,是十分严峻而苛刻的,40年前,就这样,逼出来我们这批“全科医生”,造就出这些“全能医生”,一切求教于书本,现贩现卖,时势造“英雄”!

《老爸-我的外科生涯》

《立委推荐:老爸-我的外科生涯》 (10846 bytes)

Posted by: 立委

Date: May 30, 2007 03:01AM



晋升主任医师述职报告:我的外科生涯


作者:立委父


1955年底毕业于安徽省芜湖医校后,一直从事外科临床工作,凡40年。作为首批国家统分到县医院工作的医务人员,由于缺乏上级医师指导,从60年代起,独立思考、独领风险和自我锤炼。长期以来,本人处于本学科前沿和学科领头人,68年起一直任大外科负责人。其间,65年和66年,我创办了南陵县的弋江和何湾两所县医院分院,随后又任过巡回医疗队及抗震(唐山大地震伤员救治)医疗队队长工作等等。

在准毕生外科生涯中,处理过大量各类外科病例,在众多课题鞭策下,通过自学、进修、请教及学术交流等途径,知识、技能和经验的积累和更新,亦步亦趋,紧随我国外科事业的进展同步前进。

1982年晋主治医师,85年由南陵县医院调来芜湖长航医院,88年晋外科副主任医师,兼大外科主任,为全院唯一重点科室学科带头人。现为芜湖市外科学会委员,交通部卫生系列高(中、初)级职称评委等职。

79年文革后恢复专业期刊和学术活动以来,本人陆续在《皖南医学》、《蚌医学报》、《省医讲座》、《国内医学外科分册》及《交通医学》等杂志上公开发表论文数十篇,79年和80年分别参与安徽省骨科学会和外科学会的筹建和恢复工作,并出席该二学会的历次年会(1─6届),均提交论文交流。多次参加全国及交通部的外科学术活动。

1994年参予策划和组织一次“长江流域骨科研讨会”,并在中华骨科杂志编委许竟斌教授指导下编篡《骨科临床》专刊(《皖南医学院学报》,13卷增刊,1994),刊出论文100多篇,与会者及稿源来自全国。

1995年9月全国外科急重症学术会议上(桂林)发表两篇论文,其中“肝外伤救治中有关问题”(0190)获优秀论文证书。还在“中华自然疗法首届国际学术大会“(中国成都1991)和台湾出版的《自然疗法》上发表论文等等。

1 专业历程和副主任医师业绩(兼述外科几个理论问题的演革)

1.1 60年代早期大量急性肠扭转、蛔虫肠梗阻及胆石症患者,除为此开展了大量有关手术,练就了外科基本功外,对其晚期病例中毒性休克的处理,历经了缩血管升压到扩容、改善微循环的曲折道路,从理论到临床都是一个划时代变革和进步。

1.2 皖南地区的早年大批晚期血吸虫病和晚近肝炎肝硬化患者的门脉高压症、脾亢、上消化道出血,也历经了分流、断流的反复认识和争论过程,就此,早在1975年,本人就作过巨脾切除、脾肾静脉吻合等各式分流术,由于其术后栓塞率高,降低了肝的血供及易诱发肝性脑病等弊端,尔后改行各式门奇断流术,从这一难题的处理中获得不少教益和提高。

1.3 胆系结石症,至今仍困扰着外科界。随着肝胆外科的进展,监测手段的臻善,对肝内结石这一难题,外科术式也在不断更新和完善,80年前本人就为此作过肝左外叶规则性切除(早期5例的论文发表于80年省外科年会和《皖南医学》(80,13;51),同时相继开展了各式胆肠内引流术(Finster、Longmire、Roux-en-Y……)。1992年及1995年作过3例肝内胆管切开取石、成形、“盆式”胆肠内引流术(首例报导于《交通医学》93,7;91),使手术引向肝内病灶的处理,提高了临床疗效。

1.4 近年来,急性胰腺炎发病有增高趋势,我科收治的重症胰腺炎,均经病灶清除、胰床引流、腹腔灌洗,5-Fu、生长抑素等抑制外分泌、抗休克及抗感染等措施而治愈,其中近年一例虽术后并发应激性溃疡出血,亦抢救脱险。

1.5 在甲状腺各类疾病治疗和手术基础上,80年后作过甲亢手术,94年作两例甲癌根治术(仿颈清术),其中一例为外院术后3年后复发再手术,随访无复发。

1.6 此外,还有颈动脉瘤切除吻合手术及胸腺咽管囊肿、甲状舌管囊肿、囊状水瘤切除等手术。

1.7 30余年来所经治的逾千例乳癌、胃癌、结肠癌、直肠癌等病例中不乏根治后长期存活的病例。

1.8 大量小肠切除后短肠综合征的防治,作其远端逆蠕动肠袢间置的手术方法,观察21年无腹泻及营养不良。此有关论文发表在《蚌埠医学院学报》(82;7:214)及《交通医学》(91;1:41)

1.9 十二指肠损伤的处理有其特殊性及复杂性,而其腹膜后损伤尤易漏诊、误诊,伤后24小时以上手术者,预后堪忧。94年1例,按十二指肠“憩息化”原则,于伤后28小时作了仿Berne术式,恢复顺利。其论文发表于〈交通医学〉。

1.10 膈下全胃切除、空肠代胃术,膈上食道切除、胸顶食管胃吻合,肺叶切除,纵膈胸腺瘤摘除,横膈疝修补等手术开展,始于20年前。

2 相关诸科工作

我任职的前后两院均系基层医院,“大外科”包揽普外、骨科、泌尿、胸外、妇产、五官以及麻醉、放射、化验等相关各科工作,本人长期作为学科带头人,上述诸科均有涉猎,略述于后。

2.1 骨科,是本人除普外以外的重点学科之一,基本上开展了该科各类手术,参加各级学术活动,并有骨科方面多篇论文发表、交流及专刊。骨伤、骨病的代表手术有:股骨颈闭合穿钉(论文见《骨科临床》1994;13:37),外科截瘫14例(论文见《安徽省医学讲座》1982;4:21), 脊柱结核手术(论文 见省首届骨科年会汇编,1979),腰椎间盘手术,脊髓肿瘤摘除术,骨肿瘤摘除以及矫形手术等。

2.2 泌尿外科:肾切除、肾蒂淋巴结剥脱术,各段输尿管结石取出及尿道外伤会师修补,输尿管移植术,输精管吻合术,精索静脉─腹壁下静脉吻合术,尿道下裂修补,膀胱癌、阴茎癌根治术等。

2.3 妇产科:开创本院妇产科,作过剖宫产(下段、腹膜外术式),子宫切除(腹式、阴式),卵巢肿瘤切除,膀胱阴道瘘修补及宫颈癌清扫术等。

2.4 五官科:腮腺、扁桃体、上颌窦、乳突、白内障、人造瞳、眼球摘除、鼻泪管吻合、斜视矫正等手术。

2.5 麻醉科:各段硬膜外阻滞,颈丛、臂丛阻滞,插管全麻及静脉复合麻醉等。

2.6 放射科:60─62年创建科室兼任该科负责人2年。熟悉其常规工作和有关造影。

环境育人,长期基层医院工作所遇的广泛课题,迫使我涉足多科,也因此,相关各科的知识和技能,相得益彰,助长和深化了外科水平的提高。一直开展三、四类手术,使自己始终处于时代外科的前沿。

3 不断创新和几点体会

这40年来,科技高度发展,诊断和监测手段不断更新。随着社会生活的变化,病种也在改变。社会老龄化,老年医学,地位突出。诸多因素令临床工作也随着变革,这就要求医师不断猎取科技信息,借鉴他人经验,勤于学习,勇于创新,完善工作,提高服务质量。

3.1 改进创新

3.1.1 控制外伤感染,关键是首诊的彻底清创,而不是依赖引流和抗生素。大量清水冲洗,消除异物及失活组织,认真消毒,无张缝合,若术后炎症反应,局部辅以酒精湿敷,用或不用抗生素,按此,6小时内的外伤,几可消除感染。

3.1.2 三十余年来,根据千例以上胃切除经验,除特殊需要外,基本废除预置胃管,无失败病例。这就要求精良吻合,完善止血,术中排空残胃以及术后严密观察。

3.1.3 泛发性腹膜炎,在除去病灶及感染物之后,废弃腹腔引流,减少术后粘连。关键是术中彻底冲洗拭净。因引流物在腹腔内很快被纤维蛋白粘堵失效,徒增病人痛苦。诚然如胰腺炎、腹腔脓肿等,预计有持续溢漏者,则需双套管负压引流。

3.1.4 手术无论大小,其成绩优劣,都攸关病人健康、安全,本人重视每例“小”手术的技术改进,略列于下:

· 腹股沟疝修补,重点在腹横筋膜,以改良的Madden术式代替传统的Bassini法,大大减轻病人术后张力缝合的痛苦,也有利于愈合,且复发率大降。
· 包皮环切术,常规术式,内外板对合不良,血肿、水肿和拆线困难等,都困扰医患双方。本人予以改良,局部静脉麻醉,止血带下整齐切割,完善止血,人发或可吸收缝线缜密缝合,可获术中无痛、对合良好、愈合快、免除拆线等优点。(论文刊于《交通医学》90;4(3):66)
· 肛瘘挂线疗法或切除敞开,均令病人蒙受术后痛苦,且恢复期长。本人用长效麻醉(局部注入稀释的亚甲蓝),一期切除缝合,大都一期愈合,缩短疗程。

3.2 几点体会

综合本人40年外科生涯,深感要做好一个合格的外科医师,除有坚实的基础知识并不断更新外,还要有缜密的工作方法,逻辑的思维方式,高度责感和循序踏实的工作作风。病情千变万化,体质的差异,药物的正负面作用,术式的利弊,机体器官的储备功能,病程的长短,乃至自然环境、精神和物质条件等等,如此众多因素,都使你难循统一规范,而必须具备应变能力,应变能力的大小,决定你诊治水平和临床效果。

3.2.1 手术台上全过程充斥着个人名利益和病人利益的较量。所谓“适可而止,安全第一“不啻是自嘲。一个称职的医师,必须具备为病人而承担风险的胆略,往往是这样,我们付出了艰辛的劳动和高度责任感能为病人争得可受一念之差而丢失的挽救良机,为病人抑或是为自已,这确是衡量其素质天平。至此,勾起我无数往事的记忆:一个胆道第5次手术,肝门区遍布胆汁性肝硬化门脉高压所致的海绵状的血管区,加之炎症增厚,奋力手术8小时,方打开胆管,挽救病人于濒危,这是一场毅力的胜利。

3.2.2 因时因地制宜,敢破常规救病人。出诊乡下的肝脾外伤及宫外孕大出血病例,待血源只是等待死亡,大胆而严谨地回输腹血而争得手术止血,是救命的关键。记得一例肝外伤,就地回输肝血1700ml,使手术成功。(肝外伤救治中有关问题(综述)─全国急重外科学术会议资料,95;190)。

3.2.3 高难度手术和新手术,必须蓄积有关知识和操作技能,通过翻阅资料、请教和参观手术或专家指导,方可进行,以防不测和疏漏。我科首例肝胆管盆式内引流术,曾请外科教授指导,随后的两例顺利完成。

回顾本人外科生涯40年,深切感到外科临床是一科学、毅力、决心和责感的综合体,又是起伏于风头浪尖上的一叶小舟,可随时履薄冰、触暗礁,其职业之艰辛和风险是众行业之冠,所幸尚未愧对社会,这其中,有无数手术成功之欢悦,也有过多少不眠之夜和恐惶不安之时,过来人,无不深为叹服。我决意在后来的剩余的岁月里,在“救死扶伤“的事业中,争取有个完满的句号。

附件1,发表及交流论文
附件2,有关材料证明及三、四类手术记录


本文原为申报外科主任医师述职报告。1995年10月10日
主任医师批准时间:1995年12月19日 证书号:127543

[附件1] 发表论文

1 肝外伤救治中有关问题(综述)全国外科急重症学术会议优秀论文 (190)1995(桂林)
2 胃十二指肠急性穿孔的手术治疗 全国外科急重症学术会议 (436)1995
3 闭合性腹膜后十二指肠损伤诊治体会 《交通医学》1995;9(3):43
4 闭合穿钉治疗股骨颈骨折45例 《骨科临床》1994;13:37
5 足内翻扭伤第5跖骨基底部骨折30例《皖医学报》1994;13:30
6 点灸治疗急性软组织损伤187例临床观察 《骨科临床》1994;13:159
7 肝胆管盆式胆肠内引流1例 《交通医学》1993;7(4):91
8 成人腹膜后畸胎瘤感染并发慢性脓瘘1例 《交通医学》1993;7(4):368
9 针剌肩隅透极泉配合温灸治疗肩周炎分析《中医保健与临床》1990;2(3):13
10 针剌肩隅透极泉配合温灸治疗肩周炎体会 《自然疗法》台湾 1992;15(3):26
11 短肠综合征的外科治疗 《交通医学》1991;5(1):41
12 老年胆石症中西医结合非手术治疗 中华自然疗法首届国际学术大会 1991;中国成都
13 包皮环切术的几点改进 《交通医学》1990;4(7):66
14 胆肠内引流 安徽省三届二次外科年会论文汇编 1988;87
15 胆总管缝线结石6例报告 安徽省三届二次外科年会论文汇编 1988:87
16 Peutz-Jeghers皮.杰氏综合征 蚌埠医学院学报 1982;7(3):214
17 外科截瘫14例分析 安徽省医药卫生学术讲座资料 1982;4(22)21
18 肝左外叶切除治疗肝内结石 《皖南医学》1980;13:51 〈国内医学文摘外科分册〉(上)1981;39
19 椎弓结核并发截瘫 《芜湖医药》1980;7:47
20 脊椎结核一次手术疗法 安徽省首届骨科年会 1979
21 个案报告 (省三届二次外科年会)
· 软脊膜下脂肪瘤并高位截瘫
· 先天性脐膨出一期修补成功
· 胃恶性淋巴瘤亚急性穿孔
· 腹壁皮下异位胰腺
22 译文(全国译文竞赛获奖 英译汉)
· 新生儿阑炎:早期诊断线索
· 单纯手外伤,需要预防使用抗生素吗?
· 全胰切除的临床经验

[附件2] 有关材料及手术记录

1 任职证明
2 《骨科临床》专刊编委
3 三、四类手术记录
· 全胃切除空肠代胃术 95.04.21
· 甲状腺癌根治术 94.08.30
· 闭合性十二指肠腹膜后损伤Berne手术 93.10.7
· 重症胰腺炎病灶清除+胰床引流 89.11.20
· 肝内外胆管切开取石、病灶肝切除+“盆式”胆肠内引流 91.04.18
· 直肠癌Dixon手术 87.04.02
4 近5年我科三、四类手术病案199例。

《老爸 - 人生记忆:风雨几春秋》

人生记忆:风雨几春秋  


作者:立委父
 


我的经历,“荒诞”传奇,今人看来,如天方夜谭。如烟往事,如水流年,斗转星移,恍如隔世,追忆沧桑,感慨万千。苦难童年,早年“成名”(64年28岁,就是显赫一方的“一把刀”),中年挣扎在“人斗”的硝烟中。摸爬滚打,50年外科生涯,拯救病人,数以万千。95年获国家“外科主任医师”职称。晚年尽享家庭和社会双重福祉,退休后又为社会超期服务十年。迄今,退而未休,青春不减,宝刀不老,手术、开车、上网、写回忆,还有下棋对弈,乐此不疲。此间,恰逢盛世,中国从战乱频仍、民不聊生的半封建半殖民地,历经天灾人祸,如今迎来“国恩家庆,人寿年丰”。人类科技和文明,亦空前“腾飞”:地球之“村”,天涯比邻,上九天揽月,日行八万里,一代人时光,越过以往千年、万年!

______________________________________________________________


一、书香门第

我1936年出生于长江之滨山青水秀的皖南山村:芜湖市繁昌县磕山冲操家村李家大院。这虽是穷乡僻壤,而我们家却是书香门第、教育世家。自曾祖父李香斋(岁贡生)起,世代办学。家办私塾,名曰“崇实学校”,名噪一时,众多学子,趋之若鹜。办学以孔孟儒家学说为主旨:“己所不欲,勿施于人”,“老吾老以及人之老,幼吾幼以及人之幼”......塑就儒家道德理念。国文课从三字经、百家姓到大学、中庸、论语、古文观止等,同时开有数、理、化、史、地、英(日)语及音、体、美课程。男女兼收,也总有几个“千金小姐”在读(这在当时是新潮流)。家有书房、风琴、钢琴、洋鼓、洋号......琅琅读书声、欢乐鼓乐声,洋溢于院内宅外。分班(甲、乙、丙)教学,两代人同时授课。老师及其弟子们著有《李老夫子遗墨》,于20世纪30年代出版,昭示后人。出此人才,乃社会栋梁。学校和家庭靠“束修”维持,尚殷实,鼎盛时期, 也曾有几百亩田产。上个世纪初,这个学校兼家,在曾祖父手中建成。


故居回眸 :

深宅大院,古色古香,依山面溪,坐东朝西。大门上“国恩家庆,人寿年丰”对联经年常在。正房是前后各五大间,中间一排由三个天井和两边二个厢房组成。这样前后三排,上下两层,构成一体。楼上形成环状贯通的走马楼,左边有两间“新屋”,右边及后面是一排裙屋。前面院子,有大小院门,院内七个花台,松柏相衬,花簇绵秀,果实飘香。花有梅、菊、桂、及玫瑰、蔷薇、天竹;果有柿、桃、杏、李、枣等。所有大门均有石鼓、石狮,天井是大理石铺成。建房的砖瓦是自家建窑特制,质量堪称上乘;木材取自江西,放排顺江而下,更是一流,足见主事者之匠心。正屋楼上是教学场所和学生宿舍,楼下和“新屋”是家人生活区,脚屋是酿酒作坊和厨房、柴库。

时空转到1973年,这个“大家”除了大伯家二姐一家留守外,实、勤、毅、杰四兄弟已“四海”为家,分别在合肥、芜湖、繁城。其时文革遗毒,法制淡化,私房产权受刁民挑战。经常是人家使用,我们修缮;一合计,消除它。于是由我来办。凭借同学当政的权和法,“贱卖”之,建材移去扩建镇中学,也算既为产权正名,又做了一件公益事业,聊以慰祖。我家得款900元,给哥500,我留400,这是我们惟一的财产继承。就此,四代人的故居,完成使命而退出家史舞台。时代铸就我背负“败家子”名,是一个“大家”的终结。


百年家史 :

曾祖父李香斋以上是赤贫农民,住在旧县镇下江高安圩乡,连年水灾,是中国极苦阶层,衣食住均无着。据传,曾祖父聪慧过人,他的故事传奇:少年时在野外拾粪时,偶尔靠在私塾学堂窗外听老师授课,他竟然比堂内学生背书还熟、还快,得老师赏识,免费入学。就此,改变了我家历史,成了儒家门徒,学成后职业教书、办私塾学堂。至祖父李咸升(世秀、学香,恩贡生)继承父业,执教于自家学堂,俩代单传。父辈兄弟三人,伯父李应文、叔父李应会,日本明治大学毕业;父亲李应期,经理家务,只读了高小。但他们三人也都继承祖业,通力合办“崇实学校”,成为全县乃至全省著名学堂,桃李满天下,多成社稷栋粱。


实勤毅杰四兄弟相扶相持一生

我们这一代辈“名”,祖父赐名:朴、实、勤、毅、俊、杰、(英、豪),兄长们依次递幼一岁,而我是小不点,和兄长们差10岁左右。三叔家大哥54年为国殉难(时年29岁,作为革命烈士长眠于南京雨花台)。五哥16岁时死于骨髓炎(无治疗条件)。其余弟兄相扶相持一生。这是一个大家,直到祖父仙逝(时值我出生年)后才分成三家,但都仍住在一个院宅、大门之内。这一豪门衰落于父辈中有两人自费留日,加上后来的战乱,生活逐渐陷入极度贫困。分家后,我家唯一财产是四亩田和一小片柴山(这令我家甩掉地主帽子,解放后划为“小土地出租”家庭成分),或出租或自耕(妈妈主持,雇半个工帮忙),所收难以糊口,只是祖上遗下的“家”强过左邻右舍,但同样赤贫,衣食不保。


二、苦难童年

我的童年历经战乱、饥荒,国军、日军和新四军交叉混战,加上连年水旱灾害,人们挣扎在水火和恐怖之中,餐餐为饱腹而愁。恩母常为借一顿粮而进左邻出右舍,也常挑一点野菜充饥。隔三差五“跑反”,躲避乱军土匪,诚惶诚恐。抗日战乱时期,全家随父执教私塾,客居各地,聊保温饱。间遇“失业”,就生活无着,颠沛流离。加之父亲是“现代超前消费”的先版,借贷和负债则成为我家生活主体。父亲虽只读了高小,但他教小学,游刃有余,而且,书法公正,笛、箫、琴和歌咏均上挡次。我儿时在夏夜乘凉时,常听他吹箫和唱“苏武牧羊”,幽静而富情趣。他为人是绝对的好人,人们雅称他为“好好先生”。他执教一生,做过完小教导主任,历授国文、算术、历史、地理、自然、音、体、美诸科,是一个全能的称职的教师。他亦是我小学阶段的唯一启蒙老师。

我没有正式上过一天学,而是“半工半读”算完成小学阶段。1949年4月20日上午,家乡“解放”了。社会变故,家里私塾不办,父兄都去公办小学任教。我辍学在家,跟妈妈上田下地种菜园,练就一手好农活,栽秧、割稻、锄地、砍柴等样样通行,光脚走山路,不怕竹剌和石子,脚底赛过鞋底.....一妇一幼,相依为命。为挑抬重活,就雇了"半个"工,大部分轻活就我们母子俩完成。妈妈过世后,我一人在家劳动,一次我独自从大磕山砍柴68斤,赤脚挑三、四里路回家,大嫂惊异赞赏,确也不易!也曾将一桶烧熟的山芋挑到横山街叫卖,赚回几个小钱。

母亲骆一秀(1902-1950),是远近闻名的“贤妻良母”。出身于绅士之家,中沟乡后骆村,18岁嫁来李家,门当户对。由于传统因素致其小脚、文盲。她贤淑、聪慧、勤劳、手巧,誉满娘婆两家。除缝补烧洗家务外,还独自种地、下田、兴菜园,也会纺纱织布、舂米砻稻 .....使家庭洁净温馨。为了生计,也跑过“单邦”:从芜湖批发一包棉纱,绑在身上,坐小轮回旧县街卖。一个小脚女人单身跑这小本生意,还要闯过日伪哨卡,委实不易。这种闯荡江湖的果敢和胆识,令众男人叹服。帮工在大伯家为学生烧饭,还挤空带当时七岁的我,下麦收后旷地拾残麦穗,以增收几斤小麦。她对家任劳任怨,忍辱负重,万难不辞,鞠躬尽瘁。我对恩妈的情感是绝世无双,我竟然吮奶到七岁,可创“吉尼斯”记录。加上我从未离家上过小学,日夜跟随她,足见我对恩妈的依恋之情!可她却在我14岁时就离我而去,是我首次饱受天崩地塌、锥心刻骨的感伤。(1950年4月24死于大咯血,可能是肺脓疡或肺癌,当时的医疗条件和家庭经济状况,回天无术。)

我象无舵孤舟,漂向何处?家里没人领我种田,我迷茫彷徨,无人点拨。也曾见过一亲戚早我一年上中学过我家门前,因是同龄人,倒有所触动,但以为与我无缘。后来还是三妈指点迷津,故事是这样的:当时军人堂兄从南京捎信回来,让他妹妹报考繁昌中学。她除了家境比我更困难外,也因为是女的,在家受教育远比我少,所以在她决定报考时,三妈对我发话:“你也去报名考学去,你比她总更有希望些......”。就这样我与姐一道带上干粮,步行30里,到县城中学报名。然而,考学啥样、咋考我根本无知。正赶上哥哥暑期小教集训在县城,见我前来考学,他意外而惊喜,遂利用考前几个傍晚,与我一道在城外田埂上散步,为我备考,教我自然、史地、政治、语文等,果然出了成果。比如,自然题:“火的燃烧需哪三个条件?-燃料、火种、氧”;政治题:“中国人民伟大领袖?解放军总司令?-毛泽东、朱德。我国尚待解放两地?- 西藏、台湾。”(我能考过,亦得益于家庭熏陶,我们家订有《大公报》,也常听自家几个“老师”高谈阔论时事)。三天考下来,第二天就张榜公布,全县98人考,录取50,外加备取5人,共取55人。已经辍学一年多的我,被取在28名位上(当时全县这个唯一中学是:三年级14人,二年级43人,我这一年级55人)。


三、早年轶事

卖柴买米奉养病母 :

  50年春荒(我们家乡几乎年年如此,叫“青黄不接”),全家大麦糊度命,面临断炊绝粮,而恩妈病入膏肓,却无粒米下肚。14岁的我,1米3、4的个子,从家里挑55斤柴,到附近的镇子泥埠桥去卖。在半途草山头徐家湾时就挑不动了,于是贱卖换来一斤四两大米,回家磨成米粉,打糊给妈吃,在当时是极大的抚慰。


为妈请医 :

  50年4月,恩妈肺病后期,发热咯血,我去10里外的旧县镇请一个姓杜的诊所医生(国民党退役军医)来家出诊,他给静脉打了一针葡萄糖和肌注一针青霉素,再由我挑了40斤大麦作为医药及出诊费,并护送杜回程。返回时已经天黑下来了,弱小身躯,孤行夜路,心急母病,忐忑无耐,天地无助,身心交瘁。这次请医,对病情是杯水车薪,但却是我们家的“奢侈”之举。这之前,祖祖辈辈,生老病亡,概无从医从药先例(当然也可能有中医草药问津),一切任其自然法则,听凭上苍和命运。所以弟兄姐妹们夭折过半。我们家也是肺结
核、高血压“世家”,叔应会30英年病故于“肺病”,大伯、父、哥、三哥、姐等也“承袭”下来而罹此病,名实哥为此于70年代初在沪做过切肺手术,并大伯、父亲也都因“中风”而病故于家中。


迄求棺木 :

  恩妈病逝后,一家深陷无奈,只得“为五斗米而折腰”,我与哥哥去向在洲上教书的大伯迄求棺木,双双下跪,好在这次大伯慷慨解囊,这才完成安葬大事。


幼年三病 :

  从小就常闹头痛、肚子痛、生疮,每夏秋蚊子风行时,“摆子”就来了,冷热颤抖伴剧烈头痛,一闹就是10天半月,除了一些土法治疗如锅灰涂肚眼、黎明前跑野外躲邪外,也知道买“唐拾义”药丸内服,一服就好,这是金鸡纳霜(奎宁)。病从口入,饮食不卫生,肠道寄生虫尤其是蛔虫,常成捆屙出,所以肚子痛是常来的困扰。除了喝楝树根水之外,也会买宝塔糖吃,它里面是“山道年”药,打虫很有效。再就是冬天生疮夏天生疖,全身都有,化脓流水,内衣粘上,脱衣好像揭锅粑,这都是不卫生造成的。没有洗澡条件,一周难得进一次澡堂,那澡堂也是染病源头。这三病就是疟疾、蛔虫病、和脓疱疮,如今几乎与小孩无缘。另一次是10岁时,我得了麻疹,高热声嘶,一周多饮食不进,压根就没有就医的概念,恩妈给菩萨许愿,求其保佑,听天由命,终于死里逃生。


“鸡毛信”:

  这是1946年夏我们家的一个“革命”故事。45年抗日战争胜利后,国民党鼎盛时期,我的四个长兄在抗日期间,或直接或间接都已参加了共产党在皖南的新四军。除三哥已随大军北上,二哥、四哥因为是在红区教书,未能走成,赋闲在家。而大哥在大军北撤时,他的脚底被剌伤化脓,不得已滞留在家(国统区)。时至翌年夏,他决意追赶部队。 一个晚上,几个在家的哥哥,聚在门前长坝桥头,共商出走事宜。我虽比他们年幼10岁,他们的这种政治机密并不瞒我,并决定第二天让我来送“鸡毛信”,当时我10岁,不惹人注意。我将他们给我的“信”藏在鞋袜缝里,午后出发,先走15里地,在横山桥西郊父亲的学校,等待黄昏(父也不知内情,除了“保密”外,也怕他阻止子侄们的这一“冒险”),再前进15里去三山的一个乡公所。 只身行进,天黑下来了,莫名的害怕,全身冷汗......当到三山街头之前,路在两山夹缝中走,昏沉沉,空荡荡,四周空无一人。壮着胆子往前赶,追上一个扛布的中年男子,默默地紧跟他壮胆。但在就要进街之前,他突然岔向北边山头去......我顿感紧张,怕是“拐子”(人贩),于是,我蹬下躲起来,等他走远了,我再孤身前进。终于上街了,找到在此打工的哥哥,此时是晚饭后了。他给我用猪油、酱油泡锅巴,外加一个咸鸭蛋,吃饱了。他陪我向街东郊去“散步”,我把“信”掏出,然后找了一个远房表亲,在三山乡公所私下盖到公章,取到“通行证”。这份“密件”,我第二天回家交给大哥,这才完成了他北上归队夙愿,开始了他的革命征程。行前他为了筹措盘缠,卖了“青棵田”,扮成大后方凯旋归来“接收大员”,富贵高雅(这之前他特地在旧县街学了三个月英语,可以对话),好蒙混“关卡”......一直到解放后重逢时,他告诉我们:当年的这一天衣无缝的设计,虽然途中也被关审几天,但终因“无缝”而如愿。我当年的“鸡毛信”,功不可殁。


四、求学生活

那是建国初期,人们普遍贫困,然我是贫中之最。父失业在家,哥小教收入微薄,难支他那三口小家。母已病逝,小妹才五岁,生活无着,被迫去当“童养媳”,全家衣食难保。我在校拿乙等助学金(至少不是孤儿),每月五元。当时生活费是六元,我每月得交一元伙食费,就这,也成了大难题。衣、被也是不济,一床薄被五斤,没有被面,又垫又盖,冬天通宵不暖(那年月也特冷!)。三年中没有袜子,也未有雨鞋,空荡荡的一件旧棉袄过冬。衣服补补纳纳又一年。一年一双布鞋是月娥嫂给手缝的,管了春秋冬夏、教室、操场,理发去天主堂请神父义务行善可省得八分钱。在学校吃的倒比家里好,精神上更是富有和充实,感到青春向上,前途有望。到了三年级,军人大哥从姐处得知我的窘境,从南京邮寄一套棉衣料来,再由姐为我操办做成外袄,还把衣里子腾下来加做外套,这才有了一个学生样,享受了基本温饱。最后一个学期,我那一元伙食费无着,还好,又一“老革命”三哥伸出援手,每月让在县委组织部当干事的三嫂送来二元。这不,还有一元理发、洗澡、笔墨等零花钱哩!就
这样,完成了初中学业,哥嫂恩重泰山!上一年级时,有一个插曲:50年,抗美援朝兴起,国家号召学生参干参军,同村同学操世卓等五位选中上南京军校,令众人羡慕。我的家境自然使我更加向往,一体检:1米41的个子,40多公斤体重,远不合格,望洋兴叹。

53年夏我终于以全班第四名成绩初中毕业,接下来如何抉择?虽然这时就可工作去,但求知欲令我欲罢不能。尽管养家已是燃眉之急,然父兄却支持升学。本想争得大伯的支援,我与哥哥去洲上“请教”大伯,也许出于“自我”考虑,被拒,空手而归。拆卖家里那“新屋”(分家后我家的厨房和堂屋),给我置了一床新被,又买了一只箱子,开始了升学之路。报考医校,无需学费,还给伙食吃。哥哥和一个旁叔说:医生好,任何年月任何时局都派上用场。这一真知灼见锁定了我一生职业,直至今日我无怨无悔,虽然“医生”的辛苦和风险是众行业之首。于是报卫校(林校、银行学校摆在二、三志愿),一考就中,卫校医土专业,二年半制。

来芜考学也很传奇、浪漫,我是一个人从家步行来的(70里),这也是首次来芜湖。中间站在三山小洲四嫂娘家宿夜。亲娘老人家厚待了我,翌晨给我蛋炒饭。再走,到了中沟,还有40里,实在走不动了。江边一个船夫吆喝:二角钱到芜湖,我毅然上了小木船(当时从旧县乘小轮来就是五角钱,硬是不舍得),一船头十号人,漂漂荡荡到芜湖河南江岸下船。哎呀!芜湖真大!这“河南”(如今的马塘)比繁昌县城是大多了。走啊,走啊,爬上一个高坡,来到了中山桥,见到那硕大的中山路,嗬!天外有天,车水马龙,灯红酒绿,霓红灯闪烁......真是刘姥姥进大观园,外面的世界真奇妙!我一个初中毕业生,没有坐过汽车,没有见过电灯(三年初中晚自习是靠汽油灯,宿舍用马灯),考试中出现什么“停车惯性”、电灯泡上W、V等考题,我无此经历和感悟,硬是想不出来而丢分!井底之蛙,孤陋寡闻。下了中山桥,径直去位于桥头下二街的省银行学校,找上一届同乡同学胡清纯,一切听他的。我拿从家带来的席被,晚上从江边工校被蛟子赶到金马门商校顶楼。漂啊荡啊,根本没有面临升学大考感觉,胡里胡涂,好象没有想及可否录取?也许缘自我的原本成绩,无忧无戒。我的考场在市五中,就是鸡毛山一初中,考八门:语、政、英、数、理、化、史、地,历时三天。全省统考统取,按分按志愿。考后无人操心,也无从过问,那时社会风气基本没有后来盛行的“人为”因素掺和,大家心态怡然地静等命运的驶向。

回程是大队人马,全班男女同学一道,仍然步行,沿着公路嘻戏前进。70华里走了10多个小时,各自回家待“命”。全县就我们一个毕业班42人(就是当时一年一度全县人才苗子),除五人落榜外,都升学了。我顺利地进入“芜湖卫校医士班”,中专不交学费还包吃,也发点零用钱,加上带了新被子,日子好过多了。所以大都假期也不回家,学习是认真的,无忧无虑。学期中间哥偶然也给我寄点钱,一次由平信里夹寄五角钱,不知是否“非法”,竟丢了。他来芜看我,二毛五一客冰琪淋,五毛钱一碗蟹面,一顶护耳帽,尽显手足情。三哥探亲过芜也看我,在他住的新芜路一家旅社里,用八毛钱一斤饼干招待我,“奢侈”享受,还首次偕他头生女合影。

54年暑,芜湖百年不遇大水,从北门到江边一片汪洋,宛如一口大池塘。我们留校防汛,全校师生总出动,坐船到小官山“挖山不止”(真的挖了半边山),装袋送江边堵水。杯水车薪也救急,闹了整个暑期,手上尽是血泡,也晒脱一层皮。但食堂全天有稀饭,中午一角钱面饼,倒也乐在其中,总为社会做了一件公益事,乐得其所。


五、艰难创业

55年下半年马钢医院实习,我终于成为我们家族中第一个“医生”。一纸中专毕业证书,我成了我们家、我们这一代中最高学历拥有者(战乱、贫穷使弟兄们都无缘升学)。56年3月11日加入北京医疗队赴宁国县宁墩血防组,开展全国性血防运动。工作伊始,活力澎勃。血吸虫病人的治疗是医学上一个“大”课题,好在有队长许永昶(北京积水潭医院内科大夫,南京医学院上届毕业生)在上,三位医生(另一是我的同学章寄生)、四个护士、一位化验员组成八人医疗队,在农舍独开病房,三个月治疗上百病人。三价锑剂(3日、20日疗程),对全身、对局部都是剧毒,在任何大医院,也需要审慎、严谨;我初出茅庐,胆战心惊。静脉注射技术是大家第一个公共课,漏一点就会坏死,病人又都是地铺,打针者也得俯趴下操作,难度更加一层。一二周下来,我居然鹤立鸡群,小孩和妇女的静脉注射大都由我来进行,出道初捷。

接着,还是在毛主席的“送瘟神”号召下,我们被统分到南陵县一行九人全去血防站。由于灾后断了公路,遂绕道宣城、泾县,我领队。累了,又没有蚊帐,一觉醒来,蚊子咬遍全身,密集红疹像“麻疹”一样,可怕!几天后我一人被分去这个县最偏远的何湾血防组,要走70里山路,是一个古老祠堂,七、八个人,也是锑剂治疗。这样的工作条件,对于“初生牛犊”也是太刻薄了。

头半年月薪29元,要分出一半供养父妹,不作任何个人添置,本来也居无定所,维持学生式温饱就行。第七个月起就改为42元,一下去就是17年不动。男子汉要顶户养家呀,62年后就是六口之家了,63年才升至46元(加耀桂43元是89元),就这样直至支撑两个儿子读完大学,持续人生中“上养老下养小”全程,清贫一生。

流动全县或乡野查螺、粪检,或借农舍作病房收治病人,搞血防三年。第一年下来,我得了全县唯一的“一等先进工作者”,表彰我独立治疗100个病人无事故,这在当时的确也不易。那期间,工作单调,又在乡间,我把所有的业余时间毫不浪费地用在自学数、理、化上(原本我对此有兴趣,也盲目地为可能的未来升造做准备),每每过午夜。灯油,我毫不吝啬,是每月除伙食费之外主要开支。夏天防蚊,我穿长褂裤把全身封闭起来,或将两腿放进凉水桶里降温,挑灯夜战,如火如荼。这样,我做完了大学二年级的所有数理作业一大跺,还都能做得对。有滋有味,自赏自慰,自鸣得意。三年的“单调无聊”生活,我过得充实自信。

59年我被卫生局长看中,借调到县血防办公室,和卫生局合伙办公。干一行成一行,那一年内“两办”所有文字材料都出自我手,什么简报、总结、指示、报告、通知等,受到局长的青睐和器重。也从此有了正常的家庭生活,那已是四口之家了。


六、悲惨世界

60年前后,中国出现了所谓“三年困难时期”(1959-1961),风调雨顺,广种不收,饿蜉遍野,此情此景,空前绝后。我们家竟有三人就此殉荒(两边父及小妹)。那是“三面红旗”在作祟,浮夸、吹牛、蛮干。“人有多大胆,地有多大产”;“跑步进入共产主义”......农业上“深耕密植”,工业上全民办钢铁,漫山遍野小高炉,砸锅炼铁,劳民伤财,国贫民荒。目睹一幕:地耕深两米(一人深),撒种无隙甚至迭加,出苗像头毛,所收不及所种,“揠苗助长”,无出其右。

一切吃的都极为匮乏,难求饱腹,为了度命和生存,只得将每月国家配给成人的22斤半“粮”,以数学的方式,分到每人每餐,无论大人小孩,都按自己的定量,用碗从食堂打来,尽锅不尽肚,吃完了事。只有一岁多的儿子例外,他每月配粮8斤,但他要一日三顿稀饭,一顿一碗(油炒盐拌进去就有味了),也要半斤,这样每月要15斤,只得从大人那里“平调”补齐,才得以保命。

荒唐的“大跃进”,要求“一天等于20年”,“大干快上”,没日没夜,天天加班到夜12点后。耀桂也是下了医生班,丢下老小在家,也要去砸矿石(全民办钢铁),精疲力竭!再有,那空空的肚子如何抵挡得住?她常常在屋后菜地里摘几片菜叶来家熬点汤(有盐无油),给我骗骗肚子,她自己却不舍得吃。我们有时利用职务之便,找找当官的使点权,批张条子,才买些“米糠”,炒熟,拌进“一吹三尺浪”的稀饭里,也真管用,好了不少。

60年春,我在县血防办公室工作,一次与管农业的县长、区长几个人,去池州开省血防会议10天。那时外面一片荒,吃的、穿的、用的“全荒”,“省会”内部却米饭、富强面、猪肉包供应,外加每天配购半斤饼干、半斤酒、一包烟,十天下来,我增了5斤体重。烟酒我没要,拿回五斤饼干,一片也不少,儿子独享。

60年,我被选中去学X光,开创这一新科目,来到芜湖地区医院放射科进修半年。那还是全社会饥荒延续期,满目凄凉,“吃”成了人们不厌其烦的话题,所有的人都是“祥林嫂”。“基本生存”这第一需求不能满足,哪顾第二、第三......社会停滞了,人们呆板了,成天处在“无奈”的求生状态下。光天化日的大街上就有从你咀上抢吃的,是当时特有的风景线。大环境下的我,当然不能幸免,我也曾为找一块大麦饼而拿着碗跑满街。政府号召“瓜菜代”,草根树皮也成了人们青睐的对象。一次耀桂抱着喂奶的老二来看我,从家里带来一斤多米,从地上找点树叉,拈几块砖头支个小灶烧一锅饭,算是一家人难得的聚餐。

人苦极了也想办法,61年我以医生这一特有身份,找县园艺场头批张条,买了一猪崽,又找粮局头批条买些糠,和徐师傅合伙饲养,五个月下来,长到100斤。一天晚上在他家宰了,二一添作五,一家一半,全部回家腌上,自产自消。从喂到宰到吃,全部在“绝密”下进行。我们俩家人的这点“优待”,就是七品官也望尘莫及。当时国家配给产妇的“标准营养”,是二斤“肉”。老二60年出生,我去食品公司买那配给的两斤肉,是浸盐透水的半边猪。半条猪呀,放在如今,绝对是不合格“食品”,焉能上餐?可见,我的这一智举,给俩家带来的何止口福,饥肠辘辘,救命清泉,民以食为天,至理名言!

59年春荒时节,父妹在家断粮断炊。无奈之下,父自己烧开水,昏倒在地,就再也没有起来,终年59岁。人的生命就这样脆弱,无病也能告终。那个时段类此事件,比比皆是,有资料说全国殉荒者达几千万。安徽是这场大跃进“人祸”的重灾区。家乡既无水、旱又无虫害,种粮的农村硬是饿死人。我们那个村子,那一春就死了好几十口。同住家里的有大伯、二姐一家,自身不保。哥在泥埠小学任教,家口带在身边,我在南陵医院工作,当时父妹主要由我赡养,几斤粮就能救老爷子命,却终成千古恨!(当时信息、交通也十分不
灵。)

说到妹妹,更是往事辛酸。妹妹名楠出生在45年,难产,先天不足,后天失养(奶水不够)。五岁时痛失恩妈,一个生存弱者,是我第一个牵挂的人,我也是她唯一依恋的人。她也命大,竟然捱到60年大荒!父亲走了,她跟谁?只有我,还好,耀桂识大局,顾大情,在食不果腹的艰难时期接纳了她,把她户口移入我家,并上了南师附小。但她的生活自立和学习跟班都差一层,我对她不胜呵护、照料,她对我倚赖有加。后因我来芜湖进修,不在她身边,又处在那个特殊荒年,困难尽显,她竟盲目出走,只身来芜寻我(她心目中的唯一救星)。身无分文,一个瘦弱女孩,在那个“人抢人食”的年景,乞讨无门。140里路程,多半会饿死途中。她居然一周后来到芜湖,昏倒在车站。我得知后接回,注射葡萄糖抢救,低血糖休克(饥饿、濒死)。休养几天后,我进修客居也困难,只得乘车送回南陵家中,继续原先的生活。然家已有一老二小靠耀桂一人支撑,何况那时,工作上“少活20年干革命”,生活上糊口度命也难,如何摆平?过不久,小妹故伎重演(当然她也是无奈之举),这次再没回来了!我骑着自行车,沿着南、繁、芜公路往返搜寻,音讯杳无,就这样,兄妹间无别而终,永恒遗憾!小妹苦难的15年短暂人生,留给我心灵的伤痕,无法抚平。


七、名震四方

芜湖进修,我半年内完成学业,回院新建放射科。从此,正式进了县医院。还好,干的不错,30毫安小机子,胸透、拍片、胃肠造影,样样都行,为该院开创新纪元。也为我日后外科临床,提供了有益的相关知识。

干了不到一年,调外科帮忙,守门人万光前独掌门庭。那时光人才短缺,我虽是新手,却是第二位进入外科的人物,总还是先行者。仍兼职放射科,但重点转移了,这是我从医道路上艰难的起步。临床,是引人入胜的工作,它,“立竿见影”。我称心如意,如鱼得水,全身心投入。生活也安定多了,人们安居乐业,百废待兴。

在这里,不得不提一个“坎”。正当我在外科征途上如火如荼,对临床工作悉心呵护、视若珍宝之际,出来一个“程咬金”,一个无能而昏庸的县官,分管文卫的副书记。因为歧见,出于报复心理,他已经将两位高年资医生下放到两个区医院(黄墓 、何湾),是当时盛行的处罚人的手段“流放”。这还不解恨,接下来要斩草除根,殃及于我。他赤膊上阵,来医院宣布:调我去弋江院,大言不惭地说是“革命需要”。他的这一举措导致县医院伤筋动骨,不得不关闭五官科、骨科和放射科三科,同时再让外科重回孤丁看门,荒谬之极!这一棒,打在我事业的“七寸”。官逼民反,揭竿而起,与耀桂一商量,勇气上来了。揭露丑恶,抗拒不义。找管他的人去摆理(找了两个他的上司),一摊牌,果然有“包青天”,我才躲过此劫。坦平了前程,这才有后来我的外科飞跃。另外,我厚人薄己,惠人为乐,所以人缘特好,左右逢缘,助者自来,连“大院”里理发员、通讯员也为我通风报信、出谋献计,是我成功过坎的又一因素。攸攸岁月,弱肉强食,险哉!

此后,我更珍惜这一得天独厚的岗位,悉心学习临床的、书本的知识,工作忙,看书忙。很快就动手开刀,从下腹部起,两年下来,63年我在外科就跻身前茅,开始独立做上腹部手术。渐渐地手术遍及普外(胃、脾、胆、肠)、骨科、妇产科、泌尿、五官、麻醉等领域,高难度的如巨脾、脾肾静脉分流、颈清术、颈动脉瘤切除、肝切除、盆腔清扫、全胸食道切除、肺切除、纵膈肿瘤、横膈疝、脊柱结核、椎管肿瘤、腰椎间盘摘除、肾输尿管膀胱尿道手术......成为小有名气的“一把刀”。由于文革的历史延误,74年升医师,82年晋主治(全国文革后第一批,国家发给优待证,政府每逢年节上门慰问,颇受社会尊重),南陵县医院,24年临床(61年始,85年调离),让我练就过硬的外科功底,是我外科生涯的黄金时期。本市同行及前辈们都认同我的业绩。特定的环境,造就特定的人才。

65年夏被指派带领10人去弋江医院,接管挂牌,开办“县医院弋江分院”。我行政、业务一肩挑,那30病床的医院,一、二周下来,就住上35病人。并作了胃、胆、肠、子宫、膀胱以及阑尾、疝、痔等手术,在当地发生“轰动”效应。是我“三十而立”的第一展示。两个月后离开,接上“百日巡回医疗”下一驿站。

那是1965年冬季,下乡烟墩,巡回医疗100天。这时我还是外科新手,就像一个新车手一样,嗜爱、沉溺,加之肩负的使命是送医于民,我几乎成了工作狂。仅手术,就有610多例,其中开腹的121例。我一天做过17例,一个下午作三例阴式全子宫切除。再有就是胃、胆、肠、乃及牙科、眼科、五官科和骨科等,而且效果均好,难有类此,近乎神话。我这个队长带着七人医疗队,还要培训七批卫生员,建一个卫生村。为改进饮水,亲自动手,带领大家挖了两口水井,让这里的人们告别了世代吃用泥塘水,可谓德政工程。这样狂热的工作精神和取得的优异成绩,受到地区表彰。

60、70年代,我的外科事业,如日中天。虽还不是什么主任、主治的,但权威、名气,已雷贯一方。工作再忙,手术再多,那一月46元半的工薪,雷打不动,只够用来养家糊口。医技来自前人总结,“老师”就是医书。做医生的我想出绝招,卖血买书,自鸣得意。

行医数十年,出诊多少次,手术几多台,救了多少人,数也不清,记也不完。早在60、70年代,医疗条件特别简陋,遇上急出诊,单枪匹马,就地手术,只得“因陋就简”:地上洒上水,台顶拉上布,点上汽油灯,加把手电筒,“戏”就唱起来了。那是在执行毛主席 “6.26” 指示,医疗面向农村,在当时既时髦又光荣,以自己技术换来病人康复,精神上也很满足。随手拈几个花絮,追溯当年情景。

68年出诊何湾作肝修补救回了一个“王一千”:是一个13岁的男孩,从牛背上坠下悬崖,肝中央破裂,需要开胸修补,要血、要麻醉机,这是必须的“苛刻”条件。无奈,让救护车返城取,70里羊肠山路又遇大雾,往返得四、五个小时,腹内在大出血,时间不等人,时间就是生命。我急中生智,首创腹血回输(肝血回输当时医学上尚极少论及,因有胆汁污染,10年后,文献认可了)。那一夜,我立病人身旁,“车水战术”,从腹内抽出来,过滤后再静脉输
入,共回输1700毫升,赢得了时间。手术,就在汽油灯下,完成了开胸肝修补,初战告捷。然当术后第11天拟出院时,并发胆道大出血,阵发性腹痛伴休克,再转回县院,三天保守观察,再二次进腹作肝固有动脉结扎,终愈。救回这命,花了1000元经费,故戏称“王一千”。这,在那个时代,那样条件,那种技术,是一奇迹。

另有一次是出诊东河乡,一位脾破裂,腹内大出血,病人不能搬动,也不可能有任何外援,只得就地就条件办。腹内血抽出来,无需抗凝(已去纤维蛋白,不凝,况且当地没有抗凝剂),就在临时“手术室”,完成了脾切除救人。我这生,这种模式,力救人命,从不推诿、退缩。


八、文革十年

巡回医疗后马不停蹄地来何湾,再创“备战医院”,工作热情依旧,如火如荼。把已学到的技术,发挥得淋漓尽致。手术做了,房子盖了,兴旺一时,誉满一方。这是66年,赶上文革风暴,我就在那“避风港”呆着,难得一个“世外桃园”,真的也就躲过一劫,保了平安。我历经“人斗”硝烟,肃反、反右、四清、文革......接踵袭来,尤其我这非无产家庭出身,更是矛靶。一出校,就有同学被打成“右派”,成为“阶下囚”十几年。我在乡野游弋血防,躲过这一劫。文革暴风骤雨,我在何湾,“造反派”本拟对我抄家,消息走漏,我把所有“字迹”(日记、文稿),包括祖传《李老夫子遗墨》统统放进洗衣桶里,上面放上湿衣,趁晚黑捎到塘边,将其和泥揉成团,扔入池塘,“消尸灭迹”,终于逃过文字狱。我于社会,无争无求,却也如履薄冰,所幸大智若愚,终成“漏网之鱼”。

1967年夏秋,著名的中国“无产阶级文化大革命”进入第二个年头。武斗割据,无端格杀,交通中断,完全是无政府状态。县医院“扫黑线”造反派也去全国大串联,关门停诊,守“家”的另一派“批联部”就让卫生局将我从何湾医院调回主持外科开诊。社会俨然成了战场,战就有死伤,死者已矣,伤者要救,我,一个“名”外科大夫,遂成了两派网拢要员,是两派都保护的少有的人物。格斗乱伤,子弹、炸药更是不长眼的,管你医学上什么科、什么系,所以脑
外、胸外、普外、骨科、血管外科、妇产科......都得涉足。子弹穿肺的,穿肝的,穿血管的......无法转院,也不得会诊,生死在我。当然是认真的,救死扶伤是天职,唯一老师是书本,多次“破冰之旅”,练就“多面手”,取得好疗效,令声誉雀起,是外科征途中坚实的一步。记得武斗正酣时,出诊在人家大桌上作一剖腹产,也救了两命。

68年我任外科负责人,过劳和透支尤为明显。除了白天上班外,晚上睡前总要去病房看一下,班外急诊是家常便饭。就是那一年冬天,一连17个晚上10点以后起来急诊并手术通宵,往往一夜要连做胃、脾、胆三台手术。直到来芜前我一直维持在55公斤体重,好在没闹出大毛病来,但耀桂却为此(亦常夜以继日地伫立在手术台上)英年早逝,付出了沉重代价!报端呼吁:中国中年知识份子共同面临健康危机!而我是幸运的例外。

76年7月28凌晨,唐山大地震(里氏7.8或8.2级),官方统计死24万,伤者多倍于此,古今中外罕见。在毛“自立更生”狭隘民族主义指导下,断然拒绝一切外援。实际上中国当时是“一穷二白”,也要打肿脸充胖子,全国动员,“政治任务”,赈灾抗震。8月2日,我被召来芜,受命第一批赴唐山,抗震医疗。我挟着席帐衣巾,重现当年(53年)来芜考学时“风采”。全市三人,义无反顾,往震区去。这对我,似乎回到73年:援外医疗队,赴南也门。当年官方训话:无私援助第三世界,是国际主义义务,责无旁贷,荣光器重。现在是全国性政治任务,当然亦无话可说,虽然不但劳苦,而且危险。我正值中年,“名”贯市县,极易靶中,以当时的“政治”头脑,确也自认荣耀。就在出发的当晚午夜,来电:中央决定,伤员南下,医生就地待命。接下来我被委任为抗震医疗队长,重组25人医疗骨干,落点峨桥,繁昌再配25人后勤和保安,任务是接收地震伤员100人。这个队,除我外,还有副队长三人,指导员、副指导员各一人,市、县直接领导。将这个镇的学校和旅社全部腾出来,开病房和
住宿。几天后我带三人去南京车站,上卫生专列,选定我队伤员。车至峨桥站,50米一台拖拉机发动当路灯,几百民工,担架抬下来,送入“病房”,进入医疗阶段。一切吃、住、医由政府包下来。我将几位年长医生和女同胞安排进仅有的几所旅社,我及若干年轻人,都是“打游击”,那仍是“艰苦创业”年代。经过努力,园满完成任务,2、3月后伤员康复,逐一送返原籍。这旷世大地震,有我一份奉献。


九、家庭亲情

58年,头生子出生在南陵县黄塘乡古吁一间社屋里,五斤四两,早产。当时我们还真怕这“先天不足”带来后果,还好,后来生长,证明无碍。那年代,没有产前休息,我们在搞血防粪检,住在一个闲置的社屋,空荡荡的,无任何生活设施,安张铺,就是“家”。由于成天流动劳累,导致早产,届时,来不及了。我去奎湖街,找来一个接生员帮忙,好在我自己还可“把舵”。然后抬母子回黄暮血防组的“家”做月子。此前有准备,外婆已接来,安顿好,我还得“出征”上岗。产假后回县医院,开始安定。

在我和耀桂成家最初二十几年,虽然我们俩人都是响亮医生职业,而且主持外科、妇产科工作,然而每月收入就是89元(我46,耀桂43),维持三个孩子加岳母六口人生活,也仅糊口而已。直至供两个儿子同时上大学时还是如此,这时学生伙食标准是每月15元,我的46元工资也就三一三十一,每人15元(他俩在校还有点助学金)。一代人的时光过去了,他们俩还同样是我当年上学时供给饭费为标准!衣服总是老大穿了老二穿,老二穿了改了老三穿,破了再补。老二上初中还穿妈妈的女式大襟衣。直到他在京读研还穿补丁裤和旧棉纱背心,好在培养了他们一生勤俭美德。我第一次有皮鞋是在工作10年后,第一次带手表是64年91元买的(相当于我两个月工资全额)。直到80年代孩子们都上大学了,家里才有一台黑白电视(450元)和一台五羊电风扇(135元):这两样就是我一年多的工资收入,算是步入“现代化”了。早在63年以25元买过一台旧的多波段交流收音机,可收短波外台,暗自迷恋,常听到深夜,茅塞顿开。这段人生养家主要时段(上养老下养小),一个夫妻都是主治大夫的家
庭,竟然拮据如此!这是毛时代长期经济短缺的印证。

缅怀岳母:三个孩子都是外婆一手捧大的,时值三个小人全要大人呵护时,父母要“拼命干革命”,经济又拮据,外婆的功绩,不可磨灭。岳母徐天青是一位和霭慈祥的老辈,58年起直至73年过世,全程管了这个家,付出了全部心血。

84年4月30日,耀桂胃癌病故,是我人生一个大“坎”。人去楼空,触景生情,满目凄凉,如何应对,百无良法!三子女皆已工作、深造在外,一合计,走为上。先调女儿来芜,我经努力,85年9月调来芜湖长航医院(一个主治医生调出,要县常委、市人事局批准才行,也不易),如愿以偿,终于达到移居这一从小就仰慕的芜市,也方便了孩子们来家探亲,对全家人是件大事。再在孩子们的规劝下,闰月坦顺地走进了我家,为我分忧,为家解难,对孩子们也表达了关爱。小儿子更是聪慧懂理,重组新家,没费事劳神,顺理成章。没过一年,经原南陵书记热心帮助和疏导,闰月也顺利从南陵妇联调来长航公司。86年底公司又分给我家一套三室一厅79平米房子。公司有规定:分房对象需具五年企业工龄,而我还不到一年,又是网开一面,缘自我的工作业绩。(“一把手”出面说:“破例”责任,本人承担)。一分钱不花(也无钱可花,两个人工作近30年的家底就是2000元!)住进了红梅新村,再次安居乐业,闯过人生又一坎。

96年趁孙女出生之机,我远涉重洋,从上海直飞温哥华探望老二一家。飞行也就八小时,倒是进关办手续花了五小时,那时也没手机,内外不通,害得儿子在机场出口处目不转晴地盯着,怕我走失。随后的两个多月里,三个大人“管”一个小人。除了儿子有时开车带我出去观光,我也常独自游览,带上零钱、地图、相机、字典,上公交或空铁(Skytrain),从始至终,纵贯东南西北,各边各角,还去维多利亚岛世界植物园,饱览异域风光。

我唯一的胞兄名实,2001年12月6日上午9时不辞而别。如今信息交通便捷,一小时的车程,却未能谋面告别,痛失最后伺奉机会,终身惋惜!但也是福,走得利索,少了临终痛苦。享年75岁,终于心肌梗塞。手足分离,情伤难惴。从我四岁记事起,脑子里就一直有哥哥影子,挥弗不去。兄弟俩相扶一生,一切人生轨迹,都有哥哥点拨......我也做到“滴水之恩,涌泉相报”。大嫂常说:“你哥哥要你头你都会给他”,寓意我什么都会随他意的。哥哥后来安居在一中和侄儿立足于地区医院,有我不灭功绩。和父亲一样,哥哥没有上过任何外校,没交过一元学费,也跟小学阶段的我一样“半工半读”,在自家学堂自成人才。44年18岁就在三山小洲江坝红区(当时有日、国、共三方拉锯占领,五里外三山街就是日军的,而江坝是新四军的)小学任教 ,后一直从事中小学教育。56年他30岁时出任平铺中心学区校长,晚近20年居然进了县最高学府-繁昌一中,任地理和语文中级老师,也有他传奇而耀眼的篇章,还留有大量文史资料和杂文。他年轻时英俊、洒脱,乐器遍涉,歌喉亦十分动听,水性特好......但病魔长期缠身,钩虫病、肺结核使他耗失10年多黄金时光,还经历各场“人斗”折腾,所幸躲过来了,过着清贫“先生”生活,但胆战心惊一生。


十、养儿育女

从我家里出来的小孩,不但没受过打骂,连委屈也不给,我从来就不信“棍棒出孝子”、打骂出人才。即便是不懂事的小孩,打骂无异于“弱肉强食”,他无力反抗,心理上种下“逆反”阴影,有害无益。我的这个观念符合西方文明国家规范(在西方,打骂孩子是犯法的),在国内却难能可贵:我们所见,包括左邻右舍,打骂孩子乃家常便饭,很多时候,大人在外生活压力大,回家拿孩子撒气。

养儿育女确实辛苦。60-70年代,暑夏特热,入夜,斗室闷燥(24平米),蚊虫成堆,上床入帐,似蒸笼、像桑拿。热、蚊逼人出室纳凉,不过午夜不能进屋。苦在做父母的,要不停地以笆蕉扇,给三个孩子驱热赶蚊,真是精疲力竭,困极了自己迷迷糊糊的,也还在做那机械动作。尽管如此,下半夜仍然人多长汗多长,痱子长满身,甚至疖子也来光顾,这样光景,令今人如何想及!

66年全家去河湾,一年级的老大,幼儿中班的老二,一起进何湾小学一年级。这是第二学期,老二一进去,茫然无措,上课云里雾里,回家作业也不会做。帮帮忙,还好一个月下来,跟上了,期终,老师居然让他升级。如此,他们弟兄俩就此同级上学。小女五岁,也因没有幼儿园,只得也上一年级,他们仨各差两岁,老大、老二上二年级,老三上一年级,一路优等生(有时叫“五好战士”,“三好学生”,“积极分子”等)。

在那宣扬“长大要当工农兵、书越读多越反动”的时代,劳动最光荣,三兄妹都去当过征粮“协助员”、马路工,这还因我在社会上有点“地位”,才能挤上。76年暑假,老大老二已“完成”中学学业,闲在家感到无聊,吵着要打工。我发挥社会“能量”,安排老二去峨岭、老大去丫山,做征粮员。大热天,闹地震,一个人在乡下生活,吃的,睡的,还有蚊子,可以想见,是一场意志磨炼。两个月下来,老大拿到40元工薪,第一次啊,也接近我的一月工资了,回城返家,走15里地到何湾上车。几个同行吃顿饭,出于义气,显得大方,“我请了”,掏出工资买单,其余的裤袋一塞,上车就迷迷糊糊睡着了,也因前一晚“抗震”没睡好。好了,一下车,钱全没了,两个月全部“劳动价值”,水漂了,他是多么懊恼。我们家长倒是没有丝毫埋怨,接下来,为了散心,独自来到繁昌,先在堂兄钢铁厂里干了半天抬石小工,受不了,再到峨桥我的抗震医疗队,我是队长,无暇顾他,安抚一场,打发回家。

那个年头,无论大人小孩,前途何在,一片茫然!随波逐流,随风漂荡。正值中国文革后期,以学工、学农、学军为时尚,大学停办关门,唯一出路是下放农村,到“广阔天地”,当新式农民。老二年龄不够,可以缓一年,但也“吵”着要走,到更艰苦的地方去,接受再教育,练一颗“红心”。于是由我来谋划,找来一山一圩、一南一北两位区委书记,周密安排,一烟墩,一东塘。知青送行那天,全县集中,敲锣打鼓,披红戴绿,专车欢送。老二小,自立差,不放心,由父母护送,打扫清点,安个“新家”(三个同学一起组成新家)。第二天再去东塘看老大,他已上工了,在给队长当小工砌砖,一身泥,满身汗,苦、累,经得起。后来,他放牛、栽秧、割稻、锄地。他吃的是“派饭”,东家总当“客人”待,从春耕到秋收,干了一个农业周期,极少回家。几周后再去看老二,他全身就是一件小裤衩,光脚、赤膊,也不戴帽,晒的一身黑。他白天上工锄地,晚上听英语广播(从家里带来一个交流电收音机),单词写在胳膊上,工余时可背背,说明“心”还在读书。一天挣来的工分,难保一天伙食,吃,是三人小家自己轮值烧。盐水汤就是菜,赤脚可在山上挑水,那脚底扳可赶上当年的我。也做了一个农业周期,从不离队,是当时教育的“功劳”和“大环境”使然。

按《参考消息》透风,我敏感地意识到,高考可能到来。三秋以后,新学期开始之初,我找来两边“监护人”(区书记),一商量,决定让他俩去公社中学当“代课教师”,目的是能给一个备考的环境:他们在中学时,当时的时势,高三已经取消,两年制高中一多半在“学工”、“学农”、“学军”,文化课训练薄弱。果然,这设计是“英明”的,一边教书,一边复习,还有近水楼台的老教师在侧,大量收集高考资料,背水一战,全力以赴。一学期下来,这年春季,开始了文革10年来首次高考,不管如何,我们是有备而来。相比之下,略处优势,加之平时学习功底,结果,在积压十年的高考大军中,两人居然双双中榜。可惜,老二发挥不好,也缺乏考场经验,一场语文是一篇作文,两个任选题,他花了一半时间,成了,再做另一篇也行,可徒劳,审题、切题也欠准,结果得了50分(他的语文实力本可放心的),把总分拉下去了。加上因加试英语而“吃亏”,取在师大一个教学点,他本人和家里都为此而惘然若失。但总归俩人一道中榜,而且都是本科,他们那届四个班200人也就取了四人!我们家就是两个,成为南陵号外新闻。可老二委屈伤心,挥泪不止。内外氛围显得那么不协调,连老大取在第一志愿也不敢“得意”,怕触伤老二。我劝老二:总是本科,上学去,不耽误时间。老大如意进了南航自动控制系。他是独自上学的,有点“闯”的精神。在南京中华门下车,背着挎包,直奔学校,新生接待处派一辆车给他,去车站拉回行李。他办的利索,也是第一次独立出门啊!而老二则有点“胧”,我只有全程护送,安排到位,一看他那班30人,也都不凡,彼此彼此,由此稍安。果然他们这帮人,“低着头进来,昂着头出去”,后来事实证明了他们的誓言,大多读研或在大学任教,有的还进了“顶级”大学或研究所。老二毕业后,留校未成,一时受挫。一年后进京读研,计算语言学专业,是前沿学科,考时跨三个专业,要文科的语政、理科的数学及两门外语,当时很少人能适应。这是他人生一个“大步”!三年后他留社科院,得心顺手,如日中天。91年赶上出国末班车,取得“中英友好奖学金”,在英、加攻读学位,博士阶段以后来美艰苦创业,不到八年,在学术界和工业界均取得骄人成就,发表论文数十篇,赢得18项美国政府研究项目,涉及经费千万美元,开创一片新天地。踩过荆棘、踏平坎坷,功到自成。

女儿高考落榜,物理竟考23分,要是添上10分,也就取了,而她高中物理竞赛曾是第三名呀。也许是压力太大,或者是逆反心理,一边高考一边床下放着小说书不松手,心不在焉。还好,81年银行招干,全县切高考录取后四人,她入围,一决策,让她去。以干部身份就职于工行。现实证明,这是不错的选择。后来她发奋,在职学了两个大专,按本科学历立足于社会。如今,是会计师,一直在银行办公室工作。这是我们家高考中唯一的一个意外,歪打正着,也走出一条路来。正好,幸亏留下她一人在我身边,晚年有个指靠,有个随叫随到的人,心里踏实多了。

小儿小学三年级转学来芜,一路顺风。94年师大附中高考状元,617+5分(市三好学生5分),科大主动上门:“任选专业,保证录取”。没费事,上了科大计算机系,5年制。上海工作一年多,去英国曼大读硕士、博士5年,游弋于世界计算机论坛,继老二之后又一个全球性科技人才。他,除了机灵聪慧,为人也温顺知理,充满亲情孝心。


十一、宝刀不老

来芜湖长航医院,对我是只得“吃老本”了,凭藉老本,应付裕如。用院长的话说:“你给我院挑大梁”。虽然也有两位年长医生,但还是我统揽了“手术台”。三个月下来,这年底被全院候选“人大代表”,本院及本公司职工、家属纷纷慕名找我手术。88年经交通部高评委评审晋副主任医师,95年经省卫生厅批升“主任医师”这一顶级职称。同时,我是本系统高、中、初三级职称评委,借此,以高评委身份,我南下广州(深圳),北上秦皇岛(锦州、山海关、北戴河、北京),以及万县(长江三峡)、桂林等地,履行“高知”职责,亦饱览祖国风光。

来芜20年,虽主要是吃老本,因为交流机会多了,博取众家之长,见多识广,获益亦丰。这段时期,科技飞进,技术、术式和器具、材料快速翻新,如吻合器、疝补片、骨科人工关节等,我们这代人大都没能跟上,然我却未掉队落伍,与时俱进。凭着“老本”和声誉,手术遍及几十家医院,或兼其顾问,给予辅导和支持,院外手术远逾院内总和。借着频频出诊,让我有机会开车过万公里,手术、开车成了我的“享受”,为此,我宁愿“劳累”,施益于病人及医院。不过,近年来,我国医疗环境不佳,医患纠纷频发,我主动“收紧”和“慎待”,然仍对真心求援或手术台上求助,还是应诊,深夜几十里外出诊,也在所不辞。台上救人,功德千秋!

我的从医征途上,不可忘却的两位老师是许竟斌和闵梅先。许是全国著名的骨科前辈,53年《外科学报》编辑,后来的骨科杂志编委。73年骨科进修班跟他一年,让我在全省骨科界成为一员,参与他们的历届学术活动,基本做遍骨科各类手术。他的艰苦创业和任劳任怨服务精神,是我永恒的榜样。闵是我普外、胸外开导老师,他的学术风范和领导艺术以及手术风采,令我闭目不忘。尤其在我调动来芜时,他出于“惜才”及同情,诚留我去他的医院,皖医二院。他当时恳切的肺腑之言和赤诚之意,我没齿难忘。他说:“听说你去长航医院?职工医院不是干事的地方(指行医、手术),你来这,现在是省院,后去前景光明。这边院部、人事局、卫生局都由我来办,你放心好了”。良师益友,心存感激!

电脑,这个现代文明精华,让我赶上了末班车。在我们这辈人中,用上它的,寥寥无几。我好在处于“电脑之家”,三个儿子及儿媳,都游弋于机算机浪涛中,并且都是有头有眼的人物。我在他们的“陶熏”下,走进这个“世界”。尤其是小儿上科大二时(计算机系),就给我配置了一台电脑,386,硬盘0.85G,从DOS用起,现在这台是奔腾,80G,Windows XP。英文我通一点,可读可写“初级”,用五笔、拼音可打中文。用它写论文、通讯、看新闻、搜索资料、打游戏、看图片和录像(CD、VCD),受益匪浅。使人生多了一个“消闲”有趣的去处,更让我与远在天涯海角的子女们随意“见面”,自乐陶陶。

最新消息:外孙中考,668+3分(满分720丢52分),进市重点学校。大孙女亦取省示范高中。小孙女在美读小学,全班第一,升四年级。孙儿辈健康成长,捷报频传,足另人欣慰。

《长江航运报》2001-2-20第四版“人物春秋”有对我的专访“晚霞在燃烧”,记述我其人其事。说我“15年前,从南陵县医院调来长航医院时,已是闻名遐迩的外科‘一把刀’,医术精湛、医德高尚,人不老,仍执着。顶着头衔和光环,视实惠而不见,退休后一干又是5年,李名杰用手术刀挽救了一个个生命,至今宝刀不老,献余热于人民。他是一个永不满足的人。”

2005年仲夏


附录


李咸升、李应文、李应会等:《李老夫子遗墨》
老爸:【人生记忆:立委母传略(兼家史掠影)】
老爸:【晋升主任医师述职报告:我的外科生涯】
立委:【朝华午拾:《李老夫子遗墨》简介 】
立委:【朝华午拾:父亲的行医生涯
立委:【朝华午拾:我的考研经历 】
《长江航运报》2001-2-20第四版“人物春秋”:【晚霞在燃烧】

【关于舆情挖掘】

【喋喋不休论大数据(立委博文汇总)】

【新智元笔记:再谈舆情】

舆情挖掘系统独立验证的意义

【社煤挖掘:雷同学之死】

《利用大数据高科技,实时监测美国总统大选舆情变化》

世人皆错nlp不错,民调错大数据也不会错

社媒大数据的困境:微信的风行导致舆情的碎片化

从微信的用户体验谈大数据挖掘的客户情报

社媒挖掘:社会媒体疯传柴静调查,毁誉参半,争议趋于情绪化

奥巴马赢了昨晚辩论吗?舆情自动检测告诉你

全球社交媒体热议阿里巴巴上市

到底社媒曲线与股市曲线有没有、有多少相关度?

再谈舆情与股市的相关性

【『科学』预测:A-股 看好】

舆情挖掘用于股市房市预测靠谱么?

大数据帮助决策实例:《走进“大数据”——洗衣机寻购记》

【社媒挖掘:外来快餐店风光不再】

【社媒挖掘:中国手机市场仍处于战国争雄的阶段】

世界杯是全世界的热点,纵不懂也有义务挖掘一哈

【大数据挖掘:方崔大战一年回顾】(更正版)

【大数据挖掘:转基因一年回顾】

【大数据挖掘:“苦逼”小崔2013年5-7月为什么跌入谷底?】

【大数据挖掘:转基因中文网络的自动民调,东风压倒西风?】

【大数据挖掘:转基因英文网络的自动民调和分析】

只认数据不认人:IRT 的鼓噪左右美国民情了么?

继续转基因的大数据挖掘:谁在说话?发自何处?能代表美国人民么

关于转基因及其社会媒体大数据挖掘的种种问题

【美国网民怎么看转基因:英文社交媒体大数据调查告诉你】

【社媒挖掘:必胜客是七夕节情侣聚餐的首选之地?】

【社媒挖掘:大数据时代的危机管理】

测试粤语舆情挖掘:拿娱乐界名人阿娇和陈冠希开刀

【社媒挖掘:不朽邓丽君】

【社媒挖掘:社会媒体眼中的李开复老师】

【社媒挖掘:糟糕透顶的方韩社会形象】

社媒挖掘:关于狗肉的争议

社媒挖掘:央视的老毕

社媒挖掘:老毕私下辱毛事件再挖掘

大数据淹没下的冰美人(之一)

大数据淹没下的冰美人(之二)

大数据淹没下的冰美人(之三): 喜欢的理由

大数据淹没下的冰美人(之四): 流言蜚语篇(慎入)

大数据淹没下的冰美人(之五): 星光灿烂谁为最?

【社媒挖掘:成都暴打事件中的男司机和女司机】

【社媒挖掘:社会媒体眼中的陳水扁】

【社媒挖掘:社会媒体眼中的李登輝】

【社媒挖掘:馬英九施政一年來輿情晴雨表】

【社媒挖掘:臺灣政壇輿情圖】

【社媒挖掘:社会媒体眼中的臺灣綠營大佬】

舆情挖掘:九合一國民黨慘敗 馬英九時代行將結束?

社会媒体舆情自动分析:马英九 vs 陈水扁

社媒挖掘:争议人物方博士被逐,提升了其网路形象

方韩大战高频情绪性词的词频分析

方韩大战的舆情自动分析:小方的评价比韩少差太多了

社媒挖掘:苹果CEO库克公开承认同志身份,媒体反应相当正面

苹果智能手表会是可穿戴设备的革命么?

全球社交媒体热议苹果推出 iPhone 6

互联网盛世英雄马云的媒体形象

革命革到自身头上,给咱“科学网”也挖掘一下形象

两年来中国红十字会的社会媒体形象调查

自动民调Walmart,挖掘发现跨国公司在中国的日子不好过

【社媒挖掘:“剩女”问题】

【舆情挖掘:2013央视春晚播后】

【舆情挖掘:年三十挖一挖央视春晚】

新浪微博下周要大跌?舆情指数不看好,负面评价太多(疑似虚惊)

【大数据挖掘:微信(WeChat)】

【大数据解读:方崔大战对转基因形象的影响】

【微博自动民调:薄熙来、薛蛮子和李天一】

【社媒挖掘:第一夫人光彩夺目赞誉有加】

       Chinese First Lady in Social Media

Social media mining on credit industry in China

Sina Weibo IPO and its automatic real time monitoring

Social media mining: Teens and Issues

立委元宵节大数据科技访谈土豆视频上网

【大数据挖掘:中国红十字会的社会媒体形象】

【社媒挖掘:社会媒体眼中的财政悬崖】

【社媒挖掘:美国的枪支管制任重道远】

【舆情挖掘:房市总体看好】

【社媒挖掘:社会媒体眼中的米拉先生】

【社会媒体:现代婚姻推背图】

【社会媒体:现代爱情推背图】

【科学技术之云】

新鲜出炉:2012 热点话题五大盘点之五【小方vs韩2】

【凡事不决问 social:切糕是神马?】

Social media mining: 2013 vs. 2012

社会媒体测试知名品牌百度,有惊人发现

尝试揭秘百度的“哪里有小姐”: 小姐年年讲、月月讲、天天讲?

舆情自动分析表明,谷歌的社会评价度高出百度一倍

圣诞社媒印象: 简体世界狂欢,繁體世界分享

WordClouds: Season's sentiments, pros & cons of Xmas

新鲜出炉:2012 热点话题五大盘点之一【吊丝】

新鲜出炉:2012 热点的社会媒体五大盘点之二【林书豪】

新鲜出炉:2012 热点话题五大盘点之三【舌尖上的中国】

新鲜出炉:2012 热点话题五大盘点之四【三星vs苹果】

社会媒体比烂,但国骂隐含舆情

肮脏语言研究:英语篇

肮脏语言研究:汉语篇(18岁以下勿入)

新年新打算:【社媒挖掘】专栏开张大吉

关于 NLP 以及杂谈

关于NLP体系和设计哲学

关于NLP方法论以及两条路线之争

关于 parsing

【关于中文NLP】

【关于信息抽取】

【关于舆情挖掘】

【关于大数据挖掘】

【关于NLP应用】

【关于人工智能】

【关于我与NLP】

【关于NLP掌故】

《朝华午拾》总目录

【关于立委NLP的《关于系列》】

【置顶:立委NLP博文一览(定期更新版)】

立委NLP频道

立委NLP相关博文汇总

NLP University

【立委NLP相关博文汇总一览】

NLP University 开张大吉

《朝华午拾》总目录

余致力自然语言处理(NLP,Natural Language Processing)凡30年,其目的在求交流之通畅,信息之自由,语言之归一,世界之大同。积30年之经验,深知欲达此目的,必须启蒙后进,普及科学,同心协力,共建通天之塔,因作文鼓而吹之。处理尚未成功,同志仍需努力。

关于 NLP 以及杂谈

关于NLP体系和设计哲学

关于NLP方法论以及两条路线之争

关于 parsing

【关于中文NLP】

【关于信息抽取】

【关于大数据挖掘】

【关于知识图谱】

【关于舆情挖掘】

【关于问答系统】

【关于机器翻译】

【关于NLP应用】

【关于人工智能】

【关于我与NLP】

【关于NLP掌故】

1. 关于NLP体系及方法论

【立委科普:NLP 联络图 】

【立委科普:自然语言系统架构简说】

【立委科普:自然语言parsers是揭示语言奥秘的LIGO式探测仪】

泥沙龙笔记:漫谈语言形式

Notes on Building and Using Lexical Semantic Knowledge Bases

NLP 迷思之四:词义消歧(WSD)是NLP应用的瓶颈

《立委科普:语言学的基本概念》

《立委随笔:通天塔不是一日建成的》

科研围脖:再谈查全率和大海捞针

与老前辈谈 NLP 及其趋势

【立委随笔:NLP 的童子功】

说说科研立项中的大跃进

中餐大厨和技术匠人

【李白对话录:谁无知呢?】

学科有高低,事业分档次

《泥沙龙笔记:沾深度神经的光,谈parsing的深度与多层》

【立委科普:语言学算法是 deep NLP 绕不过去的坎儿】

《OVERVIEW OF NATURAL LANGUAGE PROCESSING》

《NLP White Paper: Overview of Our NLP Core Engine》

White Paper of NLP Engine

《泥沙龙笔记:deep,情到深处仍孤独》

《泥沙龙铿锵三人行:句法语义纠缠论》

《泥沙龙笔记:知识习得对本体知识,信息抽取对知识图谱》

【泥沙龙笔记:再谈知识图谱和知识习得】

【立委科普:本体知识系统的发展历程】

Notes on Building and Using Lexical Semantic Knowledge Bases

NLP 是什么,不是什么?做什么,不做什么?

【新智元笔记:工程语法和深度神经】

【新智元笔记:李白对话录 – RNN 与语言学算法】

《新智元笔记:再谈语言学手工编程与机器学习的自动编程》

《新智元笔记:对于 tractable tasks, 机器学习很难胜过专家》

《新智元笔记:【Google 年度顶级论文】有感》

《新智元笔记:NLP 系统的分层挑战》

《泥沙龙笔记:连续、离散,模块化和接口》

《泥沙龙笔记:parsing 的休眠反悔机制》

【立委科普:歧义parsing的休眠唤醒机制初探】

【泥沙龙笔记:NLP hard 的歧义突破】

【立委科普:结构歧义的休眠唤醒演义】

【新智元笔记:李白对话录 – 从“把手”谈起】

《新智元笔记:跨层次结构歧义的识别表达痛点》

立委科普:NLP 中的一袋子词是什么

一切声称用机器学习做社会媒体舆情挖掘的系统,都值得怀疑

立委科普:关键词革命

立委科普:关键词外传

《立委随笔:机器学习和自然语言处理》

【泥沙龙笔记:语法工程派与统计学习派的总结】

【科普小品:NLP 的锤子和斧头】

【新智元笔记:两条路线上的NLP数据制导】

《立委随笔:语言自动分析的两个路子》

Comparison of Pros and Cons of Two NLP Approaches

why hybrid? on machine learning vs. hand-coded rules in NLP

Why Hybrid?

钩沉:Early arguments for a hybrid model for NLP and IE

【李白对话录:你波你的波,我粒我的粒】

【泥沙龙笔记:学习乐观主义的极致,奇文共欣赏】

《泥沙龙笔记:铿锵众人行,parsing 可以颠覆关键词吗?》

泥沙龙笔记:铿锵三人行

《泥沙龙铿锵三人行:句法语义纠缠论》

【科普随笔:NLP主流的傲慢与偏见】

【科普随笔:NLP主流最大的偏见,规则系统的手工性】

再谈机器学习和手工系统:人和机器谁更聪明能干?

乔姆斯基批判

Chomsky’s Negative Impact

[转载]【白硕 – 穿越乔家大院寻找“毛毛虫”】

【新智元笔记:语法糖霜论不值得认真对待】

【科研笔记:NLP “毛毛虫” 笔记,从一维到二维】

【泥沙龙笔记:NLP 专门语言是规则系统的斧头】

【新智元:理论家的围墙和工程师的私货】

泥沙龙笔记:从乔姆斯基大战谷歌Norvig说起

【Church – 钟摆摆得太远(2):乔姆斯基论】

【NLP主流的反思:Church – 钟摆摆得太远(1):历史回顾】

【Church – 钟摆摆得太远(3):皮尔斯论】

【Church – 钟摆摆得太远(4):明斯基论】

【Church – 钟摆摆得太远(5):现状与结论】

《泥沙龙笔记:【钟摆摆得太远】高大上,但有偏颇》

自给自足是NLP王道

自然语言后学都应该看看白硕老师的“自然语言处理与人工智能”

语言创造简史

Notes on Building and Using Lexical Semantic Knowledge Bases

【NLP主流成见之二,所谓规则系统的移植性太差】

Domain portability myth in natural language processing (NLP)

【科普随笔:NLP的宗教战争?】

Church – 计算语言学课程的缺陷 (翻译节选)

【科普随笔:NLP主流之偏见重复一万遍成为反真理】

坚持四项基本原则,开发鲁棒性NLP系统

NLP 围脖:成语从来不是问题

NLP 是一个力气活:再论成语不是问题

立委围脖:对于用户来说,抓住老鼠就是好猫

《科普随笔:keep ambiguity untouched》

【科研笔记:NLP的词海战术】

在构筑一个模型时,枚举法是常用的必要的强盗分类

没有语言学的 CL 走不远

[转载]为什么谷歌搜索并不像广泛相信的那样主要采用机器学习?

手工规则系统的软肋在文章分类

老教授回函:理性主义回摆可能要再延迟10几年

每隔二十年振荡一次的钟摆要多长?

【系统不能太精巧,正如人不能太聪明】

《泥沙龙李白对话录:关于纯语义系统》

【泥沙龙笔记:语义可以绕过句法吗】

一袋子词的主流方法面对社交媒体捉襟见肘,结构分析是必由之路

《新智元:通用的机器人都是闹着玩的,有用的都是 domain 的》

【新智元笔记:反伊莉莎效应,人工智能的新概念】

The Anti-Eliza effect, New Concept in AI

《新智元笔记:机器的秒杀人类和霍金的杞人忧天》

【新智元笔记:强弱人工智能之辩】

【泥沙龙笔记:强人工智能的伟哥测试】

重温AI历史上的思维实验:老外不会中文,正如机器没有理解

《语义三巨人》

【泥沙龙笔记:吃科学的饭,还是技术的饭?】

《立委随笔:人工“智能”》

人机接口是机器人的面子

《新智元:通用的机器人都是闹着玩的,有用的都是 domain 的》

【泥沙龙笔记:从民科谈到五代机及其AI历史与现状】

【泥沙龙笔记:吃科学的饭,还是技术的饭?】

SBIR Grants

2. 关于NLP分析(parsing)

【语言学小品:送老婆后面的语言学】

【一日一parsing:NLP应用可以对parsing有所包容】

泥沙龙笔记:骨灰级砖家一席谈,真伪结构歧义的对策(1/2)

泥沙龙笔记:骨灰级砖家一席谈,真伪结构歧义的对策(2/2)

【语义计算沙龙:巨头谷歌昨天称句法分析极难,但他们最强】

语义计算沙龙:parsing 的鲁棒比精准更重要】

语义计算沙龙:基本短语是浅层和深层parsing的重要接口》

【做 parsing 还是要靠语言学家,机器学习不给力】

《泥沙龙笔记:狗血的语言学》

【deep parsing 小品:天涯若比邻的远距离关系】

《有了deep parsing,信息抽取就是个玩儿》

语义计算沙龙:关于汉语介词的兼语句型,兼论POS】

泥沙龙笔记:在知识处理中,很多时候,人不如机

《立委科普:机器可以揭开双关语神秘的面纱》

《泥沙龙笔记:漫谈自动句法分析和树形图表达》

泥沙龙笔记:语言处理没有文法就不好玩了

泥沙龙笔记:parsing 是引擎的核武器,再论NLP与搜索

泥沙龙笔记:从 sparse data 再论parsing乃是NLP应用的核武器

【立委科普:NLP核武器的奥秘】

【立委科普:语法结构树之美】

【立委科普:语法结构树之美(之二)】

【立委科普:自然语言理解当然是文法为主,常识为辅】

语义计算沙龙:从《知网》抽取逻辑动宾的关系】

【立委科普:教机器识英文】

【立委科普:及物、不及物 与 动词 subcat 及句型】

泥沙龙笔记:再聊乔老爷的递归陷阱

【泥沙龙笔记:人脑就是豆腐,别扯什么递归了】

泥沙龙笔记:儿童语言没有文法的问题

《自然语言是递归的么?》

从 colorless green ideas sleep furiously 说开去

Parsing nonsense with a sense of humor

【科普小品:文法里的父子原则】

Parent-child Principle in Dependency Grammar

乔氏 X 杠杠理论 以及各式树形图表达法

【泥沙龙笔记:依存语言学的怪圈】

【没有语言结构可以解析语义么?浅论 LSA】

【没有语言结构可以解析语义么?(之二)】

自然语言中,约定俗成大于文法教条和逻辑

泥沙龙笔记:三论世界语

泥沙龙笔记:再聊世界语及其文化

泥沙龙笔记:聊一聊世界语及老柴老乔以及老马老恩

《泥沙龙笔记:NLP component technology 的市场问题》

【泥沙龙笔记:没有结构树,万古如长夜】

Deep parsing:每日一析

Deep parsing 每日一析:内情曝光 vs 假货曝光

Deep parsing 每日一析 半垃圾进 半垃圾出

【一日一parsing: 屈居世界第零】

【研发随笔:植树为林自成景(10/n)】

【deep parsing:植树为林自成景(20/n)】

【deep parsing:植树为林自成景(30/n)】

语义计算沙龙:植树为林自成景(40/n)】

【deep parsing 吃文化:植树为林自成景(60/n)】

【deep parsing (70/n):离合词与定语从句的纠缠】

【deep parsing (80/n):植树成林自成景】

【deep parsing (90/n):“雨是好雨,但风不正经”】

【deep parsing (100/n):其实 NLP 也没那么容易气死】

3. 关于NLP抽取

【语义计算沙龙:知识图谱无需动用太多知识 负重而行】

【立委科普:信息抽取】

《朝华午拾:信息抽取笔记》

泥沙龙笔记:搜索和知识图谱的话题

《知识图谱的先行:从Julian Hill 说起》

《有了deep parsing,信息抽取就是个玩儿》

【立委科普:实体关系到知识图谱,从“同学”谈起】

泥沙龙笔记: parsing vs. classification and IE

前知识图谱钩沉: 信息抽取引擎的架构

前知识图谱钩沉: 信息体理论

前知识图谱钩沉,信息抽取任务由浅至深的定义

前知识图谱钩沉,关于事件的抽取

钩沉:SVO as General Events

Pre-Knowledge-Graph Profile Extraction Research via SBIR (1)

Pre-Knowledge-Graph Profile Extraction Research via SBIR (2)

Coarse-grained vs. fine-grained sentiment extraction

【立委科普:基于关键词的舆情分类系统面临挑战】

【“剩女”的去向和出路】

SBIR Grants

4.关于NLP大数据挖掘

“大数据与认识论”研讨会的书面发言(草稿)

【立委科普:自动民调】

Automated survey based on social media

《立委科普:机器八卦》

言多必露,文本挖掘可以揭示背景信息

社媒是个大染缸,大数据挖掘有啥价值?

大数据挖掘问答2:会哭的孩子有奶吃

大数据挖掘问答1:所谓数据完整性

为什么做大数据的吹鼓手?

大数据NLP论

On Big Data NLP

作为公开课的大数据演讲

【立委科普:舆情挖掘的背后】

【立委科普:所谓大数据(BIG DATA)】

【科研笔记:big data NLP, how big is big?】

文本挖掘需要让用户既能见林又能见木

【社媒挖掘:《品牌舆情图》的设计问题】

研究发现,国人爱说反话:夸奖的背后藏着嘲讽

立委统计发现,人是几乎无可救药的情绪性动物

2011 信息产业的两大关键词:社交媒体和云计算

《扫了 sentiment,NLP 一览众山小:从“良性肿瘤”说起》

5. 关于NLP应用

【河东河西,谁敢说SMT最终一定打得过规则MT?】

【立委科普:NLP应用的平台之叹】

【Bots 的愿景】

《新智元笔记:知识图谱和问答系统:how-question QA(2)》

《新智元笔记:知识图谱和问答系统:开题(1)》

【泥沙龙笔记:NLP 市场落地,主餐还是副食?】

《泥沙龙笔记:怎样满足用户的信息需求》

立委科普:问答系统的前生今世

《新智元笔记:微软小冰,人工智能聊天伙伴(1)》

《新智元笔记:微软小冰,可能的商业模式(2)》

《新智元笔记:微软小冰,两分钟定律(3)》

新智元笔记:微软小冰,QA 和AI,历史与展望(4)

泥沙龙笔记:把酒话桑麻,聊聊 NLP 工业研发的掌故

泥沙龙笔记:创新,失败,再创新,再失败,直至看上去没失败

泥沙龙笔记:parsing 是引擎的核武器,再论NLP与搜索

立委科普:从产业角度说说NLP这个行当

【立委科普:机器翻译】

立委硕士论文【附录一:EChA 试验结果】

社会媒体(围脖啦)火了,信息泛滥成灾,技术跟上了么?

2011 信息产业的两大关键词:社交媒体和云计算

再说苹果爱疯的贴身小蜜 死日(Siri)

从新版iPhone发布,看苹果和微软技术转化能力的天壤之别

非常折服苹果的技术转化能力,但就自然语言技术本身来说 ...

科研笔记:big data NLP, how big is big?

与机器人对话

《机器翻译词义辨识对策》

【立委随笔:机器翻译万岁】

6. 关于中文NLP

【新智元:parsing 在希望的田野上】

语义计算沙龙:其实 NLP 也没那么容易气死

【deep parsing (70/n):离合词与定语从句的纠缠】

【立委科普:deep parsing 小讲座】

【新智元笔记:词的幽灵在NLP徘徊】

《新智元笔记:机器的馅饼专砸用心者的头》

【新智元笔记:机器的馅饼(续篇)】

【新智元笔记:parsing 汉语涉及重叠的鸡零狗碎及其他】

【新智元笔记:中文自动分析杂谈】

【deep parsing:“对医闹和对大夫使用暴力者,应该依法严惩" 】

【让机器人解读洪爷的《人工智能忧思录》(4/n)】

【让机器人解读洪爷的《人工智能忧思录》(3/n)】

【让机器人解读洪爷的《人工智能忧思录》(2/n)】

【让机器人解读洪爷的《人工智能忧思录》(1/n)】

《新智元笔记:找茬拷问立氏parser》

【新智元笔记:汉语分离词的自动分析】

《新智元笔记:与汉语离合词有关的结构关系》

《新智元笔记:汉语使动结构与定中结构的纠缠》

《新智元笔记:汉语parsing的合成词痛点》

《新智元:填空“的子结构”、“所字结构”和“者字结构“》

【沙龙笔记:汉语构词和句法都要用到reduplication机制】

钩沉:博士阶段的汉语HPSG研究 2015-11-02

泥沙龙小品:小词搭配是上帝给汉语文法的恩赐

泥沙龙笔记:汉语牛逼,国人任性!句法语义,粗细不同

泥沙龙笔记:汉语就是一种“裸奔” 的语言

【NLP笔记:人工智能神话的背后是汗水】

【立委随笔:中文之心,如在吾庐】

汉语依从文法 (维文钩沉)

《立委科普:现代汉语语法随笔》

“自由”的语言学至少有三种理论

应该立法禁止切词研究 :=)

再谈应该立法禁止切词研究

中文处理的迷思之一:切词特有论

中文处理的迷思之二:词类标注是句法分析的前提

中文NLP迷思之三:中文处理的长足进步有待于汉语语法的理论突破

专业老友痛批立委《迷思》系列搅乱NLP秩序,立委固执己见

后生可畏,专业新人对《迷思》争论表面和稀泥,其实门儿清

突然有一种紧迫感:再不上中文NLP,可能就错过时代机遇了

社会媒体舆情自动分析:马英九 vs 陈水扁

舆情自动分析表明,谷歌的社会评价度高出百度一倍

方寒大战高频情绪性词的词频分析

方韩大战的舆情自动分析:小方的评价比韩少差太多了

研究发现,国人爱说反话:夸奖的背后藏着嘲讽

立委统计发现,人是几乎无可救药的情绪性动物

研发笔记:粤语文句的情报挖掘

《立委随笔: 语言学家是怎样炼成的》

《立委科普:汉语只有完成体,没有过去时》

《科研笔记:中文图灵试题?》

立委统计发现,汉语既适合吹嘘拍马亦长于恶意构陷

比起英语,汉语感情更外露还是更炽烈?

科研笔记:究竟好还是不好

《科普随笔:汉字和语素》

《科普随笔:汉语自动断词 “一次性交500元”》

《科普随笔:“他走得风一样地快” 的详细语法结构分析》

【立委科普:自动分析 《偉大的中文》】

《立委随笔:汉语并不简单》

语言学小品:结婚的远近距离搭配

中文处理的模块化纠结

【立委科普:《非诚勿扰》中是谁心动谁动心?】

曙光在眼前,轻松过个年

挺反自便,但不要欺负语言学!

当面对很烦很难很挑战的时候

创造着是美丽的

汉语依从文法 (维文钩沉)

《新智元:挖掘你的诗人气质,祝你新年快乐》

7. 关于NLP社会媒体舆情挖掘的实践

【语义计算沙龙:sentiment 中的讽刺和正话反说】

【喋喋不休论大数据(立委博文汇总)】

【新智元笔记:再谈舆情】

舆情挖掘系统独立验证的意义

【社煤挖掘:雷同学之死】

《利用大数据高科技,实时监测美国总统大选舆情变化》

世人皆错nlp不错,民调错大数据也不会错

社媒大数据的困境:微信的风行导致舆情的碎片化

从微信的用户体验谈大数据挖掘的客户情报

社媒挖掘:社会媒体疯传柴静调查,毁誉参半,争议趋于情绪化

奥巴马赢了昨晚辩论吗?舆情自动检测告诉你

全球社交媒体热议阿里巴巴上市

到底社媒曲线与股市曲线有没有、有多少相关度?

再谈舆情与股市的相关性

【『科学』预测:A-股 看好】

舆情挖掘用于股市房市预测靠谱么?

大数据帮助决策实例:《走进“大数据”——洗衣机寻购记》

【社媒挖掘:外来快餐店风光不再】

【社媒挖掘:中国手机市场仍处于战国争雄的阶段】

世界杯是全世界的热点,纵不懂也有义务挖掘一哈

【大数据挖掘:方崔大战一年回顾】(更正版)

【大数据挖掘:转基因一年回顾】

【大数据挖掘:“苦逼”小崔2013年5-7月为什么跌入谷底?】

【大数据挖掘:转基因中文网络的自动民调,东风压倒西风?】

【大数据挖掘:转基因英文网络的自动民调和分析】

只认数据不认人:IRT 的鼓噪左右美国民情了么?

继续转基因的大数据挖掘:谁在说话?发自何处?能代表美国人民么

关于转基因及其社会媒体大数据挖掘的种种问题

【美国网民怎么看转基因:英文社交媒体大数据调查告诉你】

【社媒挖掘:必胜客是七夕节情侣聚餐的首选之地?】

【社媒挖掘:大数据时代的危机管理】

测试粤语舆情挖掘:拿娱乐界名人阿娇和陈冠希开刀

【社媒挖掘:不朽邓丽君】

【社媒挖掘:社会媒体眼中的李开复老师】

【社媒挖掘:糟糕透顶的方韩社会形象】

社媒挖掘:关于狗肉的争议

社媒挖掘:央视的老毕

社媒挖掘:老毕私下辱毛事件再挖掘

大数据淹没下的冰美人(之一)

大数据淹没下的冰美人(之二)

大数据淹没下的冰美人(之三): 喜欢的理由

大数据淹没下的冰美人(之四): 流言蜚语篇(慎入)

大数据淹没下的冰美人(之五): 星光灿烂谁为最?

【社媒挖掘:成都暴打事件中的男司机和女司机】

【社媒挖掘:社会媒体眼中的陳水扁】

【社媒挖掘:社会媒体眼中的李登輝】

【社媒挖掘:馬英九施政一年來輿情晴雨表】

【社媒挖掘:臺灣政壇輿情圖】

【社媒挖掘:社会媒体眼中的臺灣綠營大佬】

舆情挖掘:九合一國民黨慘敗 馬英九時代行將結束?

社会媒体舆情自动分析:马英九 vs 陈水扁

社媒挖掘:争议人物方博士被逐,提升了其网路形象

方韩大战高频情绪性词的词频分析

方韩大战的舆情自动分析:小方的评价比韩少差太多了

社媒挖掘:苹果CEO库克公开承认同志身份,媒体反应相当正面

苹果智能手表会是可穿戴设备的革命么?

全球社交媒体热议苹果推出 iPhone 6

互联网盛世英雄马云的媒体形象

革命革到自身头上,给咱“科学网”也挖掘一下形象

两年来中国红十字会的社会媒体形象调查

自动民调Walmart,挖掘发现跨国公司在中国的日子不好过

【社媒挖掘:“剩女”问题】

【舆情挖掘:2013央视春晚播后】

【舆情挖掘:年三十挖一挖央视春晚】

新浪微博下周要大跌?舆情指数不看好,负面评价太多(疑似虚惊)

【大数据挖掘:微信(WeChat)】

【大数据解读:方崔大战对转基因形象的影响】

【微博自动民调:薄熙来、薛蛮子和李天一】

【社媒挖掘:第一夫人光彩夺目赞誉有加】

Chinese First Lady in Social Media

Social media mining on credit industry in China

Sina Weibo IPO and its automatic real time monitoring

Social media mining: Teens and Issues

立委元宵节大数据科技访谈土豆视频上网

【大数据挖掘:中国红十字会的社会媒体形象】

【社媒挖掘:社会媒体眼中的财政悬崖】

【社媒挖掘:美国的枪支管制任重道远】

【舆情挖掘:房市总体看好】

【社媒挖掘:社会媒体眼中的米拉先生】

【社会媒体:现代婚姻推背图】

【社会媒体:现代爱情推背图】

【科学技术之云】

新鲜出炉:2012 热点话题五大盘点之五【小方vs韩2】

【凡事不决问 social:切糕是神马?】

Social media mining: 2013 vs. 2012

社会媒体测试知名品牌百度,有惊人发现

尝试揭秘百度的“哪里有小姐”: 小姐年年讲、月月讲、天天讲?

舆情自动分析表明,谷歌的社会评价度高出百度一倍

圣诞社媒印象: 简体世界狂欢,繁體世界分享

WordClouds: Season's sentiments, pros & cons of Xmas

新鲜出炉:2012 热点话题五大盘点之一【吊丝】

新鲜出炉:2012 热点的社会媒体五大盘点之二【林书豪】

新鲜出炉:2012 热点话题五大盘点之三【舌尖上的中国】

新鲜出炉:2012 热点话题五大盘点之四【三星vs苹果】

社会媒体比烂,但国骂隐含舆情

肮脏语言研究:英语篇

肮脏语言研究:汉语篇(18岁以下勿入)

新年新打算:【社媒挖掘】专栏开张大吉

8. 关于NLP的掌故趣闻

【立委随笔:文傻和理呆的世纪悲剧(romance tragedy)】

【把酒话桑麻,MT 产品落地史话】

【泥沙龙笔记:从机器战胜人类围棋谈开去】

遭遇脸书的 Deep Text

泥沙龙笔记:创新,失败,再创新,再失败,直至看上去没失败

泥沙龙笔记:把酒话桑麻,聊聊 NLP 工业研发的掌故

【 IT风云掌故:金点子起家的 AskJeeves 】

今天的Ask.com

《语义三巨人》

《朝华午拾:在美国写基金申请的酸甜苦辣》

看望导师刘倬先生,中国机器翻译的开山鼻祖之一

【朝华午拾集锦:立委流浪图】

【立委随笔:流浪的概念网络】

【朝华午拾:安娜离职记】

知识图谱的先行:从 Julian Hill 说起 》

《朝华午拾:创业之路》

《朝华午拾 - 水牛风云》

《朝华午拾:用人之道》

《朝华午拾:欧洲之行》

《朝华午拾:“数小鸡”的日子》

《朝华午拾:一夜成为万元户》

《朝华午拾:世界语之恋》

《朝华午拾:我的考研经历》

80年代在国内,社科院的硕士训练使我受益最多

科研笔记:开天辟地的感觉真好

《朝华午拾:今天是个好日子》

【朝华午拾:那天是个好日子】

10 周年入职纪念日有感

《立委随笔: 语言学家是怎样炼成的》

说说科研立项中的大跃进

围脖:一个人对抗一个世界,理性主义大师 Lenat 教授

《泥沙龙笔记:再谈 cyc》

围脖:格语法创始人菲尔墨(Charles J. Fillmore)教授千古!

百度大脑从谷歌大脑挖来深度学习掌门人 Andrew Ng

冯志伟老师以及机器翻译历史的一些事儿

《立委随笔:微软收购PowerSet》

NLP 历史上最大的媒体误导:成语难倒了电脑

立委推荐:乔姆斯基

巧遇语言学上帝乔姆斯基

[转载]欧阳锋:巧遇语言学新锐 - 乔姆斯基

【科普小品:伟哥的关键词故事】

不是那根萝卜,不做那个葱

【随记:湾区的年度 NLP BBQ 】

女怕嫁错郎,男怕入错行,专业怕选错方向

据说,神奇的NLP可以增强性吸引力,增加你的信心和幽会成功率

【立委科普:美梦成真的通俗版解说】

【征文参赛:美梦成真】

【创业故事:技术的力量和技术公司的命运】

把酒话桑麻,再泡一壶茶,白头老机译,闲坐说研发

MT 杀手皮尔斯 (翻译节选)

ALPAC 黑皮书 1/9:前言

《眼睛一眨,来了王子,走了白马》

职业随想曲:语言学万岁

立委随笔:Chomsky meets Gates

钩沉:《中国报道》上与导师用世界语发表的第一篇论文

钩沉:《中国报道》上用世界语发表的第二篇论文

贴身小蜜的面纱和人工智能的奥秘

有感于人工智能的火热

泥沙龙笔记微博议摘要

【泥沙龙笔记:没有结构树,万古如长夜】

【泥沙龙笔记:机器 parsing 洪爷,无论打油或打趣】

老革命遇到新问题,洪爷求饶打油翁

我要是退休了,就机器 parse 《离骚》玩儿

《朝华午拾》总目录

【置顶:立委NLP博文一览(定期更新版)】

立委NLP频道

《李白119:本体知识库结构体系散谈 》

【立委按】大疫当前,学问缓行,尤其是非主流的“学问”。此集可算是“闭关隔离”的副产品吧,绝对小众。然而,就题论题,本体体系结构的话题却的确是涉及AI知识系统核心的基本话题,虽然体味个中滋味者不为多数。

 

白:“颜色”与“红”的关系,和“红”与“大红、深红、砖红、朱红、玫瑰红…”的关系,是一样的吗?

颜色是属性名,红是属性值,大红、深红、砖红、朱红、玫瑰红…是细化属性值。属性值-细化属性值的关系,和属性名-属性值的关系,要区别对待。

李:那自然。本体知识库(ontology), 如 HowNet(《知网》), 就是这么区分的。属性值属于逻辑形容词,有自己的 taxonomy (上下位链条)。属性名属于逻辑名词,其直接上位是抽象名词。属性名与其相应的属性值是一一对应的关系。如,【味道】 与 “酸甜苦辣” ,【气味】与“香、臭 …”,【形状】 与 “方、圆、菱形、三角、多角 …”,等等。

白:那还有没有“属性”这个语义范畴?另外就是“宿主”挂在谁那儿?挂在属性名?属性值?还是属性?

李:【属性】可以置于 【颜色】、【形状】 … 与 【抽象名词】 之间。

白:我不是这个意思。我是说,既然分别有了属性名和属性值,那还需要有属性么?如果不需要,那宿主跟谁?

李:逻辑形容词(属性值|AttributeValue)属于逻辑谓词(Predicate),谓词挖坑。

白:这就是不要属性了。

李:【形状】类逻辑形容词挖坑,要求【物体】。所以,本体上可以说,“桌子是圆的”;不能说,“思想是圆的”。违反常识本体的,只能是比喻:“圆的思想”,真要说的话,大概是指思想的 “圆滑、中庸”。

白:这个案件的凶手是张三,杀害李四的凶手是张三,其凶手是张三。“凶手”是“角色名”,能否得到“属性名”的类似待遇?

N/X,当X匹配动词萝卜时,是具体事件在填坑;在X匹配名词萝卜时,是抽象事件在填坑。抽象事件是具体事件的指称性概括。具体事件还可以进行陈述性概括。红之于大红,就是陈述性概括;颜色之于红,就是指称性概括。is-a无法区分指称性概括和陈述性概括。

李:那就是两条线上的 ISA,两个不同角度,所以一个儿子应该允许有两个或多个老子。本体知识库中的taxonomy理应如此,可以认定其中一个是主链条,其他的是附加链条。

“凶手” 与 “张三” 的对应,与【属性名】与【属性值】的对应不同。前者是种类(角色)与专名的关系,都属于逻辑名词。后者是逻辑名词与逻辑形容词的 “跨类别” 对应关系。

白:“这张桌子的颜色是红的。” 

桌子究竟填“颜色”还是“红”还是两者都填?“这张桌子的颜色有点红。” 填谁?桌子填颜色,颜色填红?还是桌子填both?

如果颜色的坑是“物体PhysicalObject”,红的坑也是,那么颜色就无法填红的坑。大小S就有问题。

“象鼻子有点长”vs.“桌子颜色有点红”

“象鼻子长度有点长”,虽然啰嗦但并不违反语法。

“桌子腿儿颜色有点红”,部件和属性名,句法地位类似,语义上还有问题。桌子腿儿,输出直接就是另一个对象了。颜色,输入是物体,输出是属性名;红,输入是物体,输出是属性值。属性,应该是<属性名,属性值>二元组。红的输入不是属性名。这个二元组之一可以default,如果从值到名不混淆的话。但是“红”还有“人气高”的意思,跟另一个属性名“人气”还勾勾搭搭。于是,“这个歌手有点红”,虽然歌手也是物体,但更是公众人物。

李:小s “颜色” 是大 S “桌子腿儿” 的 aspect,谓词“有点红”要求大S填坑,与小s构成总分对应关系;句法上,小s类似于 PP 状语“论color”。

白:腿儿是中s,桌子是大s。

李:由于总分的对应关系属于常识,是记忆在静态的本体知识中,因此小s实际上是冗余信息。这就说明了为什么我们觉得 “桌子腿儿颜色有点红” 啰嗦,其实际语义就是“桌子腿儿有点红”。

白:是值到名映射单一,不用看是不是常识。“颜色不太对劲儿”当中的“颜色”就不能省。

李:值到名映射单一,就是常识,是最简单的分类型常识:红是一种颜色。这种常识在 ontology 中是必须表达的,没有新意,不具有情报性。

白:这是系统自身就能确定的事实,不需要借助于常识机制。

李:总之都在 ontology 里面。前者是概念分类,属于事实,毋庸置疑;后者是趋向性常识,常有例外。【动物】吃【食物】,例外是,“某个动物吃了石头”。

白:把“红”换成“深”试试:这张桌子腿儿颜色深。“深”的坑,谁来填?“这张桌子腿儿颜色过深”,“这张桌子腿儿颜色太深”。“这张桌子腿儿颜色过红”,“这张桌子腿儿颜色太红”,红的坑,谁来填?

属性名和值同时出现在一个合法的句子里,是绕不过去的。总要说明白,是怎么填坑的。“这张桌子腿儿颜色太红”语义上不等于“这张桌子腿儿太红”。不仅可以是“红的程度太甚”而且还可以是“太偏向于红”。

在ontology里,不仅要给名和值各自以相应的地位,还要给它们的坑赋予相应的本体标签。

李:“颜色”分“深浅”,“腿儿”分“高矮、粗细”。

白:高矮是“高度”这个属性名下的值,粗细是“径向大小”这个属性名下的值。说起来跟红和颜色的关系都一样,不能厚此薄彼。

李:【属性名】、【属性值】、【物体】是个三角关系。可以利用【属性名】作为桥梁,具有概括性。但是,【属性名】与【物体】的对应是静态本体知识,没有情报性,属于ontology里面对 schema 定义中的 type appropriateness 的描述。而【属性值】填的萝卜,是动态的知识,这才属于语言理解得出的情报。

白:“颜色深”就有情报了,深不是属性值。“颜色花哨”“颜色怯”“颜色俗”都不是属性值,都有情报性。

李:这是层次纠缠。“深”、“浅”、“花哨”、“俗”、“怯”,当然也是【属性值】

白:不是具体颜色,怎么说是属性值?

李:【属性值】的萝卜对象不应该只局限于【物体】呀。这儿其萝卜不再是具体【物体】,而是抽象的东西,即【物体】的一个侧面【颜色】。再如,【程度】、【垂直高度】等抽象概念也一样论“深浅”的。

白:等等,宿主都变了。是对颜色的comments。垂直高度是属性值。

李:具体的垂直高度,譬如“深、浅、高、矮”是【属性值】,但“垂直高度”本身则是【属性名】。

白:这里的逻辑不顺,满是问题。

李:没有问题。如果误读,那是层次纠缠的干扰。

逻辑名词分为具体与抽象,深浅描述的对象是抽象名词。

白:“逻辑名词”并不是本体概念吧。

李:是。是本体概念链条处于顶端(TOP)的一个节点。

白:董老师叫“万物”。

李:对,董老师命名为 【thing|事物】,下面有【抽象】,也有【具体】,【具体】下面有【PhysicalObject】。【thing】,我称之为逻辑名词,属于跨语言的本体概念。

白:在本体文献里不常见。

李:叫什么名不重要,实质就是,语言的POS各有不同,但背后的概念本体其实也有对应的东西。【thing】 就是【逻辑n】,【AttributeValue】 就是【逻辑a】

白:“行为”算不算thing?“红”算不算thing?

“红是一种象征革命的颜色”,“那是一种非常大气的红”。

李:不算,【行为】是【逻辑v】,“红”是【ColorValue】,属于【逻辑a】。上例的“红”是逻辑形容词到了具体语言以后名物化,成为名词了,但本体概念是恒定不变的,依然是【逻辑a】。

白:eat算不算“行为”的实例?

李:eat 算【行为】,是【逻辑v】。到了具体语言以后,譬如英语,“eating”借助形态 -ing,就是 thing了,属于抽象名词。

白:不应该是两个义原。处理为两个义原会遇到很多问题,一定是一个。

李:对,本体里面不应该是两个义原,因此“eat”作为概念,永远是逻辑动词,“红”永远是逻辑形容词。有个简单的办法解决这个问题,词典里面的本体分类是一个,但句法分类可以变换。这种变换在形态语言里面用的是形态,非形态语言可用零形式根据上下文来决定。eat 作为概念就是逻辑v,但在具体语言使用中成为词的时候,可能是 POS N 或者 POS V。

白:可以往指称和陈述两个方向概括,所以thing是指称性概括的总根子。下面通过抽象事件、抽象性质、抽象行为,可以平滑过渡到具体事件、具体性质、具体行为。陈述性概括的总根子,应该也有一个。

eat通过“行为”也会被thing罩住才对。正如“红”通过“颜色”也会被thing罩住。指称和陈述的分叉口是通过句法提供的。底下是一套人马,上面是两块牌子。不做成这样,会有巨大的麻烦。句法结构强制,可以分叉。范畴词(属性名)也可以分叉。

李:对呀。异曲同工,英雄所见,大原则都是相同的,具体表示(representation)层面的技术性差异而已。

白:“红这种颜色在中国股市里表示涨,在西方股市里表示跌”。

范畴词就是命名ontology非叶子节点的词。

李:范畴词,软件界叫做“保留字”。保留字是元概念,但自然语言也有实际的词汇对应它。

从表示手段看,只要允许一个儿子有两个老子,ontology 就好办了。

白:DAG

李:对。“红”的上位是【ColorValue】,属于【AttributeValue】 (我叫它逻辑a);“红”的另一个上位是【颜色|Color】。

白:万物,其中就包括事件,这是根本。

李:也许这要问爱因斯坦了 LOL

白:就好像,程序的代码也是数据,打冯诺依曼起就这么玩儿了。程序的执行是另一回事儿。事件的发生/展开/执行,也是另一回事儿。

李:纯粹从形式表示看,不过就是个命名问题。假设【万物】就是唯一的 TOP,TOP 下面还是 n a v。

白:n a v 并不是TOP的直接子节点。颜色下面才有红,行为下面才有eat。颜色、行为,我这里叫“范畴词”,往上都是【万物】,往下才分n v a,范畴词是分叉点。

李:也行,也许更自然。其实不过是原来 n下面的抽象子类中的成分,被提升了一个节点而已,让它们作为桥梁通向TOP。不觉得有本质变化,需要用到的一子多父的链条都在。

【颜色】(ColorValue)、【形状】、【外貌】、【品性】等等与TOP之间,应该有一个节点 叫 AttributeValue (逻辑a)。链条大体是这样的:

红 --》 颜色 --》attribute --〉TOP
英俊 --》外貌 --》attribute --〉TOP
eat --》action --》behaviour --〉TOP
桌子 --》家具 --》产品类 --》物体 --》具体 --》thing --〉TOP

白:对。

李:换汤不换药。在我看来,顶部概念有三,thing 就是逻辑n,behaviour 就是逻辑v,attribute(i.e. AttributeValue) 就是逻辑a。

白:问题是,下面的这些边并不都是is-a

李:至于在他们上面再加一个 TOP 统领,那是一个哲学的观点,不是一个实用的需求。

白:不是的。不是这么统领的。属性、状态、关系相互独立,但都有可能是形容词。

李:红 --》 ColorValue --》AttributeValue(逻辑a) --》Predicate(谓词);红 --》Color --》AbstractObject --》thing(逻辑n)

就是让“红”有两个老子:ColorValue 是属性名,属于逻辑a;而 Color 是属性类,属于逻辑n,

白:这盏灯很亮,说的是属性。这盏灯真亮,说的是状态。

李:为什么要这么细分?

白:作为属性的亮,说的只是某种定性或定量的亮度指标,但灯并不必然处于点亮状态。作为状态的亮,是真实点亮了的,其亮度是可感的。后者可以推出灯的点亮状态,前者不能。不是说有两个“亮”的词条或义原,而是说往上走有两个岔路。通往属性和通往状态各有不同。

李:就句子论句子,多数人没有这种区分吧。“很”、“真”都是程度副词。

白:不好说。多数人还没语法概念呢,但是该区分的都区分了。可以设计问卷。我相信多数人都推的出。

李:顺便说一句,30年前董老师刚开始酝酿 HowNet 的时候,我们正好在中关村的高立公司有半年多在一起做项目,董老师谈 HowNet 的设想。当时对董老师主张的逻辑语义以及本体知识网络这些学问觉得特别有兴趣。可是回到宿舍在纸面上想把思路理清楚,很快就觉得跌入了语义学的深渊,一头雾水。很快产生一种畏难情绪。那时刚入行,历练不够,实践也不足,只得知难而退了.... 30年后算是坐享其成了。

白:我不认为hownet可以达到让人坐享其成的程度了。

李:哈 各人要求不同吧。前面提到对颜色、属性之类 HowNet 都 encode 进去了。还有很多很细的分类和梳理的工作以及体系建设。我觉得是自成体系、自圆其说,比较 comprehensive 的了。

白:这都是应有之义,但远远不够。作为数字版的辞书,很好。作为可计算的基础设施,还有改进的空间。

李:自然可以改造使用。举个例子。

hownet 把 Attribute 与 AttributeValue 分开,命名方式一致,但是是两个岔。这在客观上造成了 features 数量 double 了的结果。在采用的过程中,觉得虽然这样一来【属性名】(逻辑名词)与【属性值】(逻辑形容词)从 category 角度是分清楚了,但是多了这么多 features 感觉不必要,累赘。于是做了如下变通:

颜色:color category
红色:color attribute

二者共用了 color 这个 feature。其区分可以用 features 之间的 AND 来表示。如果照搬 HowNet,词典标注大体是这样的:

颜色:ColorAttribute
红色:Color

至于 ColorAttribute 与 Color 的对应关系,那是在 HowNet 内部联系的(除了命名的助记效果外)。经过改造,都用 color 以后,这种关系就直接体现在词典的 features 中了。

好处是 HowNet 基本上把概念梳理出来了,这里不过是做了实用主义的技术性改造。一个语言的词汇表中,表示 atrribute value 的逻辑形容词,远远多于 表示其种类的词。有几百个表示颜色的词,但“颜色”本身只有一两个词(“颜色”、“色彩”)。为后者另外命名一套 features 感觉很不合算,也不方便。

白:本来就是某种意义上的“上位”。

李:一个是直接来一条竖线串联下来,而董老师是中间插了一条横线,等价于一个儿子两个老子,表示手段不同。一横一竖也不是没有道理。毕竟 “玫瑰红” 到 “红” 的 ISA 关系 与 “红” 到 “颜色” 的 ISA 不是同类的上下位。

白:值与名的关系不是严格意义上的上下位关系。横过来当然是可以的。这是指称性和陈述性的分叉,与一般的多爹不同。

李:实际应用中,这种区分没什么必要。何况需要区分的时候,还是有办法区分,多一个feature(而不是重复几十个平行的对应 features)就齐了。

白:看是谁家的实际应用了。

“陈述性义原的指称性概括”,或者叫“跨域上位”。

李:对,跨类、跨层次的关联。这就好比概念与“元”概念的区别一样。一不留神,可以引起层次纠缠。可以说“红太阳”、“白太阳”,甚至“黑太阳”,不能说 “颜色太阳”。(搁文革时候,提“红太阳、白太阳、黑太阳”,立马打成现行反革命呢,绝对逃不过的。时代还是进步了。)

白:动词也有同样的问题

另外就是同样在名词这边,角色名,是从属于事件的,是事件折射回来的。比如一开始提到的“凶手”。“凶手”从属于“杀人”事件,杀人事件可以跨域追溯到上位名词“案件”,于是“凶手”也可以间接从属于“案件”。也就是说,一个具体事件的坑,可以被它的上位抽象事件所继承。

李:“杀人” 有个【agent】 坑,这个坑的 type 是 【human】,如果细分的话,就是 【凶手】。

【凶手】 --》【肇事者】--》human

“杀人”(名物化)指的是一种案件,案件是事件,“杀人”的坑里面的萝卜,自然就是案件/事件中的角色。

白:我不认为HowNet在这些方面提供了ready的计算机制。

李:有空可以细看一下,我觉得 HowNet 做得很细,应该把“案件”与“杀人” 关联了,“杀人”与“凶手”关联了。至于这些关联的计算机制,有什么函数可以调用,这些方面,HowNet 的确不强,至少是不好用。

白:问题杀人是动词,案件/事件是名词,跨域了。如果不揭示这个动词到名词的概括关系,就没有理由给名词挖一个关联的坑。

我们的处理,“凶手”是N/X,分母上的X填动词萝卜时,就是具体事件的角色名;填名词萝卜时,就是抽象事件的角色名。角色名和属性名,应该用类似机制处理,这才简明好用。在实例层面能做到,和在表示层面、机制层面能做到是不一样的。“凶手”是agent的实例,或者某个下位。

李:对。类似的角色还有“受害者”、“受益人”,甚至“施事”、“受事”、“对象”这些词所对应的概念。这些都是元概念,恰好与逻辑语义系统内部的角色定义【施事】、【受事】等相交了。

查“凶手”的定义:凶手乃是杀人之施事。“刺客” 是 “凶手” 的细分,“凶手”是“施事”的细分。

白:我们叫范畴词,颜色、长度、程度……,也都是。

引入了名-值体系,对ontology意味着什么?我看到的是:打开了横向跨域关联的通道。不仅“事件”本身可以通向“万物”,就连配属于“事件”的“角色”也可以通向“万物”,在其中找到概括自己的抽象物。这才符合冯诺依曼的原则:程序也是数据。

实际上,细化属性值(如“砖红、翠绿”等)很少直接作谓语,更多的是作定语,也就是说用法类似北大体系里的“区别词”。修饰语对被修饰语的要求与约束,与“坑”属于同一个数据类型。与“坑”不同的是,它会在修饰语与被修饰语的结合中,把这些要求和约束传递给被修饰语,这个传递过程有点像“合一(unification)”。作为一个特例,当修饰语升格时,这些要求和约束会传递给作为升格结果的那个零成分。

“坑”本身也有要求和约束,在填坑时反向传递给萝卜,萝卜如果可以再复用,这些反向接受来的标签可以像自己从词典里带来的标签一样使用。比如“我吃的”,会从坑里接收Food标签。

我们把修饰语携带的对潜在被修饰语要求和约束的标签集合体称为“修饰目标”,生造了一个词Modee。一个修饰语,自身有一套语义标签,又为修饰目标准备了一套语义标签。自身的语义标签是双轨制的:一方面指向自己的上位属性值,另一方面指向自己的对应属性名。上位属性值仍在谓词领域,属性名就跨越到了体词领域。这不同于一般的多爹,是跨域多爹。

李:修饰目标与谓词目标(逻辑主语)在形式逻辑上是统一的,都是挖了一个目标坑,期望同一类型的萝卜。

乔姆斯基句法也做了类似本体语义的抽象,谓语的句法主语与名词的定语,被认为都处于所谓 specifier 的 position,具有某种结构同质性。

作为典型的修饰语,形容词就是挖了这么个需要主语或被修饰语的坑。至于形容词中的子类“区别词”(“男”、“女”等),不能做谓语,只能做修饰语,那是语言内部的某种句法约束习惯,不是逻辑语义层面的约束。区别词在中文不能做谓语,并不代表在其他语言不能做谓语。但无论做谓语还是修饰语,其本体对于目标的要求是跨语言的。世界语中,就可以说:

la vir-o est-as vir-a
(the man is male)

la vir-o vir-as
(the man male-s)

说明:世界语形态中,-o 是名词,-a 是形容词,-as 是谓语(现在时)。这些都是本体外语言层面的东西。

这样看来,应该用另一个feature或其他方式来区别谓语和修饰语,而在本体逻辑层面它们都是是同一个挖坑者(谓词)。

作为逻辑谓词的形容词,在句法结构中做了谓语还是修饰语,是本体静态知识外的情报。这种由句法结构而来的信息区分,也是语义理解的一部分,也必须在语义结构的解析图中反映出来,但并不影响谓词挖坑者对目标萝卜的本体约束方面的统一要求。

白:N+和S/N究竟使用哪一个标签,可以在词法阶段解决,也可以在句法阶段解决。这不是问题。

作补语和作定语就不一样:喝 好酒 vs 喝好 酒

李:形式逻辑比较粗暴或粗陋,前者就是:喝(酒)& 好(酒);后者则是:好(喝(酒))。当然不同。不同的原因是“好” 太广谱:挖的坑针对的目标可以是体词,也可以是谓词。

白:“红 太阳”也好,“太阳 红”也好,“红”所对应的句法标签“N+”和“S/N”可以同时存在,交给句法去选择。语义标签则是同一套。“太阳 红”中如果“红”取N+会导致dead end。而“红 太阳”中,修饰操作优先级本来就高于填坑操作。所以选择下来没难度。词典里语义标签是同一套数据。但在构建N+成分和S/N成分时,标签数据的装载方式略有不同。

李:词典信息给多个约束 features 是自然的,本来这些信息也都是针对潜在关系对象的。等到实现的时候(走了一个结构路径的时候),另一条路往往自然堵死。

白:相反的情况是走了一条死路时,活路的优先级自然处于当前最高位。只要分析过程中用过的成分允许再用。

李:词典信息中的语义本体的挖坑信息( semantic expectation features )应该是同一的,是句法的句型信息(syntactic subcat features)各有不同。expectation 与 subcat 是两套,是对于遣词造句的两个不同维度的约束条件。前者是跨语言的约束,后者才是具体语言的约束。所谓基于知识的解析(knowledge-based parsing),说到底就是从 semantic expectation 出发,看语言如何以某个 syntactic subcat pattern 来实现。因为人就是这么从思想外化为语句的,深度解析再现了这个逆过程,平衡了句法和语义两个维度 的约束。

白:形容词是二元化处理(N+和S/N),动词是一元化处理(S/*)。动词作定语通过降格实现,而且是白名单制,需要特定条件满足才激活。

李:中文经典结构歧义案例是:“学习文件”,“炒鸡蛋”。从本体约束看,“文件” 是可以被“学习”的,才可以做被修饰语(即NP的中心词),表示是“(所/要)学习(的)文件”。

白:炒鸡蛋当菜名可以,炒苏北草鸡蛋当菜名就差意思了。

李:如果是 “学习 x”,则不可能是定中结构,只能是动宾结构。因为 x 未定,没有本体信息,作为白名单不满足萝卜的约束。但它却在黑名单之外,符合要求。

同理,“炒 x”只能是动宾。如果是 “炒【food】”,在中文就歧义了。

白:扩展的food也不灵,只能是动宾。

李:这种结构歧义,源于本体语义对于arg的坑与对于 modee 的坑,约束完全相同,而恰好句法的词序约束(动在宾前,定在中前)也同时符合两种结构的要求。为了消歧,必须在本体约束外找细琐的条件或heuristics,譬如音节数pattern(2-2pattern,1-2pattern更多是定中结构,2以上的N趋向于是动宾结构),是否开放还是可以死记(定中结构作为菜名,开放性不如动宾结构),以及萝卜本身的结构特点(是裸萝卜N 还是穿衣的萝卜 Noun Group:有定语特别是长定语的N,差不多都是宾语),等等。

白:死记和开放有不同的优先级。

 

【相关】

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

《李白宋118:多层处理为 heuristics 的实现提供了广阔空间 》

白:“老师批评的是我”

问题:升格以后的空范畴,具备建立Hidden links的资格吗?看图上,填“老师”名词坑的应该是“我”才对。填空范畴总有点那个。

李:最终应该得出SVO 才对:老师/S - 批评/V - 我/O, 不管用什么中间links和手段, 因为人的理解如此。其实从 pattern 角度,通向最终目标的路径还是蛮清晰 。

以前提过,的字结构 与 英语 what-clause 类似,本质都是 NP+定从,定从中阙如的 arg 通常是主语或宾语。所缺的角色一旦有同位语或be结构(或其他的结构)相连,其算元(无论主宾)拉过去,深层逻辑语义svo也就确定了。

宋:能不能分解成两个任务。一个任务是把复杂句变成两个简单句的某种逻辑关系的组合,另一个任务是分析简单句。
老师批评的是我
{老师s 批评v Φ}and{Φs 是v 我o}
他眼睛哭肿了
{他s 哭v}and{[他m 眼睛h]s 肿v}
我帮他打圆场
{我s 帮v 他} mode{我s 打圆场v} //A mode B表示B为A的方式
我帮他打官司
{我s 帮v 他o}grw{他s 打官司v}//A grw B表示B是A的背景

有的原始问题并非词间依存所能说清楚的,还涉及到命题间的逻辑关系。而且,如此处理可以避免图结构,完全是树结构。

{老师s 批评v Φo}and{Φs 是v 我o}

他眼睛哭肿了
{他s 哭v}rst{[他m 眼睛h]s 肿v}//A rst B表示B是A的结果

李:图结构表示比较简练,但也不是没有缺点,缺点就是层次不够清晰。树结构层次清晰,缺点是表达力有限。

宋:但是不清楚,把论元关系与逻辑关系混起来了。因此应分解成两个任务。本来就是性质不同的任务。

李:利用树结构的层次性,加上 coreference 互指关联或做等价的节点复制,然后用逻辑算符把树结构联系起来, 从理论上说是一个更好的语义表示方法:逻辑语义单纯、完整,而且不失层次性。

宋:是的。

李:依存图结构表示可以看成是一个缩略版。

宋:原句就是一个紧缩句。

我帮他修车。
{我s 帮v 他o}and{我s 修v [他m 车h]o}

我帮他做家务
{我s 帮v 他o}and{我s 做v [他m 家务h]o}
我帮他做作业
(我s 帮v 他o} grw{他s 做v 作业o}

李:对。

白:图上建边的顺序是有结构意义的,“图+建边顺序”可以完美恢复层次。只做到一堆边的无序呈现是不够的。

另外,我说的例句里,有没有“是”并不关键。可以举出更多不包含“是”的例子:“老师批评的不包含他”“老师批评的只有他”“老师批评的除了他还能有谁”……。这些里面同样要弄出一个空范畴出来。

宋老师建议的,其实就是以谓词为中心的逻辑语义拆解。其实有了图,谓词为中心(面向过程)和体词为中心(面向对象)都是可以选择的。

李:与 “是” 无关,是字只是谓词结构的一种;与多层结构的模式处理有关,说的是各层次的 patterns 是清晰的。不同层面的解析,最终可以达到逻辑语义图的最终解。无需人为添加的空范畴。

白:刚才几个怎么提取?枚举吗?枚举我就“窃喜”了。

李:按章办事就成。多层模式解析,一个一个来。此类结构紧缩现象,我应该是已经处理过了。待会儿上机试试。

白:“前妻欠下的都算到他头上了”。试试没有空范畴怎么玩。

李:这么玩的:PS(短语结构) 搭架子,DG(依存文法)依据架子再做逻辑语义:老师-批评-我 的 SVO 就出来了。

白:图上的“的”不标“x”了?有进步。

“老师批评的我一条都没犯过”

“老师批评的(得)我哑口无言”

当“得”和“的”混淆时,这里会出伪歧义。

另外就是共指关系如果做“是且仅是”理解,逻辑上可能出现“白马非马”式的混乱。

宋:空范畴还是要的,关键问题是把复杂句拆成基本小句的逻辑组合,语义上相当于把复合命题拆成基本命题的逻辑组合。命题内的谓词论元关系和命题间的逻辑关系性质不一样。

白: “的”当修饰语时可以x,当升格的指称语时就不能再x,必须当个物件儿。没名字的物件儿,对应的就是空范畴。表达体系里区分了两种不同的“的”,后一种“的”其实就是变相的空范畴。

接着说共指的问题。“是”有三解,集合的包含关系、元素属于集合的关系以及等同关系。前两者都不是简单共指。

“他偷的是我的书”,“他偷的”和“我的书”不是共指(相等)关系,而是子集关系。“是”的右端只有在是个体的情况下才能是等同关系。因为此时包含和属于所确定的类型都不适用了。只剩下等同可以用。

“老师批评的是五班的学生” 就无法建立共指,因为不知道批评的是“五班的学生”的全部、部分还是个体。

宋:这两个"的"能否并成一个?"我的书","我的"是所有属于"我"的东西的集合, "书"是另一个集合,“我的书”是这两个集合的交集。

白:就算是个体,也还有“某一个(无定)”和“这一个(有定)”的差别。汉语此处无局部形式标记。@宋柔 “的”是未饱和坑提取和交集运算集于一身的形式标记。当运算对象缺位时,就只剩下未饱和坑提取一个职能了。

宋:有的时候不是交集,而是元素纳入集合。“说谎的匹诺曹”,“说谎的”是一个所有说谎者的集合,把“匹诺曹”加入这个集合之中。或者说,表示"匹诺曹“是这个集合的一个元素。

白:这又回到之前讨论的“聪明的一休”了。也可以理解为个体为唯一元素的集合与另一个集合的交集。

宋:忘了以前是怎么说的了。

白:@宋柔 限定性与非限定性。限定就是求交集,非限定就是给个体添加属性。

宋:不好这么说。交集可以是空,这里说的是该元素属于该集合。也可以。

白:@宋柔 个体在里面是公理。左面的集合只有“从了”的份儿。不属于也必须属于;过去不属于从现在开始也必须属于。

 

哈,“老师批评的”作了“我”的定语。

也没错。

被批评的事儿,在这里不是标配,标配又是明确在场的。

李:听到“也没错”,感觉 relieved

@白硕 同病相怜?

不过,还是想看看有什么系统的方法避免次优解,以求得最优解。

(传统)机器学习中很多算法 stuck 在 local 峰顶上,就是从算法上达不到全局最高峰,可见问题的普遍性。不知道深度学习有没有这个困扰。

人脑得到最优没有丝毫问题的。肯定有个机制直取最优,不得已而求其次。

想了想,线索之一是语言学的:代词虽然不完全拒绝定语从句,但是并非常态。

其实代词甚至带形容词定语都感觉“怪怪的”:“不得已的我”可以接受定语从句,“小小的我”也貌似别具一格,但“我”通常是独行侠的。

这种 heuristic 如何实现好呢?统计上看其痕迹是很明显的。下面这种情况下,不得已求其次就对了,但常规不是这样。

“(被)老师批评的我,无地自容。”

口语中还有个妥妥的“de字”纠缠: 老师批评得(de)我无地自容。为简化问题,不去论它。

在多层系统中实现这个heuristic的系统性方法之一就是,推后“定从+代词”的操作。把优先组合尽量让给“的”字前后的短语结构。按照这个多层思路试试。

啦啦啦 功成了 可见很多事还是太粗心,做系统怕就怕认真二字:

只是把代词定从推后,一切不变,水到渠成。当然严格说,“一条”应该挂到“的字NP”上,不过,“一条”这种很虚的量词,挂不挂没啥落地价值。只要知道 “一条都(也)”是一种强调性否定,就足够好了。

白:好歹人家是总分关系。

李:真地没啥价值。贡献不出“强调”以外的实际东西来。

白:代词不是本质,“老师批评的张三一条都没犯”,问题是绕不开的。

李:这么论语言,也可以说凡是 heuristics 都不是本质。这几乎就是 heuristics 的定义决定的。但我们都知道,对付语言这个 monster,heuristics 可能是一大法宝。统计模型能处理自然语言,也与 heuristics天然的统计性表现有关。

系统啥也没变就出来了。瞎猫撞了死耗子了?

非也,狗屎运也不是要有就有。

白:这不是代词的功劳了吧。

李:这是类似于代词 heuristic 的功劳。语言工作者都知道,专有名词的NP独立性可媲美代词,原来早就下意识 built into 系统了。普通名词就差一些:

 

 

就是说,专家做系统,heuristics 是下意识进入的,可能会有缺漏。缺漏也不怕,数据驱动,迟早会实现。关键是多层系统从机制上提供了优先级排序的广阔空间,使得不同的 heuristics 迟早体现出来。(图中有个bug,句法主语synS“问题”转成了逻辑 S,没转成 O。)

白:“老师教的学生一点儿都不会”。

李:这是真歧义。

解析歧义世界里面 90%以上是伪歧义,10%不到是真歧义。

(“学生”是“教”的 O 这个 hidden link 没连上,是个“待做事项”。)

一般而言,对于真歧义,因为其出现频率低,只要解析能在真歧义中得到其中一条,就暂时不再追求。解析关键是先堵住伪歧义泛滥。考察人对真歧义的理解,发现是因人而异的。很多人面对真歧义,脑子也是一根筋,只有一个解读,对另一个解读无感,往往是只有人提醒了才恍然。(语言学家除外。)

 

 

【相关】

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

 

《李白宋117:汉语连动兼语式句型的解析》

白:“帮”是个很怪的动词,格式像“兼语”,用起来却是“连动”。所以也是穿透。“我帮你做家务”当中,“你”做不做无所谓,反正“我”是要做的。

宋:@白硕 这个例子有意思。“我帮你做家务”按传统汉语语法来说好像算兼语句,“你”是“帮”的宾语,又是“做家务”的主语。但是,正如你所说,“你”未见得做家务,“我”肯定要做的。按照这样的语义分析,这个句子应当是连谓句,“帮你”和“做家务”是“我”的接续的谓语。
如果是“我帮你做作业”,一般来说“我"只起辅助作用,为你解释其中的难点,真正做作业的还是“你”。于是,这句话应当是兼语句。
当然,由此可见把“兼语”从“连谓”中分离出来,理论上是有问题的。不过即使不管术语,只看语义关系,还是有问题。在词形和词义没有改变的情况下,语义关系的分析要依赖于实际场景,这是很糟糕的事情。

李:如果留有空间 给实际场景的解读画个框 就可以避免这种糟糕局面。留有空间就是保持非确定性:连兼 == 连动|兼语。就是个打标的线条粗细而已。细线条看,这是结构歧义。粗线条看,没有歧义。不过是思维语言模糊性的自然反映而已。

宋:是的。只能承认这一现实,保留非确定性。“他帮老师擦黑板”就是歧义句。“帮”引起歧义,可能还有其他动词或句式引起歧义。

李:其实,“我帮你做作业” 的解读,不同人可能不同。我的解读偏向于“我”是“做作业”的主要人,“你”不过就是一个不得不面对作业责任但做不出来的人。

宋:“我”和“你”参与度的划分问题。语义分析碰到这种问题很可悲。不过好像很少遇到。要让机器知道该留有余地,不容易。“我帮他打圆场”,百分百是“我打圆场”,目的是“帮他”。

李:容易啊。

宋:依存的箭头怎么画?

李:我们的思维定势是把标注绝对化了。依存是图不是树。“连兼”画出来,没任何问题。所以我那本小书《自然语言答问》特别有一章,标题就是“深度解析是图不是🌲”。

宋:图也要有边呀。

李:待会儿我到电脑前画给您看。

宋:“我帮他写作业”,“他”和“写”之间有没有边?

李:有,兼语就是两个老爸,老爸“写”是逻辑主语S。

宋:如果“他”没写呢?

李:省略就留白呗。

宋:这条边也许应当画成虚线,表示可能有也可能没有。

“我帮他打官司”,“他”和“打官司”之间是实线;
“我帮他打圆场”,“他”和“打圆场”之间没有线。

李:每一条binary依存,道理上都不是绝对的,都是一种概率。 可能性多大 可能性要不要也标 怎样标(概率) 那是 representation 的考量。parser 不需要做那么确定。如果有应用场景的确需要确定,那就 在parse graph 后去做 ,可以做得很细琐 。但事实上 绝大多数场景根本不需要。多数时候,自然语言就是说者模糊说,听者模糊理解,没人深究。 

宋:我想大部分情形下,行为者与动词之间的关系存在与否应当是0/1问题。这里“帮”是个特例。“帮”肯定有“施惠”之意,有没有行为之义,要看行为动词。行为动词决定不了,再看场景。有些是模糊的,但还是一定有清楚的。“苏联帮朝鲜打美国。”

李:模糊还是确定是绣花的工作。要做可以做,但做了也白做为多数情形。关键是机制与表示上留下空间。

宋:我想还是要分出来模糊和清晰,不能让所有的关系都沦为模糊。

李:一切决定于落地 落地到应用如果模糊就够了,那就够了。如果不够,需要定义哪里需要更清晰更细线条,然后去做。如果落地目标不定,那就是一个资源与投入产出的拿捏问题了。

宋:供给侧应当有一个独立于应用场景的分析结果,其中大部分确定,少部分模糊,后者待场景确定后再看是否需要清晰化。

白:这不是多爹,是不明确給两个人当中的谁当爹。

李:多爹可以是表示手段,表示的是“异或(XOR)”,这样就可以在同一个数据流中表示 xor 的关系了 。英语 pp attachment 的典型结构歧义亦可如法炮制。至于挤在同一个数据流中可能引起的逻辑混乱,可以利用关系的不同标签来避免后果。譬如 mod 表示正牌修饰语,概率很大,mod2 表示候选修饰语,概率较小。pp attachment 处理中,可以根据上下文条件决定歧义不同边的强弱,譬如让mod与adv2(候选状语)配合,或者mod2与adv配合。还有其他的表示法。标签不过是一种内部约定,用的人知道怎么回事就可以了。这个设计思想 可以把宋老师想要表达的可能性在同一张图表示中涵盖住。S 是概率大的逻辑主语,S2 是概率较低的候选逻辑主语。二者通常是异或关系,只是可能性的差别。兼语不同,两个老爸是“逻辑与“ 而不是“逻辑异或”。这一套数据结构和表示的说法也是很多年实践中摸索出来的东西,很管用。拔高说,也是机制创新。

@宋柔 具体到您上面的案例,PS 树是这样的:

深度解析是图不是树,因此句法树改造为深度依存解析图如下:

“帮”与“做家务”连动(关系表示为C,Complement),“你”是兼语,既做“帮”的宾语(O),又做“做家务”的主语(S)。这不就在一张图中实现了“连兼”的语义表示了吗?

也许宋老师的理解中,“做家务”的 S(概率大的主语) 与 S2(概率小的主语) 应该对调,真要这样解析也没什么不可以,但我觉得这个很难说。这里的 S 与 S2 倒不是 XOR/OR 而是 AND。

白:坑和萝卜的关系相对刚性,一坑二萝卜是需要禁止的。谁是“事主”和谁是“施事”,大概率是重叠的,小概率有分歧。有分歧的时候,施事占逻辑主语坑,事主有一万种方法从语义上兜住。帮X,X就是“事主”。事主是否参与了施事,不是要点。要点是施事就是逻辑主语。那个S2可以妥妥地留给事主专用。我们的说法叫“再入”。再入就是非标配,但是有关联。介词也好,特殊本体标记也好都可以。

李:禁不了的。并列在逻辑上就是多个萝卜(填同一个坑)。句法上可以说并列的几个实体就是一个萝卜,但深度解析是 logical form。

白:并列可以认为是几个实体构成一个集合,集合填坑。这个不是问题。特殊动词在兼语或连动的情形下也可以提供再入的标签。这个都不是问题。问题是对S2的定性,不是施事,或者不关心是不是施事,而是事主。事主在句法上是借逻辑主语的坑存在,当施事和事主有分歧时,事主退出,借其他标记再入。

李:好像实际上也没那么大区别。就是个标签,叫什么都可以,相近的标签有细微差别。也都是系统内部的事儿。

白:事主是责任方。在问答等场景,需要区别对待。是不是亲自操刀无关紧要。缺省是亲自操刀,但是如果另有亲自操刀的出场,事主就退场好了。

李:法律上,好像对教唆犯比对事主惩罚更加严厉,LOL

白:教唆和帮,标记是不一样的。教唆的场景,被教唆的反而是施事。教唆的是事主。这需要在词典里把标签给好。

李:“教唆”与“帮”,在某个上位概念上归一。

白:嗯,都穿透到一个动作里。但是角色各有侧重。这就是某种归一吧。“张三教李四认字”,“李四”是“认字”的施事,“张三”是事主。

李:如果区别非常依赖于词汇的不同,细线条的语义工作就是词驱动了。

白:必须的。我们需要新时代的下一个“知网”。

李:这类词驱动的细琐工作,可以在粗线条句法把架子搭起来后去做,属于一种锦上添花的工作。

白:句法挖坑,词驱动填坑。句法大类相同而填不同的坑,说明词驱动会反作用于句法。好的句法在此应该预留这种可能性。把选择权留给词驱动。

李:句法后的词驱动模块可以:1 细化关系;2. 增加关系;3. 推翻关系(休眠唤醒)。细化就是把模糊的句法关系细化为逻辑语义关系。增加关系通常是挖掘隐藏的逻辑语义关系,常常是句法树无法表达的关系。休眠唤醒基本上就是推翻局部句法了。

白:我们的具体做法是,句法给出先验优先级,词驱动调整后产生后验优先级。分析器执行的时候,以后验优先级为准。

李:先验优先级就是标配,管大路货。

白:这里包含两个方面,依据后验优先级可以颠覆单纯依据先验优先级的分析结果,但是分析是句法语义同步进行的,所以单纯依据先验优先级的分析结果并没有产生的机会,当然也就无所谓颠覆。所以,并不是真有一个颠覆的动作。只是回头看,假如没有词驱动,会是那样;现在因为有了词驱动,所以结果是这样。

李:词驱动不会一下子就做全了的,是个过程。在没做全的时候,先验优先级就有机会实现了。

白:这种架构是把词驱动的约束,体现为后验优先级的Fine tuning,这就要“统一度量衡”。没做全的时候,只要有做了的部分,那部分就是使用的后验优先级。没做的部分用的就是先验优先级。大概率下,用先验优先级也死不了人。但是我们的先验优先级也是词驱动的,只不过是仅依据句法标签自带的先验优先级。所谓超越句法的词驱动,用的是其他的标签体系,比如本体标签体系、控制标签体系,甚至还有语种信息。比如,汉语和英语的介词禁止左填坑,日语的格助词禁止右填坑,英语谓词的左填坑个数不能多于1、多了就要等待后置定语从句的修饰,等等。这些都会由句法标签、语种标签、控制标签协同作用的方式决定后验优先级。控制标签不仅是词驱动的,还是解析过程驱动的,不同的解析动作,会精准地改变特定中间成分的控制标签。所以,这里面的关键技术是:1、“先验优先级”要足够强大到可以大概率兜底;2、设计合理的本体标签、控制标签和语种标签体系,体现它们之间对分析的协同作用;3、从先验优先级调整到后验优先级的幅度,要能够在“统一度量衡”的原则指导下,既能最大限度地发挥作用,又能最大限度地抑制副作用。

比如,“这所学校张三是校长”,如果不使用本体标签调整后验优先级,“张三”会去填“校长”的名词坑:

但是一旦使用了本体标签,就进行了后验优先级调整,结果长这样:

前者只是一个无所事事的大S,后者却是实实在在的宿主,有明确的领属对象。这就是词驱动的威力。实际上我们是禁掉了词驱动的本体标签,才得到前面那个结果。分析器实际运行的时候,直接就产生后面的结果,前面的根本不出现,中间过程中也不出现在前一个结果中,“张三”填“校长”的坑,在特定的阈值设置下,是可以避免的,但是这样做就会误伤很多很多本来可以做出来的Hidden Links可以看出,纯句法在这种情况下非常难做,里外不是人但是有了后验优先级,就完全不同了。有些性质是词典本身没有,在分析的过程中借助其他词负载的信息传播过来的。比如,“高兴”并不负载“带自由补语”的信息,但是“得”有。“得”(+S)携带的这个信息不是自己用的,而是传递给被它修饰的S用的。一旦完成S与+S的结合,新的S就具有了“可携带自由补语(没有字数和本体限制那种)”的控制标签。对于紧随其后的S成分,就有了通向Merge操作的可能性。平常Merge操作是实行白名单控制的。成分所处的特殊位置,也是控制标签的来源之一。比如处于句末,处于反向修饰隔离墙下,都可以获得特殊的控制标签,进而驱动后验优先级的计算。

宋:@白硕 你试试这几个例子:
我帮他做家务,我帮他做作业,我帮他打圆场,我帮他打官司

白:宋老师,都长一个样:

词驱动主要是“帮”这里不一样,两个做,和两个打,没区别。我们并不把离合词合成一个词,打圆场,打官司,都是两个词。

宋:问题在于,“打官司”的是“他”,不是我;“打圆场”的是“我”不是“他”。"打官司“我”只是后台帮忙,“打圆场”是我直接行动。

白:在后一动词没有区别那么细。

李:“打圆场”,詞驱动的话,可以把 “帮/替/为/给” 当成介词格变的条件,填个【受益者】的逻辑语义坑,就齐了。“帮”作为谓词,被覆盖了,或者说,被降格为介词了。结构的伪码模式如下:

PP("帮|帮助|为|替|给" NP) "打圆场" --》 VP

这是动词退化为副动词(介词)的实例,与 “给他唱歌” 同理。

动词“帮”降格为介词

白:X帮,不是帮X。如果有左填坑的介词倒是像。这里要单独处理。

宋老师要的是“介词宾语做施事、主语做帮事(我瞎起的名字)”,而不是主语做施事。这和“给他唱歌”完全不同。

李:基本合理。是“我”为了“你”在“打圆场”。细究“打官司”可以另论(是“你”在“打官司”,“我”在过程中“帮”到“你”),虽然其实 “打官司” 同类处理的话,也不无合理之处:是“我”(律师吧)为了“你”在“打官司”。

宋:麻烦在于,这是词之间的二元关系,不是词的一元性质。甚至是3元关系:帮-打-官司/圆场。

白:帮X,X是惠格,这个有。X帮,是友情赞助,没有。

宋:一元性质直接进词库,二元、三元关系麻烦大了。

白:宋老师要的是,你做打官司的施事,我还要填个非标配的语义坑。我这里目前没有准备这个坑。

宋:"打官司”别人不能直接下手,“打圆场”自己不能下手。这是这两个词的本意决定的。这种词义描述也许太精细,但在落地场景(争吵以致发展到诉讼)中却是必要的。就是连谓和兼语的区分。

白:现在从“帮”这个位置上的动词定义控制标签没有问题,在“打官司”这个位置上怎么定义控制标签,需要仔细考虑一下。

contributor,献格。用来描述宋老师说的那种帮办角色,不知是否合适。首先语义上要有这个格,然后对填入这个格的语义萝卜在类型上有什么要求,再然后通常在句法上处于什么位置。这些都有了就可以加进来。

“张三找李四去坦白交代”之前曾经讨论过这个例句。坦白交代有三个角色,谁,向谁,交代什么。这里的人物暂时跟第三个坑都没有牵扯。看“找李四”,无疑李四是两个Human坑当中的一个,假设张三是另一个。但是也有可能张三是编外的非标配坑,比如上面那个contributor,张三是公安局派来给李四传话的,他既不是谁,也不是向谁。这就出现第三个歧义。为坦白交代这件事只是贡献了一个“找”的动作,仅此而已。

宋:是的,“坦白”有3个论旨,但“帮”就只有两个论旨,“打圆场”和“打官司”都只有一个论旨。
我帮他打官司:他打官司,我帮他。
我帮他打圆场:我打圆场,我帮他。

这里帮的语义涉及词的二元甚至三元关系,我觉得这种词是很有限的,因此不会带来知识需求的暴增。不过从中也看出,离合词还是作为整体处理比较好,免得增加关系的元数。文本中凡分开的离合词应当尽量在句法分析前把它们合起来,虽然不可能全部做到。

白:就“坦白交代”而言,很有意思的是,如果它的主动发起方找相对方或者相对方找主动发起方,都是可以的。但是第三方,只能找主动发起方,而不能在主动发起方不在场的情况下直接“找”相对方。

找到一个涉及三人的动词:“登记结婚”:“张三找李四去登记结婚”。

第一,张三是男方,找女方去登记处登记结婚;第二,张三是女方,找男方去登记处登记结婚;第三,张三是男方,李四是登记处的;第四,张三是女方,李四是登记处的;第五,张三是登记处的(有点勉强),李四是男方;第六,张三是登记处的,李四是女方;第七,张三是第四方,李四是男方;第八,张三是第四方,李四是女方。就算男方女方完全对称不加区分,至少也有四重歧义。同样道理,如果张三是第四方,那么李四不可能是登记处的,只可能是婚姻双方之一。

李:我觉得这些带入了场景需求的歧义,不是文法层面的消歧问题,应该属于“伪歧义”。标配无歧义,到了具体篇章或场景,推翻了标配解读也是可以的。那是解析器后续模块的事儿了。

 

【相关】

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

 

丹尼尔·马尔科维茨:生活如何成为一场无止境的可怕竞争

立委按:一个繁荣无比的现代社会 结果是没有人真正快乐。输者输 赢者其实也输了。这种社会肯定是站不住的。问题是 看到现代社会问题的 越来越多 越来越切实。但解决方案是一个很大的问题。但如果连问题都不面对 又有什么希望解决它呢?作者说,不能坐视精英社会不平等最后走向社会崩溃,总是要做点什么。既然现代化 全球化 资本主义化 精英化 没有带给人类更美好的社会,那么其他的路线都是可以考虑的选项了:包括川普的保护主义和建造大墙;包括桑德斯的社会主义;也包括杨的ubi方案。还有其他什么出路?

精英社会把成就看得比其他一切都重要,这让每个人——甚至富人——都很痛苦。也许有出路。

The Atlantic 杂志 2019年九月刊
丹尼尔·马尔科维茨
耶鲁法学院教授,《精英陷阱》的作者

1987年夏天,我从得克萨斯州奥斯汀的一所公立高中毕业,前往东北去耶鲁。然后,我花了将近15年的时间在不同的大学学习——伦敦经济学院、牛津大学、哈佛大学,最后是耶鲁法学院——一路上获得了一系列学位。今天,我在耶鲁大学法学院教书,那里的学生与我年轻的自己惊人地相似:他们绝大多数都是职业父母和高水平大学的产物。我把自己老师给我的优势传授给他们。他们和我都把我们的繁荣和种姓归功于精英选拔制度。

20年前,当我开始写关于经济不平等的文章时,精英制度似乎更像是一种对于不平等的疗法,而不是一种原因。精英制度的早期倡导者支持社会流动性。例如,20世纪60年代,耶鲁大学校长金曼·布鲁斯特(Kingman Brewster)将精英录取引入大学,明确目标是打破世袭精英。校友们一直认为他们的儿子有与生俱来的权利跟随他们去耶鲁;现在,未来的学生将根据成绩而不是家庭背景来获得入学许可。精英选拔制度——有一段时间——用才华横溢、勤奋努力的局外人取代了自满的局内人。

今天的精英仍然声称通过才能和努力,使用对任何人开放的手段来取得进步。然而,在实践中,精英制度现在将狭隘精英之外的所有人都排除在外。哈佛大学、普林斯顿大学、斯坦福大学和耶鲁大学从收入分配最高的1%家庭招收的学生总数超过了收入分配最低的60%的家庭。校友子女优先、裙带关系和彻头彻尾的欺诈继续给富有的申请者带来腐败优势。但是,偏向财富的主要原因还是要追溯到精英选拔制度本身。平均来说,父母年收入超过20万美元的孩子在SAT考试中比父母年收入4万到6万美元的孩子高出250分。来自最贫困的三分之一家庭的每200个孩子中只有一个达到耶鲁的平均SAT分数。与此同时,顶级银行和律师事务所,以及其他高薪雇主,几乎完全从少数精英大学招聘。

勤劳的局外人不再享受真正的机会。根据一项研究,每100个出生在最贫困的五分之一家庭的孩子中只有一个会侪入前五分之一的富裕阶层,每50个出生在中产阶层的五分之一家庭的孩子中只有不到一个会加入前五分之一。绝对经济流动性也在下降——自本世纪中叶以来,中产阶级孩子收入超过其父母的可能性已经下降了一半以上——中产阶级的下降幅度大于穷人。精英选拔制度将这种排斥定义为达不到标准,给经济伤害增加了道德侮辱。

公众对经济不平等的愤怒经常针对精英机构。皮尤研究中心称,近五分之三的共和党人认为大学对美国不利。今年早些时候大学入学丑闻引发的强烈而广泛的愤怒引发了一场深刻的怨恨。这种愤怒是合理的,但也是扭曲的。对裙带关系和其他不光彩的精英优势形式的愤怒——这种行为含蓄地宣扬精英理想。然而精英制度本身是一个更大的问题,它正在摧毁美国梦。精英制度创造了一种竞争,即使每个人都按规则行事,也只有富人才能赢。

但是,富人到底赢了什么?即使精英制度的受益者现在也因为它的要求而受苦。它诱捕富人就像它排斥穷人一样肯定,正如那些设法爬上顶峰的人必须拼命工作,无情地利用他们昂贵的教育来获取回报一样。

没有人应该为富人哭泣。但是精英制度给他们带来的伤害既真实又重要。诊断精英制度对精英的伤害会带来治愈的希望。我们习惯于认为减少不平等需要给富人增加负担。但是因为精英制度下的不平等事实上对任何人都没有好处,所以逃离精英制度的陷阱实际上会让每个人受益。

精英们在幼儿时期首先面临精英压力。父母——有时不情愿,但觉得别无选择——让他们的孩子报名接受精英教育,这种教育不是以实验和游戏为主,而是以培训和技能或人力资本的积累为主,其宗旨是被精英大学录取,并最终获得一份精英工作。纽约、波士顿和旧金山等城市的富裕家长现在通常要向10所幼儿园提出申请,进行一系列评估和面试——所有这些都是为了精英幼儿园评估4岁儿童的申请。申请精英中学和高中重复了这一磨难。贵族儿童曾经陶醉于他们的特权,精英儿童现在是“计算”他们的未来——他们通过各种自我展示的仪式,踩着雄心、希望和担忧的节奏为精英之路无休止地计划自己。

学校鼓励孩子们这样操作。例如,在东北的一所精英小学,一名教师贴出了一个“每日问题”,学生们在回家之前必须解决这个问题,尽管没有给他们留出时间来解决这个问题。这项练习的目的是训练五年级学生通过多任务处理或牺牲休息时间来榨取他们附加的学习时间。

这种要求是需要付出代价的。精英初中和高中现在通常布置每晚需要三到五个小时的作业。疾病控制和预防中心的流行病学家警告说,学校作业会导致睡眠不足。富裕学生比贫困学生表现出更高的吸毒和酗酒率。他们也遭受抑郁和焦虑的折磨,其比率是全国同龄人的三倍。最近对硅谷一所高中的研究发现,54%的学生表现出中度至重度抑郁症状,80%的学生表现出中度至重度焦虑症状。

尽管如此,这些学生还是有充足的理由像这样鞭策自己。几十年前接受30%申请者的精英大学现在只接受不到10%。某些院校的变化甚至更加引人注目:芝加哥大学直到1995年还录取了71%的申请者。2019年,它承认其录取率不到6%。

当精英进入职场时,竞争会加剧。在职场中,精英机会只被抓住机会所需的竞争努力所超越。一个财富和地位依赖于人力资本的人在选择工作时根本不能考虑自己的兴趣或爱好。相反,她必须把工作当作一个从人力资本中获取价值的机会,尤其是如果她想要足够的收入来为孩子购买保证自己优秀品质的精英教育。她必须致力于一个狭窄的高薪职位,集中在金融、管理、法律和医学领域。贵族一度认为自己是一个休闲阶层,而精英阶层则以前所未有的强度工作。

1962年,当许多精英律师的收入大约是他们现在收入的三分之一时,美国律师协会可以自信地宣布,“普通律师每年大约有1300个收费小时”。相比之下,2000年,一家大型律师事务所同样自信地宣称,“如果管理得当”,2400个计费小时的配额“并非不合理”,这是“希望成为合伙人所必需的”的委婉说法。因为不是律师工作的所有时间都是收费的,所以2400小时的收费很容易要求一年中每周从早上8点到晚上8点工作6天,没有假期或病假。在金融领域,“银行家的工作时间”——最初是以19世纪到20世纪中期银行规定的10到3(上午10点到下午3点)的工作制命名的,后来更普遍地被用来指代任何轻松的工作——现在已经被讽刺性地命名为“银行家9到5”,是从这一天早上9点开始,一直持续工作到第二天早上5点。精英管理者曾经是“组织人”,被终身雇佣束缚在公司等级制度中,奖励资历高于业绩。今天,一个人在组织结构图上爬得越高,她被期望工作得越努力。亚马逊的“领导原则”要求管理者“坚持不懈地保持高标准”,并“交付成果”。公司告诉经理们,当他们在工作中“碰壁”时,唯一的解决办法就是“爬上墙”。"

每周工作超过60小时的美国人报告说,他们平均希望每周少工作25小时。他们这么说是因为工作使他们遭受“时间饥荒”。一项2006年的研究发现,这影响了他们与配偶和孩子建立牢固关系、维持家庭、甚至过上令人满意的性生活的能力。哈佛商学院(Harvard Business School)最近一项高管调查的一名受访者自豪地坚称,“我晚上给孩子们的10分钟比花在工作上的10分钟伟大一百万倍。”只有十分钟!

优雅地或至少冷静地承受这些时间的能力已经成为精英成功的标准。一家大公司的一名高管接受了社会学家阿丽·拉塞尔·霍奇奇德(Arlie Russell Hochschild)为其著作《时间捆绑》的采访。她观察到,展示了自己技能和奉献精神的有抱负的经理面临着的“最终淘汰赛”是这样的: “有些人会火冒三丈,变得古怪,因为他们一直在无休止地工作……而高层的人非常聪明,工作得像疯子一样,而且不会火冒三丈。他们仍然能够保持良好的心态,保持家庭生活在一起。最终是他们赢得了比赛。”

一个从自己的人力资本中获取收入和地位的人,完完全全是把自己置于老板的支配之下——为了工作他必须耗尽自己。精英学生极度害怕失败,渴望那些传统的成功标志,即使他们看穿并公开嘲笑那些仅仅是“金星”和“闪亮的东西”。就精英员工而言,他们发现越来越难通过工作来追求真正的激情或获得意义。精英制度将整代人囚困在被贬低的恐惧和不真实的野心中: 总是饥饿,但从来没有找到,甚至不知道正确的食物。

精英阶层不应该——他们也没有权利——期待那些被排除在精英特权和利益之外的人的任何同情。但是忽视精英制度对富人的压迫也是一个错误。富人现在不是无所事事地而是费尽心力地统治着社会。曾经批判贵族不平等的常见论点,并不适用于基于努力和技能回报的经济体系。这位每周工作百多个小时的银行家的不懈努力,使她免受不劳而获的指控。那么,更好的办法是说服富人,他们所有的工作并没有真正得到回报。

他们可能不需要你想象的那样去说服他们。随着精英阶层的精英陷阱越来越收紧,富人自己也开始反对现行制度。要求工作/生活平衡的悲哀呼声越来越高。大约三分之二的精英员工表示,如果新工作需要更多的精力,他们会拒绝升职。当拉里·克莱默还是斯坦福法学院院长时,他警告毕业生,顶级律所的律师们陷入了一个似乎永无止境的循环: 更高的工资需要更多的计费时间来支持他们,更长的时间需要更高的工资来证明他们的合理性。他哀叹道,这个系统服务于谁的利益?有人真的想要吗?

逃离精英陷阱并不容易。精英们自然会抵制那些有可能削弱他们优势的政策。但是现实是,如果不压榨自己,使自己的内心生活变得贫瘠,就不可能从自己的人力资本中致富,而那些希望拥有自己的蛋糕并吃掉它的精英其实是在欺骗自己。建立一个让更广泛的人群能够获得良好教育和工作的社会——这样,爬到最高层就不那么重要了——是缓解现在驱使精英们坚持自己地位的压力的唯一途径。

如何做到这一点?首先,教育——其利益目前集中在为富裕父母苦练孩子——必须变得开放和包容。除非私立学校和大学的学生中至少有一半来自收入分配最底层三分之二的家庭,否则它们应该失去免税地位。公共补贴应该鼓励学校通过扩大招生来满足这一要求。

一个平行的政策议程必须改革职场,重点扶持那些无需经过精心培训或没有高学位的工人所生产的商品和服务。例如,卫生保健系统应该强调公共卫生、预防保健和其他主要由执业护士监督的措施,而不是需要专科医生的高科技治疗。法律系统应该部署“法律技术人员”——并非所有人都需要法学博士——来管理日常事务,如房地产交易、简单遗嘱,甚至是无争议的离婚。在金融领域,限制外来金融工程并支持小型地方和地区银行的法规可以将工作转移给中等技能的工人。管理层应该接受将控制权分散到高管之外的做法,以增强公司其他人的权能。

克服精英不平等的主要障碍不是技术上的,而是政治上的。今天的情况引发了不满和普遍的悲观情绪,可以说近乎绝望。政治学家杰弗里·温特斯在他的著作《寡头政治》中调查了从古典时期到20世纪人类历史上的各个时代,并记录了将收入和财富集中在一个狭窄的精英阶层中的社会的变化轨迹。几乎在所有情况下,这种不平等的消除都伴随着社会崩溃,譬如,军事失败(如罗马帝国)或革命(如法国和俄罗斯)。

然而,还是有希望的。历史的确清晰地展示了从集中的不平等中有序复苏的一个例子: 在20世纪20年代和30年代,美国通过采用新政框架来应对大萧条,新政框架最终建立起本世纪中叶的中产阶级。至关重要的是,政府再分配不是这一进程的主要引擎。政府建立的广泛共享的繁荣主要来自于一个促进经济平等而非等级制度的经济和劳动力市场——通过大幅扩大受教育机会,如《GI 法案》,将中等技能的中产阶级工人置于生产中心。

这些安排的更新版本今天仍然可用;教育的重新扩张和对中产阶级工作的重新重视可以相互加强。精英阶层可以收回闲暇时间,以换取收入和地位的降低,而这是他们可以轻松承受的。与此同时,中产阶级可以重新获得收入和地位,重居美国生活的中心。

重建民主经济秩序将是困难的。但是经济民主给每个人带来的好处证明了这一努力的合理性。不去应对可能导致的社会暴力崩溃让我们别无选择,只能尝试。

这篇文章改编自丹尼尔·马尔科维茨即将出版的书《精英陷阱》。它出现在2019年9月的印刷版上,标题是“精英制度的悲惨赢家”

搜狗机器翻译 译自:How Life Became an Endless, Terrible Competition

摘选老友芒果的评论,说得非常到位:

精英选拔制度不仅加剧贫富分化,阻碍阶层流动,而且身处其中的精英也深受其害:为了维持从自身人力资本中得来的财富和社会地位,他们得忍受超长工作时间,对自我兴趣自我表达的压抑,与家人关系的稀薄。(文中只提过一句而没有展开的是,这种高度倾扎的环境得来的利益并未如表面看那么美好。诚然数字上精英与大众薪酬差距越来越大,精英的社会环境也与大众越来越区隔,但正因为教育回报率高,社会环境区隔厉害,薪酬大部分是花在bid up positional goods,如学区房,如各种显示身份地位的消费品。如果大家不bid up,这些positional goods也属于这些人,不过代价少得多。所以disposable income没有看起来那么多)。

但这是个囚徒困境,谁先放弃谁输的,所以这个既得利益者也受害的制度的改革势在必行,否则只会迎来社会各阶层的离心。可惜作者提出的制度改革比较天真,nurse practitioners和legal technician代替医生和律师做一部分简单工作或许可行,但社会中,像这类硬性准入制度严苛的职业其实不多。强行用区域金融机构代替大行只为中低技能人士提供工作机会更是天真得可怕,我对这种理想主义戒心比对现状的不满还要强烈些。

但有没有希望呢?我觉得现在的技术条件是有的。精英选拔制度的基石,是winner-take-all,是符合狭窄一揽子选拔标准中的佼佼者能广泛的服务一大群人。但如此的“效率”并非我们的天性,我们天性中渴求知识,渴求推进认知的极限,渴求自我表达,渴求真实的人际关系,渴求与自然,与本土的连接,渴求有缺陷的美,如果社会价值鼓励多元化(真实的多元化,不是口号),相信大部分人都能寻得安身之所。

社会制度相应的变化,就是一个强健的安全网络,能容忍各种试错,能护扶年轻人的勇往直前不怕跌倒,让what doesn’t kill you makes you stronger不仅是一句鸡汤而能理直气壮成为他们的信念。当然,在美国,一个很重要但一直被忽略的,就是社会对基础研究的投入,想想如果当初的bell labs在美国到处开花。。。聪明的年轻人不用只往花街律师医生这几行里面挤了。

立委后记:

Great great thesis.  Right to the point on problems of modern society.  Is the solution feasible ?

一个繁荣无比的现代社会 结果是没有人真正快乐。输者输 赢者其实也输了。这种社会肯定是站不住的。问题是 看到现代社会问题的 越来越多 越来越切实。但解决方案是一个很大的问题。但如果连问题都不面对 又有什么希望解决它呢?

所谓左派的抬头或流行 与其说是人们认同他们 不如说是人们不能接受/忍受现状。既然现代化 全球化 资本主义化 没有带给人更美好的社会 那么其他的路线都是可以考虑的选项了:包括川普的保护主义和建造大墙;包括桑德斯的社会主义;也包括杨的ubi方案。还有什么出路呢?作者说,不能坐视精英社会不平等最后走向社会崩溃,总是要做点什么。

但这位象牙塔教授的作者还是太过书生气。她在诊断和刻画过度竞争的现代精英社会的社会矛盾和道德不平等方面,力透纸背。但在提供方案方面,简直是天真,看不出任何可行性,还不如摇唇鼓舌的政客。譬如,她说 精英阶层既然不幸福 不堪重负,那就退一步 少拿钱,把机会分给中下层一些。她建议说 社会应该下放一些工作。感冒发烧不值得去看医生,可以改去看赤脚护士。大体就是这个思路。道理是有的 没有实现的切实路线。

相关:

原文:How Life Became an Endless, Terrible Competition

精英陷阱

搜狗机器翻译

miserable-winners/594760/

杨安泽的UBI答问:作为自由红利的全民最低收入保障

华裔民主党总统候选人杨安泽 (Andrew Yang)在其网站解答了有关其竞选纲领UBI的种种问题。借助有道机器翻译后稍加编辑,分享如下:

华裔民主党总统候选人杨安泽 (Andrew Yang)

自由红利的定义

在未来的12年里,每3个美国工人中就有1个面临着因新技术而失业的风险,而且与以往的自动化浪潮不同,这次新工作的出现速度不够快,数量不够多,无法弥补这一损失。为了避免前所未有的危机,我们必须找到一个新的解决方案,这与我们以前所做的任何事情都不同。这一切都始于自由红利,这是所有美国成年人的普遍基本收入,没有任何附加条件,是建立一个稳定、繁荣和公正社会的基础。

什么是自由红利(freedom divident)

自由红利是全民基本收入(UBI:Universal Basic Income)的一种形式,是一种社会保障,在特定的治理人口范围内为每个公民提供一定数量的资金,而无需通过考试或满足工作要求。每个UBI计划在数量或设计上都可能不同。

杨安泽将在2020年以民主党人身份竞选总统,以实现自由红利。他为美国提出的这种形式的UBI是一套每月1000美元,或每年12000美元的保证付款,支付给所有18岁以上的美国公民。是的,这意味着你和你认识的每个人每月都能从美国政府那里得到1000美元,没有问题。

为什么杨安泽想要在美国实施自由红利?

杨安泽希望实现自由红利,因为我们正在经历世界上有史以来最大的技术变革。到2015年,自动化已经摧毁了400万个制造业工作岗位,世界上最聪明的人现在预测,未来12年,三分之一的美国劳动者将因自动化而失业。我们目前的政策还不足以应对这场危机。甚至我们最具前瞻性的政治家也没有做好准备。

随着技术的进步,工人们将能够停止从事最危险、重复和枯燥的工作。这应该会让我们感到兴奋,但是如果美国人没有收入来源——没有能力支付食品杂货,没有能力买房,没有能力为教育存钱,也没有能力建立一个有信心的家庭——那么未来可能会非常黑暗。我国目前的劳动参与率只有62.7%,几十年来的最低水平,每5名劳动年龄人口中就有1人不在就业市场。随着自动驾驶汽车和其他技术的出现,这将变得更加糟糕。

由简单的增值税资助的自由红利将保证所有美国人都能从自动化中受益,而不仅仅是大公司。自由红利将为美国人提供基本生活所需的资金,同时使我们能够找到更好的工作、创业、重返校园、照顾我们所爱的人或为下一个机会而努力。

有关杨安泽为何如此坚定地相信自由红利的更多信息,请阅读他的著作《对普通人的战争》。

谁将在杨安泽的计划中获得自由红利?

每个18岁以上的美国公民每月都可以免费领取1000美元,无论其收入或就业状况如何。无任何附加条件。是的,这意味着从2021年1月开始,你和你认识的每个人每月都会收到1000美元的支票。

在你现在的收入基础上,如果再加上每月1000美元,你会怎么做?让我们找出答案。

我们如何支付自由红利?

这可能比你想象的要容易。杨安泽提议通过整合一些福利项目和实施10%的增值税来资助自由红利。目前的福利和社会项目受益人将在他们目前的福利和无条件1000美元现金之间做出选择——大多数人更喜欢没有限制的现金。

增值税是对企业生产的商品或服务征收的一种税。这是一种公平的税收,它使那些擅长隐藏利润和收入的大公司更难逃避支付他们应该缴纳的公平份额。增值税并不是什么新鲜事。世界上193个国家中有160个已经征收了增值税或类似的东西,包括欧洲所有国家,它们的平均增值税为20%。

支付自由红利的方式将来自4个方面:

  1. 当前的支出。我们目前每年在福利项目、食品券、残疾人等方面的开支在5000亿到6000亿美元之间。这降低了自由红利的成本,因为已经获得福利的人将有选择,但将没有资格在现有福利之外获得全部1000美元。

    此外,我们目前在医疗保健、监禁、无家可归服务等方面的开支超过一万亿美元。我们将节省1000 - 2000亿美元,因为人们会更好地照顾自己,避免进急诊室、监狱和露宿街头,而且通常会更有功能。自由红利将通过帮助人们避开我们的制度短板来为自己买单,而这正是我们的成本飙升之时。一些研究表明,给贫穷的父母1美元可以导致多达7美元的社会成本节省和经济增长。
  2. 增值税。我们现在的经济规模大得令人难以置信,达到19万亿美元,仅在过去10年就增长了4万亿美元。如果增值税达到欧洲水平的一半,将会产生8000亿美元的新收入。随着技术的进步,增值税将变得越来越重要,因为你不能从机器人或软件那里征收所得税。
  3. 新的收入。把钱交到美国消费者手中会促进经济增长。罗斯福研究所预计,美国经济将增长约2.5万亿美元,创造460万个新就业岗位。这将从经济增长和活动中产生大约8000亿至9000亿美元的新收入。
  4. 对高收入者征税和开征污染税。通过取消社会保障上限,实施金融交易税,结束对资本利得/附带利息的税收优惠,我们可以减少金融投机,同时为自由红利提供资金。我们可以在此基础上再增加一笔碳排放费,这笔费用将部分用于资助自由红利,以弥补支付该项目成本所需的余额。

自由红利的好处是什么?

自由红利将以许多积极的方式改变社会,有证据表明这一点。各种UBI计划的试验已经带来了各种各样的好处——有些是意料之中的,有些是出乎意料的。以下是其中的一些:

UBI鼓励人们去找工作。当前的许多福利项目在受助人找到工作时即取消福利,有时使他们的经济状况比受雇前更糟。UBI适用于所有成年人,无论他们的就业状况如何,所以受助人可以自由地寻求额外收入,而大多数人都是这样做的。
UBI通过无附加条件的覆盖减少了官僚空间,确定谁有资格获得保险要简单得多,管理福利的成本也大大降低。

UBI提高了工人的议价能力,因为有保障的、无条件的收入给了他们拒绝剥削工资和恶劣工作条件的筹码。雇主不能像以前那样对员工颐指气使。

UBI增加了创业精神,因为它提供了公司早期初创时期的基本需求,并在业务失败时充当安全网。它也给了你更多的消费者,因为每个人都有更多的可支配收入。罗斯福研究所发现,UBI将创造460万个就业机会,并使经济持续增长12%。UBI将是我们所见过的促进就业、创业和创造力的最大催化剂。

UBI改善了接受者的心理健康,因为它减少了匮乏、贫困和财政不安全的状况,而这些是数百万人的主要压力来源。

UBI帮助人们做出更明智的决定。研究表明,处于经济不安全困境的人认知能力的下降相当于13个智商点。UBI将为人们提供安全保障,让他们把精力集中在重要的事情上,比如他们的家庭。

UBI改善身体健康。随着经济安全程度的提高,人们更不容易受到压力、疾病和自我毁灭行为的影响。UBI在加拿大的一项实验显示,住院率下降了8.5%。

UBI增加了艺术创作、非营利性工作和对所爱之人的关爱,因为它为那些对这类工作感兴趣的人提供了一份补充收入,而这些工作并没有得到市场的支持。

UBI提高了劳动力市场的效率,因为更少的工人被困在不合适的工作岗位上。国家生产力将会提高,因为人们将能够找到更有价值的工作,并促进更高的工作满意度。

UBI通过减少家庭暴力、虐待儿童、经济压力和冲突来改善人际关系。它确保每个人对自己的未来有更乐观的看法,并有能力摆脱虐待关系。

一个稳定的资金来源可以改变人们的生活,这是惊人的。如果我们接受自由红利,我们就能在美国体验到这一点; 我们是人类历史上最富有、技术最先进的社会。是时候投资到我们的人民身上了。

想象一下你和你认识的每个人的生活中,每个月多出1000美元,你们会怎么花? 事情会如何变化?

它会与社会保障或退伍军人伤残福利叠加吗?

那些为国家服务并因此而面临残疾的人,除了享受自由红利外,还将继续享受他们的福利。

社保退休福利与自由红利叠加。既然这是人们一生都在为之付出的一种利益,那么这笔钱就应该被恰当地视为属于他们的,他们不需要二者选一。

SSDI基于挣得的工作权益。SSI则是一个基于经济状况的福利项目。你可以同时获得SSDI和自由红利。大多数合法残疾人同时接受SSDI和SSI。在自由红利制度下,那些合法的残疾人可以在领取SSDI和自由红利,或者领取SSDI和SSI,之间做出选择,看哪一个组合更慷慨。

即使是一些每月在SSI中获得1000美元以上的人也会选择自由红利,因为它没有先决条件。自由红利消除了这些要求,并保证收入,不管其他因素。

有证据支持自由红利吗?

在世界各地进行的无条件现金福利试验已证明是减少贫困最成功的方法之一。世界银行(World Bank)已经证明,那些担心现金接受者会把钱浪费在毒品或酒精上、停止工作或生更多孩子的推测是错误的。很多这样的行为实际上减少了

自1998年以来,共发表了461篇这方面的研究论文。你可以在这里看到它们

在过去的50年里,已经有超过30个这类现金福利项目被研究。以下是我们推荐的几个:

Mincome实验,加拿大马尼托巴省(减少住院和不减少工作时间)
纳米比亚大型试点项目(减少犯罪、减少辍学和改善健康)
直接给予项目,肯尼亚(增加资产和营养,不改变毒品和暴力)
在这里查看所有这些项目

数据很清楚——给人们钱能让他们过上更好的生活。但先把数据放在一边,自己想想。如果每月多给你1000美元,你会怎么做? 你的家人和朋友呢?

自由红利将使我们的社会变得更加美好; 我们需要的是勇气和意志来关心和投资我们的人民。

我从未听说过自由红利和全民基本收入。它是从哪里来的?谁支持它?

保障每个公民从政府中获得收入的想法由来已久,最早记录于文艺复兴时期。在美国,这是由开国元勋托马斯·潘恩(Thomas Paine)继承的,他把这笔钱称为“自然遗产”。

UBI和类似的现金项目早在1918年工业革命期间的20世纪中期就开始升温。随着发达国家的产量超过以往任何时候,这个想法重新浮出水面,并得到了米尔顿·弗里德曼(Milton Friedman)和哈耶克(F.A. Hayek)等众多诺贝尔经济学奖得主的大力支持。

20世纪60年代,马丁·路德·金(Martin Luther King Jr.)表达了他的支持,还有来自125所大学的1000多名经济学家联名致信尼克松总统,要求提供收入保障。

1970年,尼克松总统在众议院通过了一项法案,将保障最低收入的想法纳入其中。它在参议院夭折,因为民主党人试图寻求更高的收入保障。

如今,这个想法得到了马克·扎克伯格(Mark Zuckerberg)、罗伯特·里奇(Robert Reich)、埃隆·马斯克(Elon Musk)、比尔·格罗斯(Bill Gross)、理查德·布兰森(Richard Branson)、塔-内希西·科茨(Ta-Nehisi Coates)、诺姆·乔姆斯基(Noam Chomsky)等许多人的支持。从奥巴马总统到自由意志主义者卡托研究所(Cato Institute),更多人表达了对研究这一想法的兴趣。

全民基本收入并非新概念——它是一个老概念,但其时代已经到来。

以下是多年来支持全民基本收入的一些人:

马丁·路德·金(1967年): “我现在确信,最简单的方法将被证明是最有效的——解决贫困的办法是通过一项现在被广泛讨论的措施来直接消除贫困: 提供收入保障。”

理查德·尼克松,1969年8月: “我的建议是,联邦政府在每个美国家庭的收入下建立一个基金会……对于不能照顾它自己的家庭,不论这个家庭在美国的任何地方。”

米尔顿·弗里德曼(诺贝尔经济学奖得主),1980年: “我们应该用一个单一的全面的现金收入补充计划——负所得税——来取代具体福利计划的杂七杂八。这将使我们当前的福利制度更有效率、更人性化。”

伯尼·桑德斯(Bernie Sanders), 2014年5月: “在我看来,每个美国人都至少有权享有最低生活水平……实现这一目标有不同的方式,但这是我们应该努力实现的目标。”

巴拉克·奥巴马(Barack Obama) 2016年10月: “随着人工智能得到进一步整合,社会可能变得更加富裕,生产和分配、你工作多少和你挣多少之间的联系会变得越来越弱……我们将在未来10年或20年讨论无条件的免费资金。”

埃隆·马斯克,2017年2月: “我认为我们最终会实现全民基本收入……这将是必要的……机器人不能做得更好的工作将会越来越少。我想说清楚。这些都不是我希望发生的事情; 但我认为这些事情很可能会发生。”

马克·扎克伯格,2017年5月: “我们应该探索……全民基本收入,让每个人都有缓冲去尝试新想法。”

为什么我们现在需要自由红利?

自2000年以来,科技已经取代了400万美国制造业工人的工作,摧毁了整个中西部地区的社区。随着科技的新发展,专家们预测在未来的12年里,三分之一的美国人会因为新科技而失业。

在29个州,卡车司机是最常见的工作,有350万司机,其中94%是男性,另有1200万工人在全国各地的卡车停车站和汽车旅馆里为他们提供支持。当卡车开始自动驾驶时会发生什么?

我们正在经历人类历史上最伟大的经济和技术变革,我们的制度却跟不上。如果没有自由红利,随着越来越多的工作由软件、人工智能和机器人完成,我们将看到机会减少。当人们没有钱花的时候,市场就不能很好地运转。自由红利是帮助社会通过人类历史上最大的自动化浪潮实现转型的重要一步。

关于我们为什么需要自由红利的详细说明,请阅读杨安泽的著作《普通人的战争》。

自由红利会对经济产生什么影响?

罗斯福研究所发现,如果每个18岁以上的成年美国公民每年接受1.2万美元的基本收入,到2025年,美国经济将永久性增长12.56%至13.10%,即2.5万亿美元左右,劳动力市场将增加450万至470万人的工作机会。

这是因为把钱交到人们手中会促进经济增长,尤其是当人们需要钱并愿意花钱的时候。想象一下,密苏里州的一个小镇上有5000名符合条件的居民。12000美元的自由红利将为社区带来6000万美元的额外收入,其中大部分将用于当地。然后想象一下,在这个国家的每一个社区,无论大小。各地的社区将拥有更有活力的地方经济,创造更多的就业机会,并催生新的企业。

这会不会导致严重的通货膨胀?

联邦政府最近在没有通货膨胀的情况下,印了4万亿美元用于银行救助。我们的自由红利计划主要使用经济中已经存在的资金。在货币经济学中,主流理论认为通货膨胀是建立在货币供应变化的基础上的。自由红利的货币供应量变化很小,因为它是由增值税提供资金的。

很有可能,一些公司会提高价格,以回应人们有更多的购买力,增值税也会小幅提高价格。然而,各公司之间仍将存在价格竞争。随着时间的推移,技术将继续降低大多数允许降价的商品的价格(如服装、媒体、消费电子产品等)。我们目前经历的主要通货膨胀发生在由于政府监管或不适用而难以自动化的行业——主要是住房、教育和医疗保健。真正的问题不是自由红利,而在是否允许技术和自动化降低不同行业的价格。

人们不会把钱花在毒品和酒精等愚蠢的东西上吗?

数据没有显示这一点。在许多向穷人发放现金的研究中,毒品和酒精的使用并没有增加。事实上,很多人用它来试图减少他们的酒精消费或物质滥用。例如,在阿拉斯加,人们经常把从该州获得的石油红利计入子女的教育支出。穷人会对他们的钱不负责任、挥霍无度的观点似乎是一种偏见,而不是事实。

当人们拥有更大的经济安全时,决策就会得到改善。给人们提供资源将使他们能够做出更好的决定来改善他们的处境。正如荷兰哲学家罗格尔·布雷格曼所说:“贫穷不是缺乏品格。就是缺钱。”

人们不会停止工作吗?

几十年来对现金转移项目的研究发现,只有新妈妈和上学的孩子在接受直接现金转移时工作时间更短。在几项研究中,高中毕业率上升。在某些情况下,人们甚至工作得更多。引用哈佛大学和麻省理工学院的一项研究,“我们发现(现金)转移对工作行为没有影响。”

在我们的计划中,每个成年人每年只能得到12000美元。在许多地方,这还不足以维持生活,当然也不足以让你获得舒适的生活或提升。要想取得有意义的进步,人们仍然需要走出去工作。

生活成本的变化呢?难道大城市不需要比农村地区更多的钱吗?

每个符合条件的自由红利接受者,无论在哪里,每月都将获得1000美元。按地区改变美元数额将会增加昂贵的官僚机构。此外,自由红利实际上将帮助更多的美国人生活在他们想要的地方。美国人口普查局(Census Bureau)的数据显示,美国人在各州之间的流动达到历史最低水平,导致经济和劳动力市场停滞不前。搬家需要很多钱,而美国人也越来越缺钱。自由红利将使人们和家庭更加流动,并在人们寻求新环境和机会时提高劳动力市场的活力。

在一些地方,每月1000美元比其他地方要经花得多。自由红利将带来许多社区的复兴,因为人们可以利用某些地区生活成本较低的优势,而不是蜂拥进入昂贵的大都市区。

为什么要给富人自由红利?

通过给每个人发放自由红利,接受政府现金转账的羞耻感就消失了。此外,它还消除了任何人留在一定收入范围内领取福利的动机。如果像Andrew的计划那样,通过增值税来支付,那么富人很可能会向这个体系缴纳的税比从这个体系中得到的要多。

为什么我们不能对那些失业的人进行再培训呢?

培训很重要 - 可不幸的是,数据表明,再培训计划难以大规模展开。行业调整援助计划(TAA)是一个为失业的制造业工人设立的联邦计划,该计划的成员中只有37%的人从事他们接受再培训的工作。密歇根州的“不让一个工人掉队”计划发现,该计划实施后,三分之一的成员仍处于失业状态,与未参加该计划的同龄人40%的失业率相似。在2003年至2013年间离开工作岗位的密歇根工人中,约有一半人后来靠残疾福利,未能接受再培训以适应新的工作。

许多最有可能失业的工人都是中年人,已经过了壮年。许多人都有健康问题。再培训将是困难的,许多雇主将更愿意雇佣工作要求较低的年轻员工。

目标岗位现在正在移动——当某人通过再培训计划时,他们再培训的工作可能已经改变或自动化了。技术会变得越来越好。此外,要想知道谁应该接受再培训也很难。如果一个商场关门了,其零售工人要接受再培训吗? 呼叫中心呢?

虽然培训计划是一个好主意,但我们应该承认,从历史上看,我们在这方面做得非常糟糕,即使我们知道岗位流失正在发生。在多个行业对大量人口进行再培训是不现实的,也无法解决新技术带来的人口迁移问题。

我没有看到机器人。实施UBI是不是太早?

不。“机器人”不一定是会走路会说话的机器人来敲你的门。当软件取代成千上万的服务台工作人员或汽车开始自动驾驶时,甚至当一个购物中心因为现在每个人都用电脑购物而关闭时,机器人时代就开始来临。

我们正处于自动化的第四局。自2000年以来,已有400万个制造业工作岗位被抢走,科罗拉多州的自动卡车已经在运送货物。如果我们再等下去,我们就没有时间了。《平价医疗法案》(Affordable Care Act)花了7年时间才全面生效。在失业危机全面爆发之前,是时候让自由红利成为现实了。

想了解更多关于劳动力和技术趋势的信息,包括机器人是如何出现和取代工人的,请阅读4月3日由阿歇特出版的Andrew的书《普通人的战争》(the War on Normal People)。

如果自由红利如此伟大,为什么我们还没有这么做呢?

在20世纪60年代末,我们的支持率非常接近——实际上在1969年众议院通过了该法案,之后由于民主党人想要一个更高的层级,该法案在参议院陷入停滞。1000名经济学家在一封信上签了名,表示这对经济来说是件好事。

从那时以后,我们就被洗脑了,认为对人们有益的东西并不对经济有益,但对大公司有利的东西才是。

我们还没有这么做的原因是,我们宁愿把钱给富有的公司,并希望钱能慢慢流下来——我们更信任机构,而不是我们的人民。这是我们必须改变的。我们必须赋能我们的人民,从每个个人和家庭做起,重建我们的经济。

这会导致大量移民到美国吗?

250年来,美国一直是世界上最受欢迎的移民目的地。对公民身份的高要求并不新鲜。的确,随着自由红利的落实,对公民身份的需求可能会上升。然而,只有公民才能获得自由红利,而美国已经是世界上公民之路最为漫长的国家之一。自由红利将使公民身份变得更有意义。

这个不就是共产主义/社会主义吗?

不。从定义上讲,共产主义是一场革命运动,旨在建立一个在共享生产所有权基础上的无阶级、无金钱、无国籍的社会秩序。社会主义的核心原则是生产资料的国有化,即政府占领亚马逊和谷歌。自由红利并不是这些东西,实际上它与资本主义是如此的天衣无缝,它预计在8年内使经济增长2.5万亿美元。

实际上,自由红利是资本主义在自动化浪潮和劳工失业潮中得以延续的必要条件。市场需要消费者作为销售产品的对象。自由红利是一种具有底线的资本主义,使得人们不会陷落下去。

难道雇主们不会开始降低工资吗?

雇主们已经让他们的员工做得更多而支付更少的薪水。自1973年以来,企业生产率增长了72%,但美国的工资仅增长了9%。UBI将把权力交到工人手中——用持续的、无条件的现金来支付他们的开支,美国人将能够对他们愿意接受的工作条件更加挑剔。

有了UBI,人们自然想做的工作——比如教师、教练或艺术家——可能会少付一些钱。但是人们不愿意做的工作实际上需要支付更多的工资,因为工人不一定要接受那份工作。

这听起来太棒了! 我该怎么做才能让它发生呢?

杨安泽的竞选不仅仅是UBI。它致力于建设一个把人民和生活质量放在首位的社会。UBI只是第一步。

在这里为竞选活动做捐献

帮助我们实现普遍的基本收入。如果我们有勇气赋能我们的人民,我们就能创造一个自由和富足的社会。让我们把人性放在首位 - 以人为本。

有道机器翻译 from https://www.yang2020.com/what-is-freedom-dividend-faq/

【相关】

华裔总统候选人杨安泽的高光时刻

华裔民主党总统候选人杨安泽 (Andrew Yang)竞选网页

Andrew Yang:The War on Normal People

36 项UBI社会实验

有道机器翻译

金灿荣教授提到的【厉害了我的国】

立委按:偶然听到金灿荣教授在点评中美贸易摩擦升级的一个演说。他提到美国中情局定期发布更新的《世界概况》(The World Factbook),对中国经济有准确的描述,笑称,比发改委还要正面,就是一本【厉害了我的国】的英文版。出于好奇,上网查到了他说的这个报告,的确精细客观,大概是美国的智囊团专家和中国通们撰写的,具有不错的参考价值,利用搜狗机器翻译稍加编辑如下,以飨读者。

背景

中国的历史文明至少可以追溯到公元前1200年;从公元前3世纪开始,在接下来的两千年里,中国在一系列帝国王朝的统治下,时而团结时而不团结。在19世纪和20世纪初,这个国家饱受内乱、大饥荒、军事失败和外国占领的困扰。第二次世界大战后,毛泽东领导下的中国共产党建立了专制的社会主义制度,在确保中国主权的同时,对日常生活实行严格控制,并导致数千万人丧生。1978年后,毛泽东的继任者邓小平和其他领导人专注于市场经济发展,到2000年,产量翻了两番。对大多数人来说,生活水平已经显著提高,但政治控制仍然很严格。自1990年代初以来,中国增加了在国际组织中的全球外联和参与。

人民与社会

人口: 本条目给出了美国人口普查局基于人口普查、人口动态统计登记系统或与最近过去相关的抽样调查以及对未来趋势的假设所做的估计。总人口是衡量该国对世界及其所在区域潜在影响的一个总体尺度。注:从1993年的概况介绍开始,一些国家(主要是非洲国家)的人口估计已经明确考虑到了死亡率。

更多人口字段列表
1,384,688,986(东部时间2018年7月。)
与世界的国家比较:1
国籍:这个条目提供了公民的识别术语——名词和形容词。国籍字段列表
名词:中文(单数和复数)
形容词:中文
族裔群体:该条目提供了族裔群体的有序列表,从最大的族裔群体开始,通常包括总人口的百分比。

族裔群体字段列表
汉族91.6%,壮族1.3%,其他(包括回族、满族、维吾尔族、苗族、彝族、土家族、藏族、蒙古族、侗族、布依族、瑶族、白族、朝鲜族、哈尼族、黎族、哈萨克族、傣族和其他民族)7.1% (2010年东部时间。)
注:中国政府正式承认56个民族

语言:此条目提供了每个国家使用的语言列表,并指定了任何官方的国家或地区语言。当数据可用时,每个国家使用的语言根据将每种语言作为第一语言的总人口的百分比进行细分。对于那些没有可用数据的国家,语言根据流行程度按等级排列,从最常用的语言开始。

语言字段列表
标准中文或普通话(官方;普通话,以北京方言为基础,越语(粤语)、吴语(上海话)、闽北(福州)、闽南(福建-台湾)、湘语、赣语、客家方言、少数民族语言(见少数民族条目)
注:壮族是广西壮族的官方语言,岳是广东的官方语言,蒙古语是内蒙古的官方语言,维吾尔语是新疆维吾尔文的官方语言,吉尔吉斯语是新疆维吾尔文的官方语言,藏语是西藏的官方语言

宗教:这个条目是信徒从最大群体开始的有序的宗教列表,有时包括总人口的百分比。世界主要宗教的核心特征和信仰描述如下。巴哈伊教——由米尔扎·侯赛因·阿里(又名巴哈伊·阿卜杜拉)于1852年在伊朗创立,巴哈伊教强调一神论,信奉一个永恒的超验上帝。它的指导重点是鼓励地球上所有民族的团结,以实现正义与和平。

更多宗教字段列表
佛教18.2%,基督教5.1%,穆斯林1.8%,民间宗教21.9%,印度教< 0.1%,犹太教< 0.1%,其他0.7%(包括道教(道教)),非附属宗教52.2%(美国东部时间2010年)。)
注:官方无神论者

年龄结构:这一条目提供了按年龄划分的人口分布。按性别和年龄组分列的信息如下:0-14岁(儿童)、15-24岁(早期工作年龄)、25-54岁(主要工作年龄)、55-64岁(成熟工作年龄)、65岁及以上(老年人)。人口的年龄结构影响一个国家的关键社会经济问题。人口年轻的国家(15岁以下的比例很高)需要加大对学校的投资,而人口较老的国家则需要加大投资。。。更多年龄结构字段列表
0-14岁:17.22%(男性128,270,371/女性110,120,535)
15-24岁:12.32%(男性91,443,139/女性79,181,726)
25-54岁:47.84%(男性338,189,015/女性324,180,103)
55-64岁:11.35%(男性79,340,391/女性77,857,806)
65岁及以上:11.27%(男性74,277,631人/女性81,828,269人)(2018年东部时间。)
人口金字塔:人口金字塔

抚养比:抚养比是一个人口年龄结构的量度。他们将可能在经济上“依赖”他人支持的个人数量联系起来。受扶养人比率将青年(0-14岁)和老年人(65岁以上)的比率与工作年龄组(15-64岁)的比率进行对比。受扶养人比率的变化表明了人口年龄结构变化带来的潜在社会支助需求。生育率水平。

更多相关性比率字段列表
总抚养比:37.7 (2015年东部标准时间。)
青年抚养比率:24.3 (2015年东部标准时间。)
老年抚养比率:13.3 (2015年东部标准时间。)
潜在支持比率:7.5 (2015年东部标准时间。)
数据不包括香港、澳门和台湾

中位年龄:这个条目是将一个人口分成两个数量相等的群体的年龄;也就是说,一半的人比这个年龄小,一半的人比这个年龄大。它是一个单一的指数,概括了一个人口的年龄分布。目前,中位年龄从尼日尔和乌干达的15岁左右到几个欧洲国家和日本的40岁或以上不等。请参阅“年龄结构”条目,了解

政府

国家名称:本条目包括美国地名委员会批准的国家名称的所有形式。国家名称字段列表
传统长型:中华人民共和国
传统简称:中国
当地简称:中国
缩写:PRC
词源学:英文名字来源于公元前3世纪的秦统治者,他们组成了中国古代的第一个帝国王朝;中文名字“中国”翻译成“中央民族”或“中央王国”

政府类型:此条目给出了政府的基本形式。主要政府术语的定义如下:绝对君主制——君主不受阻碍地统治的政府形式,即没有任何法律、宪法或合法组织的反对。无政府状态-政府权威缺失导致的无法无天或政治混乱的状态。独裁主义--辉格党的一种政府形式。。。更多政府类型字段列表

共产党领导的国家

首都:该条目给出政府所在地的名称、地理坐标、相对于协调世界时(世界时)的时差和在DC华盛顿观察到的时间,如果适用,还提供夏令时的信息。在适当情况下,还增加了一个特别说明,以突出那些有多个时区的国家。

名:北京
地理坐标:北纬39° 55,东经116° 23
时差:世界协调时+8(标准时间比DC华盛顿早13小时)
词源:中文意思是“北方首都”

注:尽管面积很大,但整个中国都在一个时区内

行政区划:本条目通常给出美国地名委员会(BGN)批准的数字、指定术语和一级行政区划。行政区划字段列表
23个省、5个自治区(自治市)和4个市(市)

省份:安徽、福建、甘肃、广东、贵州、海南、河北、黑龙江、河南、湖北、湖南、江苏、江西、吉林、辽宁、青海、陕西、山东、山西、四川、云南、浙江;(见关于台湾的说明);

自治区:广西、内蒙古(内蒙古)、宁夏、新疆维吾尔自治区、西藏(西藏);

直辖市:北京、重庆、上海、天津

注:中国认为台湾是其第23个省;参见香港特别行政区和澳门特别行政区的单独条目

独立:对大多数国家来说,这个条目给出了主权实现的日期,以及从哪个国家、帝国或托管。对其他国家来说,给出的日期可能不代表严格意义上的“独立”,而是一些重要的建国事件,如传统的建国日期或统一、联邦、邦联、建立、政府形式的根本改变或国家继承的日期。独立字段列表

1949年10月1日(中华人民共和国成立);值得注意的较早日期:公元前221年(秦朝统一);1912年1月1日(清朝被中华民国取代)

国庆节:这个条目给出了主要的国庆庆祝活动——通常是独立日。国家假日字段列表

国庆节(中华人民共和国成立纪念日),10月1日(1949年)

宪法:本条目提供一个国家的宪法信息,包括两个子字段。历史子字段包括以前宪法的日期以及制定和实施最新宪法的主要步骤和日期。对于以前有1-3部宪法的国家,列出年份。更多宪法字段列表

历史:以前的几个;最近于1982年12月4日颁布
修正案:由全国人民代表大会常务委员会提出或者得到全国人民代表大会五分之一以上成员的支持;通过需要国会成员三分之二以上的多数票;修订了几次,最后一次是在2018年(2018年)

法律制度:本条目提供了一个国家法律制度的描述。还包括一些国家关于对立法行为进行司法审查的声明。几乎所有国家的法律体系通常都以五种主要类型的要素为模式:民法(包括法国法、拿破仑法典、罗马法、罗马-荷兰法和西班牙法);普通法(包括美国法律);习惯法;混合或多元法律;和宗教法(包括伊斯兰法)。更多法律系统字段列表:

受苏联和欧洲大陆民法体系影响的民法;立法机关保留解释法规的权力;注-2017年初,全国人民代表大会通过了《民法通则》,迈出了通过新民法典的第一步

国际法组织的参与:这一条目包括一国接受国际法院和国际刑事法院管辖权的信息;59个国家有保留地接受了国际法院的管辖权,11个国家无保留地接受了国际法院的管辖权;122个国家接受了ICCt管辖权。附录二:国际组织和团体解释了国际法院和国际刑事法院的不同任务。国际法组织参与领域清单

没有提交国际法院管辖权声明;ICCt的非缔约国

公民身份:该条目提供与获得和行使公民身份有关的信息;它包括四个子领域:出生公民身份是指根据出生地获得公民身份,即出生地法,而不管父母的公民身份如何。血统公民身份仅描述根据血统原则获得公民身份,或通过血统获得公民身份,父母中至少有一方是国家公民,出生在美国领土范围内。更多公民字段列表

出生公民身份:否
仅限血统公民身份:父母中至少有一方必须是中国公民
承认双重国籍:不
入籍的居住要求:虽然理论上入籍是可能的,但实际上却极其困难;居住是必需的,但没有具体说明

选举权:这一条目给出了选举权的年龄,以及选举权是普遍的还是受限制的。选举权领域列表

18岁;普遍的

行政部门:该条目包括五个子条目:国家元首;政府首脑;内阁;选举/任命;选举结果。国家元首包括国家名义领导人的姓名、头衔和就职日期,他在官方和仪式上代表国家,但不得参与政府的日常活动。政府首脑包括被指定管理政府行政部门的最高行政人员的姓名、头衔。更多行政部门字段列表

国家元首:习近平主席(自2013年3月14日起);副总统王岐山(自2018年3月17日起)
政府首脑:李克强总理(自2013年3月16日起);常务副总理韩正(自2018年3月19日起)、孙春兰(自2018年3月19日起)、刘禾(自2018年3月19日起)、胡春华(自2018年3月19日起)
内阁:由全国人民代表大会任命的国务院
选举/任命:全国人民代表大会间接选举产生的总统和副总统,任期5年(无限期);上次选举于2018年3月17日举行(下次选举将于2023年3月举行);总理由总统提名,全国人大确认
选举结果:习近平再次当选总统;全国人民代表大会投票——2,970票(一致);王岐山以2969票当选副总统

立法部门:该条目有三个子字段。描述子字段提供了立法结构(一院制——单一议院;两院制——上院和下院);正式名称;成员席位数;选区或投票区的类型(单一席位、多席位、全国范围);选举投票制度;和成员任期。选举子字段包括上次选举和下次选举的日期。选举结果子字段列出了政党/联盟的投票百分比。更多立法部门字段列表

说明:一院制,全国人民代表大会(最多3000席;由市、区、省人民代表大会和人民解放军间接选举产生的成员;成员任期5年);注-实际上,只有中国共产党(CCP)、其8个同盟独立党和CCP批准的独立候选人当选
选举:上次于2017年12月至2018年2月举行(下次将于2022年底至2023年初举行)
选举结果:选票百分比-国民大会;按政党分列的席位----国民议会;构成----男性2,238人,女性742人,女性24.9%

司法部门:该条目包括三个子字段。最高法院子字段包括一个国家最高级别法院的名称、法官的人数和头衔以及法院审理的案件类型,这些通常基于民法、刑法、行政法和宪法。一些国家有独立的宪法法院。法官遴选和任期子字段包括负责提名和任命法官的组织和相关官员。更多司法部门字段列表

最高法院:最高人民法院(由340多名法官组成,包括首席法官和13名大法官,组成一个民事委员会和法庭,处理民事、经济、行政、申诉和上诉以及通信和运输案件)
法官遴选和任期:由全国人民代表大会任命的首席法官(NPC);限于连续两届5年任期;由首席大法官提名并由NPC常务委员会任命的其他大法官和法官;NPC确定的其他法官和法官的任期
下级法院:高级人民法院;中级人民法院;区县人民法院;自治区人民法院;国际商事法院;军事、海事、交通和林业问题特别人民法院
注:2014年末,中国公布了一项多年司法改革计划;2018年继续取得进展


政党和领导人:除非另有说明,本条目包括截至每个国家上次立法选举的重要政党、联盟和选举名单。政党和领导人实地名单
中国共产党或CCP·[·习近平]
注:中国有8个名义上独立的小政党,由CCP控制

国际组织参与:本条目按缩写字母顺序列出主题国家是其成员或以其他方式参与的国际组织。国际组织参与领域列表

亚行、非行(非区域成员)、亚太经合组织、北极理事会(观察员)、东盟区域论坛、东盟(对话伙伴)、国际清算银行、金砖国家、CDB、CICA、埃及、粮农组织、FATF、20国集团、24国集团(观察员)、5国集团、77国集团、IADB、原子能机构、国际复兴开发银行、民航组织、国际商会(国家委员会)、ICRM、国际开发协会、农发基金、国际金融公司、红十字与红新月联会、IHO、劳工组织、货币基金组织、海事组织、IMSO、刑警组织、海委会、国际移民组织(观察员)、IPU、国际标准化组织、信息技术事务办公室、国际电联、拉美一体化协会(观察员)、多边投资担保机构、西撒特派团、马里稳定团

在美国的外交代表:此条目包括使团团长、办事处地址、电话、传真、总领馆所在地和领事馆所在地。附加注释的“任命大使”一词指的是向国务卿而不是美国总统提交全权证书的新大使。这些大使履行所有外交职能,除了会见总统或出席总统出席的活动,直到他们在白宫正式递交国书。更多外交代表在美国

特派团团长:崔天凯大使(自2013年4月3日起)
衡平法院:DC华盛顿州西北国际广场3505号,20008
电话:1 495-2266
传真:1 495-2138
总领事馆:芝加哥、休斯顿、洛杉矶、纽约、旧金山

美国外交代表:此条目包括代表团团长、大使馆地址、邮寄地址、电话号码、传真号码、分支机构位置、总领馆位置和领事馆位置。美国驻外代表机构名单

特派团团长:特里·布兰斯塔德大使(自2017年7月12日起)
大使馆:北京100600安家楼路55号
邮寄地址:采购订单AP 96521
电话:86 8531-3000
传真:86 8531-3300
总领事馆:成都、广州、上海、沈阳、武汉

国旗描述:独立国家的旗帜由其属地使用,除非有官方认可的当地旗帜。一些有争议的地区和其他地区没有国旗。标志描述字段列表

红色,有一个大的黄色五角星和四个较小的黄色五角星(排列在朝向旗帜中间的垂直弧线上),位于上提升侧角;红色代表革命,而星星代表中国共产党统一的四个社会阶级——工人阶级、农民阶级、城市小资产阶级和民族资产阶级(资本家)

国家象征:国家象征是动物、花卉或其他抽象的象征——或一些独特的物体——随着时间的推移,它们已经与一个国家或实体紧密地联系在一起。并非所有国家都有国家标志;一些国家有不止一个。国家符号字段列表

龙,大熊猫;民族颜色:红色、黄色

国歌:一种普遍爱国的音乐作品——通常以歌曲或赞美诗的形式——唤起和颂扬一个国家或其人民的历史、传统或斗争。国歌可以被一个国家的宪法、颁布的法律或简单的传统正式认可为国歌。虽然大多数国歌都有歌词,但有些没有。国歌列表

名称:《义勇军进行曲》
歌词/音乐:田汉/聂耳
注:1949年通过;国歌虽然在文化大革命期间被禁止;它最初是1935年中国电影《暴风雨中的儿女》的主题曲

经济

自20世纪70年代末以来,中国已经从一个封闭的中央计划体系转变为一个更加市场化的体系,在全球扮演着重要角色。自1978年以来,中国以渐进的方式实施改革,提高了效率,使国内生产总值增长了十倍以上。改革始于集体农业的逐步淘汰,并扩大到包括价格的逐步自由化、财政权力下放、国有企业自主权的增加、私营部门的增长、股票市场和现代银行体系的发展以及对外贸易和投资的开放。中国继续奉行产业政策、国家对关键部门的支持以及限制性投资制度。从2013年到2017年,中国是世界上增长最快的经济体之一,平均每年实际增长率略高于7%。根据购买力平价来衡量,中国在2017年是世界上最大的经济体,在现代史上首次在2014年超过美国。中国在2010年成为世界上最大的出口国,在2013年成为最大的贸易国。尽管如此,中国的人均收入仍低于世界平均水平。

2005年7月,中国转向参考一篮子货币的汇率制度。从2005年年中到2008年末,人民币兑美元升值逾20%,但从全球金融危机爆发到2010年6月北京宣布将恢复逐步升值,人民币汇率实际上一直与美元挂钩。从2013年到2015年初,人民币对美元保持稳定,但从2015年年中到2016年底,在资本大量外流的背景下,人民币贬值了13%;2017年,人民币对美元恢复升值——从2016年底到2017年底,升值幅度约为7%。2015年,在人民币被纳入国际货币基金组织特别提款权篮子后,中国人民银行宣布将继续谨慎推动人民币的完全自由兑换。然而,自2015年末以来,中国政府加强了对海外投资的资本管制和监督,以更好地管理汇率和保持金融稳定。

中国政府面临诸多经济挑战,包括:(一)降低国内高储蓄率,相应降低国内家庭消费;(b)管理其高公司债务负担,以维持金融稳定;(c)控制用于为基础设施刺激融资的表外地方政府债务;(d)为有抱负的中产阶级,包括农村移民和大学毕业生提供更高工资的工作机会,同时保持竞争力;(e)抑制房地产部门的投机性投资,同时不大幅减缓经济;(f)减少工业产能过剩;(g)通过更有效的资本配置和国家对创新的支持来提高生产率增长率。沿海省份的经济发展比内陆省份取得了更大进展,到2016年,超过1.693亿移徙工人及其家属已迁往城市地区寻找工作。中国被称为“独生子女政策”的人口控制政策的一个后果是,中国现在是世界上老龄化速度最快的国家之一。2016年,中国放宽了独生子女政策,允许所有家庭生育两个孩子。环境恶化——特别是空气污染、土壤侵蚀和地下水位持续下降,尤其是在北方——是另一个长期问题。由于侵蚀和城市化,中国继续失去可耕地。中国政府正在寻求增加煤炭和石油以外的能源生产能力,重点是天然气、核能和清洁能源开发。2016年,中国批准了《巴黎协定》,这是一项应对气候变化的多边协定,并承诺在2025年至2030年间实现二氧化碳排放峰值。

2016年3月公布的政府第十三个五年计划强调,需要增加创新和刺激国内消费,以减少经济对政府投资、出口和重工业的依赖。然而,与经济再平衡相比,中国在补贴创新方面取得了更多进展。北京方面已承诺让市场在资源配置方面发挥更具决定性的作用,但中国政府的政策继续偏向国有企业,并强调稳定。中国领导人在2010年承诺到2020年将国内生产总值翻一番,第十三个五年计划包括到2020年至少6.5%的年经济增长目标来实现这一目标。近年来,中国在被认为对“经济安全”至关重要的领域重新支持国有企业,明确寻求培育具有全球竞争力的行业。中国领导人还通过重申国家在经济中的“主导”作用破坏了一些市场化改革,这一立场有可能阻碍私人主动性,并随着时间的推移降低经济效率。2017年经济增长略有加速——这是自2010年以来首次出现这种增长——给了北京更大的空间进行经济改革,重点是金融部门去杠杆化和2015年末首次宣布的供应方结构改革议程。

GDP(购买力平价):这一项给出了一个国家在某一年生产的所有最终产品和服务的国内生产总值(GDP)或价值。一国按购买力平价(PPP)汇率计算的国内生产总值(GDP)是该国生产的所有商品和服务的总价值,按该年美国市场价格计算。这是大多数经济学家在考察人均福利和比较各国生活条件或资源使用情况时更喜欢使用的衡量标准。更多GDP(购买力平价)指标

23.21万亿美元(美国东部标准时间2017年)
21.72万亿美元(美国东部标准时间2016年)
20.35万亿美元(美国东部标准时间2015年)
注:数据以2017年美元计算
国家与世界的比较:1

国内生产总值(官方汇率):这一项给出了国内生产总值(GDP)或一个国家在某一年生产的所有最终产品和服务的价值。一个国家按官方汇率计算的国内生产总值(OER),是以本国货币计价的年度国内生产总值(GDP),除以当年美国与该国的双边平均汇率。该方法计算简单,可以精确地测量输出值。许多经济学家在衡量一个经济体相对于其他经济体所保持的经济实力时,更倾向于采用这种方法。更多GDP(官方汇率)字段列表

12.01万亿美元(美国东部标准时间2017年)。
注:由于中国的汇率是由法定汇率决定的,而不是由市场力量决定的,因此官方的GDP汇率指标并不能准确地衡量中国的产出;以官方汇率计算的GDP大大低估了中国相对于世界其它地区的实际产出水平;在中国的情况下,按购买力平价计算的GDP是比较各国产出的最佳指标

GDP -实际增长率:这一项给出了经通货膨胀调整后的GDP年增长率,并以百分比表示。增长率是逐年增长的,而不是复合增长。GDP -实际增长率字段列表

(2017。6.9%)
(2016。6.7%)
(2015。6.9%)
国家与世界的比较:21

国内生产总值-人均(购买力平价):这一项是按购买力平价计算的国内生产总值除以同年7月1日的人口。GDP -人均(PPP)字段列表
16700美元(2017年美国东部时间)。
15700美元(2016年美国东部时间)。
14800美元(2015年美国东部时间)。
注:数据以2017年美元计算
国家与世界的比较:105

国民储蓄:国民储蓄是减去最终消费支出(家庭和政府)从国民可支配收入,包括个人储蓄,加上业务储蓄(资本消耗的总和津贴和留存业务利润),加上政府储蓄(税收的超额支出),但不包括外国储蓄的过剩商品和服务的进口/出口)。这些数字以GDP的百分比表示。更多国民储蓄总额
占GDP的45.8%(美国东部时间2017年)。
占GDP的45.9%(美国东部时间2016年)。
占GDP的47.5%(美国东部时间2015年)。
国家与世界的比较:6


GDP——按最终用途划分的构成:这个条目显示了一个经济体中谁在进行消费:消费者、企业、政府和外国人。该分布给出了家庭消费、政府消费、固定资本投资、存货投资、货物和服务出口、货物和服务进口对GDP的贡献率,如果数据完整,将占GDP的100%。家庭消费包括居民家庭和非营利性机构的支出。更多GDP构成,按最终用途字段列出

家庭消费:39.1%(美国东部时间2017年)
政府消费:14.5%(美国东部时间2017年)。
固定资本投资:42.7%(美国东部时间2017年)。
存货投资:1.7%(美国东部时间2017年)。
商品和服务出口:20.4%(美国东部时间2017年)。
商品和服务进口:-18.4%(美国东部时间2017年)。

国内生产总值(GDP)——按来源行业划分的构成:这个条目显示了一个经济体中生产发生在何处。该分布给出了农业、工业和服务业对GDP的百分比贡献,如果数据完整,将占GDP的100%。农业包括农业、渔业和林业。工业包括采矿、制造业、能源生产和建筑业。服务包括政府活动、通讯、交通、金融和所有其他……国内生产总值-成分较多,按行业原产领域列出

农业:7.9%(美国东部时间2017年)。
所属行业:40.5%(美国东部时间2017年)
服务:51.6%(美国东部时间2017年)

农产品:这个条目是一个主要农作物和产品的有序列表,从最重要的开始。农产品

农业总产值居世界首位;大米、小麦、土豆、玉米、烟草、花生、茶叶、苹果、棉花、猪肉、羊肉、鸡蛋;鱼、虾

行业:这个条目提供了以年度产值最大开始的行业的排序。行业领域清单

工业总产值居世界首位;采矿及矿石加工、铁、钢、铝等金属、煤炭;机械制造;武器;纺织品和服装;石油;水泥;化学物质;肥料;消费品(包括鞋类、玩具、电子产品);食品加工;运输设备,包括汽车、火车、机车、船舶、航空器;通讯设备,商业空间运载火箭,卫星

工业生产增长率:这一项给出了工业生产(包括制造业、采矿业和建筑业)的年增长率。工业生产增速

(2017。6.1%)
国家与世界的比较:40

劳动力:这一项包含劳动力总数。劳动力市场

8.067亿(美国东部时间2017年)
注:截至2012年底,中国劳动年龄人口(15-64岁)为10.04亿
国家与世界的比较:1

劳动力-按职业:这一项列出了劳动力按职业部门的百分比分布。农业包括农业、渔业和林业。工业包括采矿、制造业、能源生产和建筑业。服务包括政府活动、通讯、运输、金融和所有其他不生产物质产品的经济活动。如果数据不完整,则分布总数将小于100%,由于四舍五入,分布范围可能在99- 101%之间。更多劳动力-按职业领域列出

农业:27.7%
工业:28.8%
服务:43.5% (2016 est.)

失业率:这一项包含了失业劳动力的百分比。可能会注意到大量的就业不足。失业率字段列表

(2017。3.9%)
(2016。4%)
注:数据为城镇登记失业人数,不包括民营企业和外来务工人员
国家与世界的比较:48

贫困线以下人口:国家对贫困线以下人口比例的估计是根据对各子群体的调查得出的,调查结果按每个群体的人数加权。各国对贫穷的定义差别很大。例如,富国通常采用比穷国更慷慨的贫困标准。贫困线以下人口实地名单

(2016。3.3%)
注:2011年,中国设定新的贫困线为2300元人民币(约合400美元)

按比例计算的家庭收入或消费:家庭收入或消费数据来自家庭调查,调查结果根据家庭规模进行了调整。各国在收集和调整数据时使用不同的标准和程序。基于收入的调查通常会比基于消费的调查显示出更不平等的分配。调查的质量随着时间的推移而提高,但在进行国家间比较时仍需谨慎。家庭收入或消费按比例或份额实地列名

最低10%:2.1%
最高10%:31.4% (2012)
注:数据仅适用于城镇家庭

家庭收入分配-基尼指数:该指数衡量一个国家家庭收入分配的不平等程度。该指数是根据洛伦茨曲线计算出来的,在洛伦茨曲线中,累计家庭收入与从最贫穷家庭到最富裕家庭的排列数量相对应。指数是(a)一个国家的洛伦茨曲线和45度辅助线之间的面积与(b) 45度线下的整个三角形面积的比值。基尼指数字段列表

46.5 (2016)。
46.2 (2015)。
国家与世界的比较:31

预算:这一项包括收入、支出和资本支出。
收入:2553万亿美元(美国东部时间2017年)。
支出:3.008万亿美元(美国东部标准时间2017年)。

税收和其他收入:这一项记录了国家政府在指定时期内的税收总额和其他收入,以GDP的百分比表示。税收包括个人所得税、企业所得税、增值税、消费税和关税。其它收入包括社会贡献——如社会保障和医院保险支出——赠款,以及来自公共企业的净收入。将数据正常化,即总收入除以GDP,可以方便地比较……更多税收和其他收入

占GDP的21.3%(美国东部时间2017年)。
国家与世界的比较:141

预算盈余(+)或赤字(-):这一项记录了国家政府收入和支出之间的差额,以GDP的百分比表示。正数(+)表示收入超过支出(预算盈余),负数(-)表示相反(预算赤字)。将数据正常化,即预算余额除以GDP,可以方便地进行各国间的比较,并表明一国政府是储蓄还是借款。更多预算盈余(+)或赤字(-)字段列表

-3.8%(占GDP的3.8%)(美国东部时间2017年)
国家与世界的比较:152

公共债务:这一项记录了所有政府借款减去以本国货币计价的偿还额的累计总额。公共债务不应与外债混淆,外债反映了私营部门和公共部门的外币债务,必须由外汇收入提供资金。公债上市

占GDP的47%(美国东部时间2017年)。
占GDP的44.2%(美国东部时间2016年)。
注:官方数据;数据涵盖中央和地方政府债务,包括2011年中国审计署报告正式承认的债务;数据不包括政策性银行债券、铁道部债券和中国资产管理公司债
国家与世界的比较:111

通货膨胀率(居民消费价格):这一分录提供了居民消费价格与上一年度居民消费价格的年度变动百分比。通货膨胀率(居民消费价格)字段列表
(2017。1.6%)
(2016。2%)
国家与世界的比较:88

中央银行贴现率:这一项提供了一个国家的中央银行对商业银行、储蓄银行为满足资金暂时短缺而提供的贷款收取的年化利率。央行贴现率字段列表

2.25%(美国东部时间2017年12月5日)
2.25%(美国东部时间2016年12月31日)
国家与世界的比较:117

商业银行优惠贷款利率:这一项提供了一个简单的平均年化利率,商业银行收取的新贷款,以国家货币计价,向他们最值得信用的客户。商业银行优惠贷款利率领域上市

4.35%(美国东部时间2017年12月31日)
4.35%(美国东部时间2016年12月31日)
国家与世界的比较:160

狭义货币的股票:该条目,也被称为“M1,”包括流通中的货币总量(纸币和硬币)+活期存款以非银行金融机构持有的本国货币计价,州和地方政府,非金融公共企业和私营部门的经济,以一个特定的时间点。各国货币单位已按资料提供日期的收盘价兑换成美元。更多狭义货币领域的股票上市

8.351万亿美元(美国东部时间2017年12月31日)。
7.001万亿美元(美国东部时间2016年12月31日)
国家与世界的比较:1

广义货币存量:这个条目覆盖所有的“狭窄的钱,”加时间和储蓄存款的总量,信用社存款、货币市场基金机构,中央银行之间短期回购协议和商业银行存款,和其他大型非银行金融机构持有的流动性资产,州和地方政府,非金融公共企业和私营部门的经济。各国货币单位在收市时已兑换成美元。更多的股票在广义货币领域

8.351万亿美元(美国东部时间2017年12月31日)。
7.001万亿美元(美国东部时间2016年12月31日)
国家与世界的比较:1

国内信贷存量:指金融机构向中央银行、国家和地方政府、公共非金融企业和私营部门提供的以国内货币计价的信贷总量。各国货币单位已按资料提供日的收盘价兑换成美元。国内信用领域股票上市

27.34万亿美元(美国东部时间2017年12月31日)。
23.02万亿美元(美国东部时间2016年12月31日)
国家与世界的比较:1

公开上市股票的市值:这一项是指公开上市公司发行的股票的价值,其价格在指定期间的最后一天在全国股票市场上确定。它只是每股最新价格乘以在特定交易所上市的所有公司的流通股总数。上市公司股票市值实地挂牌

7.335万亿美元(美国东部时间2016年12月)
8.234万亿美元(美国东部时间2015年12月)
8.518万亿美元(美国东部标准时间31日)。
国家与世界的比较:2

经常账户余额:这一项记录了一个国家在特定时期内货物和服务的净贸易,加上租金、利息、利润和股息的净收入,以及与世界其他地区的净转移支付(如养老基金和工人汇款)。这些数字是按汇率计算的,即,而不是按购买力平价(PPP)计算。经常账户余额字段列表

1649亿美元(美国东部时间2017年)
2022亿美元(美国东部时间2016年)
国家与世界的比较:3

出口:这一分录以船上交货价(不含运费)计算出口商品的美元总额。这些数字是按汇率计算的,即,而不是按购买力平价(PPP)计算。出口领域清单

2.216万亿美元(美国东部标准时间2017年)。
1.99万亿美元(美国东部标准时间2016年)
国家与世界的比较:1

出口-合作伙伴:这个条目提供了一个贸易伙伴的排名顺序,从最重要的开始;它有时包括总美元价值的百分比。出口-合作伙伴字段列表

美国19%,香港12.4%,日本6%,韩国4.5% (2017)

出口-商品:这一项提供了价值最高的出口产品的清单;它有时包括总美元价值的百分比。出口-商品领域的清单

机电及其他机械,包括电脑及电讯设备、服装、家具、纺织品

进口:这一分录提供了按到岸价格(成本、保险和运费)或离岸价(船上交货)计算的进口商品美元总额。这些数字是按汇率计算的,即,而不是按购买力平价(PPP)计算。进口领域清单

1.74万亿美元(美国东部标准时间2017年)。
1.501万亿美元(美国东部标准时间2016年)
国家与世界的比较:2

进口-商品:这个条目提供了价值最高的进口产品的列表;它有时包括总美元价值的百分比。进口-商品领域的清单

电气和其他机械,包括集成电路和其他计算机部件、石油和矿物燃料;光学、医疗设备、金属矿、机动车;大豆

进口-合作伙伴:这个条目提供了一个贸易伙伴的排名顺序,从最重要的开始;它有时包括总美元价值的百分比。进口-合作伙伴字段列表

韩国9.7%,日本9.1%,美国8.5%,德国5.3%,澳大利亚5.1% (2017)

外汇储备和黄金:这一项是指在指定期间终了时,为满足一国的国际收支需要而可供中央货币管理局使用的所有金融资产存量的美元价值。这一类别不仅包括外汇和黄金,还包括一个国家在国际货币基金组织中持有的特别提款权及其在该基金中的储备地位。外汇储备和黄金领域上市

3.236万亿美元(美国东部时间2017年12月31日)。
3.098万亿美元(美国东部时间2016年12月31日)
国家与世界的比较:1

债务-外部:这个分录给出了欠非居民的公共和私人债务总额,这些债务应以国际认可的货币、商品或服务偿还。这些数字是按汇率计算的,即,而不是按购买力平价(PPP)计算。债务-外部

1.598万亿美元(美国东部时间2017年12月31日)。
1.429万亿美元(美国东部时间2016年12月31日)。
国家与世界的比较:14

外国直接投资在国内的存量:这一项是指截至所述期间结束时,其他国家的居民- -主要是公司- -在本国直接进行的所有投资的累积美元价值。直接投资不包括购买股票的投资。外商直接投资股票——境内上市

1523万亿美元(美国东部时间2017年12月31日)。
1.391万亿美元(美国东部时间2016年12月31日)
国家与世界的比较:7

外国直接投资存量- -外国直接投资:这一项是指截至所述期间结束时,由本国居民- -主要是公司- -直接在外国进行的所有投资的累积美元价值。直接投资不包括购买股票的投资。股票直接对外投资——境外上市

1.383万亿美元(美国东部时间2017年12月31日)。
1.227万亿美元(美国东部时间2016年12月31日)。
国家与世界的比较:10

汇率:这个分录提供一个国家货币单位在指定期间的平均年价格,以每美元当地货币单位表示,由国际市场力量或官方法令决定。括号内是国际标准化组织(ISO) 4217个字母的国家交换媒介货币代码。每日收盘汇率并不列在《世界概况》中,而是用于转换股票价值,更多汇率字段列表

人民币(元)兑美元
7.76 (2017)。
6.6446 (2016)。
6.2275 (2015)。
6.1434 (2014)。
6.1958 (2013)。

地理 .........

能源: ............

通讯: ............

交通: ............

军事与安全: ............

跨国问题: ............


( thanks to 搜狗MT https://fanyi.sogou.com and 有道MT http://fanyi.youdao.com/

【相关】原文链接:

https://www.cia.gov/library/publications/the-world-factbook/geos/ch.html

华裔总统候选人杨安泽的高光时刻

民主党总统候选人初选辩论第二夜,终于迎来了华裔候选人杨安泽(Andrew Yang)的高光时刻。绝对精彩,一鸣惊人。第一次辩论由于现场争抢话语权不够有力而失利后,这次他是精心准备了,没有一个多余的字,句句戳心,无可挑剔。对主流议题提出了独特的视角和前瞻性解决方案,具有新鲜的冲击力。

请看辩论现场杨辩的翻译(thanks to 有道MT):

Opening Statement

BASH: Andrew Yang?

YANG: If you've heard anything about me and my campaign, you've heard that someone is running for president who wants to give every American $1,000 a month. I know this may sound like a gimmick, but this is a deeply American idea, from Thomas Paine to Martin Luther King to today.

Let me tell you why we need to do it and how we pay for it. Why do we need to do it? We already automated away millions of manufacturing jobs, and chances are your job can be next. If you don't believe me, just ask an auto worker here in Detroit.

How do we pay for it? Raise your hand in the crowd if you've seen stores closing where you live. It is not just you. Amazon is closing 30 percent of America's stores and malls and paying zero in taxes while doing it. We need to do the opposite of much of what we're doing right now, and the opposite of Donald Trump is an Asian man who likes math.

(APPLAUSE)

So let me share the math. A thousand dollars a month for every adult would be $461 million every month, right here in Detroit alone. The automation of our jobs is the central challenge facing us today. It is why Donald Trump is our president, and any politician not addressing it is failing the American people.

(APPLAUSE)

开场白:

BASH: 安德鲁·杨?

杨: 如果你听说过我和我的竞选活动,你一定听说过有人竞选总统,他想给每个美国人每月1000美元。我知道这听起来像是一个噱头,但从托马斯·潘恩(Thomas Paine)到马丁·路德·金(Martin Luther King),再到今天,这是一个深刻的美国理念。

让我来告诉你为什么我们需要这么做,以及我们是如何支付的。我们为什么要这么做?我们已经有数以百万计的制造业工作岗位被自动化了,你的工作很可能就是下一个。如果你不相信我,就问问底特律的任何一位汽车工人。

我们怎么负担?如果你看到你住的地方的商店关门,请在人群中举手。不仅仅是你。亚马逊关闭了美国30%的商店和购物中心,并且在这一过程中不缴一分钱的税。我们需要做与我们现在所做的相反的事情,而与唐纳德·特朗普相反的,是一个喜欢数学的亚洲人。

(掌声)

让我来分享一下这里面的数学。每个成年人每月1000美元,仅在底特律将是4.61亿美元。工作岗位的自动化是我们今天面临的主要挑战。这就是为什么唐纳德·特朗普(Donald Trump)当上了我们的总统,而任何不解决这个问题的政客都辜负了美国人民。

(掌声)

TAPPER: Thank you. Thank you, Governor Inslee.

Mr. Yang, I want to bring you in. You support a Medicare for All system. How do you respond to Governor Inslee?

YANG: Well, I just want to share a story. When I told my wife I was running for president, you know the first question she asked me? What are we going to do about our health care?

That's a true story, and it's not just us. Democrats are talking about health care in the wrong way. As someone who's run a business, I can tell you flat out our current health care system makes it harder to hire, it makes it harder to treat people well and give them benefits and treat them as full-time employees, it makes it harder to switch jobs, as Senator Harris just said, and it's certainly a lot harder to start a business.

If we say, look, we're going to get health care off the backs of businesses and families, then watch American entrepreneurship recover and bloom. That's the argument we should be making to the American people.

(APPLAUSE)

TAPPER: Thank you, Mr. Yang.

TAPPER:谢谢。谢谢你,英斯利州长。

杨先生,我想带你进来。你支持全民医保。你如何回应英斯利州长?

杨:嗯,我只是想分享一个故事。当我告诉妻子我要竞选总统时,你知道她问我的第一个问题吗?我们要怎么对待我们的医疗保健?

这是一个真实的故事,而且不仅仅是我们。民主党人谈论医疗保健的方式是错误的。作为做生意的人,我可以明白告诉你,我们当前的医疗保健系统使得雇人很难,很难对雇员好,给他们实惠,并把他们当作全职员工,也很难换工作,当然也更加难以创业。

如果我们说,看,我们要把医疗保健的重负从企业和家庭的背上卸下来,然后看美国的企业家精神的复苏和繁荣。这才是我们应该向美国人民提出的论点。

(掌声)

谢谢你,杨先生。

【关于移民议题】

LEMON: Mr. Yang, your response?

杨安泽的UBI答问:作为自由红利的全民最低收入保障

(APPLAUSE)

YANG: I'm the son of immigrants myself. My father immigrated here as a graduate student and generated over 65 U.S. patents for G.E. and IBM. I think that's a pretty good deal for the United States. That's the immigration story we need to be telling.

We can’t always be focusing on some of the -- the -- the distressed stories. And if you go to a factory here in Michigan, you will not find wall-to-wall immigrants; you will find wall-to-wall robots and machines. Immigrants are being scapegoated for issues they have nothing to do with in our economy.

(APPLAUSE)

莱蒙:杨先生,你有什么看法?

(掌声)

杨:我自己就是移民的儿子。我父亲作为研究生移民到这里,为通用电气和IBM申请了65项美国专利。我认为这对美国来说是一笔不错的交易。这就是我们需要讲述的移民故事。

我们不能总是把注意力集中在那些痛苦的故事上。如果你去密歇根州的工厂,你不会发现到处都是移民;你会发现到处都是机器人和机器。移民被当作替罪羊,他们与我们的经济困境毫无关系。

(掌声)

【关于刑事司法议题】

TAPPER: Thank you, Mr. Vice President.

YANG: May I, please?

TAPPER: Mr. Yang, your response?

(APPLAUSE)

YANG: I speak for just about everyone watching when I say I would trust anyone on this stage much more than I would trust our current president on matters of criminal justice.

(APPLAUSE)

We cannot tear each other down. We have to focus on beating Donald Trump in 2020.

I want to share a story that a prison guard, a corrections officer in New Hampshire said to me. He said, we should pay people to stay out of jail, because we spend so much when they're behind bars. Right now, we think we're saving money, we just end up spending the money in much more dark and punitive ways. We should put money directly into people's hands, certainly when they come out of prison, but before they go into prison.

TAPPER: Thank you, Mr. Yang.

(APPLAUSE)

TAPPER:谢谢你,副总统先生。

杨:我可以插一句吗?

TAPPER:杨先生,你有什么看法?

(掌声)

杨:我可以代表在场的每一个人说,在刑事司法问题上,我相信这个舞台上的每一个人,远远超过相信我们的现任总统。

(掌声)

我们不能拆散彼此。我们必须集中精力在2020年击败唐纳德·特朗普(Donald Trump)。

我想分享一个监狱看守的故事,新罕布什尔州的一名狱警对我说。他说,我们应该付钱让人们远离监狱,因为当他们在监狱里时,我们花了很多钱。现在,我们认为我们是在省钱,我们只是以更加黑暗和惩罚性的方式花钱。我们应该把钱直接交到人们手中,在他们出狱之后,但也在他们入狱之前。

谢谢你,杨先生。

(掌声)

LEMON: Mr. Yang, why are you the best candidate to heal the racial divide in America -- your response?

YANG: I spent seven years running a non-profit that helped create thousands of jobs, including hundreds right here in Detroit, as well as Baltimore, Cleveland, New Orleans. And I saw that the racial disparities are much, much worse than I had ever imagined.

They're even worse still. A study just came out that projected the average African-American median net worth will be zero by 2053. So you have to ask yourself, how is that possible? It's possible because we're in the midst of the greatest economic transformation in our history. Artificial intelligence is coming. It's going to displace hundreds of thousands of call center workers, truck drivers -- the most common job in 29 states, including this one.

And you know who suffers most in a natural disaster? It's people of color, people who have lower levels of capital and education and resources. So what are we going to do about it? We should just go back to the writings of Martin Luther King, who in 1967, his book "Chaos or Community", said "We need a guaranteed minimum income in the United States of America." That is the most effective way for us to address racial inequality in a genuine way and give every American a chance in the 21st Century economy.

(APPLAUSE)

LEMON: Mr. Yang, thank you very much.

莱蒙:杨先生,为什么你是治愈美国种族分裂的最佳人选?

杨:我花了七年时间经营一家非盈利机构,帮助创造了数千个就业机会,其中包括底特律、巴尔的摩、克利夫兰和新奥尔良的数百个就业机会。我发现种族差异比我想象的要严重得多。

更糟的是,一项刚刚出炉的研究预测,到2053年,非洲裔美国人的平均净资产中值将为零。所以你要问自己,这怎么可能?这是可能的,因为我们正处于历史上最大的经济转型时期。人工智能即将到来。这将导致成千上万的呼叫中心工作人员和卡车司机失业——而这是29个州最常见的工作,包括这个州。

你知道谁在自然灾害中受害最深吗?是有色人种,他们的资本、教育和资源水平较低。那么我们要怎么做呢?我们应该回顾一下马丁·路德·金(Martin Luther King)的著作,他在1967年出版的《混乱还是社区》(Chaos or Community)一书中说,“我们需要美国有保障的最低收入。”这是我们以真正的方式解决种族不平等问题、让每个美国人在21世纪的经济中都有机会(分享经济红利)的最有效方式。

(掌声)

莱蒙:杨先生,非常感谢。

BIDEN: - in research for new alternatives to deal with climate change.

BASH: Mr. Yang, your response?

BIDEN: And that's bigger than any other person.

YANG: The important number in Vice President Biden's remarks just now is that he United States was only 15 percent of global emissions. We like to act as if we're 100 percent, but the truth is even if we were to curb our emissions dramatically, the earth is still going to get warmer.

And we can see it around it us this summer. The last four years have been the four warmest years in recorded history. This is going to be a tough truth, but we are too late. We are 10 years too late. We need to do everything we can to start moving the climate in the right direction, but we also need to start moving our people to higher ground.

And the best way to do that is to put economic resources into your hands so you can protect yourself and your families.

拜登:在寻找应对气候变化的新选择的研究中。

巴什:杨先生,您有什么看法?

拜登:这比其他任何人都重要。

杨:拜登副总统刚才讲话中提到的一个重要数字是,美国的温室气体排放量只占全球的15%。我们喜欢表现得好像我们是百分之百的,但事实是,即使我们大幅减少排放,地球仍然会变暖。

今年夏天我们可以看到它在我们周围。过去四年是有记录以来最热的四年。这将是一个残酷的事实,但我们已经太迟了。我们晚了10年。我们需要尽一切努力让气候朝着正确的方向发展,但我们也需要让我们的人民搬到更高的地方。

最好的方法是把经济资源放在你的手中,这样你就可以保护你自己和你的家人。

TAPPER: Thank you, Senator Gillibrand. Mr. Yang, in poll after poll democratic voters are saying that having a nominee who can beat President Trump is more important to them than having a nominee who agrees with them on major issues. And right now, according to polls, they say the candidate who has the best chance of doing that, of beating President Trump is Vice President Biden. Why are they wrong?

YANG: Well, I'm building a coalition of disaffected Trump voters, independents, libertarians, and conservatives, as well as democrats and progressives. I believe I'm the candidate best suited to beat Donald Trump and as for how to win in Michigan and Ohio and Pennsylvania, the problem is that so many people feel like the economy has left them behind.

What we have to do is we have to say look, there's record high GDP in stock market prices, you know what else they're at record high is? Suicides, drug overdoses, depression, anxiety. It's gotten so bad that American life expectancy had declined for the last three years.

And I like to talk about my wife who is at home with our two boys right now, one of whom is autistic. What is her work count at in today's economy. Zero and we know that's the opposite of the truth. We know that her work is amongst the most challenging and vital.

The way we win this election as we redefine economic progress to include all the things that matter to the people in Michigan and all of us like our own heath, our well being, our mental health, our clean air and clean water, how are kids are doing.

If we change the measurements for the 21st century economy to revolve around our own well being then we will win this election.

(CROSSTALK)

TAPPER: Thank you, Mr. Yang. Congresswoman Gabbard, your response?

TAPPER:谢谢你,吉里布兰德参议员。在一次又一次的民意调查中,民主党选民表示,对他们来说,有一个能够击败特朗普总统的候选人比有一个在重大问题上与他们意见一致的候选人更重要。现在,根据民意调查,他们说最有可能击败特朗普总统的候选人是副总统拜登。为什么他们错了?

杨:嗯,我正在建立一个由心怀不满的特朗普选民、独立人士、自由主义者、保守派、民主党人和进步人士组成的联盟。我相信我是最适合击败唐纳德·特朗普的候选人。至于如何在密歇根州、俄亥俄州和宾夕法尼亚州获胜,问题是很多人觉得经济已经把他们甩在了后面。

我们要做的是,看,股票市场的GDP达到了创纪录的高水平,你知道处于创纪录的高水平的还有什么吗? 自杀,药物过量,抑郁,焦虑。情况变得如此糟糕,美国人的预期寿命在过去三年里下降了。

我想谈谈我的妻子,她现在和我们的两个儿子在家,其中一个患有自闭症。她的工作在今天的经济中起什么作用? 0,我们知道这是与事实相反的。我们知道她的工作是最具挑战性和最重要的。

当我们重新定义经济发展时,我们赢得这次选举的方式包括所有对密歇根人民和我们所有人都重要的事情,比如我们自己的健康,我们的幸福,我们的精神健康,我们干净的空气和干净的水,孩子们过得怎么样。

如果我们改变对21世纪经济的衡量标准,使之围绕我们自己的福祉,那么我们将赢得这次选举。

(相声)

谢谢你,杨先生。国会女议员加巴德,你怎么看?

BASH: Mr. Yang, Mr. Yang, women on average earn 80 cents, about 80 cents for every dollar earned by men. Senator Harris wants to fine companies that don't close their gender pay gaps. As an entrepreneur, do you think a stiff fine will change how companies pay their female employees?

YANG: I have seen firsthand the inequities in the business world where women are concerned, particularly in start-ups and entrepreneurship. We have to do more at every step. And if you're a woman entrepreneur, the obstacles start not just at home, but then when you seek a mentor or an investor, often they don't look like you and they might not think your idea is the right one.

In order to give women a leg up, what we have to do is we have to think about women in every situation, including the ones who are in exploitive and abusive jobs and relationships around the country. I'm talking about the waitress who's getting harassed by her boss at the diner who might have a business idea, but right now is stuck where she is.

What we have to do is we have to give women the economic freedom to be able to improve their own situations and start businesses, and the best way to do this is by putting a dividend of $1,000 a month into their hands.

(APPLAUSE)

It would be a game-changer for women around the country, because we know that women do more of the unrecognized and uncompensated work in our society. It will not change unless we change it. And I say that's just what we do.

(APPLAUSE)

巴什:杨先生,杨先生,女性的平均工资是男性的平均工资是80%,男性挣一个美元的工作,女性才能得80美分。哈里斯参议员希望对那些没有缩小性别薪酬差距的公司进行罚款。作为一名企业家,你认为严厉的罚款会改变公司支付女性员工的方式吗?

杨:我亲眼目睹了商界的不平等,尤其是女性在创业和创业方面的不平等。我们必须在每一步都做得更多。如果你是一名女企业家,障碍不仅来自家庭,而且当你寻求导师或投资者时,他们往往和你长得不一样,他们可能认为你的想法不正确。

为了给女性提供帮助,我们必须做的是,我们必须考虑到各种情况下的女性,包括那些在全国各地处于被剥削和虐待处境和关系中的女性。我说的是女服务员,她在餐馆里被老板骚扰,她可能有一个商业想法,但现在却被困在原地。

我们要做的是给女性经济自由,让她们能够改善自己的处境,创业,最好的办法就是每月给她们1000美元的红利。

(掌声)

这对全国的女性来说将是一个游戏规则的改变,因为我们知道,在我们的社会中,女性做了更多不被认可和没有报酬的工作。除非我们改变它,否则它不会改变。我要说这就是我们要做的。

(掌声)

TAPPER: Thank you. Thank you, Congresswoman.

Mr. Yang, Iran has now breached the terms of the 2015 nuclear deal after President Trump withdrew the U.S. from the deal, and that puts Iran closer to building a nuclear weapon, the ability to do so, at the very least. You've said if Iran violates the agreement, the U.S. would need to respond, quote, "very strongly." So how would a President Yang respond right now?

YANG: I would move to de-escalate tensions in Iran, because they're responding to the fact that we pulled out of this agreement. And it wasn't just us and Iran. There were many other world powers that were part of that multinational agreement. We'd have to try and reenter that agreement, renegotiate the timelines, because the timelines now don't make as much sense.

But I've signed a pledge to end the forever wars. Right now, our strength abroad reflects our strength at home. What's happened, really? We've fallen apart at home, so we elected Donald Trump, and now we have this erratic and unpredictable relationship with even our longstanding partners and allies.

What we have to do is we have to start investing those resources to solve the problems right here at home. We've spent trillions of dollars and lost thousands of American lives in conflicts that have had unclear benefits. We've been in a constant state of war for 18 years. This is not what the American people want. I would bring the troops home, I would de-escalate tensions with Iran, and I would start investing our resources in our own communities.

(APPLAUSE)

TAPPER: 谢谢。谢谢你,国会女议员。

杨,在特朗普总统宣布美国退出2015年核协议后,伊朗违反了该协议的条款,这使得伊朗离制造核武器又近了一步,至少有能力制造核武器。你说过,如果伊朗违反协议,美国需要做出“非常强烈”的回应。那么,杨现在会如何回应呢?

杨: 我想采取行动缓和伊朗的紧张局势,因为他们是在回应我们退出这项协议的事实。不仅仅是美国和伊朗。还有许多其他世界强国也参与了这项多国协议。我们必须试着重新达成协议,重新协商时间表,因为现在的时间表已经没有意义了。

但我已经签署了一项承诺,结束永远的战争。现在,我们在国外的实力反映了我们在国内的实力。到底发生了什么? 我们在国内四分五裂,所以我们选了唐纳德·特朗普(Donald Trump),现在我们与我们的长期合作伙伴和盟友之间的关系也不稳定、不可预测。

我们要做的是开始投资这些资源来解决国内的问题。我们已经花费了数万亿美元,在冲突中失去了成千上万的美国人的生命,而这些冲突的好处并不明显。18年来,我们一直处于战争状态。这不是美国人民想要的。我将把军队撤回国内,我将缓和与伊朗的紧张局势,我将开始在我们自己的社区投入我们的资源。

(掌声)

TAPPER: Welcome back to the CNN Democratic presidential debate. It is time now for closing statements. You will each receive one minute. Mayor de Blasio, let's begin with you.

TAPPER:欢迎回到CNN民主党总统候选人辩论节目。现在是结束陈述的时候了。你们每人将得到一分钟。白思豪市长,让我们从你开始。

TAPPER: Mr. Yang?

YANG: You know what the talking heads couldn't stop talking about after the last debate? It's not the fact that I'm somehow number four on the stage in national polling. It was the fact that I wasn't wearing a tie. Instead of talking about automation and our future, including the fact that we automated away 4 million manufacturing jobs, hundreds of thousands right here in Michigan, we're up here with makeup on our faces and our rehearsed attack lines, playing roles in this reality TV show.

It's one reason why we elected a reality TV star as our president.

(LAUGHTER)

(APPLAUSE)

We need to be laser-focused on solving the real challenges of today, like the fact that the most common jobs in America may not exist in a decade, or that most Americans cannot pay their bills. My flagship proposal, the freedom dividend, would put $1,000 a month into the hands of every American adult. It would be a game-changer for millions of American families.

If you care more about your family and your kids than my neckwear, enter your zip code at yang2020.com and see what $1,000 a month would mean to your community. I have done the math. It’s not left; it’s not right. It’s forward. And that is how we’re going to beat Donald Trump in 2020.

(APPLAUSE)

TAPPER:杨先生?

杨:你知道上次辩论后那些人不停地说些什么吗? 并不是说我在全国民调中排名第四。谈的是我没有打领带。我们不是在谈论自动化和我们的未来,包括自动化让400万个制造业工作岗位消失的事实,就在密歇根这里,成千上万的工作岗位消失了。我们化着妆,排练着相互攻击的台词,在这个真人秀节目中扮演角色。

这就是为什么我们选了一个电视真人秀明星当了我们的总统。

(笑声)

(掌声)

我们需要集中精力解决当今的真正挑战,比如美国最普通的工作可能在十年后不复存在,或者大多数美国人无法支付账单。我最重要的提议,自由红利,将使每个美国成年人每月获得1000美元。这将改变数百万美国家庭的游戏规则。

如果你更关心你的家庭和孩子,而不是我的领带,请在yang2020.com输入你的邮政编码,看看每月1000美元对你的社区意味着什么。我算过了。这不是蛇么左派,也不是右派,而是向前看。这就是我们如何在2020年击败唐纳德·特朗普。

(掌声)

【相关】

https://www.yang2020.com/?fbclid=IwAR1QJVOpwu1FBgXsCwE0YBmeX0U02TbEmwliQD7A8dtPhrQHAZe7h9qOg5o

华盛顿邮报: https://www.washingtonpost.com/politics/2019/08/01/transcript-night-second-democratic-debate/?noredirect=on&utm_term=.f895d8fa66aa

youTube:

看看这个剪辑。七分多钟:
https://www.youtube.com/watch?v=M97zgXh89jM&t=335s

还有辩论后CNN采访:

Andrew Yang and Anderson Cooper, Post Debate Interview (July 31, 2019) 




《李白王116:句法的脑补,情报的冤家(2/2)》

李:@宋柔 老师说了不少我正想说的话 I cannot agree more,譬如:

“当然。我完全同意语义的重要性,只是觉得词汇语义+事理常识+专业知识,实在是无边无际,难以控制。某个句子可以采用某种语义关系加以解释,但可选用的语义关系非常多,机器怎么就能选对了语义关系进而做出正确的解释?大数据并非万能。所以,挖掘句法的硬约束还是有意义的。一些硬约束其实还没有挖掘出来。”

句法做深做透做得细线条 -- 直到暗度陈仓碎片化引入常识语义 -- 以后,句法这个“独角戏”可以唱很远,留给纯粹需要语义、事理的休眠唤醒部分就会大量减少。如果句法模块解决了90%+的逻辑语义,语言学知识成为解析的主力,留下不到 10% 交给语言学外的其他知识,岂不多快好省。其实 甚至那个 10% 还在不断缩小中 因为在句法解析不断迭代细化的过程中,硬性约束(或硬性+非系统性的碎片化软性约束)搞定的现象越来越多,无须留给后面的语义语用模块做。留给下一步的现象,理论上是句法有意留下的,包括真歧义。当然 也可以说 殊途同归,因为上面提到的细线条句法 已经不是纯粹句法了。

POS feature 公认为句法特征,POS 下面的 subcat 通常也认为是句法,再往下是 sub-subcat 直到词汇驱动的个性规则,最后到搭配和成语,其实是句法渗透到语义的地盘了。只要句法用特征(features)这种隐性形式(而不是词序、小词、形态这些显性符号的形式),句法就为碎片化语义和常识开了一道门缝。但这里的语义带入不是系统性的。换句话说 句法约束与语义约束是一个频谱 没有一道鸿沟。但是句法为主语义为辅、句法模块先于语义模块、句法系统话语义碎片化,则是一条解析路线。争的就是路线(“路线斗争”),所做的 功/工,无论哪条路线,也都有很多相交。

特征(features)是灰色地带的标志和桥梁。既然句法 可以用 N,V,NP 这样的特征 当然也可以用细线条的 food,person-action 这样的特征。前者普遍接受为句法 后者说是语义 但形式上不过就是命名的粗细而已。看句法 hierarchy 是如何逼近语义灰色地带的:

(1) SVO 传统规则的 VP rule:V + NP --> VP

这是经典句法 漏得跟筛子似的 但可以 cover 英语和汉语的很多现象(在汉语的表现差一些)。

(2)Subcat 句型规则: Vt + NP --> VP

用到 subcat 标签 Vt 了,不再涵盖动词的全集,漏洞是弥补了一些,但仍很多例外。

(3)SVO 完整句型:NP + Vt + NP --> NP:S + VP(Vt+NP:O)

这个用到了SVO完整句型,更可靠一些了。

(4)T1 SVO T2 上下文规则,如:
句首 + (NP + Vt + NP) + 标点 --> NP:S + VP(Vt+NP:O)

这条开始用到上下文约束了,有了前后条件,句法更加精准,差不多板上钉钉了。上下文也有更复杂的情况,所以光靠 T1 T2,也不是天衣无缝:但句法可以晚上睡觉睡得踏实一些了。进一步细化条件也可以的。

(5)细线条T1 SVO T2 上下文规则:
句首 + (NP + Vt + NP) + 句末 --> NP:S + VP(Vt+NP:O)

这是铁案,纯句法完全搞定。至此 没有常识语义什么事儿了,哪怕是nonsense(“鸡吃了我”),逻辑语义也是可以解析的。

(6)暗度陈仓的碎片化语义句法规则:EAT-V + FOOD-N --> VP(V+N:O)

开始带入常识语义了。虽然没有查验更大的上下文,但因为带入的语义(相偕)弥补了长度的不足,还是相当可靠的。也可以 argue 这实际上不是句法规则 而是语义规则,但放在句法 hierarchy 的一端,与句法规则的另一端 V + NP 形式上无异 不过是符号的颗粒度、概括性不同而已。

(7)动宾搭配规则:吃 + 亏|西北风|药 --> VP(吃+N:O)

这是 rule hierarchy 细化的极端,算是句法语义规则吗?搭配这类词典与句型交叉的东西 说它是词典化的句法 没问题。里面暗藏的语义相谐和常识的印迹是非常的强烈,句法语义已经分不清了。

所谓 hierarchy 就是说 上述n层规则可以组织成为一个系统 保证细颗粒度和高精度规则具有优先权。这样的暗度陈仓又自成体系的句法 叫唱独角戏也好 叫偷梁换柱也好 总之 留给系统性常识的空间已经不多了 90%+ 现象不需要等到“纯语义”出场。

从符号逻辑的匹配和演算来看 什么是句法 什么是语义 二者区别何在呢?给一万个词做N的标签 给一千个词做 Vt 的标签,写一条符号模式 V + N --》VP(V+N:O), 全世界都同意这是句法。如果给一千个词做个 FOOD标签,给50个词做 EAT 的标签,然后照猫画虎写一条模式:EAT + FOOD --> VP(EAT+FOOD:O), 突然就变成语义/常识规则了。不就是标签的概括面大小不同吗 所有的机制手段演算方式都不变,这个模式的所有句法变式也不变:

Vt+N ==> 把+N+Vt ==> N+被+Vt
EAT+FOOD ==> 把+FOOD+EAT ==> FOOD+被+EAT

ontology 中的 taxonomy 链条也是恒定不变的:

EAT --> Vt --> V
FOOD --> N

所有的标签都是隐性形式 只要开始使用隐性形式 想不让“语义”溜进来都难。除非句法不允许隐性形式(不许给词标签 不许抽象 不许查词典),只允许用显性形式:词序+直接量(词本身和前后缀词素和形态), 否则论约束条件,句法语义的边界必然是灰色的。(但句法模块与语义模块、语用模块是可以分开的。)

白:这个分明是暗度陈仓,细线条的特征就是轻量级的语义。无后续手段的句法标签例如s标了也是糊弄,不如不标。按这个说法,伟哥90%的所谓句法在我这里都是轻量级的语义,好的坏的暂且不论。

李:退一步 只使用显性形式的句法 也就是差不多一律只使用 ngram 去枚举语言现象 是不是句法就纯粹化 不受语义侵入了呢?其实也不是 因为所谓强搭配(洗+澡)的现象 实际上就是 直接量+词序 的规则 :吃 + 亏|西北风|药 --> VP,算不算句法?里面有没有语义约束?不仅有,而且是最强的语义相谐。

白:CFG无法把“吃亏”的原有形式和被穿插、被逆序的形式联系在一起。必须使用transformation,但这样一来毛毛虫又变长了。完全可以不这么处理的。

李:以前论过语言的句法形式 说主要就是:1 词序; 2 小词(直接量); 3. 形态(词尾直接量)和其他的前后缀(直接量);4. 句法词法特征。到了 4 就跳进黄河洗不清了,因为句法词法特征与语义特征的区别 只对人类玩符号逻辑的游戏有意义 对于机制和实现都是同样的东西,每个特征就是划个圈,代表一个集合,完全可以等价地用直接量的“逻辑或”来表达,这就从隐性形式等价转回为显性形式了。最后还有 5,被有意无意漏掉: 5. 实词(直接量)。据说实词是开放集,不提倡用直接量写规则(强搭配呢,例外?)。

白:直接量聚类可以获得标签。

李:从现在的算力看 实词直接量在 ngram(譬如 n<=5) 的范围内,全部死记住其组合 根本就不是问题。这就等价于 词直接量+词序 的规则形式,算句法还是语义呢?应该还是句法 不过就是沾染了人认为具有语义味道的句法。老话说 句法的基础是形式 语义的基础是概念。一旦概念利用同质的特征来形式化表示以后 语义也是(隐性)形式了,自然可以进入形式句法。

白:这些标签叫不叫语义不是一个理论问题,而是一个习惯问题。隐性只是相对于傻瓜而言。对于具有聚类和分类功能的系统来说,被称为隐性的很多特征也都是明摆着的。

李:这是在论证句法和语义从定义上就是模糊的,没有清晰界限和鸿沟的。句法为主的路线 可以不露痕迹带入语义,而且是句法发展的自然结果。不能说 a+b 是句法 换成 x+y 就不是句法了。都是 符号+符号的位置啊。从模式的形式化或形式化的模式来看 没有任何区别。但那个深度本身是一个渐变的频谱 pos -- subcat -- subsubcat -- wordsense。而且 对于深度的归类 本质上就是符号逻辑的游戏 说白了就是一个助记符。

wang:我觉得词法、句法、语义本身概念还是很清晰的,只不过为了实现他们的分析,采用的方法很难区分界限了,感觉也没有必要区分界限,只要能解决问题就好。方法上把它们分得再清晰,不解决问题,也无意义。符号描述内容的深度,确实会触及到语义。除非,N, V,adv,adj ... 这些符号,不过这些符号 现在来说,法力不大。助记符,是一方面,这分类的限制级别,对匹配效果影响很大,粗粒度,细粒度,什么都靠它。在匹配时,不是固定的级别,弹性适应才好。过粗,泥沙混进来了,过细,则无徒了。

白:对实现来说,叫什么不重要,是什么才重要。关键是,叫句法,显得这句法神秘无比。好混饭吃。叫语义,可以有N板斧挑战你,没想好就望风而逃吧。利用人们心目中的语义其重无比、其玄无比的印象,把轻量级的语义打翻在地再踏上一万只脚:让你冒充语义!声称用了语义者,一定拖家带口,拖泥带水,不干不净而且注定hold 不住。声称用了句法者,一定清清白白、简简单单、干干净净,而且让其他拘泥于真句法者不明觉厉。

wang:同意白老师,以最终解决问题为看点。可以先不拘泥于叫法。其实现在很多技术和方法都是杂糅的,单纯清口的一道菜,很难满足客人的胃口。若扯起语义挂名的系统,很多人就会追问那种语义,什么级别的语义,,,,非时一番解释后,发现对自身系统也没什么收益。语义盘子大,要么是沾点边就马上算,要么只要没覆盖到主要点上马上,就会视为伪语义。自然语言处理系统,尤其汉语,就必须走句法语义相结合,才能走大,不必去硬性区分泾渭之界。谁占得比例多大,结合的有效果就好,至少目前来说,看不出什么黄金比例。

李:其实 这年头是相反的。句法老掉牙了 谁都不尿它。要是说常识 事理 世界知识 领域图谱,才勉强能站得住 为符号学派发点声。毕竟语义、知识听上去高大上 那边厢黑箱子里面讨论未来的时候,也还是免不了要吆喝一声要常识 才可望有个奔头,否则就该到了终结者末日了。下一个突破点在哪里,说句法太寒碜 说知识才拿得出手。印象中几个院士也在说知识,没听说人还说啥句法的。

说法/吆喝不论,加了语义约束的句法叫是句法模块,是因为它与句法的运作模式没有变化。主要目标也依然是结构化:把线性输入变为树图输出。到了下一步的语义模块,运作模式就不再是线性输入了,而是在图里面做文章了。目的的重点也改变了,结构化已经基本完成,语义模块的任务变成:1. 逻辑语义细化(句法角色映射到逻辑语义角色);2. WSD。对结构化的部分重建(休眠唤醒)也算是一个语义模块的子任务。

句法模块:string --》graph/tree 句法
语义模块:graph --》逻辑语义+WSD 语义

白:大s小s,硬s软s,这种标签对于我们的体系来说是不重要的。我们更看重一些像C-Command这样的无语言学色彩的纯数学条件,比如:两个成分结合,一个携带了残坑,另一个携带了已填坑的萝卜,二者的源头都不是当下的中心词而且相谐,此时要不要建立萝卜和残坑的二元句法关系。

“象鼻子长”,象标成大s又如何,实质是鼻子的宿主。“王冕死了父亲”,王冕标成s又如何,整个句子标成svo又如何?王冕实质是父亲的宿主,死仍是不及物的。在我们的体系里,宿主有直接而明确的体现,没主语什么事儿。“张三又吃食堂了”,就算把食堂标成o又如何?吃什么还是不知道。假装把“吃”填的满满的,没解决根本问题,等能解决根本问题的词语出现时,却没位置了。小三就是这么上位的。

“张三又吃食堂了,那么油腻的面条他也忍受得了。” 面条出来了,位置却没了。句子复杂一点,就会遇到各种企图上位者。把它们挡在门外的最好办法就是相谐性检查。这是通过一个中间件进行的,一点不麻烦,与句法之间也不会发生除了优先级动态调整之外的任何其他牵连。这个检查做完了,句法设定的初始优先顺序如果没有发生改变,就相当于尊重句法了,也可以说是给句法把了一道关。但是不能因此说保镖无用。后句中心词是“忍受”,“面条”作为非中心词萝卜,与“忍受”有填坑关系。

两句以谓词“吃”与“忍受”的“合并”结合,各自携带着自己的辖域形成一个更大的辖域,这时候辖域内的未饱和坑就暴露出来了。“Food”坑是前句中心词“吃”的亲儿子,不是残坑,所以属于“单边飞线(中心词与非中心词的hidden link)”,优先级高于“双边飞线”。所以已填坑萝卜“面条”和未饱和坑“吃”的关系被摆上了桌面。查中间件的结果是,二者相谐。后来的正主儿“面条”登堂入室,先到的小三“食堂”该降格早已在处理前句时降格了,大家井水不犯河水。这个过程怎么看都是在帮句法啊。

“一辆车坐六个人”“六个人坐一辆车”,语义上没区别,我们给出的句法标签拓扑上也没区别。但语序上是两套不同的svo。如果不做相谐性检查,这样的s和o就算标了,给谁用呢?谁会用呢?等语义落地?我们在做相谐性检查的时候,这部分就已经落地了。

大家看到的似乎是除了词例外长得一模一样的两张图,但实际上,两个坑有语义差异,两个萝卜也有语义差异,这些语义差异引发的内部的较量已经完成,可以说提前撇下句法进入语义了。相应语义标签,在下一阶段开发完成后也会提供出来。记得当年长者的同学窦祖烈先生的汉英机器翻译系统就栽在我给他出的这个例子上:“这辆车能坐六个人”被翻译成“This car can sit six people”。后来我说,把“坐”换成“载”试试?老先生这个高兴啊……

加“把”会不会有利于坐实所谓逻辑宾语?不一定。

“食堂”过坑门而不入,都赶上大禹了。虽然被“把”加持了,该不是你的位置,仍然不给你。这里也遇到一个问题,就是原来“食堂”从名词降格而来的“地点状语”的身份不见了,成了补语“穷”的正牌萝卜。既然正牌,还降什么格?系统目前是这个逻辑。但是状语标签没了似乎也不对。既然都“把”了,总得给谓语动词留点什么念想吧?不能混同于普通名词。应该是降格之前做补语的萝卜,降格之后做谓语的修饰语,两不误才对。

【相关】

《李白宋115:常识是句法的脑补(1/2)》

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

《李白宋115:句法的脑补,情报的冤家(1/2)》

立委按:cs(common sense):句法的脑补,情报的冤家,是为常识。常识语义在语言理解中的作用,一直是AI符号派的重要话题。常识看上去漫无边际,如何形式化有效利用,也一直是个挑战。沙龙讨论的是轻量级或碎片化的常识语义的可行性与实践体会。具体说来有两方面,一是所谓语义相谐反映的常识条件在语言解析中的作用(譬如,EAT谓词概念 与 FOOD类实体的相谐度高),二是所谓“事理”图谱(譬如,“面试”与“录用”之间的因果关系),反映的是某种常识推理。有意思的是,语义落地所强调的情报性有与常识相逆的特性。俗话说,狗咬人不是新闻,人咬狗才是。

白:“他给张三倒洗脚水”、“他向张三泼洗脚水”,在两句中,“洗脚水”各是谁的?“他给张三拿银子”有歧义,一是他帮张三拿张三的银子,二是他拿自己的银子给张三。介词宾语和主语,什么条件下谁来跟宾语发生领属关系?有钱出钱,拿的是自己的钱;有力出力,拿(拎?背?揣?端?抱?抗?)的是别人的钱。

“他给张三写自传”,自然是张三的自传;“他给张三送自传”有歧义,可能是赠送“他”的自传给张三,也可能是给张三跑腿,把张三的自传送给其他人。赠送义本身有间接宾语,但“给”的介词宾语未必与之重合。因为出现了一个“帮办”角色。主语是帮办,主执行;介词宾语是事主,主名分。帮办做动作,名分归事主。间接宾语角色和事主角色造成歧义。

“张三给李四带口信”有三重歧义。张三委托别人把口信带给李四vs别人委托张三把口信带给李四vs李四的口信委托张三带给别人。这里的角色有:事主、帮办、直接宾语、间接宾语,口信是直接宾语,李四不能是帮办、张三不能是间接宾语。剩下的组合构成上述三重歧义。“向”引入的介词宾语坑,在动词不具有间接宾语坑时(如“吐痰”、“泼水”)临时客串间接宾语角色。在动词带间接宾语坑时(如“投掷”、“赠送”),二者共享一个萝卜。没有事主帮办之分。临时客串的情况下,介词宾语和直接宾语没有领属关系。“为”引入的介词宾语又是另一番景象:它是直接宾语的当然领属者。“为他人做嫁衣裳”不管是谁做,穿的一定是“他人”。

“在公园爬树”,“树”是“公园”的附属物,勉强说得上领属关系。“在公园打人”,“人”是不是“公园”的附属物,难说。“张三在公园放风筝”,“风筝”不仅不是“公园”所有,反而大概率是“张三”所有。所以,介词为“在”时,领属关系似可不作标记。真要追究时,靠事理来弄。没有坑的直接宾语,随他去。有坑的,看相谐性或者大数据。“张三在这个公园有月票,每天早上都来锻炼身体。”“月票”的坑就由“公园”来填。

“他给张三买了块巧克力吃”,是“张三”吃,不是“他”吃。“给”的介词宾语置换出来,在谓词群里面横扫千军。在有接续动词的情况下,“帮办”角色自动消失了!

“他给张三送了本自传看。”没歧义了,是“他”的自传而非“张三”的自传,“他”不是帮办“张三”也不是事主。世界清静了。真神奇啊。“他给张三挖了个坑”有微弱歧义;“他给张三挖了个坑跳”一点歧义没有。

汉语的介词,S+/N,禁止名词右填坑;日语的格助词,S+/N,禁止名词右填坑。英语N向S左填坑只限一次,再多的名词只能受动词短语降格修饰,汉语的N向S左填坑则不受这个限制,所以逻辑主语话题主语大小主语一堆堆。方向性对于加速获得正解还是很必要的。汉语的个别词,如“以前”,是反过来的,S+/X,但是X坑只能从左侧填,禁止从右侧填。从CG走来,先把填坑的方向性全部放开,再选择性地关闭其中个别词的个别方向。特别是,语种选择可以批量设置关闭方向。修饰的方向性基本不放开。头尾修饰是否有副作用,还不清楚。

宋:@白硕 在你的系统中如果一句话内的词相同,词序不同,是不是分析结果相同?

白:@宋柔 不一定,看具体配置,特别是词性标注不同会不一样。比如:张三比李四高,李四比张三高,一定是不同的parse。

谁填“高”的坑,谁填“比”的坑,都是不同的,当然是不同的分析结果。

酱油李四打了,李四酱油打了。这俩,分析结果的拓扑一样,内在语义角色的指派也一样。毕竟酱油不能打李四。

后面四个的分析结果,拓扑结构是一样的。它们当中,1-2的语义角色指派是不确定的,3-4的语义角色指派是确定的。如果有更强的上下文,1-2的语义角色指派会随之更为确定一些。这个机制,在句内的已经部分实现,跨句的还没有实现。

宋:猫抓老鼠和老鼠抓猫,分析结果一样吗?

白:拓扑一样,语义角色指派不一样。看图看不出本质差别。

鸡不吃了,在图上是没有歧义的。

宋:猫抓老鼠和老鼠抓猫,施事都是猫,受事都是老鼠?

白:不是的。能说的是:猫和老鼠,相对于抓,都是“填坑”关系,而且填了不同的坑。谁填了哪一个,句法不予确定。语义角色指派可以根据语序推定,但只限于一左一右这种。两个都在一边就无法推定。图上不标施事和受事。现在图上能看到的是LMa、RMa等。不负载施事受事等语义标签信息。

在双宾语的情况,某些江南方言里有时听到“我给钱你”这样的句式。直接宾语和间接宾语倒挂,而且不加介词。二者一人一非人的场景,是可以搞对的。二者皆人,我还没听到例子(不知道“我嫁女儿你”能说否),但真要区分角色的话,可能需要用到事理了。

宋:也就是说,对于二价动词V来说,N1 N2 V中,N1和N2各填V的那个坑,要看N1和N2与V的语义相谐性;N1 V N2,还是要看语序来决定谁填那个坑。对吗?

白:都相谐再看语序。

如果都在一边,语序也不起作用:“猫老鼠抓了”“老鼠猫抓了”,这时还要请出事理啊大数据啊更大上下文啊什么的。

宋:明白了。

李:都相谐再看语序?

svo 语序 为啥要看相谐呢?

“是乌云吃了月亮 还是月亮吃了乌云?”

白:都不相谐也回到语序。

李:“做了个梦好怪 一张烙饼吃下了一窝兔子”。

白:相信说话者别有用心,或者相信一切皆可为专名,都是出路。有强语境做免死金牌的,更可以回到语序。

李:还可以这么说话:

“一个实体x了另一个实体”。

“x 被律师打黑了”。

白:见怪可以不怪,那还相谐个啥。说都不会话了。提着火车上皮包。小孩说话慢慢教,哪有一井挖个锹。

李:问题是 先相谐 然后看语序 次序感觉不对。

“月亮吃乌云” 是都不谐,“烙饼吃兔子” 是谐与语序矛盾, svo 语序是决定性的,相谐是非决定性的。决定性的句法形式 决定了就完了。形式留下空间 才有相谐出场的必要。

白:“草把兔子吃肥了”。“烙饼把兔子吃噎着了”。完不了。句法形式到了汉语,语序变轻了。

李:语序是句法形式 相谐是语义约束。“烙饼把兔子吃噎着了”,不是句法的反例。语序 小词 都是形式,它们留下空间 才有语义约束的可能性。硬指标以后 才看软指标。显性形式没辙了 才求隐形形式 包括常识语义。

白:还有容错一说吧。“拎着火车上皮包”,就是被容错了。韵律感越好,越容错,乃至无感。反过来搭,和不搭,是不同的处理。反过来搭,容错占主导;不搭,句法占主导。句法一主导,然后就进入疯狂的脑补,拼命找辙。

顺杆儿爬,顺杆儿滑,隐喻,夸张,甚至怪诞的专名,都可以有。此外,局部有伪歧义的情况,不搭是最先要排除的。比如“馒头吃光了”。标准svo啊,但是不work。除非拿到怪诞大比拼的免死金牌。

宋:老鼠抓猫,老鼠一定是施事,猫一定是受事,因此,此时的“抓”不会是“抓捕”。而应该是“抓挠”。语序决定了施动受关系,进而决定了动词的语义。

白:这是事理。恰好“抓”有一个义项符合事理。

宋:如果有更大的语境提示是童话故事,或者发生基因变化,“抓”可以是“抓捕”的意思,但仍然老鼠是施事,猫是受事。

白:当你在处理一个局部的sov时,并不知道其他义项是否会组成更搭的合语法结构,所以对局部不搭的sov而言,是否一定会出头,不是局部能确定的,还要看别人。

“老鼠抓不抓猫都吃得好好的。”

“老鼠一抓到猫就可以睡大觉了。”

“老鼠一抓到猫就可以美餐一顿了。”

“猫一抓到老鼠就可以美餐一顿了”。

一个意思。局部要不要搞成不搭的svo,取决于全局。

宋:好例!

白:所以svo不是教条,只是一种可能性。放大看,svo要不要还两说呢……

宋:“老鼠一抓到猫就大祸临头了。”

白:不搭给这种可能性减分,但也不断其生路。外围有更好的组合,svo又算个啥,该扔就扔。外围没有更好的组合,svo就勉为其难吧。但是,组合好不好,一定是句法语义通盘考量的,哪有句法一定优先于语义一说。

“老鼠一抓到猫就大祸临头了。” 有歧义,充分脑补吧。老鼠居然抓到了猫,这世界该翻了天了,大祸临头。猫抓到了老鼠,去掉了主人的心病,主人也该卸磨杀驴了吧,大祸临头。猫给老鼠抓到只是猫的计策,老鼠大祸临头了。接下来玩死你。

事理可以作用于伪歧义的消除,但是对真歧义,事理也毫无办法。猫大祸临头,老鼠大祸临头,看客大祸临头,都有相应的解读。svo作为一个局部,你根本不知道外面有什么时,根本不敢把赌注押在句法上。

李:T1 svo T2,就够了。绝大多数情况不需要语义出场。trigram 是句法 5-gram 也是句法 都还在可控范围之内。以前说过 任何在(dynamic) 5-gram 之内可以搞定的事情 都是 tractable 的。虽然理论上永远可以找到反例,但是随着 n-gram 中 n 的扩大 (up to 5),随着 gram 的定义由 literal 延伸到包括 token features,以及随着 gram 从 word 延伸到动态的句素(包括各类短语),句法兜不住的伪歧义反例急剧减少 -- 直到句法发现真歧义。这时候 语义(主要是常识)约束、语用约束、领域约束等等 可以逐步出场,或不出场(保持歧义,或包容歧义)。

“传统” parser 为伪歧义困扰的事情 已经是过去的故事了。“现代”的句法基本上摆脱了伪歧义的羁绊 因为细线条 词汇主义路线 以及多层动态的 parsing。

白:五元组判定过程中用不用语义?用不用相谐性?如果用,那岂不是说相谐性判断先于svo?如果不用,伪歧义怎么弄掉的?单凭句法?就是说,T1、s、v、o、T2,各自携带了一些特征,用于五元组来判断svo要不要归约为s。这些特征包不包括语义/本体特征?动用这些特征是不是先于svo结构被确定?

不妨就试试 “老鼠一抓到猫就可以美餐一顿了”。看看“一”和“就”的辖域分界线是怎么确定的。实际上就四元组。左侧空缺。右侧再饶一个,又怎样?

“酱油打了李四也该回去交差了。”

到底是把“酱油”理解成一个人的外号,还是放弃svo转投ov(s)?哪一个是符合奥卡姆剃刀原则的?

如果上下文介绍李四是杀手,目标是张三,“张三杀了李四也该回去交差了”是不是应该放弃svo?这个上下文是五元组能cover的?事理:x完成任务—>x交差,任务从上文取得。

李:以反例批评一个一般性策略 其结果就是所有的过程性都是跛脚的 所有的因素都必须同时起作用。

白:有更好的系统性策略,而且并不跛脚。就是加分减分而已。看得分是一个统一的策略。硬约束有一个高的基准分。软约束不把它拉下来他往前走就是,拉下来就别怪谁了。

李:(较)软性约束与(较)硬性约束不同步 是一个总体有利的策略。

白:同不同步只是一个计算策略问题。晚几步发现问题还是早几步发现问题的事儿。只要有问题,拉下来则是必须的。就看付出的代价是什么了。另外的选择也虎视眈眈呢。一遇到合适的软约束,马上张口咬人。以现在的算力,神经网络那么大的冗余都不在话下,几个相谐性检查算什么。更何况毕竟都在线速的范围内。只要不破坏现场,总有翻盘机会。你走你的,但别杀死别人。

李:理论上 一个 l 长度的句子 在 l 没有全覆盖之前,任何 n-gram ( n < l )  的模式都是跛脚的。这一点在分词中表现最为简明。不断有人以“反例”来推论 分词必须包括 parsing、常识、领域知识、世界知识...

白:分词不是最终任务,只是一道工序而已。

李:道理都是一样的。这道工序一旦缺乏某个知识 理论上就是 过早剪枝,但实践中 几乎所有 real world 系统都不理睬这种理论上的批评。保留所有可能分词路径 直到最后的系统 不能说没有 但极少。(当然 这个分词的工序 现在有了 越来越流行省心的 char-based 的路线, 干脆绕过去。)

白:曾经的real world系统还都不睬deep parsing呢。按同样逻辑deep parsing甭活了。real world系统也在进步好不好?

常识,有重量级搞法,也有轻量级搞法。不要被重量级搞法吓住了。

白:

李:

“张三杀了李四也该收手了吧”

“张三杀了李四还嫌不够解气吗?”

“张三杀了李四也该有个说法 不能白杀”。

谁白杀谁?

“张三杀了李四也该有个说法 不能白死”。

谁白死?

“人咬死了狗, 不会受处置 合理吗?”

“人咬死了, 狗不会受处置 合理吗?”

“人咬死了狗不会受处置 合理吗”

白:“这些木头盖了房子。”不是svo。

李:工具s 与 施事s 是一个熟透了的现象。中英都很普遍。

白:木头不是工具,是材料。

李:材料也差不多,工具 占据 s 位置 更普遍一些。材料 对于 制造类谓词 占据 s 位置也很多。

白:贴了标签也无益。人家正主儿可能在后面藏着呢。到时候找上门来,嘿嘿,小三上位了。

李:svoc,句法只有 三个位置,逻辑语义几十个。一对多 很自然,也很谐。不过就是需要增加一个 逻辑语义细分的任务,否认不了 svoc 的句法骨架作用。

“枪不杀人 人杀人”

枪真地不杀人吗?子弹杀人 不长眼睛的。

“x 杀人”

x 与 “杀” 相谐吗?x 是不是 s?如果是,x 是 agent,还是 instrument,还是 material?如果 x 未知 怎么填坑?

白:要真是未知就简单了,坑说了算,抽象的听具体的,奥卡姆剃刀。不举证证明不是他,就是他。

此图像的alt属性为空;文件名为Screen-Shot-2019-07-15-at-6.58.54-PM-1024x200.png

李:“他” 很难说是 “盖” 的 S【施事】,更像是 “盖” 的【受益人】。

语言没有明说的 可以存疑 或 模糊。硬要跳坑里去,也不过就是个情报价值不大的常识默认。

白:这没问题啊,没有证据证明策划人、出资人、执行人、受益人是分离的,就假设他们是一致的。这叫非单调逻辑,举证义务在反方。

李:对于模糊表达 可能无所谓正反。一不小心就是 over reading,读出了不存在的语义。

白:情报价值不应由开发方评价。这类连边都有特殊标记。

李:用户方的证据也不足。多少用户需要不可靠的情报 与 明确表达的情报 混杂在一起呢?

逻辑预备的坑总是很完备,但语言不见得。常识是情报的冤家:用的适度 可以帮助情报的完整性;稍不留神 就伤害了情报的准确性和可靠性。

白:想避免错误的填坑可以用阈值拦一刀。但是拦得住拦不住是水平问题,那个位置该不该给小三则是态度问题。先要端正态度,虚位以待。就算一直虚着,也没小三什么事。这些不进坑的角色,语义上都有后路,才不在乎主语的标签。我们也没有主语标签。只有留给施事的标配坑。

李:

“这些木头盖了房子他很开心”,他才不管谁盖的房子呢 木头物有所用就好。

“这些木头盖了房子他很伤心”,木头是他的 房子却是他人的。

白:这叫自己跳出来。

李:根据常识填坑是危险操作,很容易 put words into others mouth。这不是语言理解的目的。

白:不妨设个开关,一切可控,用不用随你。

李:可以,一个叫 s,明说出来的 有句法依据的;一个叫 hiddenS,常识推出了的。就是到了法庭 也不怕了。

如果任着常识使性子,党指挥枪 与 枪指挥党,就同义了。首先 先帝不答应。

枪不能杀人 背后一定有个扣动扳机的 agent,机器人能杀人吗?机器人背后也有人。

“他造了把土枪 专门杀人”

“他造了个机器人 专门杀人”

是他杀人 还是机器人杀人?

白:系统说是就是呗,反正认的是标签,标签背后的道理,说了也不懂。

李:系统1说 a 杀人,系统2说b,系统3说 a and b,系统4 说 a or b,系统5 说 测不准 ……

白:很正常,除非有人强推标准化。

李:这一路不是一直在论标准吗?材料不是 s “他“是 s,也说的是标准。“党“是 s “枪“是 o。

白:党和枪都是隐喻,指挥的坑里面没有能匹配枪的。

李:重点是 常识与句型,谁说了算、比例如何?

白:只有不匹配得离谱,才引出隐喻。说常识太泛,其实就是一个中间件,给出了相谐度的评价。

李:不匹配离谱 的前提是 先逃进坑。谁决定的 枪要跳进坑o,而不是 s?肯定不是常识。

白:枪指挥党就跳进s。

李:对呀。谁决定的?Svo 决定的,准确说是,T1 svo T2 决定的。

白:反正离谱而且没有正解,于是回到svo,或者说,没有相谐度方面给出加分,改变不了句法初始设定的优先格局。是检查了之后没推翻它,而不是不需要检查。

李:不如不检查。这是争论的焦点。不检查先做,做错了“休眠唤醒”再反悔 也是常态。一多半根本就到不了需要检查那一步 就差不多成了铁案。

白:检查了推翻也是常态。不等检查结果出来就做也可以,这只是不同的控制策略。上不到标准层面。

李:譬如 x 指挥 y,根本就走不到相谐还是不相谐,“系统说了算”,这里系统指句法。

白:维也纳爱乐乐团指挥够了,他又来指挥费城了。

@宋柔 不一定。假设李四有个to do list,上写“打张三”“打王五”等等。做完一件事,就划去一项。

宋:“张三杀了”有歧义:杀别人和自己被杀,如此才有了“张三杀了李四也该收手了吧”的歧义。如果换成“打嬴了”,“张三打嬴了”没有歧义,一定是张三打别人。此时,“张三打嬴了李四也该收手了吧”也没有歧义。这个句子的语义就要靠语法来分析了。

李:白老师可以把 “打-赢” 拆开来论证语义大于句法 也许。谁打 谁赢……

宋:不要“打”。只要”嬴”。“张三嬴了李四也该收手了吧”。

白:打是S/2N,赢是S/N。合并的时候两个坑共用一个萝卜,一个占名额,一个不占。

宋:“张三赢了李四让教练很生气。” 谁的教练?

白:@宋柔 都可以,张三李四都行。

宋:除非有更大的语境进行强制约束,否则还是张三的教练生气。这是句法胜过语义。句法胜过常识。

白:句法语义都行,但是sentiment是顺着一头儿说的。赢和生气的不应该是一头儿的,除非教练安排只许败不许胜。因为有只许败不许胜的“找辙”,句法没被颠覆。

宋:当有人说“张三赢了李四让教练很生气。”后,一定会有人觉得奇怪,问“为什么生气?”

白:如果是“有人说”,那么“赢了”后面会有一个停顿。

宋:这里是说没有停顿的情况。有停顿的话就要加逗号。“赢了”后面没有停顿。

白:不吃最后一个馒头不饱,总有人觉得之前的馒头可以不吃。

宋:一般人都会觉得这个表述很奇怪,违反常理。

白:有保镖在身边没人敢动你,并不说明不需要保镖。“李四”后面有没有停顿?

宋:李四后面与无停顿都一样。

白:好像不是。可以都不停顿,但李四后面的间隔更小。这时难说。主要是叙述的视点变化奇怪,并不是句法。

宋:我感觉这句话体现了了句法的硬性约束:教练一定是张三的。但是,嬴者的教练本应高兴,实际的情况是生气,于是就有矛盾。如果教练可以是李四的,就没有矛盾,听者就不会奇怪了。

白:“张三痛打了李四,脸都肿了。”

谁的脸?是句法决定的?跟上面句法可是完全平行。谁的脸肿了,跟谁挨打有直接的事理关联。这就是常识“拗得过”句法了。刚才那个只是没拗过而已,因为可以只许败不许胜,尤其在团队作战时,为了在下一轮避开某个对手。这说明确实两方面因素在较劲。如果不是同时出场,较劲就不会发生。

宋:任何一种行得通的理解都有一种合理的解释。问题在于听者在强大的事理约束下居然并不顺从,还会疑问,就说明句法胜过了事理。

白:胜过了非但不证明句法早起单独起作用,反而证明了事理因素早期就参与较量。恰恰是我的观点的一个旁证。

宋:但较量不过。

白:是。但不是都较量不过。平行的句子也有相反的结果。语义和事理早期参与了较量,这个就够了。

宋:是的。句法约束胜过语义的例子不大好举。

白:伟哥的意思是根本句法就在唱独角戏,语义和事理没参加较量。

宋:路线斗争。李维:先看句法再看语义;白硕:先看语义,辨不清时再看句法。

白:我是句法先拿到基准分,出不出线,要看句法和其他因素的较量结果。较量可以不改变得分的高低顺序。

宋:合二而一。

白:但是这时,非句法因素相当于最后一个馒头、相当于没有动手的保镖,不可以认为非句法因素是多余的,是不在现场的。较量不是多余的,基准分不是一锤定音的。甚至,如果并行机制设计得好的话,拿基准分和较量可以异步。中间有一段时间存在叠加态,保留部分坛坛罐罐走不齐。

宋:当然。我完全同意语义的重要性,只是觉得词汇语义+事理常识+专业知识,实在是无边无际,难以控制。某个句子可以采用某种语义关系加以解释,但可选用的语义关系非常多,机器怎么就能选对了语义关系进而做出正确的解释?大数据并非万能。所以,挖掘句法的硬约束还是有意义的。

白:硬约束已经在基本分里体现了呀

宋:一些硬约束其实还没有挖掘出来。操纵语义需要极大的功力。当然,做实际应用系统,语义相谐性是绝对离不开的,而且是最大量的工作所在。

白:软约束就像保险,花点小钱,保你关键时刻用非句法兜底。也许没用到,但是不等于没有用。特别是,软约束可以灵活地面对长尾。看起来每一个都是小概率,但是放在一起并不少。所谓没用到,就是较量了但没产生颠覆效果。并不是没较量。

宋:解决长尾问题必须靠软约束,但这个尾巴太大,需要的软约束太多,如何挖掘和使用软约束是一个极困难的问题。

白:软约束不仅数量大而且类型多、机制复杂。我现在尝试做的事情是:1、不管什么类型什么机制,最后都折合为同一种量(优先级),这是较量的前提。2、当个别软约束缺失时,不会影响其他软约束以及硬约束的较量,这是软约束增量化建设的需要。3、集中把两三个重要的软约束类型吃透做透,形成明显的“高地”,再图类型的扩充。其实绝不是无边无际,完全把握得住的。

宋:我觉得难度非常大。在某一个较小的专业领域,可能可以正确解决大多数问题。做一个通用的理解系统,恐怕不好办。

白:先分类型,再抓主要类型,铺开规模时以领域为抓手。做出来的不会是通用理解系统,但可能是通用理解机制框架+领域资源。

宋:AI的知识工程(知识获取、知识表示、知识使用)讲了几十年了,未见到突破性进展。现在的数据驱动+深度学习是一个突破,但是范围很受限。

白:加类型不影响通用机制,上规模不影响通用机制,改参数不影响通用机制。而且它不是知识处理,只是标签演算。也不能说是理解,只是某种程度上的精准解析。

我们范围也很受限。

(喘口气儿,待续...... 《李白王116:常识是情报的冤家(2/2)》

【相关】

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

《李白刘114:围着火炉吃西瓜闲聊点文字》

立委按:白沙龙是个神奇的所在 / 感觉有点像围着火炉吃西瓜 / 有一搭没一搭 /貌似漫不经心 / 不时闪现火花。“学问”也可以是聊出来的吗?

白:“包里揣着自行车座的天津人”,有伪歧义,但可以干掉。人揣不进包里,size不匹配,包装方式也不人道。人成为被自行车座领属的对象,组合也怪异。

李:Vt + N1 + de + N2

subcat pattern ambiguity, similar to the PP-attachment ambiguity in English, 不过这个例子到了细线条的 “sub-subcat” 就排除歧义了,Vt两个子类:

1.  Vt-person --> Vt

2. Vt-non-person --> Vt

“揣着” is Vt-non-person sub-subcat,默认不能带 【human】(“天津人”),只能带【!human】(“自行车座”)。

白:外星人/机器人,说不准。小矮人,似乎也可考虑。罐头小人,更没问题了。还是多管齐下好,东方不亮西方亮,总有一条堵得住。ad hoc的简单不是真简单,系统性的简单才靠谱。

李:subcat 是公认的词典细化知识,subcat 不是 ad hoc,sub-subcat 就不算 ad hoc,同一条延长线上。多管齐下才不简单呢,每一管都是一个窗口,知识非常容易发散。一般来说,开放知识难以维护,知识平衡也不好实现和追踪。当然,高手另算,白老师定有秘器。

刘:“懂事是没人疼出来”,这句有点难。

白:趋向补语优先级高于状语,更高于主语。所以“疼-出来”先结合,“没人”后加入。至于两个谓词的坑共用一个萝卜,倒不是事儿。

刘:这里疼出来先结合不通,没人疼有特定含义,应该先结合

白:“没人疼”当一个词倒也简单了。状中固定搭配的优先级已经是顶格了。

“他从来没有不作为过”

那个“过”与“作为”的优先级也是干不过“不作为”固定搭配的优先级。

刘:难就难在这里,怎么知道没人疼就变成一个词了呢

白:不过这个真的不重要。“作为”与“过”的结合也好,“疼”与“出来”的结合也好,都不影响语义。只是说“作为”、“疼”是中心词,代表结构跟外面发生关系。中心词可以在结合之后被否定。

当然紧耦合、强搭配的,顺序反过来也一样。语言学界不是讨论过“A的媳妇是B的妈”的问题吗?这个句子的中心词主干是“媳妇是妈”。但这个主干不具有保语义性。就是说,枝叉的添加,会改变“媳妇”和“妈”两个带坑名词的共指性。

看这两个图,谁先结合要紧吗?

李:“从来没有不X过” ,可以看作是 X 的形态(变体)

白:某种aspect

李:词典规则大概就是:

从来没有不X过 --》X(VG,perfect,always)

perfect+always (same as never1 for backward aspect in contrast to never2 forward, e.g. "never forget class struggle" ) are tense-aspect,VG is its category (V) and phrasal sign (Group, or X one bar).

总之就是用可以枚举的前后缀或小词材料的有限组合,去对 X 做词法句法的加持而已。没有必要再去细分其内部的词法结构。X 哪怕不是 V,也被强制为 VG 了。5gram以内的可以记住的组合,可以一律交给词典标注或词典习得,不必寻找其中的结构规则。

白:看主干,还真是“媳妇是妈”,仔细想想没错,既为人妻又为人母,多个角色而已。但是,两个坑没萝卜,这两个坑“共用”一个萝卜就是“奥卡姆剃刀”的体现了。这发生在句法分析之后。

奥卡姆剃刀,本人对“如无必要,勿增实体”表示过不满意,而且特地给了一个修正版本:“如无必要,勿增实体,勿减标配。”

坑是否共用,取决于“标配”做到什么份儿上。

“从来没有不爱也从来没有放弃过”

白:出情况了:“毕加索”被推定为“挂”的逻辑主语。

为什么不是,需要给个系统性的说法。挂的逻辑主语,和墙的关系比和画的关系要深?查了一下,这个推定关系在诸多关联边中,优先级是最低的。等于是规定动作做完了,开始做自选动作时搞出来的。我们的系统是看到“挂”的逻辑主语是Human,而且空缺,“毕加索”的本体标签也是Human,于是启动了把填坑的正式名额置换出来的机制。

看来通过“的”引入的萝卜和通过介词引入的萝卜要区别对待:介词宾语与谓词关联紧密,可以更加无障碍地用于填补谓词的未饱和坑;“的”的领项,用于填补“的”的属项相对优先,用于向的字结构外部填坑则应受到某种限制。

“他的小提琴拉得很好”当中的“他”,是修饰语的已填坑萝卜,但却可以穿透到“拉”,这是优点。这个优点和前面的缺点,怎么样兴利除弊,需要进一步完善。

李:“我的小提琴他拉得很好。”

?“他的小提琴被拉得不成样子”

“他的小提琴被砸得不成样子。”

“他的小提琴砸得不成样子。”

谁“砸”小提琴,不大可能是“他”。

白:

“被”阻断了“他”的填坑可能性。“被”自己升格,根本不关心向前文可能的回指。这个逻辑在我们的系统里简单粗暴,但是大体上有效。如果“被”标作介词的标配形式S+/N,就免不了要面对这一麻烦。当然,有的坑我们规定了单向填入,纵使变成了残坑,也依然受到约束。

这个还不行。修饰语的已填坑萝卜和被修饰语的未饱和坑结合时,看来还是需要修饰语和被修饰语的某种一致性。怎么划定边界是个问题。

从统计上看,“拉小提琴”是强搭配,“砸小提琴”是弱搭配,难道这个线索works?强搭配可穿透,弱搭配不可穿透?

“他的文章写得非常感人。”“他的文章改得面目全非。”

“写文章”是强搭配,“他”可以穿透到“写”;“改文章”是弱搭配,“他”穿透到“改”就遭遇主体的“弥散”,至少有歧义了。

总结:1、修饰语和被修饰语类型匹配时,已填坑萝卜对未饱和坑有穿透性;2、修饰语和被修饰语类型不匹配时,如果已填坑萝卜和未饱和坑之间有强搭配,那么可穿透;3、修饰语和被修饰语类型不匹配时,如果已填坑萝卜和未饱和坑之间只有弱搭配,那么不可穿透。

“他的小提琴砸得不成样子”,在弱搭配下,“小提琴”成为与谓词松耦合的物体,“他”成为“小提琴”的单纯领属角色。补语“不成样子”的语义指向也锁定“小提琴”。设想,“砸小提琴”如果成为一种职业或习惯性破坏行为,就构成了紧耦合,“他”就会兼作“砸”的逻辑主语,补语“不成样子”也会指向谓词“砸”,谓之砸得不够专业。幸亏现实世界没有这么个职业。

所以有没有歧义,全在于系统有没有把“砸-小提琴”列入强搭配名单,或者说大数据有没有把“砸-小提琴”训练成强搭配。砸,被砸之物是有后果的。拉(演奏义),被拉之物不必然有后果。所以“拉得不成样子”没有歧义,语义指向一定是动词“拉”。

【相关】

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

《每周一歌:英语名曲 – Because I love you》

英语名曲:'Cause I love you (背景:硅谷腹地原生态盐碱沼泽地)

这是家喻户晓经久不衰的英语名曲,真正百听不厌。背景风光是硅谷腹地桑塔克拉拉237号公路旁的盐碱沼泽地,政府辟为野生动物保护区。虽然地近闹市,这一大片海湾末端的沼泽完全原生态。

周深 - 我是真的爱你 (背景:硅谷南边的天线山脊)

原唱是梁静茹 周深唱歌很用心 喜欢他。

天线 skyline blvd 是把硅谷与太平洋一号分开的山脊路线 最喜欢山顶村子的那片红木和绿地。

从 Saratoga 那个downtown 开进山里 曲曲弯弯就到了 skyline 右转一直开 一路很野的保留地 但路很好开。skyline 很好的路 但是山里有些岔路非常艰险 有一次不小心跟着GPS进了山里岔路 两边是悬崖 中间一条忽隐忽现的窄小土路 那叫一个后怕 只能硬着头皮蜗牛一样缓慢前行,爬一样一个多小时才慢慢开出山来。

宠物大片,主演牛顿、卡塔拉与赞他

《每周一歌:Terri Clark - Just the Same》

Terri Clark - Just the Same (background footage of Silicon Valley and Highway No 1)

第一次听到乡村女歌手 Terri Clark 是25+年前 在加拿大的电视上 那时候她的 mtv 在热播 just the same 的音乐片 演绎了一个消防队员家庭的故事 消防队员救火回来 满身烟土 terri 与孩子扑上去迎接 那个短片让人感动 terri 的嗓音浑厚苍凉 她一贯穿着也很阳刚的样子 但歌声里面还是藏近了温柔亲情。 后来也听过一些她的其他的歌 嗓音无可挑剔 但觉得都不如这一首的感情深挚 于是一直保留在 iPod / iPhone 的五星榜上 听了几十年。觉得值得每周一歌推荐给朋友。

youTube: Just the Same MV

好像是乔布斯说的 说歌曲与影视不同 歌曲可以反复听 而再好的影视最多也就看三五遍到头了。其实 老歌是可以陪人一辈子的 每个人心中都有一套自己的歌曲集 是人生不同阶段的积累和回忆。

记得当年热播的还有 Shania Twain 的 any man of mine 很欢快跳跃 音乐片也很时髦性感 让人联想到陈方圆刚上电视春晚的形象做派。

YouTube Shania Twain: Any Man of Mine

同时期的电视 还熟悉了两位女歌手 一位是后来红透半边天的 Celine Dion 另一位是与盲人歌手 Andrea Bocelli 对唱 Time to say goodbye 的 Sarah Brightman, 这都是 pre-iPod 时代的老歌 也都陪伴了一辈子。

【泥沙龙笔记:带标大数据这道坎迈不过去,不要侈谈AI革命】

李:前两天与NLP主流的权威人士聊人造智能的现状和前景。我问,人造智能这么牛,你给我找一个在自然语言方面没有标注大数据,靠非监督学习落地成功的案例。只要一例。

其实主流里面就是找不到一例(非主流有,但大家习惯性视而不见)。主流里面规模化成功的全部是监督学习,全部靠大数据。应了那句话,多少人工,多少智能。

毛:你这要求太苛刻了。咱们人小时候不也要靠爹妈教吗?@wei

李:不对,爹妈教的不是大数据。孩子跟父母学的是小数据,举一反三,不是举100返1。当然乔姆斯基认为那不是爹妈的功劳 也不是学童的功劳,是上帝的功劳,固化遗传的。

白:人工用在语料上还是用在资源上,才是区分技术路线的关键。

李:同意。前者简单野蛮粗暴,容易推广,后者需要精心设计。

在带标大数据的这道坎迈不过去前,不要侈谈人造I的革命。

有些疑似不需要带标大数据的有效学习,可以一一讨论。看看到底是不是无监督学习突破了,知识瓶颈化解于无形了。

MT 不用说了,无穷无尽的带标大数据。人类翻译了多少年,而且还会一直翻译下去,或者利用MT然后修订编辑。活水源源不断。好处是免费,是人类正常翻译活动的副产品。

白:小数据带标、大数据聚类,小数据循聚类举一反三。实际就是协同推荐。

李:好,看看大数据聚类,clustering 的本性就是非监督,有成功案例吗?clustering 是个好东西 但是独立规模化成功的,几乎不见。

白:加上小数据,不是纯聚类。

李:对。以前有一个路子,貌似有部分成功,就是先聚类,然后人工少量干预(给好的聚类起一个名字、把混进革命队伍的异己分子手工踢出去之类),然后利用所起的名字作为带标数据,把聚类(clustering)转换为可以落地有价值的分类(classifciation)。狸猫换太子,多少就克服了大数据短缺的知识瓶颈,聚类--》分类,曲线救国。

白:带标小数据更关键。

李:那也是一途 叫 seeds,boot strapping,找个办法来 propagate,用得巧的话,也有部分成功的,算是弱监督学习。

白:聚类是纯几何行为,不知道对什么敏感。小数据告诉你该对什么敏感。两轮驱动,不可偏废。大数据聚类可以提供疑似窝点,小数据一举捣毁。不是所有疑似窝点都值得捣毁。聚类是等势线(超曲面)相互包围的拓扑。

毛:立委你这不是抬杠吗,也没人说AI已经等同于人类智能呀。

肖:用户分群很有用啊,例子很多很多。聚类方法找异常也有很多成功应用,比如反欺诈。

李:聚类的结果 粗线条应用大概是有的,在宁可错杀一千的应用场合,或有当无的场合,聚类可松可紧,拿来就用,总之是有统计基础,作为参考,强过看不见。细线条就傻了。只要用眼睛和脑袋去检视过聚类结果的,大都有这个体会:这玩意儿说它不对,还长得蛮像,说它对吧,米锅里 到处可见老鼠屎。经常的感觉是鸡肋 食之无味 弃之可惜,用又不敢用,对接吧 可费劲了。词典习得 (lexicon acquisition),聚类用得上,最后的难点还是在对接上,就是聚类以后的标注(起名字),并让标注与现有的知识体系对接上。

白:不需要,有内部编号即可。以xor为例。聚类可以聚出四个象限。不需要为每个象限取名。如果小数据指向一三象限,就把这两个聚类的内部名称贴一个外部标签。聚类按小数据的指引,当粗则粗,当细则细。不能只用一个尺度,小波的成功就是借鉴。记得工厂里钣金,师傅领锤,力道不大但是都在点儿上,徒弟力大但不能乱锤,必须跟着师傅走。小数据是师傅,大数据是徒弟。

李:这个形象。

最近的NLG(自然语言生成)方面的成功,是因为语言模型在深度学习的时候 强大了。生成的句子 比我们普通人还顺溜。我们受过这么多年教育 还免不了文法错误 语句不顺。机器生成的句子 越来越“超越”人类了。怎么回事?

原来 NLG 比 MT 还邪性 还牛叉,MT 还需要双语的翻译大数据,NLG 面对的是单一的语言,数据无穷无尽,文满为患,这是一个极端的 raw corpus 居然等价于 labeled corpus 的现场。我们每个人写文章 都是潜在给 NLG 提供标注服务。自然语言语句与词汇随机发生器发出来的字符串 的不同,全部体现在每一篇人类撰写的文章里面。它不出色才怪呢。NLG 可以预见将来有大发展,在应用文写作等方面。有孩子的 可以放松他们的语文训练了,将来他们只要学会善用机器 就没有写不出规范的文章的。

白:大家写文章全一个味儿,也是问题。应该以强风格的作家为吸引子,形成若干漩涡,你接近某个漩涡,就持续往里面吸。至少不能千人一面。

肖:(NLG)现在摘要还写不好。

李:孩子不必特地去修应用文写作课,反正后来会有电脑帮忙写文字的。这就跟我小时候钢笔字写得狗爬似的,一直难受 羡慕小伙伴每天练字 让人看得赏心悦目。(当年喜欢一个女孩子 一半看脸蛋 一半看她写的字。)结果 我成年后 除了签字 就几乎没有写钢笔字的机会。

以前要成为(文科)大学者,最为人津津乐道和崇敬的是:

(1)记忆能力:过目不忘,检索起来可以闭着眼睛把典故的章节甚至页数指出来。社科院里面有很多这样广为传诵的奇闻逸事,尤其是关于钱锺书、吕叔湘这些老先生。

马:我认识一个理工科的教授,跟他聊天时,经常会说,那本期刊第几期第几页提到了这个问题。

李:(2)好书法。(3)诗词歌赋。这些到了机器,反而容易。

白:千万别提机器那个诗词歌赋,倒胃口。

李:感觉清华的《九歌》比不少郭沫若的诗词写得好。小时候看郭沫若带着西哈努克去山里面玩,诗性大发 口占一首,那个诗可真是纯粹应景 干瘪无味,就是平仄啥的应该整对了,论意境、诗味,啥都没有。

机器诗词倒胃口 也比不上郭沫若的那次表演(忘了是什么纪录片了),印象极深刻 不是好印象 而是坏印象。当然 艺术的鉴赏 见仁见智 不好说绝对。但往前看,机器做诗词 还有很多提升空间。人要熟读唐诗300首就很不容易了,机器灌输它个全唐诗去模仿,是小菜。人在时间限制下 需要应景作诗 提升空间就不大了。七步诗这样的天才 万里无一。

白:端到端、简单无结构标签、大数据是深度学习商业化的关键。但凡涉及到场景化、复杂结构和小数据,深度学习一定会不适应。是让应用迁就深度学习还是用技术改造深度学习,这不是个简单的选择。我主张:1、把标注的对象从“语料”迁移到“资源”;2、用带标小数据引领无标大数据;3、尊重领域专家、融合领域知识。

【相关】

【 立委小品:AI is fake I 】

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

AI is fake I

The term Artificial Intelligence (AI), which traces its roots to the milestone Dartmouth's historic conference, is quite a bit of an afterthought by the then thought-leaders of the time, with an emphasis on artificiality. It, in essence, defines the true nature of AI as a fake intelligence that simulates human intelligence. But we seem to often forget that.

Those commonly known as "vegetarian chicken" or "vegetarian duck" are soy products, generally classified under the category of "artificial protein". The gap between "artificial proteins" and "animal proteins" is very comparable to that between "artificial intelligence" and "human intelligence". Every vegetarian eating "vegetarian chicken" knows clearly that it is fake meat so they feel comfortable enjoying it with its great taste. In contrast, almost all media and the majority of users of AI products today rarely regard the nature of AI as fake intelligence. That is quite a surprise to me.

I don't know if it's just tabloid hype or it's true. But the impression is fairly clear that those popular AI stars more and more often act like god. They seem to love to use super big words and philosophical metaphors which lead the mass to the belief of an equal sign between AI and human I. I don't think it is so much a sense of mission as a sense of superiority and ego, and they just feel too good about themselves in mastering some magic of AI algorithms. It occurs to me that if you act like God, talk like God, over time you will believe you are God. In times of AI bubbles, people buy that; more importantly, media love that, and investors are willing to pay high.

My entire career has been engaged in "natural language understanding" (NLU), with a focus on "parsing", which was for a long time widely accepted as the key to language understanding, the crown of artificial intelligence as some experts put it. As practitioners in developing industrial products, we know all these AI terms such as language understanding, machine learning, neural networks, plus AI itself, are just analogy or metaphors. AI models are just simulations, mechanical programs attempting to mimic intelligent tasks. But that is apparently not what has been depicted by media's efforts for "AI marketing", nor is it educated by the few AI stars at the spotlight. The public opinions or even decision-makers, shaped or influenced by such media, run more and more towards the opposite. So it might be high time to air a different voice and re-uncover the true nature. Artificial intelligence is fake intelligence by its very nature, filled with "artful deception", as pointed out by Pierce in the AI history. His criticism has never been out of time. In fact, there is never a time with this much "artful deception" built into products such as intelligent assistants, so artful that we start getting used to it for the convenience.

What is "understanding"? Strictly speaking, the computer has zero intelligence except for its mechanical computation and memorization. Natural language understanding has always been a metaphor by convention, that is why the Turing test was purposely designed to define "artificial intelligence" by bypassing "understanding". This is by no means to deny the breakthrough in recent years in the functional success stories of AI applications such as speech processing, image recognition, and machine translation.

We all have had personal life experiences when we were amazed at some functions performed by a non-human. As a child, I was amazed for quite some time that the radio could "talk", how "intelligent" this box called radio was. My mother had been confined to a remote rural area in her childhood, and when she went to a middle school in the nearby town, she had a chance to see an automobile running on the road for the first time. She ran away in awe and years later described to me the shock at the time when a non-human machine was running so fast. That is beyond intelligent to her mind. We all had those first times of "intelligence" shock, the first time we had access to a calculator when I was a middle school kid, the first time we walked through an automatic door, the first time we went to the bathroom which automatically flushed the toilet, not to mention the first time we used GPS. All those fake intelligence behaviors look so true and superior to our modest being when we are first exposed to them. But now such "intelligence-like behavior" is all out, we all accept that it is non-I. By human nature, we tend to over-read the meaning when we do not understand something. We are shocked to see any "automatic" behavior or response from a non-human, regardless of whether the mechanism behind is simple or an algorithm with complexity. Such shock is easy to amplify, and it's hard not to be fooled by wonders if we don't understand the mechanisms and principles behind, which happens a lot around the media talks about AI. In recent years, the media and industry are never tired of "man-machine competitions", in games and knowledge showoffs, in order to demonstrate that now AI beats human. Sometimes in my dreams, I have been haunted by similar images of human weight lifting champions challenging a crane to see who could lift the ton of steel with a single swipe.

In recent years, some celebrity CEOs in industry and legendary figures in the science community have seriously begun to talk about the problem of the emotional machines and the threat from machines equipped with super-human AI. It is often far fetched, citing functional AI success as autonomous intelligence or emotions. I would not be surprised when the topic is taken one step further to start discussing the next world problem as recreating hormones and reproductive systems in machines. Why not? Machines are believed to develop a neural network to become this powerful, it is a natural course to be reproductive and even someday marry humans for the man-machine hybrid kind. Science fiction and reality tend to get mingled all in a mass too easily today.

Nowadays, artificial intelligence is just like a sexy modal attracting all the eyeballs. Talking to an old AI scholar the other day, he pointed out that AI is, in fact, a sad subject. A significant feature of AI is to temporarily hold things whose mechanisms are not yet clear. Once the mechanisms are clear, it often becomes "non-artificial intelligence" and develops into a specialized discipline on its own. The plane is up in the air, the submarine is under the water, deployed everywhere in our land for decades. Do people who design airplanes and submarines call themselves artificial intelligence researchers? No, they are experts of aerodynamics, fluid dynamics, and have little to do with AI. Autonomous driving today is still under the banner of AI, but it has less and less to do with AI as time moves on. Aircraft has long been self-driving for the most part, no one considered that artificial intelligence, right? Artificial intelligence is not a science that can hold a lot of branches on its own. The knowledge that really belongs to artificial intelligence is actually a very small circle, just like the part that really belongs to human intelligence is also a very small circle, both of which are much smaller than what we anticipated before. What is the unchangeable part of AI then? We might as well return to some original formulations by the forefathers of AI, one being a "general problem solver" (Simon 1959).

(Courtesy of youdao-MT for the first draft translation of my recent Chinese blog, without which I would not have the energy and time in its translation and rewriting here.)

My original Chinese blog on this topic:

【 立委小品:AI is fake I 】

Other English blogs

The Anti-Eliza Effect, New Concept in AI

From IBM's Jeopardy robot, Apple's Siri, to the new Google Translate

Question answering of the past and present

【 立委小品:AI is fake I 】

有个关于翻译的疑问, AI 台湾翻译为“人工智慧”, 大陆不知谁最先翻译的,总之一直叫“人工智能”。两岸都没有采用更为贴切的翻译“人造智能”。

那些俗称为素鸡素鸭的大豆制品,一般归到 “人造蛋白” 类。“人造蛋白”(或植物蛋白)与“动物蛋白”的距离和区分,可比“人造智能”与“人类智能” 的差异,鸿沟比较清晰。“人工智能/智慧”的译法有很大可能误导或被误解,当然媒体与大众多半乐于误导或被误导,那是另一回事儿。

突然想到老川把除了 fox 外的主流媒体一律称为 fake news,也可以考虑把AI 叫作 fake intelligence,至少比老川靠谱得多,利人也是这么认为的:“AI被忽悠得大家都认为是真的了”。

不知道是小报的渲染,还是的确如此,总之印象是,被称为AI牛人的,常常做上帝状,无论说话口气,还是描画蓝图,与其说是使命感,不如说是优越感,自我感觉特别良好。

认真说,明明是artificial,如今开口闭口机器智能,甚至自主推理、自发情感,弄得跟真的似的。巧妙欺骗的时代,连国家首脑都难免受影响,整得风声鹤唳,草木皆兵。貌似狼来了,机器就要统治世界,人类末日即将来临。

我一辈子做自然语言理解(NLU),主攻语言自动解析(parsing),这曾经被广泛认为是语言理解的钥匙,人造智能的皇冠。那天群里老友说,“理解文章上,机器比90%读完高中的人差吧”,突然意识到类比与现实已经潜移默化到我们自己都可能不假思索混同和认同的时候,觉得也许可以试图做一点澄清了:

什么叫“理解”?严格说,电脑是0理解。所谓自然语言理解,不过是个比喻的说法,所以图灵测试一开始就绕过“理解”来定义“智能”。区别在于,符号派用一套看上去是模拟理解的符号推理的步骤,也就是在符号系统内自己跟自己玩,过家家的游戏。经验派甚至连这个模拟的过家家也不要了,端到端,别跟我扯理解,你理解了要做什么,给我把要做什么的任务定义出来,然后按照这个定义给我标注数据,越大越好,上不封顶。然后给你把这个任务做出来,照猫画虎。你说它理解了啥?毛都没有。说理解和智能,都是比喻,不改变artificial智能是fake的本质。这并不是要否认模仿的功能性成功。

小时候很长时间惊异于收音机“会说话”,不理解无线电啥玩意能够如此“智能”。记得看过一本书,里面描述凉山少数民族百姓第一次“被看电影”,下面观众惊吓莫名。我妈妈一直在农村读私塾,后来到城里读中学第一次见到汽车在路上跑,跟我描述过当时的震撼。25年前我母校语言学系教授第一次对着苹果电脑叫 “Open Computer”,用语音启动电脑的得意样子还历历在目。还有我们第一次用计算器,第一次走进自动门,上厕所自动冲洗马桶,更甭提第一次用GPS。所有这些fake智能,全是那么真切。可现在全部脱离 I了,成为 non-I。可见,“智能”这东西不仅仅界限模糊,而且很雷人。第一次见到任何非人类出面的“自动”行为或反映,甭管原理简单还是算法复杂,受众都会感觉震撼。这种震撼很容易放大,如果不理解背后的机制和原理,很难不被忽悠。

小时候还有一事儿,挺扎心的,手太笨学珠算、写钢笔字总也没大成效。好在用了电脑后,就几乎没“写”过字,字俊字丑没人知道,藏拙了。当年对于心算快的,算盘打得快的小伙伴,那叫一个羡慕。计算器出来以后,没听说过有人组织过人机算术挑战赛。可是后来的下棋,知识问答,机器翻译,却不断作为智能的里程碑载入史册。回头想想,不就在计算器的延长线上,一多半靠的是memory和computing吗。人跟机拼,傻呀。近几年来,不知怎的,我常常头脑出现一种诡异的画面:人类举重冠军组团挑战起重机,看谁能把“那成吨的钢铁,轻轻地一抓就起来”(盗自革命样板戏《海港》插曲)。媒体和业界乐此不疲的“人机大战”,除了噱头效应外,其实也是非良定义(ill-defined)的为多:苹果怎么好与梨子打架呢。

Artificial 智能,明明是假智能(fake intelligence),里面充满了“巧妙的欺骗”(artful deception,于今为烈,前辈皮尔斯历史上的著名的AI批判其实从来没有失效过,见 Church - 钟摆摆得太远(3):皮尔斯论】 ),如今整得跟真的似的。哲学上、伦理上、媒体上、国际政治上,如今都在说狼来了。

还好AI这个术语,追根溯源到达特茅斯那次历史性会议,起名还算知趣,强调的是人工/人造/仿造。但大家久而久之时间长了就忽略了定语 artificial,把电脑与人的智能和理解,混同了。加上科技小编和科幻的鼓噪,类比与现实貌似等同了。甚至一些名人也一本正经开始大谈机器具有情感的问题,自主智能到自发情感,就差说要与人类杂交生子了。下一个世界难题应该是机器中再造荷尔蒙与生殖系统。(理论上也并非绝对不可能。无机物突变为有机物,历史上应该是发生过的。不妨在人类高科技刺激下,再发生一次?)

隐约记得以前论过这个话题,一搜果然说过,而且说得还不浅:

“人工智能其实应该翻译为人造智能。人造翻译(或仿人翻译)与人工翻译可大不相同。但取法乎上仅得其中的古训不大灵了,古训忽略了量的概念。被取法者足够大量的时候 所得不止于中。AI 代替中庸 势在必行。取法乎众 可得中上,这是事实。但最好的机器翻译不如最好的人工翻译,这也是事实。因为后者有智能 有理解。而前者虽然号称神经了,其实连“人造的理解”(譬如 NLU)都没有。

现如今人工智能好比一个性感女郎,沾点边的都往上面贴。今天跟一位老人工智能学者谈,他说,其实人工智能本性上就是一个悲催的学科,它是一个中继站,有点像博士后流动站。怎么讲?人工智能的本性就是暂时存放那些机理还没弄清楚的东西,一旦机理清楚了,就“非人工智能化”了(硬赖着不走,拉大旗作虎皮搞宣传的,是另一回事儿),独立出去成为一个专门的学科了。飞机上天了,潜艇下水了,曾几何时,这看上去是多么人工智能啊。现在还有做飞机潜艇的人称自己是搞人工智能的吗?他们属于空气动力学,流体动力学,与AI没有一毛钱的关系。同理,自动驾驶现如今还打着AI的招牌,其实已经与AI没啥关系了。飞机早就自动驾驶了,没人说是人工智能,到了汽车就突然智能起来?说不过去啊。总之,人工智能不是一个能 hold 住很多在它旗下的科学,它会送走一批批 misfits,这是好事儿,这是科学的进步。真正属于人工智能的学问,其实是一个很小的圈圈,就好比真正属于人类智能的部分也是很小的圈圈,二者都比我们直感上认为的范围,要小很多很多。我问,什么才是真正的恒定的AI呢?老友笑道,还是回到前辈们的原始定义吧,其中主要一项叫做“general problem solver”(西蒙 1959)。

from 【尼沙龙笔记:宁顺不信,神经机器翻译的成就和短板】

这个话题足够重要,不妨从不同角度多说说、反复说,被热昏误导的人太多,吹吹冷风,听见一个算一个。

【相关】

English: "AI is fake I "

【尼沙龙笔记:宁顺不信,神经机器翻译的成就和短板】

人工智能,一个永远没有结果的科学_马少平

【Church - 钟摆摆得太远(3):皮尔斯论】

反伊莉莎效应,人工智能的新概念

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

《每周两歌:中外女声魅力嗓音,Allison与于文华》

首先,刚过去的周末,祝各位母亲节快乐!

母亲节请欣赏【于文华:想起老妈妈】。背景是上次探亲,正值江南油菜花的季节。我插队的村子的邻村 原来鬼不生蛋的深山老坳 如今是【美丽乡村】的典型了。

关于于文华,以前推荐过:“于文华绣花嗓子,甜美细腻。郁钧剑怎么配她?(别说,还就那嘎声嘎气的尹相杰配于的细嗓子,还有点特别的风味。)郁钧剑没唱过什么给人留下印象的歌曲,这一次照他的功底,老实说算是不错了,也难为他了。无奈于文华的演唱登峰造极,相比之下郁钧剑太平淡了。我们通常只听第一段于的演唱,一到郁钧剑就回头或跳过去。”

Allison is my all time favorite, with her unique voice.  The footage I shot is from a Costco tv demo plus the footage from the Apple Store in the new headquarters

【相关】

音乐欣赏随笔:Brad Paisley & Allison Krauss:威士忌安魂曲

立委随笔:网事如烟

《每周一歌:水姑娘》

风情万种的《水姑娘》,让人骨头松软的民族风

好像是水族的民歌。《水姑娘》周末放送 祝各位复活节快乐!

花红柳绿 风情如此。此乐只有地方有 绕梁三日不绝缕。不知道歌手是哪一位少数民族夜莺 “嗲”得如此上档次。

10年前从湾区草根舞蹈团的Mary老师处听得此曲 惊为仙乐 藏之深山。

画面应该是水乡写意之类。但要与亲友分享三个猫咪的近况,懒得单制作视频了,分享音乐和pets合二为一了。

三只猫只有一位 lady,katara 具有水姑娘的气韵 (也兼具铁姑娘的风餐露宿、攀缘跌打本领)。两位君子 牛顿忠厚 Xander 懵懂。片头片尾是苹果新总部的 Apple Store,这视屏就是在手机上用他家 iMovie 制作的,非常便利。

《李白113:白老师秘密武器二瞥(2/2)》

立委按:两载设计,三载实现,白老师的自然语言秘密武器日前曝光。十载孕育,如水流年。挑开面纱,犹抱琵琶,先者为快,一睹芳颜。

李:其实语言理解过程中究竟用到哪些知识,并不难确定。难的是 这些知识如何加分减分打群架。

白:人理解时也不过是在打群架,没高明到哪儿去。

李:如果不给设计师束缚,所有的知识都特征化,不限定范围和多少。然后假定神经可以搞定这些特征,那么 符号逻辑 实际上只剩下符号特征化的工作。逻辑由神经管了,果如此 自然语言理解离开终结就不远了。

白:不对。逻辑有两部分,一部分是有限的可选择的操作或变换,另一部分是何时何地选择何操作的控制策略。控制策略特征化应该鼓励,而所选择的操作的轨迹,是充分可理解、可定点修复的。表示-对表示的操作-选择操作的策略,这三者,我认为第三种是适合特征化、向量化、神经网络化的。这不仅不是终结,更是升华。同时也并不影响前两者的可解释性、可定点修复性和容纳复杂结构的能力。

“身份证”的主人在两句中不同。

李:设想对话场景:

A: 他要求我出示身份证
B:你出示了吗
A:出示了,结果没通过。
B:为什么?
A:因为他是检疫官,要求我出示我宠物的身份证。我以为他是警察,要求出示我本人的身份证呢。
B:这才叫场景的阴错阳差!你过的哪道关都没搞明白。

再如:“监护人向我出示了身份证,是想证明这孩子不是非法移民。”

hidden links 根据常识或常理而来,这就带来两个问题:

第一是,因为是常识、常理,而不是语言明确指明的信息,这些 hidden links 即便挖掘出来,也仍然是不重要的枝节边缘信息,更谈不上情报价值,因为一般人根据已知信息都可以推算出来。

第二是,因为是常识、常理,因此肯定有例外。例外常源于场景和背景的不同。如前面的对话场景的思维实验。

白:打群架好了,神经最擅长。

李:既不十分可靠 也没有新意 也许意味着常识介入理解应该有个限度。如果常识的带入,是帮助确定了情报,那就物有所值。如果常识的带入,不过是反过来为常识增加一个案例,信息还是常识,那就没啥意义。

白:

1,情报又不是落地的唯一领域。

2,即使情报,三个link有情报价值,一个link是这三个link的常识推论,那这推论人做还是机器做大不一样。你先抓到那三个links,人聚焦了看,然后人得出推论,黄花菜都凉了。机器直接得到四个links,能一样吗?

3,推论重要还是那三个重要,这得情报人员自己说,NLP不应该越俎代庖。常识是带变量的f(),只要里面的x是新的,f(x)就是新的。新的就可能有意义。常识都知道撤职了职务属性值就该变了。但是只要张三撤职是新的,张三职务属性值就应该变化为新的。就算常识是旧的,有常识和新事实共同参与的推论也是新的。另外,疑似知识、打过折扣的知识并非就没有意义,只不过置信度稍低而已。哪有那么多百分百置信度的事儿。谣言还满天飞呢。

李:有一定道理。

@白硕 他要求我出示身份证 / 他向我出示身份证。“出示” 一般认为是 3-arg:sb “出示” sth to sb: SVOC,现在看来 这个补足语萝卜 C(嫡系) 是被当成附加语(庶出)了。这不是主要问题,问题在 hidden links 因此也漏掉了。“他要求我出示身份证” 中,“我” 连上了 “身份证”,但是 “出示” 没有连上 “他”。逻辑语义上 向谁 出示呢?是向他的。

白:改成双宾了。这情形更可预期。

李:”他 为/替 我出示身份证”,“为” 与 “向” 的区别在句法如何利用?小词不同,句法有表示吗?还是指望接盘的 一个一个小词重新 check 来做区分?

白:小词会携带算子,把动态特征贴到自己修饰的成分上。目前只能说这么多。比如,一个“的”,无所谓跟谁相谐。但是“张三吃的”就必须明确自己的subcat。

李:fair 就是说 显示出来的 what 只是个架子,不是输出的全部。这其实是自然的。如果不在 link 上细化,那就在特征上细化。反正信息需要下传。

双宾句如何处理的呢?譬如:

他送了我一本书。
他把一本书送了我。
他送了一本书给我。
他给我送了一本书。
那本书他送我了。
那本书他送了我
他送一本书给了我。

白:

双宾句式,双宾句式加明示间接宾语的介词短语的互通,我们已经做得很透彻了。

李:两个 Lma 一个 Rma,等于是三个 args 句法都不做鉴别。下面接盘的,依靠什么来区分,去做 123 与 abc 配对。

白:这个自有办法。分母上的数字只是显示

李:怕下面接盘的 还要回头做部分句法

白:不需要,句法信息都带进去了。

李:句法上 Topic 与 synS 不区分,但是偏移量有区分,也算等价了。怎么知道 “我” 不是 O,“书” 才是 O 呢?

白:书有subcat信息,还有Default位置信息。如果O的subcat跟S兼容而且相对Default有变,比如O提前做了话题,那就取决于右填坑的间接宾语的事理因素了。

这个丫鬟我送你了。

这位夫人我送那个丫鬟

取决于夫人和丫鬟在事理中的地位。这个绝不是句法单独可以做的。加上subcat也不行,所以目前我们做不了。只当default位置是O,啥时候事理做了进来,就有希望了。

李:句法为谓词选了萝卜候选人,萝卜进坑的事儿归后面的语义模块,所以 后面的任务仍然蛮繁难。因为萝卜进坑 仍然需要综合平衡,语序、小词和语义相谐,综合平衡才能基本搞定。更难的要借助事理。

白:哪个对哪个,特别是subcat也区分不了的时候,目前没有足够的资源。NLP的魅力就在这里。好在方向基本是看清楚了的,见效取决于投入。要想糊弄人,做个玩具事理图谱也能蒙一阵子。不过我们不会这么做。事理图谱一定要结合应用场景做。不见兔子不撒鹰。

李:”吃在买后“ 这样的事理,HowNet 没有:HowNet 主攻本体常识,一般不带入动态场景的形式化。真正规模做过“场景常识”的只有 cyc,“开枪” 在 “伤残” 之前 之类。但以前的教训依然存在,其数目实在太大了。

白:吃、买太具体了,模式是“消费在取得后”,消费是吃的上位,取得是买的上位。如果仅看到具体事件对具体事件的因果联系和承接联系,那还不累死。要把事件的Taxonomy像实体一样组织起来。赋予抽象度适中的标签。事件的诸多要素,都要纳入这个体系,参与者、时空特性(时-体)、事件类型的包含与继承、关联类型的包含与继承,触发条件、副作用……不一而足。这是目前聚焦事理图谱领域的各个利益相关方都极为关注的。

李:“我洗脸”,英语总是说:我洗我的脸(I wash my face)。中文解析,根据常识,可以推算出“我的脸”。感觉上 人的理解中 标配信息真地很边缘。赶巧了英语用代词把它明说出来了。但说了也跟没说差不多。情报性无论怎么定义 这个“脸”属于“我”都很难成为情报焦点。

一般而言,感觉上 possessive 的 hidden links 情报性最差,在有冠词的语言,possessor 很多时候被一个定冠词 “the” 虚指了。凡是定冠词打头的实体(语言学里面叫 anaphor) 理论上省略了所有者这类实在的 specifier。“the” 的含义是“你知我知”, 虽然有个主儿但这不重要。

白:不同源头会带上不同约束,使推论减少盲目性。比如“给”的介词宾语和非三价动词的主宾语坑就不太能共享。这是“给”所明确标记的间接宾语属性所决定的。这些约束会截断共享通道。

“张三给李四写自传”,这李四要是有什么来头,情报价值还真挺大。张三是个代笔的小人物,张三的自传不重要。所以谁的自传,不简单。

李:从性质上看 寻找这类所有者属于篇章的 coreference 范畴,而 coreference 的工作,句法有一定影响 (binding theory 说的就是句法对于 coreference)。但是句法影响对于篇章非常有限。更大因素还是语义相谐和距离。把 一个实体对于其所有者的预示 与一个谓词对于一个 arg 的期望 等量齐观,有点高抬了前者。

白:优先级不一样。

对范畴语法做了重大简化,跟依存很接近但比他更丰富。分析结果可以不是树而是图,图还可以成环。图更科学,更反映语言实际。

带加号的句法标签,可以看成是“只约分不输出”的范畴。每次完成约分,就废掉自身,以保持中心语的正统地位。

李:就是 adjunct/mod,庶出,跟私生子也差不多,投奔过来又不能不认,但上不了台面。

我的理解,DG 与 CG 性质不同,DG 是 一种结果表示法 刻画的是output what,CG 却带有 how 的味道 表示和刻画 input tokens,可以据此演算 作为 parsing 基础和驱动。最终从 CG 达成 DG 的结果。

parser 被词典化的 CG 驱动以后,在遇到叉口的时候 求助于其他知识的引入,主要是语义相谐的调用。根据一个优先原则和有限级计算的机制 做路径判断 然后完成 parsing。如果不怕伪歧义 也可以只依据 CG 词典与优先级原则 而不引入其他知识。

这条路线的搜索空间 (universe)是句子长度 n 的这样的一个函数:可以 assume n 中每两个词都必须发生7种二元关系之一。三种是实关系但是有方向(父父子子),所以“原子化”后就是6种实关系,即,是二元排列不是组合。第7种是:无关系。无关系也算关系,就一网打尽了。任意两词只允许发生7种关系之一,不能多也不能少。在 n 不大的时候,搜索空间爆炸得不算厉害。

白:ordered pairs,A跟B和B跟A可以有不同的关系标签。

李:对,有这个二元循环的可能,忘了这茬了。不过那很罕见,对于搜索空间影响不大。能想到的只有 定语从句谓词与中心词有二元循环关系,一个 mod 一个 arg 方向相反。

李:By the way,你用 subcat 正好与(很大一部分的)语言学内部用的术语相反,句法学家说 subcat (子范畴)只是针对 句型,主要是给 谓词 根据不同句型的预测 分为不同的 subcat,而一个词的本体的细分 就是 subclass(子类),所以 vt,vi 属于 subcat,到了 HPSG 等理论,这个 subcat 就真展开成句型了:

give:: SUBCAT <NP left:S>, <NP right:O>, <PP(to):C>]
give:: SUBCAT <NP left:S>, <NP right1:C>, <NP right2:O>]

第一条 SUBCAT 句型是 sb give sth to sb;第二条是 sb give sb sth

白:不管了,反正就是负载逻辑语义结构信息的标签,来自词典。标签之间的关系在本体里定义。

也不能说是“特征”,因为特征给人的印象是扁平化、向量化,缺少结构。但也绝不是曾经流行的“复杂特征”。

李:扁平化 原子化 有好处的,以前你也是赞成的。复杂特征在符号逻辑上漂亮,但不好伺候,难以承受逻辑之重:实用系统不能过分与逻辑较真(这个体会很深,以后有机会展开再论)。

白:我们只有一层除号,分子,分母。分子和分母里边都不再有除号,我称之为“单子化”。就一个成分而言,萝卜和坑都不必再有相对性。它们都是“单子”(singleton)。

李:那是因为你们的出身是 CG,算法里面就对分子分母的表示有要求,作为区分输入输出的手段。

白:把CG改造到这么实用的程度,我们应该在世界上挂个号了。

李:不知道这个 CG 还有没有个 community 和相应的 events,还是拉丁文一样被搁置了。HPSG LFG 那些人还在,有自己的圈子 不过是越来越游离于主流(两不靠:语言学主流和计算语言学主流都不是)之外了。

白:CG可能就剩下CCG还活跃。CCG的本质是带坑填坑,于是就会产生我们所说的残坑。残坑在计算上的处理非常复杂,单子化对残坑处理带来莫大好处。但是从数学观点看,引入“修饰”,就是N+、S+这种,打破了“一个运算符吃遍天下”的理论美感,理论框架变得有些dirty了。等有空了,我会梳理一下“修饰”从数学上看是个什么鬼鬼。修饰之于单纯的相除,就好像X-bar之于CFG。象牙塔里的人可能不屑为之,我们编外游侠接手没什么顾忌。

【相关】

白硕:人工智能的诗与远方,一文读懂NLP起源、流派和技术

文章来源:https://read01.com/AJGzNQN.html

《一日一析系列》

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

《李白112:白老师秘密武器一瞥(1/2)》

立委按:两载设计,三载实现,白老师的自然语言秘密武器日前曝光。十载孕育,如水流年。挑开面纱,犹抱琵琶,先者为快,一睹芳颜。

白:坑之交响曲:

脑补进行时:

李:白老师的符号给个说明啊,L是左 R是右。LMo 是左成分 不占坑 属于 mod/adjunct,LMa 是左成分,是填坑的萝卜,属于 arg,是不是?

一个及物动词挖了两个坑 2N,左边填坑的叫 LMa 右边填坑的叫 RMa,什么时候确立他们的逻辑主宾呢?

Me 是个什么?条件结果的谓词之间“(如果)选择,(那么)看好”是 Me,动补合成词内部的“哭-肿”也是 Me,所以这是个表示并列或接续的二元关系,不分词法句法 也不分短语还是从句。

二元关系图里面 层次扁平化 结构层次没看见有反映。X-bar 这类层次信息一多半属于语言 一小半属于逻辑。属于语言的可以扔掉 属于逻辑的应该有个表示。起码 “哭-肿” 的二元关系 与两个谓词结构的因果关系 在层次上天差地别。对于 dependency graph 表示,如果不允许逻辑交叉的“飞线”,层次信息可以从子树中 derive 出来,短语就是子树的 parent node 所下辖的节点范围。以此反映思维中的复合概念与单纯概念的区分。但是,现在我们允许 dependency 可以交叉,甚至允许循环(dag 丢掉了 acyclic 特性,成了 dg),以此来挖掘语言中隐藏很深的 hidden dependency (譬如 “眼睛” 与 “肿” 的主谓关系)。这虽然使得深度解析更加深入,同时也带来了层次交叉以后的副作用。复合概念的边界和范围模糊了。逻辑概念的层次没得到应有的表示。图中的主次不再分明。

结构(表示)应该是由关系和层次两个要素构成,否则就难以担当语言的模型和思维的模型。其实 关于 graph representation,以及利用 graph matching 落地到应用,里面很多机制性的东西,还是没有探索清楚。属于深水区,摸着石头过河会不会不小心淹死,也不好说。

白:树是现成的,只是没有做展现而已。

回顾一下五个操作:Ma代表Match,也就是填坑,除了左右填坑还有中填坑,就是分子向分母上的残坑填坑。Mo代表Modify,也就是修饰。Me代表合并,不仅有S(谓词)的合并,也有N(体词)的合并。谓词的合并在传统句法看来那么多种情况,在我们看来其本质都是分子合二而一,分母尽可能共享,在结合的优先级上也刚巧非常合理地靠在一起。Up和Down是升格降格。在扁平表示中,采用了新增虚拟节点和方式,原节点汇聚入边,新节点汇聚出边,新旧节点间则是单一的升降格边。

这些范畴非常“冷血”,非常地就形式论形式,但不代表不能转换成主谓宾。但是,第一,我不认为主谓宾的叫法在句法上比我更科学;第二,句法标签只是个过渡,对接语义标签时,这套标签不仅不会输给传统标签,反而映射更直接,比如话题、大小主语、总分关系、谓语动词周边非逻辑主宾语的地位尴尬的NP。第三,这套标签不是不分词法句法,而是词法句法的边界在一些地方有异于传统认知,特别是紧定中式名词(如“红太阳、好朋友”等)和动结式动词(如“打伤、哭肿、染红”),由于在我们的体系下微结构和句法(比如动趋式、动介式)并无不同,所以放到句法里并没有违和感,也并不因此多费什么手续,完全是搂草打兔子,顺手的事儿。

这个体系会不会乱?我们用了将近两年的时间建立它的what,接近三年的时间建立它的how,经过了无数的推演、测试和复盘。在这样高强度的打磨下,传统语法书里的绝大部分难句都不是问题,也没有因此把普通句搞得不普通,基本结论是结果(what)可用、过程(how)可控。

解析结果保持歧义的能力也有独特风格,比如“鸡不吃了”是传统歧义句,但在我们的表示框架下,句法无歧义,一个左填坑,一个右修饰,如此而已。歧义是语义层面的,鸡不小心即是Animate又是Food而已。这两个角色在句法上都是左填坑的N,并无区别的必要。

如果落地要的是语义标签,我们可以直接去对接。如果一定要传统标签,我们可以做转换,但这就像高清晰度的视频向低清晰度的视频转换一样,我们并不认为它是一种成就,而是一种无奈。比如“这件事我有意见”里面,“这件事”和“意见”有直接的填坑关系,跟“有”没有一分钱的关系。你让我标注出“这件事”是“有”的什么角色,我当然是很不情愿的。


我们说动结式动词的微结构和松耦合的述补结构在本质上是同一类结构,都是分子合并、分母尽量共享坑,但坑的共享是有相谐性前提的。刚才说到的“哭肿”就没有相谐的坑可以共享,所以只好各填各坑,但是分与合,都是在一个机制下的不同子模块而已,并不是说一个很好把握另一个很难把握,都在可控范围之内。

李:落地要的语义标签是逻辑语义,还是语用的标签?语用标签譬如信息抽取里面的事件角色。

白:公共服务落地是逻辑语义标签,应用落地是语用标签。中间隔一层适配。

李:这个落地模块 需要多少额外的知识呢,包括语义相谐。

白:适配具有行业特点,不懂行业没门儿。

李:逻辑语义原则上是行业独立的。

白:也不可能一家公司包打,一定会发展出众多的落地服务商和落地适配包。主打逻辑语义的公共服务,在足够精准的前提下是有独立商业空间的,如果再做几个示范的语用落地,表明生态效应和层次衔接机制work,后续还会有大发展。就好比,逻辑语义提供面粉,应用落地提供面包蛋糕包子馒头。面粉的供应商有自身的商业空间。面粉也需要好的面包蛋糕包子馒头来背书自己的质量。

李:说这些 道理上站得住,听起来好遥远。parser 要独立成为生意,感觉很难,NLP component technology 定位的,迄今几乎没有成功案例。不是没人尝试,而是没人成功,除非今后几年有突变发生。(满世界只知道端到端呢,最近加了个普遍看好的预训练,离开符号语言学更遥远了。)

如果句法就3种关系,嫡系 Ma,庶出 Mo,哥们儿 Me,从数目上看 这不仅比 100种逻辑语义、也比 五六种传统句法关系(“主谓宾定状补”之类)要粗线条。说这个 what 是高清,感觉还不够。

白:这个标签体系显然不是逻辑语义,但它可以直通类似知网的逻辑语义体系。说直通的意思是,拓扑基本上都对,只是需要细化。谁跟谁有关系基本都对,什么关系需要细化。不像有些拓扑都不对的,细化起来遇到的麻烦大得太多。

李:从这个 what 匹配到逻辑语义,是一对n,必然需要更多的知识和做功。

对于短句,标签集很小的时候,凭着词典的预示信息,句法基本不是问题。到了长句 可能挑战就来了。短句不是问题 就好像过去社交圈小 但每个人都必须结婚,谈恋爱就特别容易有结果,因为没得选。很多时候 门当户对以后 候选只剩下一个 那就ta了。

白:结构就是用来拉近距离的。依托结构拉近的距离,比望文生义拉近的距离,更为精准。

李:词典在类别基础上所给的那些subcat预示信息,譬如 S/2N,这类 subcat 也是粗线条。即便原子化 平铺开来 也没有多少,估计 20 个左右。

白:这不算subcat,只是POS

李:上面的标签 S/2N 传统词典是 vt,属于 V 的 subcat,不过叫什么名字无所谓,总之是预示一个潜在 pattern 的词典标签。这类标签的集合 感觉20个可以收住。在 20 个标签以内做句法,结果的关系是 3,这应该还算是粗线条的。

让人眼亮的是这种颗粒度 的确是句法最核心的部分,在回答 “谁与谁发生 directed 关系” 的问题上,是一个不错的抽象。

短句容易做粗线条句法是显然的 因为没得选,“这件事 我 有 意见”,一共两个潜在萝卜 n1 n2,正好有两个坑 空着,“我” 被 “有” 抓走以后,“意见” 的 【对象】 只剩下 “这件事”,不是它 也是它了。

白:还有另一面,明明空着,也不进来。下例中,“今年”,“食堂”,明明是最贴近坑的萝卜,但不是你的坑,打死不填。宁可降格做状语。这就不是那么简单了。还有前面“这碗猪”也不能谈婚论嫁,要等“汤”拉近,这背后有玄机。绝不是一个村里没婚没嫁就可以拉郎配的。

李:这里面玄机如果不论 how 就没法评论了 只能说不明觉厉,特别是“食堂” 不填坑,句法上有点天理不容。

白:所以这样的结果,转换成主谓宾,得多憋屈。那是后退。前进一步,就是精准的逻辑语义。拓扑都对了,就差一个相当于知网的基础设施。

李:可是反过来想,“吃” 与 “食堂” 发生了关系 是肯定的,这个关系中 “吃” 是老爸 也是无疑问的。为什么要把 arg 与 mod 的区分负担,强加给句法,而不是留到语义或语用呢?

“鸡不吃了”里面的主宾歧义句法都可以包容,为什么不可以包容 arg 和 mod。如果句法最好轻装 那就听乔姆斯基的,彻底排除语义,现在看来 这个 "食堂" 的降格 是带入某种语义了。反正 map 到逻辑语义的时候 还是要调用语义约束,想不出为什么一定要有选择地把部分语义前置。

白:语义arg无边无际,句法管不过来。我的原则是:标配的语义arg走填坑,非标配的语义arg走修饰。

李:“我吃月亮” 呢? 现在也降格吗?

白:是。

李:感觉是得不偿失。因为不降格做引申意义的宾语情形,应该比降格做状语的现象更加普遍。

白:“这场火”,也降格。月亮可以是处所啊。怎么非常识了?

李:比起传统的svo句法解析,个人感觉这样做是得不偿失。要是我,就宁肯放宽语义约束,得到一个非常识的解析,也比过早实施语义约束合算 命中率会更高。 这当然只是感觉,还需要数据调查和统计来验证。“把月亮吃了”,就是“非常识”,而非常识的说法 语言中也没有那么罕见(“一片乌云飘来,吃了月亮”)。原因是 非常识为语词的 引申,创造了条件和手段。说话者是用不相谐 来倒逼听话的人去联想 引申。

白:修饰,只是非标配的语义坑而已,不明属性,并不是语义层不能再入,这个修饰的标签并不给语义分析设置篱笆墙。只是说他非标配,非标配的后续,既可以脑补缺失的非标配格标记,也可以作为修辞手段再入标配格标记。两个可能性都存在。并不存在“失”,只有“得”。

李:设不设篱笆墙,说到底还是 句法输出以后,后续工作量 是增加了还是减少了。把“食堂”和“月亮” 都降格了,后续工作量 感觉是增加了 而不是减少了。因为 月亮被吃这类的表述 比 “吃食堂” 这类表述 数量为多,何况 吃食堂其实已经词典化了,本来就不该参合进来的。关键在 它不应该在歧义区分的雷达上,属于常识例外。词典绑架 没商量。

白:工作量不是唯一标准,有利于精准才是最终标准。再入,实际上你可以认为引申受事和常规受事是两个格标记。

即便词典化,微结构仍然是修饰。吃七食堂,吃教工食堂,并不是词典化的,但我们不怕。

李:那种叫成语活用,在词典绑架的延长线上。实现一个成语活用的机制 也就可以不来参合了。

白:吃勺园,吃全聚德。吃麦当劳 ... 也不是成语活用,但背后是一个机制。它们如果走了不同路径,反而奇怪。

李:这是真歧义,“吃麦当劳” 作为地点和食品 均可。这其实也成语化了 真歧义也可以在词典绑架为歧义表述。

白:就算吃食堂是词典绑架,但其词典定义依然是S/2N,并没因为“食堂”的加入而变成S/N,这恰恰证明“食堂”填的确非标配坑。

李:话说回来,只要句法不必调用语义相谐的大数据,而只是使用语义标配的二值判断,那不过是查一下本体,也没什么可批评的。不过就是两种各有利弊的路线 择其一而行之。

白:不一定二值啊,可以连续值,折扣么。

李:如果折扣的话,

我吃月亮
我吃石头
我吃土疙瘩
我吃面疙瘩
我吃疙瘩

这些解析结果应该有区别,而不是都降格,或都是宾语。

白:对啊,看你Ontology怎么设计的了。这与分析器无关,取决于Ontology的返回值。

李:返回标配是二值,还是多值,多到什么程度。

白:连续值,看小数点精度。但是0.2和0.3的差别,估计不足以颠覆。能够利用梯度最理想。

李:哈 你这一球踢出去 倒是轻省了,对了是我的,错了是你的。

就是说,ontology 供应商的相谐颗粒度,不一定是二值 但也不要超出太多,多了反正也没有区别,也许三值 很搭/较搭/不搭。也许四值。ontology 供应商最好是婚恋交友网站的架构师出身,懂得如何配对。

我还是没理解 从设计上为什么句法要在 “嫡系/庶出” 上较真,非要劳动 ontology,而在 “主语/宾语” 上反而不较真。反正提供的是半成品。从逻辑语义角度 语义也还是不全的。

白:我觉得这太显然了,这事儿不正是Ontology该做的吗?要站在比它们俩都高的视角看他们俩。句法和本体,我们的方法论是,句法要给出对的拓扑。为此,Ontology、情感、事理都是必要的补充。

李:细节不纠缠 逻辑语义可以算是一个唯一可以公认的语义理解的黄金标准了。arg 与 mod 的区分,本来就不是黑白分明的。这个对错 不好说。

白:但是构建逻辑语义层的输出,虽然也同样使用Ontology 、情感、事理,但是用得更重。这两个方向的用,不可混为一谈。

李:所以说是 双重使用啊,重复劳动。

说起 arg 与 mod 的嫡系和庶出 有点意思 可以展开简单说说。args 是计划内的婚生子女,主语、宾语、宾语补足语,名正言顺,所以受到父母特别关照。mods 属于计划外的秘密勾当。因此,总是 parent 去找 args,利用 subcat 的计划内指标。到了庶出的 mods 就管不过来了,只好是 mods 去找 parent。千里寻父 叫父亲太沉重。

可是这一切的句法区分都是世俗的角度,语义层面 嫡系和庶出并没有那么大的鸿沟,都是围坐在天父身边 各司其职 各有角色。所以说 句法费力气区分嫡系庶出 为的是服务语义和理解,可是 语义那边偏偏对这种区别其实没那么敏感。为啥?因为语义在分配角色的时候,更加看重本人的资质,而不是看重 嫡系还是庶出的出身。“有成分,不唯成分论”,重在个人品质。个人的品质,就是你到底离我的本体要求有多远。

白:就是因为庶出的不加标记的情况太稀疏,句法留这么多资源给稀疏的庶出,不值得。

李:反正语义那边还要政审把关,用的也还是ontology 资质审查,为什么句法还要预审?

白:此地预审,方便彼地直通。

李:我是说 费力区分 Ma 与 Mo,没多大必要性。如果这种区分 不需要劳动各种知识 那当然。如果需要费力 就不值得了。

白:从基础设施建设的角度,只为一个中间步骤建,当然越轻越好。如果建了既可以为一个中间步骤服务同时更可以为有独立商业价值的最终步骤服务,那就可以建的重一点。即使重,也包办不了落地适配。落地适配是一个既统一规划又独立实施的环节。也就是说,从一个必建的基础资源里顺手提取一些信息就可以搞定正确的拓扑,这算不得什么费力。劳动的方式非常清晰和标准化(相谐度查询),也算不得什么劳动。我们目前的算法也并不是对所有候选邻对都进行相谐度查询。只有当前动态优先级最高的邻对才做相谐性检查。

这个,显示还有点小bug,但是揭示了一个现象,就是嫡出的萝卜出现位置太远,需要许多中间步骤拉近。但一旦拉近,那个位置还是人家的,庶出的没脾气。远近并不构成威胁。把“你”挪到“食堂”后面,也是同样结果。“要是这个时间吃食堂你就只剩下包子了”,用传统句法范畴分析这个“你”,就很莫名其妙,它跟“剩下”是主谓关系吗?但是论坑,一点关系没有。它跟“吃”是主谓关系或者述宾关系吗?论坑是的,但是形式上却完全不在那些位置。甚至跑到了另一个从句的辖域里面,要多尴尬有多尴尬。谐我坑者,虽远必填。

李:好例。改造一下:

“要是这个时间吃食堂你就只剩下二厨了 大厨早就自己躲一边吃包子了”

“二厨” 比 “食堂” 如何? “包子”更远 但相谐,为什么不能虽远必填?

“要是这个时间吃食堂 大厨早就自己躲一边吃包子了。”

白:后面又出现了“吃”,截胡了,“包子” 第一次就近填坑。

李:填 “剩下”,与 填 “吃”,不都是劫持了吗?

白:“剩下”的坑,抽象度比较高,万金油。我们的说法是“置换”,就是把首次填的坑从占名额的调整为不占名额的,后续填的坑再视情况决定占不占名额。

李:就是说 对于远近两坑,还要做比较计算,来决定截住没有?

“要是这个时间吃食堂你就只剩下二厨了 大厨早就做完一屉包子回家休息了”

“做完” 与 “剩下” 差不多,都是万金油 vt,截住没有?

白:这个还真可以有。但前提是,子句之间得有依据是连接的。大厨做完了包子,不一定卖完。

李:人的理解,首选不是包子,而是二厨做的档次较低的食品。大厨做的包子 轮不到。

白:如果两个子句只是最低档次的连接(next),还真未必建立坑的共享。但是用连接词连接的,肯定可以共享。

李:有一万个理由否认,因为说话语气是可惜和后悔,想吃大厨的口福 你享受不到。谁叫你迟到呢。共享与共产共妻类似,是高危操作。

白:你那里只有空格,没有上句和下句的明确锚点,不在我们的共享白名单里面,不能建立Me,所以坑里的萝卜是带不过来的。跨小句需要白名单制。前提是:1、甲小句不饱和、2、乙小句有供给、3、两小句连接方式在白名单中。

李:嗯,虽远必填 限定在句法关系圈内,也是一说。

“要是这个时间吃食堂 厨师都出去买海鲜了。”

这个应该是 Me,因为符合 “要是...就...”句型。

白:对。

单从本体看海鲜就是加分的,但是事理是减分的。吃在买前,不符合事理。不符合事理的会减分,就看二者抵消成啥样了。

李:这个事理如何用 感觉漫无边际,“先买后吃” 这样的常识事理,何止以万计。

白:但是人就是这么判断的。这是长尾,攻击到本体的概率有限,不到落地肯定不做。

李:所以 句法一般不带入事理常识,语义语用才考虑用。

白:句法只是中间产物,又不是产品。加了边还可以砍啊。砍了边再加就不那么简单了。有一万种方法砍。一个公司既做句法也做落地,没必要维护句法的面子。整体可以就OK。句法提供的这些边,送神容易请神难。

李:就是大体了解句法模型,用到几个维度的知识,用到的维度 颗粒度如何。之前论过 维度多了就是一锅粥。如果符号逻辑最终还是一锅粥,那就不如索性舍弃符号。因为一锅粥最终丧失了符号的优势。可解释性不再清晰,可定点纠偏也丧失了。

白:还是要区分表示和控制。表示是符号的,控制是符号与神经结合的。这没什么不可以。

(未完待续...... 《李白112:白老师秘密武器一瞥(2/2)》

【相关】

白硕:人工智能的诗与远方,一文读懂NLP起源、流派和技术

文章来源:https://read01.com/AJGzNQN.html

《一日一析系列》

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

《李白111:范畴细化与语义相谐的知识爆炸》

白:“张三不满意李四没有表扬自己”“张三不满意李四没有批评自己”

这个是情感倾向性决定“自己”共指关系的例子。虽然,default建立得很脆弱。外面有个风吹草动就可能洗牌。比如张三和李四绑死了是一伙儿的 等等语境引入的预设。

“把鸡咬死的虫子扔了” “把鸡咬死的狐狸跑了”

李:好例。

微瑕是,鸡吃虫 论咬吗?虫无骨 没咬劲儿。

白:“中国北京是首都”当中的“中国”是啥成分?“这支队伍我是当家的”当中“这支队伍”是啥成分?

“这个人我感觉很蛮横”“这个人我感觉很舒服”

插入语一旦确立,应该封闭与外部建立hidden links的通道。什么“你知道、我认为、他觉得……”当中的你我他,都不要再花心了,安守本份即可。

李:

"有点乱,有点乱......"

想起周华健的“今天我有点烦 有点烦”。“当家”与“队伍”挂上是对的,可貌似关系颠倒了,这 S2/mCL 肯定是个🐛,需要 “de- de-” 的。

白:队伍和当家摘开,并不明智。

李:debug 过火了耶。句法负面影响了语义。应该弱化句法。

昨天/前天 说了,这 Topic 如果是人名, 默认就是“呼语”,如果不是人,那就是状语,什么状语?很可能表示 scope(范围)。

把“的字结构”也做过火了,结果 “的” 成了 S2(hidden subject), 反而 “我”没有直接做“当家”的主语,虽然道理上可以通过与 “的” 的 coreference 推导出来。

白:王冕死了父亲,王冕也是状语?

李:不是。王冕是句法主语(synS),不是 Topic 降格。

白:“人” 给 “队伍” 当家,这坑都在。“的”不占名额,回指到定语从句里没事的。 空出一个坑留给“队伍”。

李:那个坑感觉不强烈?“当家” 需要一个 范围。可啥东西不要范围?就跟时间 地点似的,啥事儿都发生在时空及其范围之中。

“当家” 词法上是动宾 感觉饱和了,其实不然 它词义是 manage,与其说范围,不如说需要 manage 一个对象。但是词法饱和(“家”已经做了“当”的词法宾语)的残留影响还在,所以这个句法宾语的坑只好退化为范围状语,逻辑语义上其实是【对象】的。

白:不一样。在真正一个家庭里当家,范围是默认的。在一个“拟家庭化”的组织里当家(掌权),这个组织就是需要凸显的范围。这是隐喻固化导致的,跟一般动词的范围不可同日而语。从非标配坑提升到了标配坑,于是就获得了参与句法构建的资格。

李:成葫芦了:

白:这就靠谱了。还可以画成公鸡🐓

李:传统 parsing 怎么可能做到这个深度?PennTree 的标注太浅,PSG 的本性也无力表达到这种深度。

群里面专门修过乔姆斯基语言学课程的朋友说说,对于这种语义谓词隐藏较深的,乔姆斯基句法是怎么最终达到他的 logical form 的?还是根本就不管,当不存在?逻辑形式的核心类似一个SVO: <我 - 当家 - 队伍>。

“这支队伍我当家”。

白:这样就可以啊:

李:N[+1] 变成 N[-1] 啊,狸猫换太子的感觉。+1 是左,-1 是右,这个指针运算还蛮溜的。

白:这是把“是”当S+使,把“的”当+S使。偏移量。残坑出自“当家”。辖域合并不交叉,指针还原就交叉了。

李:传统语言学里面的 subcat 没有这么丰富细致,CG 细化过来的,主要是词典功夫。乔老爷好像在 subcat 上没强调细化。

subcat 的范畴细化 还不够,因为范畴细化 不加上语义相谐的支持 仍然导致伪歧义泛滥。在专家词典学派看来,范畴细化+语义相谐 成为一体了,那就要求词典成为知识库,等于是把语言学词典转变为 HowNet 了。HPSG 其实就是在专家词典学派这条道上,想走 没完全走通 就式微了。

白老师是分开了范畴细化与语义相谐。可是展示的 parsing 全部是范畴细化,相谐的工作机理语焉不详。所以 看白老师的 parse 图,结论是,就这些子范畴,运算起来,这路是 “应该” 通的。其他不应该通,但实际上也通了(伪歧义等),就不在雷达上。

白:这是what,不是how。what我希望更多的人理解和支持。how的商业属性就太强了。当然,这是结果,过程中不仅使用了这些。

李:就是。

what 似乎也不齐全,只是展示结构的 what,没有展示结构的功能性(角色)。所以,作为学习,这里有两个空白需填补,一个是 how,尤其是语义相谐机制,怎么招之即来挥之即去的。另一个是逻辑语义,逻辑语义怎么在句法或逻辑的链接基础上得出的。当然这二者是相关的,前者是条件,后者是结论。目前展示的结构树图就是个架子和桥梁。

白:这是一套资源向两个方向的延展。向句法方向就是前者,向语义方向就是后者。而且是句法方向退一步,语义方向进两步。

但是认真地说,本例,真的不需要语义相谐性,纯句法层面就搞定。

李:不是说本例。所以说是 (语义相谐是)招之即来 挥之即去耶。

那个 “专家的” 或 “大数据的” 语义,像个鬼影。说是要做个不是 HowNet 的 HowNet(《知网》),数据驱动的。怎么做?

这与最近NLP主流特火的预训练 也许殊途同归?预训练是个好东西,听上去就是阳光大道。就是不知道今后几年的使用中 会遇到什么坎儿。

白:新一代NowNet,早晚要做。但是不能跟场景两张皮,必须通盘顶层设计。

李:架构上,我看好预训练,关注它的走向。道理也简单 我们一直孜孜以求的就是把语言学和领域先分开,然后再连接,各司其职。预训练就是先分开,而且不用标注语料,这个语言模型等于是在无穷语料上架设。所有的语义相谐和常识理论上都应该在预训练的模型里面(间接)反映了。

白:“他们让我从侧门进大楼”“他们让我跟太太进大楼”

“侧门”(N/N)的宿主是“大楼”,“太太”(N/N)的宿主是“我”。这要动用本体了。这俩的对比很有意思,纯句法肯定搞不定。

李:

白:侧门和大楼没挂上,侧门的宿主是building。所以building下位一定相谐。大楼小区之类。

李:知道。HowNet 都有,但不好贯彻。

不确定要多大的语义相谐合适。如果大面上说 只要是 part 就与不是 part 的 physical object 相连,那是手到擒来的事儿,怕的是副作用。会不会连得太多,因为 part 和 physical object 都是范围很大的本体概念,概括一大批语词。如果说,细化到 “楼” 与 “门”的本体,就非常相谐,没有顾虑,那就需要一个完整的 hownet 本体知识,可是 我对 hownet 的使用 目前是限制的,不想进入语义泥淖太深。HowNet 董老师自己用 得心应手,其他人用 就颇不易。

白:知识必须是机器可读的。

李:hownet 是机器可读的,或者说 形式化的。

白:机器可读的最好办法就是向一个丰富的技术栈靠拢,否则自己从头建立技术栈,得不偿失。但是董老师对此并不感冒。

李:subcat 以及 sub-subcat 的语义关联,有点组合爆炸的味道。本体自己从细到粗就是一个不小的集合(上千的 vocabulary),本体与本体的相谐 就是组合爆炸。如果组合粗线条 不会爆炸 但失去精准,如果细化 把 HowNet 全部引进,相应的规则集也有个组合爆炸的细化过程,有可能不好管理和维护。总之 现在是控制使用,不想步子迈得太大。

白:还是要区分what和how,what本身无所谓组合爆炸,只有how没做好才组合爆炸。向句法这一端延伸,只用到少量资源。机制必须是轻量级的,重了适得其反。

时代呼唤具有更好场景对接能力和顶层设计理念的新一代“类知网”基础资源。

李:语义常识是一个多大的坑啊,淹死人不偿命啊。谁设计 谁来组织去做?个人还是开源社区?最后 谁用?怎么用?除了设计 白老师可以统率 后面这些问题都还不好回答。

白:要分层,基础层给专业层用,专业层给用户场景用,但是必须统一规划。知网也没搞成开源社区。这东东,不容易协调利益。除非使用区块链。关于知识长什么样如果没有统一的顶层设计,本体和场景一定是两张皮。

【相关】

《一日一析系列》

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

《音乐心情故事:童趣回放》

女儿小时候的录音不多,仅有的几段大概在 iPod 里录的音,随 iTunes 转到了 iPhone,车上常听,与音乐一起化为岁月的记忆。

小时候就特爱说话,甚至有点饶舌,话比思维快,喜欢显摆童谣。录音里面有几个美国儿童的段子。

“boys go to Jupiter to get more stupider, girls go to college to get more knowledge.”

这是取笑男孩的。饶舌的甜甜现场发挥,富于夸张和强调:“what do you want me to say now? boys go to Jupiter , do you know the planet Jupiter? they go to the planet Jupiter, once they get there, they get supider and supider every second. And girls they go to college to get more knowledge and knowledge into their brain on their head.”

"Eeny, meeny, miny, moe,
Catch a tiger by the toe.
If he hollers, let it go,
Eeny, meeny, miny, moe.

My mother told me/says to pick the very best one, and you are not it."

这是非常流行的“选择”童谣。小孩子面对两个或多种选择的时候,不知道选哪一样好,就口中念念有词,一边用手在选择物之间轮流数着,道理上应该是童谣完了手落在哪个选择上,就选择哪个。可是,儿童的心理是微妙的,很多时候内心其实有了一个所指,为了最终得到自己想得到的,表面上还跟着童谣走,孩子们学会在童谣后面,打着家长的名号,用肯定或否定来保证自己不要落到自己不要选的东西上:如果最后落到中意的选项上,就说 “My mother told me/says to pick the very best one, and that is YOU”. 否则就改口说:“My mother told me/says to pick the very best one, and you are not it.”

可见,生活的智慧,从儿童就开始滋生。明明是自己的愿望和选择,却包装成命中注定,或听命于父母大人。

(cf: https://en.wikipedia.org/wiki/Eeny,_meeny,_miny,_moe)

"You know what
Kick your butt
All the way to Pizza Hut

While you're there,
Comb your hair
Don't forget your underwear!"

里面有个片段说学校的事儿。回家说的这个故事是小女孩玩家家的,也有微妙的儿童心理:

"I said that I am the Princess of Jewelry because one of my friends and buddy said that she looked at my jewelry I brought to school.  What happened is she was so surprised and she loved it ... she said that I am Princess of Jewelry and she is the Queen of Makeup.  Next time I am going to bring new jewelry, she said that I am the Queen of Jewelry...... No,Daddy, Jessica said I am the Queen of Jewelry if I bring some new jewelry tomorrow."

显然这个小女孩 Jessica 是精明的,有小希拉里的情商。她见到甜甜带到学校的那些“首饰”(女孩喜欢收集的那些小玩意儿),先是恭维甜甜是“首饰公主”,然后自封自己为“化妆女王”。甜属于比较傻的那种,一听恭维,高兴得不行。说明天要带更多新首饰去找女孩儿玩儿,带了新首饰,Jessica 就会封她为“首饰女王”了。可是“化妆女王”是“首饰公主/女王”的老板呀。跟孙悟空讨了个弼马温乐得不行一样,甜却非常高兴做女王的首饰运输队长。哈。

前后还有两段读书录音的回放。可以明显区别什么叫 native speaker/mother tongue,什么是第二语言。前一段英语故事读起来非常顺溜,有声有色。从幼儿园到小学一直就是英语的环境,在家里听的那点汉语无法匹敌。周末中文学校的课本文字,读起来就显得生硬。

说起来这都是十六七年前的片段了。

樱花季节,岁月如斯。

【相关】

Little Stories of Tian Tian

成长花絮

《朝华午拾》总目录

《李白110:深度解析,曲高和寡,值得吗》

白:“这首歌听过的都说好听”“这首歌听过的都说过瘾”

——什么好听?

——谁过瘾?

李:"过瘾" 这类词对人对物均可:我听这首歌过瘾;这首歌过瘾。

这就好比 -ed/-ing 混合了:exciting/excited。类似于 自动/他动 的零形式转变,“好听” 不同,只能对物。

白:“这首歌过瘾”可以看成,过瘾的正主儿没出现,但是使动的角色已经在那儿了。句法上鸠占鹊巢,本体上主客分明。

李:正主儿不重要,默认是 (令人)过瘾,这个“人”等于没说。

白:本体里“人”是出席的。linked data,首要任务就是不能掉链子。

李:本体是逻辑体系,不要掉链子。语言理解和表示,有所不同。本体等于是个认知背景,理解时候随时调用,也可以不调用。

“这首歌听过的都说过瘾 / 听过的都说过瘾 / 听过这首歌的都说过瘾 / 听过的都说这首歌过瘾 / ......”

白:句法上,不相谐并不一票否决,而只是减分。没有更好的选择,减分的选择也会顶上去的。但是在回答问题的时候,低分的选择会提示某种降低自信的折扣。

在c-command位置有多个置换候选,用哪一个自然会精挑细选;如果只有一个,横竖就是他了;如果坑已经被占满,c-command位置上无论有多少候选也是干瞪眼。

李:终于弄妥了。

此图像的alt属性为空;文件名为Screen-Shot-2019-04-11-at-2.19.32-AM.png

就是这图越来越不像树了,倒是更像那种叫四不像的动物。Topic 可以抹去的,不过感觉留下有益无害。真要逻辑较真的话,“的字结构” 与 “过瘾” 还可以连上 S 或 S2。痕迹都在,本体也支持,但懒得做了。连来连去,也还就是个 “的”字,连个名儿都没有。谁过瘾了?哦,听过的人过瘾了。 感觉没人这么问的。信息不具有情报价值,更像是从常识推导来的。常识常识,就是那种理应熟视无睹的不具备情报价值的知识。

白:推理,张三是听过的人,张三过瘾。

李:三段论是如此。就是不大容易想到啥场景会用上的,怀疑其解析价值。另外就是,语言表达中的确有清晰的情报与边缘的信息的区分,也的确有重要与不重要的区分。所以,单从语言角度看,也有一个什么一定要抓,什么可以放过的问题。所以,单从语言角度看,也有一个什么一定要抓,什么可以放过的问题。从情报性角度看,其实是不应该让常识过多介入的。常识之所以为常识,就是它不具备情报性。如果语言表达方面有意无意的漏洞或含糊之处都被常识“脑补”了,信息单元的情报性就被抹平了,主次容易混淆。

白:脑补的东西,一定有单独的标记。怎么可能允许一锅煮。“营业额超过了联想”也是需要脑补的。

李:人的表达和理解,都有很大的偷懒成分在。这一方面为了节能,节省带宽和脑力,另一方面也可能有个聚焦因素在。解析作为一个为表达通向理解所搭建的桥梁,也许也应该模拟逼近人的表达和理解中的聚焦和节能。所以 一直以来 句法以后做那些逻辑语义的 hidden links,总觉得是锦上添花 适可而止的工作。要做可以做得很深很全,特别是不断引入常识“脑补”,就有很多的 hidden links 可以挖掘。隐隐觉得这不是目标和应该着力的点。

白:不脑补,那张图摆在那里也是摆设。地球人都知道不可比,关键是,轻量级的脑补还是重量级的脑补。

李:这类例子很难说是需要解析的脑补。更大可能是在语用场景,是在领域落地的阶段,根据领域词汇和领域知识去补。这里有个区别:深度解析利用常识脑补,基本是不分领域和场景的,算是 boil the ocean。而到了领域场景,那是下一个阶段了,那里已经有场景聚焦和领域聚焦的考量了。

白:只做解析的立场和做场景的立场是截然不同的。下一阶段,未必是时间的先后,可能只是工序的先后。一个抓总的人需要同时考虑。

知网的设计者,除了翻译是直达场景的,其他很难说有多少场景驱动的东西触达了知网的架构和方法论层面。这也导致二次适配的工作量巨大。时代呼唤一个从方法论层面直接对接场景的新一代知网,or whatever 网

李:撇开MT,NLU 两大应用是:

  1. 知识挖掘 这更多是后台,离线,大数据。
  2. 对话,这更多是前台,在线,小数据。

当然,一个完整的交互系统,是两端都需要有的。现在看这两大应用,迄今为止,对于深度解析,需求不大,不明显,也许更多是因为还没找到可以利用的巨大潜力。

白:层次残缺。

需要解析器、本体、领域适配包协同工作,不能各行其是。

李:端到端的系统不去说它了,即便是想努力使用NLU的,在这两大应用中,凭实际经验看,对于 shallow parsing 的需求,远远大于对于深度解析的需求。shallow parsing 主要就是 NE 和一些 XP 抱团,这方面做好了,可以立竿见影。超越 shallow 的部分,用起来感觉不在痛点上。

也许是还没到那个火候。

白:现在的需求不是真正的需求,因为没有把各环节的潜力展现给最终用户。还是没做好。

李:总之,日常的开发实践和场景,不断把我们拉向 shallow 的工作。这些都是非常琐碎的,基本是资源堆积的领域性工作。也没有那么大挑战性,只要有人力 有资源,总是可以大兵团作战,以资源取胜。而具有挑战性 让我们着迷的深度解析,却发现性价比很差。做了白做的时候居多。

全世界都做对话系统,问题于是简化为 intent/slots,说白了,都是既浅层又领域的目标定义。intent 根本就没有语言学定义,不具备任何普遍语义。intent 完全就是根据目标应用所需要的 actions 来定义的语用意义上的“语义”,是典型的端到端的反映,没有可移植性。就是对于输入问题的一个针对具体应用(skill)的classification,1000个skills 有 1000 种不同的定义。这些是当前的“范式”,浅得不能再浅,但证明是可以 scale up 和有效的,前提是有资源去做。

“听过这首歌的都说好听”:

“都说听过的这首歌好听”:

【相关】

《一日一析系列》

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

《语义群笔记:端端的端到端》

白:“盼望长大的童年”

本来是歧义,常识把它变成了伪歧义。“长大的”和“童年”不搭。

李:“盼望长大的童年”,可以问:1. 谁盼望长大?-- 童年;2. 盼望【谁】长大? -- 童年;3. 盼望 可能有两个 【human】 的坑。类似的例子有:“盼望到来的幸福” vs “盼望幸福的到来”,当然 还有一个 盼望- 长大(了)的童年。

虽然说似乎不合常识,概念来点弹性的话,也不是说不通:童年的定义里面虽然有没长大的意味,在类比和修辞的意义上,两个概念可以做各种关联和联想。事实上,“不搭”才是诗意的简单有效的手段,保证了想象的空间。

"这就是我那位想买你别墅的朋友"

白:【打败你的不是天真,是“天真热”!】

李:不是天真,而是天(真)热:

白:“它是一个不断松弛的过程,到头来,已经没得松可驰了。”

李:没得松可驰了 还是 没得弛可松了?没得澡可洗 从来不说 *没得洗不澡。当然 “松弛” 虽然 比照 “洗澡” 的动宾离合词 但自己并不是动宾 而是并列,因此 换位了也不觉得。没得学可习 还是 没得习可学?

成语活用 只要愿意花时间 不是问题 问题仍然是 有多少用场。

Lai:@wei 有什么深度学习有效的方法可以发现这些Dependency?

李:不知道 据说只要有标注 就不是问题。

郭:斯坦福的陈丹琪(danqi chen)和她的导师Manning有个深度学习的dependency parser。应该算state of the art。开源,是stanford coreNLP的一个模块。

谷歌基于这个工作,做了个大数据版,据说准确率“超过人类”。也是开源的。

李:标注可以让目前的系统先自动做,让人去修正(只修正黑白错误,不修正模糊地带或不清晰的地方),这会大量节省人工,所以数据也不是大问题。最大的问题是,这些 dependency 出来了,懂得如何派上用场的 不多。在大半个世界都迷信端到端的时候,缺乏资源去用的话,parsing 就是面壁十年的玩偶。

白:端到端不是问题,问题是端不能容纳结构。

李:神经MT 就是一个端到端典型示范。一端是串 另一端还是串 为什么要容纳结构。只要有可以监督的数据 信息抽取也是如此。

白:关系抽取不是这样的。

李:以前一直以为抽取乃是我结构的长项。最近朋友问我 如果是抽取关系,现存数据库就有亿万,表示 locationOf,whereFrom,bornIn,bossOf 等等关系。这些关系的两端 都在数据库里面,用他们去找语言数据 可以产生难以想象的不用人工的标注大数据。结构的路子一定可以匹敌这种大数据?我觉得很难。这与mt可以一比。

还有一些端到端 结构无从下手 可是端到端可以派上用场,譬如 图片转文字看图说话,和文字转图。这些事儿 有了结构也难以缩短距离。玩结构 玩理解 应该在小数据 多变的domains 以及数据虽大 但无法监督的情况下。这时候 人家“端端的” 根本就不跟你玩,视而不见。另一个就是 打下手 做小三。在人家玩剩下的某些短板上 玩补充作用。譬如 mt,张冠李戴这类问题 可以帮上忙。

神经mt最不可思议的突破是顺畅度。这是当年认为mt无解的一个方面。突破带来的副作用是损失忠实,这点损失 符号结构派其实可以擦屁股的。结构派有个貌似真理的预设,自然语言千变万化 唯有结构化才可以变得 tractable。这话实际上并不尽然。结构化的确可以导致 以较少的patterns 捕捉较多的现象,可是 对于“端端的”系统 对于海量容量和算力 这种 generalizations 的意义大打折扣。推向极端 如果有个现象 两个 patterns 可涵盖一千个变体,如果我真有充分的数据 可以看见这一千个变体足够的重复,全部记住了 或者用另一种非符号化非规则化表达了 embedding (嵌入)抽象了,那么那两条 patterns 还有什么优势呢?何况 符号规则化的本性就是不够鲁棒 免不了漏掉点什么例外。

还有个有意思的现象。以前老以为 起码起码 结构化总是帮助提供了更好的基础 总是归纳了很多现象 没有功劳有苦劳。这个苦劳认不认不重要,客观情形是,满世界没几个人有兴趣利用,一多半也因为没几个人懂得怎么利用和消化,包括业界学习方面的牛人,曾经私下交流过,回答说,引入结构说起来应该有好处,但不好融啊。

绝大多数的端端学习系统有自己的一套比较成熟的 有广大community主流不断集体探索和积累的基于一包词或ngram的各种模型 算法和工具,语言结构横插进来,有异物感,heterogenous evidence,增加了模型复杂度,很容易得不偿失。

牛的 parser 能够开拓市场和被大家接受估计需要相当一段时间,其契机可能是: 1. 端端系统遇到瓶颈或死胡同,不得不探索其他路子的时候;2. 主流中的少数坚持探索利用结构或者结合AI理性主义和经验主义路线的融合派,在算法研究中取得了突破性进展,带动整个领域”产业升级“到结构化。

在此之前,基本上是自产自销,内部消化,用于目前主流“视而不见”无所作为的短板应用场景。(其实很不少,甚至 text NLP 中端端最成熟的 MT,进入领域由于缺乏数据也有很大短板。)

吕:@wei 大赞。

【相关】

《一日一析系列》

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录

《岁月如歌: 美错 / 雪落下的声音》

喜欢王菲的《美错》,后来周深也唱得同样好,为此自己编制一枚音乐风光片试试,背景是硅谷高尔夫乡村俱乐部(高档社区)。特别喜欢《美错》的歌词,为此曾经在白老师的语义群里 parsed 过玩儿。

本來相約他在海邊山盟海誓 卻找錯地方來到一個游泳池
滿眼湖水藍的美麗 你我就從那裡開始 藍色的漣漪鋪展一段回憶
你送我偶然從天而降的隕石 我一直誤會那是顆完美鑽石
不曾看見它的瑕疵 把它鑲在我的戒指 我也沒發現 有什麼損失讓我感情用事 理智無補於事 至少我就這樣開心過一陣子
不管他是真的你是假的誰是目的地 能自以為是也是個恩賜
不是來的太快 就是來的太遲 美麗的錯誤往往最接近真實
儘管昏迷有時夢醒有時不堅持 人生最大的快樂也不過如是
所謂醉生夢死 大概就是這個意思

为什么 NX(接续) 不是 C(宾补)?怪就怪词作者用的是 “相约” 而不是 “约”。大概是凑个双音节吧,句法就突破一点了。接续就接续吧。

很虚的小词(e.g. indefinite,默认),和已经 feature 化(e.g.【转折】)的小词,过河拆桥,扔掉。

这个 “的” 估计是 “得”, 可 “美丽” 并不是 typical 补语。解为 ((满眼)的 ((湖水 蓝)的 美丽)),也通。

鑲+在 合成动词,前者带过来一个 O 后者带来一个 C(locative),非常常见的构词方式。

从来没听说有人拿陨石当钻石送给女友,而女友居然把陨石镶嵌到戒指上。这段 romance 好奇异。

作为“外一首”福利,再来一枚风光音乐片,这次是周深的《雪落下的声音》:

美死人不偿命,据说天堂不过如此。对于住进去提前进入共产主义的一批硅谷码农特权阶层,他们无一例外全部蜕变为修正主义分子。

乡村俱乐部离硅谷市中心不过15分钟车程。朋友说 这个社区其实并不贵 山顶上的那座宫殿不过两千万美元 中等大屋两三百万。次贷危机那阵子好多法拍屋 也就一百万美元 比京上广别墅便宜太多了。

【相关】

《一日一析系列》

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

《朝华午拾》总目录