练字(外一篇)

    小学一年级时,有一门课叫“描红”,是写字练习课,专练毛笔字的。

    可惜好景不长,那场大革命开始了,人们一下子革命热情高涨,中小学停课,从此再无写字练习的必要,这门课程也就取消了。

    在我印象中,我的同学中,绝大部分人,字都写得歪歪扭扭,不堪卒看。文章内容且不说,大多数作文一看那丑陋字迹就毫无兴趣读下去。那不是享受,那是受罪。

    除陈琳、王建军二人字还算不错外,几乎我所有同学朋友,字写得都是“狗爬式”的,包括我和我弟弟。我初中语文老师和高中语文老师都专门找我谈过,希望我能好好练练字,会获益无穷的。可我当时没当回事,听不太进去,好像自己很忙似的,总感觉没有那么多时间、耐心和兴趣去专门去练字,一拖再拖,一晃就临近高中毕业了。

我初中、高中的字(练字前)

 

    我的好朋友兼同学杨国民在和我闲聊时,他对我说:再过二个月,我就要走向社会,作为上山下乡知识青年,我们这样的字实在拿不出手,在农村可能会很丢人。

    于是,他提议我们现在一起来练字,改变这一状态。

    我和我弟弟表示同意。

    于是我们三人一起去县城十字街的新华书店,我和杨国民觉得行书字帖的字体很好看,就各买了一本行书字帖。而我弟弟倾心于楷书体,字正方圆,他喜欢,就买了一本正楷字帖。

    说干就干,刚开始我们用半透明纸,贴在字帖上,类似于描红那样,一笔一笔描写,大约半个月后,我们扔了半透明纸,改用作文本,一个格子一个格子临摹字帖字体,一遍又一遍抄写,只要有空,就不停地临摹,乐此不疲。

    大约一个月,效果立竿见影,我们三人字迹有了很大改善。不久我高中语文魏老师找到我,问我:你最后一篇作文《新的征途》是请谁帮你抄录的?我告诉他是我自己写的,他很吃惊,似乎不相信才一个多月,我作文字体会有如此大变化。他高兴地对我说:好,现在字体不错,看着舒服多了。继续练,字体是门面,有时也是事业的敲门砖,再有水平,字体太差,会丢失很多机会的。字体会直接影响到个人才华的发挥,那得不偿失。字写得不好是一大遗憾,需要引起格外重视。你做得很好,现在练字还不算晚,一定要坚持下去,切不可半途而废。

高中毕业前的字(练字后)

 

    受到鼓舞,我们三人自然干劲更足,继续不停地练着、练着,很想一口气吃个胖子。

    还是老毛病,我的恒心不够,七七年三月份我下放农村后,就停止了临摹那本字贴,结束了练字的日子,满打满算练字仅四余月。而杨国民则没有停顿,在农村也不忘抄字贴,终于把他小学、中学那极难看的字体扔进太平洋,造就他一手飘逸潇洒的好字。

    七八年三月进大学后,由于不练习,我字体越来越差,基本住老路上去,软不拉爬,无形无样。字体,终成了我一块不大不小的心病。

    感谢计算机的迅猛发展,终于大家字体趋于一致,再也不用为难看的字体羞愧难当了。但我还是很羡慕那些写一手漂亮字体的同事、朋友和同学,非常羡慕,非常非常羡慕。

 

 

 

外一篇:

新的征途(高中阶段最后一篇作文)

                                  一位高中毕业生的感想

 

立委按:老哥这篇不做修改,保留原状,原汁原味的红色作文,带着那个时代深深记印,可以作为化石进入文革博物馆。作又满篇大话空话套话,积而成习,习以为常。遥想当年,绝对真诚,豪情万丈,热血沸腾。无论多苦多累,总是胸怀世界,放眼未来,活得充实而豪迈。几十年过去,弹指一挥间。世事沧桑,恍如隔世,抚今追昔,不胜唏嘘。

 

     踏上,我将踏上新的征途。

    在下乡学习班上,在分别座谈会上,在毕业典礼大会上,我满怀豪情地说:我将要踏上新的征途,我将要迎接新的斗争,新中国年青一代,无所畏惧,勇敢攀登。

    征途万里,任我前进,任我飞奔,任我翱翔,任我驰骋。

    英雄有用武之地,革命的征途,大有作为。革命的征途,是达到革命的理想的唯一途径。

    新的征途,就在眼前。

    在踏上新的征途之时,我总不免要慕念昔日,回顾过去,从中吸取经验与教训,得到勇气和信心。

    在我过去的少年和青年时代的生活,给我心底留下的痕迹,是我永生不会磨灭的。我怎能忘记那难忘的岁月,那经历了十二个寒暑的学生生活……

    在我走过的这些征途中,闪耀着我青春的绚丽光彩,活跃着我少年的飒爽英姿,留下着我儿童的天真笑容……难忘的年头,难忘的生活。

    在我走过的这些征途中,曾激起我生活的朵朵浪花,曾思虑着人类理想前途,曾遭受着斗争的考核锻炼……严酷的斗争,更能锤炼人。

    在我走过的这些征途中,理论组留着我的身影,学习会响起我的声音,农场里映下我的足迹……努力刻苦学,方能有本领。

    在我走过的这些征途中,我恨那些无聊的语言,我恨那些商人的气息,我恨那些做作的表情……复杂的生活,让人识真金。

    在我走过的这些征途中,参加了揪斗刘少奇的运动,狠批了林彪的“克己复礼”,抵制了“四人帮”毒瘤影响……狠斗走资派,识别真马列。

    过去的一切,一去不复返,但留下的经验,却十分难得。它使我对未来,更加充满信心,满怀豪情,迎接新的征途。

    在过去的征途中,在学生生活中,我曾憧憬过未来的生活,对新的征途产生过强烈的向往。我构思过许多未来生活图景,对新的征途产生过许多奇丽的想象。浪漫、现实、幻想、理想交织在一起,索绕在我脑海里。天真、焦虑、离奇、胡想混杂在一起,赶走我的睡意……

    我曾想,自己穿上绿军装,威武凛凛,豪气冲天。手持五尺钢枪,身跨红色骏马,驰骋在千里边防线上。警惕的双眼,注视着对岸的风风雨雨。仇恨的子弹,随时消灭对岸来犯的敌人。用身躯筑成长城,“北极熊”休想踏进。用鲜血谱写战歌,为祖国而战虽死犹生。

    我曾想,自己在社会主义大学里,认真听课,努力钻研。和老师一起研究太阳黑子运动的规律,癌症的起因和它的治疗。和同学一起研究中国哲学史上尖锐斗争,<<红楼梦>>的政治意义和历史背景。在课堂上,认真学习,攀登科学尖端。在厂矿,开门办学,理论联系实际,誓为祖国献出全部智慧和才能。

    我曾想,自己满身油污,精神昂扬,在高炉林立的工厂里做一名普通一员。机器隆隆,努力完成国家交给的任务;马达轰鸣,和老工人一起大搞技术革新。加强岗位责任制,努力实现现代化,为共产主义,我们工人阶级的最高理想而奋斗终身。

    我曾想,在村头田傍,在广阔天地,活跃着我的人影。虚心接受贫下中农再教育,决心在三大革命运动中锻炼成长。出批判刊,写批判稿,狠批“四人帮”,注意新动向,我和贫下中农一起查账目,斗地主。开山劈岭,围垦造田,叫高山低头,让河水让路,我和公社社员一起战“双抢”,干“三秋”,为普及大寨县贡献自己的力量。

    我曾想,学校的教师,医院的大夫,商店的职员……我多么向往这一切呀。

    但是,这终究是遐想。

    这是不现实的,而且充满着小资产阶级知识分子的那种通病。

    现实在考验着我们,新的征途已经到来。

    “知识青年到农村去”,毛主席发出的伟大号令,已在广大青年学生中深深扎下根。“上山下乡,立志务农”,是广大青年学生的必由的革命道路。“走与工农相结合”,是广大青年学生唯一的革命途径。

    我们永远不会忘记,在那黑龙江畔,在那北疆战场,电闪雷鸣,雨雪交加,阶级斗争异常激烈,社会帝国主义虎视眈眈,一个英雄的名字挺立在那里,——金训华,我们的英雄,用他那革命的激情,牺牲的精神,建立起一个巍峨,挺拔的丰碑,成为广大上山下乡知识青年的学习榜样。

    我们永远不会忘记,在那茫茫草原上,在那塞外风沙里,一个矫健的英姿,持枪跨马,飞奔向前。草原再大,没有她那胸怀大;羊群再多,没有她的事迹多。为建设牧区,改造草原,她把自己的全部青春献给,她把自己的全部热情拿出。我们的张勇啊,上山下乡知识青年的模范,舍生忘死救羊群,壮歌一曲震山河。

    我们永远不会忘记,在昆仑山麓,在大江南北,在长城内外,在珠江两岸,战斗在祖国山山村村的千百万上山下乡知识青年,和祖国各条战线上同志们一样,挥汗抡锄开荒山,立志建成大寨县。他们活跃在高山,水乡,战斗在河道,峻岭。红夜校里,他们进行理论辅导,农科站里,他们大搞科学种田。他们为建设社会主义新农村贡献巨大的力量,立下了伟大的功绩。

    伟大的上山下乡运动,以磅礴之势,席卷全国,不可阻挡。

    伟大的上山下乡运动,是一场社会主义革命,任何人也扭转不了。

    考验,严峻的考验己经到来。

    征途,新的征途就在眼前。

    临近毕业,我们每个人都在问自己:毕业后向何处去?

    上山下乡,新的征途,我们将昂首阔步,迈上这光明之路。

    上山下乡,新的考验,我们将挺身经受,使自己锻炼成钢。

    在临近毕业,将要走上和工农相结合的新的征途上,我的心情十分激动,党培养我,党教育我,现在党又将送我上新的征途,迎接新的斗争。我含着感激的泪水,举起右手,向党发誓:

    上山下乡,走毛主席指引的康庄大道;认真工作,决不辜负党的培养和教育;刻苦锻炼,增加劳动人民纯朴本色。在华主席的英明领导下,猛批“四人帮”,为建设祖国的新农村而努力奋斗。

    走,背起背包,走向山乡村庄。

    走,挑起担子,走向广阔天地。

    走,扛起挖锹,走向田头地间。

    让青春的热血,化为海潮,汹涌澎湃。

    让朝华的时代,化着劲风,风起云涌。

    上山下乡,我们走定了。

    走与工农相结合的道路,是我们唯一的新的征途。

    可是,也有人悲观地发出:征途到底有多远?

    我们乐观豪迈地说:征途永远走不完,旧的征途过去,新的征途又来。我们任重而道远,无产阶级,就是要我们年青一代继续革命,永远革命。对于那些把舒适的环境,幸福的家庭,可爱的孩子,高额的工资作为自己的征途的目标和最高的理想,我鄙视他们的市侩的气息,庸俗的灵魂,我看不起他们的所谓含情脉脉的生活,鸟语花香的家庭……

    也有人轻轻地对我说:新的征途是镀金的开始。

    我看他那庸俗的笑容,神秘的表情,还有他那渐渐显露出来的肮脏的思想,我感到厌恶而报之一声冷笑。镀金?在我们祖国九百六十万平方公里的土地上,那里不是锤铁炼钢地方;在奔腾的厂矿广阔的农村,那里不是培养和造就人的地方。要说镀金,那么全国的山村水乡,都在为青年一代镀无产阶级品德和思想闪闪发光的金,耀眼夺目的金,是商品货币买不到换不到的真金。我鄙夷那人狭小的胸怀,短促的目光,我看不起他的所谓丰富社会经验,高超处世哲学……

    当然,征途并不笔直,平坦。在我们所要走过的征途中,到处都是崇山峻岭,悬崖峭壁,激流险滩,暴风骤雨。泥泞曲折的小道,崎岖不平的山路,耸入云霄的崖峰,一望无际的海洋,风雪弥漫的严寒,赤日炎炎的盛夏……总之,困难不间断,斗争不停歇。有人望着新的征途,胆颤心惊,毛骨悚然,惊叹道路不平,畏惧大海波涛,他们悲观失望,颓唐衰退,半途而废。而我们——无产者,不惧道路艰险,坚信一个目标,劈风斩浪,昂首阔步,永远进击。“世上无难事,只要肯攀登。”

    新的征途,决不像某些人说的,风平浪静,没有斗争。在我们要跨过的“千山万水”中,我们明知征途有艰险,越是艰险越向前。在未来的生活征途中,我们将经历数不尽的阶级斗争,数不尽的生产斗争。也许我们要受打击,经风浪,但是曲折的征途,严峻的斗争,更能考验人,更能锻炼人。任何事情都不会一帆风顺,马到成功。我们“不管风吹浪打,胜似闲庭信步。”新中国年青一代担的起,我们上山下乡知识青年担的起,阶级的委托,革命的重担,斗争的磨练。

    请战斗在祖国各地的工人、农民、解放军指战员放心吧,请同学、老师放心吧,让可爱的城市作证,让战斗的水乡作证,我们决心到农村去,努力锻炼,把先辈们开创的无产阶级事业接过来,进行到底。让伟大祖国千秋万代,永不变色。

    亲爱的父亲母亲,虽然家庭温暖,生活快乐,但我却更需要农村。美丽的城市故乡,虽然乡情依恋,生活方便,但革命者志在四方。

    也请爸爸妈妈放心,有贫下中农的关怀培养教育,我们一定会茁壮成长。

    踏上,我将踏上新的征途。

 

 

小城记忆(外一篇)

 

我出生的小城现况

 

   我从出生到二十岁之前,也就是从五八年到七八年,二十年来我都生活在一个恬静、秀丽、破旧的江南小城—南陵县籍山镇,当年叫南陵县城关公社,它是县府所在地。

    小城地处黄山山脉和长江中下游平原交汇处,城的西边是起伏的丘陵,城的东边是一望无际的水乡平原。

    对小城的记忆随着时间的流逝,虽然不是那么完整和清晰,但老旧的小城总让我魂牵梦萦,无法忘怀,是铭刻在心中的烙印。

   我的同学好友,我的少年童真,那纯朴的风土人情,那古旧的土墙破房,都是抹不掉的记忆。

尚未拆除的老旧街道

 

    小城不大,当时城内人口约三万多,街道也是仅有一个十字型的街,分别叫东门、西门、北门、南门和十字街口,其中东西长约二公里多点,南北长不到二公里,尤其是南门街道很短,大约一百多米。

    我家住在西门父母单位分配的平房中,那是一个大通道,房子很小,通道分割成两间房子和一个厨房总共大约三四十平方,没有厕所。地面是泥土地面 ,屋顶经常漏水,天屋子里很冷,房屋不保暖,四处透风。一般会生一个木炭火盆炉子,用以取暖,而且还根本不用担心会煤气中毒。

当年住的平房早无踪影,但门前两颗百年白果树仍在

 

    当然家里要比学校教室暖和多了,学校窗子上连一块完整玻璃都没有,四外透风,中小学十年均如此。(全被学生砸碎了)我们一般从学校回来,双手双脚冷得发僵,立即去炉子旁,那真是一种特别的享受。

    小城有五所小学,两所中学。我上的是全县最好的小学,叫南师附小,后改名叫韶山小学,最后变成城关第五小学,现在据说又改叫籍山中心小学。这所小学基本上是县直机关和文卫单位的子弟学校,大家都是邻里街坊,都彼此相识,不同年级学生也常在一起耍闹。

    不像现在的孩子,从幼儿园开始,我们都是自己走去上学,不管刮风下,从就没有看见过那家家长去接送自己小孩。

    小城有一个剧场和一个电影院,电影院在西门,离我家不远,剧场位于东门,就算比较远了。

    剧场一般演黄梅戏,就是那几出样板戏,母亲喜欢看戏,总带我去看。我对剧场环境装饰和灯光很感兴趣,但对看戏一点也提不起劲来。我更喜欢看电影,只是当年电影不多,刚开始只有记录集锦片新闻简报,地道战,地雷战和南征北战。门票倒不贵,新闻简报每场5分钱一张,地道战,地雷战和南征北战都是一毛钱一张,这几部故事片电影至少看了几十遍。

    小城城东和城西各有一条小河,城中还有一条市桥河。

    小河都不宽,不到二十米。

  城东那条河叫漳河,我们习惯叫它为东门大河,是长江的支流,在芜湖市汇入长江。

漳河和前方的东门大桥

 

    城西的河叫后港河,是漳河的支流,该河在城北汇入漳河。

后港河

    不论城东的河,还是城西的河,当年都十分清彻,河水终年不断,河流婉曲细长,两岸青草依依,处处柳绿桃红。两河是小城子民饮用水源,默默哺育着小城的子民。当年有人用板车水箱拖东门大河河水沿街叫卖,可见其水质甚好。

    在城东漳河与城西后港河交汇处的北门,有一个水运码头,这是过去小城通往外界的最重要渠道,但冬季枯水期是停航的。

    每年五一到十一这段时间,我几乎天天都会去河中游泳,尤其喜爱东门大河,水质好,又是沙地,很适宜玩水。后港河也不错但水底是硬土质。

    最不好的是城中的市桥河,这是一条横穿小城核心区域的断头的小河,河上有四座风格各异的石拱古桥,水底是厚厚的淤泥,沾脚又有腥臭味,故水质较差,无法饮用,但因离家近,也常去那下水游泳捉魚玩耍,小河边常见的是一群少妇在河边石阶上用木梆搓、捶、洗衣服。

市桥河

    夏天我常常泡在河里,一泡就是大半天,它们承载了我青春的悲欢喜乐。

    西门后港河的河岸有一种黑色的粘土,是我儿童时最爱。

    我与小伙伴们常去河旁挖这黑土,用来做手枪等玩具。这黑土很粘,能塑成各种形状,晾干后又坚如石块和水泥,黝光发亮,做手枪尤为逼真。当年此土分布不多,也不成片,不知今天改造后的后港河岸还有此土不?

    东门的漳河盛产河沙,小城的建筑用沙,当年全靠此河。包括我上中小学,它的运动场跳高跳远的沙坑的沙,都来自东门大河。而且是我们学生从东门大河一担一担,行走三华里多挑到学校的,几乎每年运动会前都会去东门大河挑沙数次。

    市桥河的淤泥是很好的农家肥,每年冬天都有人抽干水,把淤泥挖上岸,然后运到田里。

    小城四周有很多水塘,很多同学都喜欢去城外钓鱼、捕虾、捉黄鳝。我对这方面实在笨拙,天赋极差。第一次出去约鱼,是同学鲁干劲硬拉我去的,他还为我准备了鱼杆和诱饵,可一天下来,他收获满满,而我一条鱼也未钓上来,空手而归,所以印象极深。最有意思的是和几个同学一起去离县城不远的水田田埂旁捉黄鳝,那是一个夏天的晚上,大家点着松木火把或打着手电筒,挽起裤腿,卷起袖子到田埂边捉黄鳝,一晚可捉一小桶呢。那年头黄鳝可是美歺,虽然我们全身是泥,十分疲困,但喜悦洋溢在脸上,总会各拿几条送回家里,改善了当年贫瘠的生活,也丰富了我们课外活动。

    小城当年很破旧,小城街道都是土石子路,只有去党训班的路保留着过去的青石板路,城里没有路牌,也没有红绿灯。常见有人的端小板凳坐在自家房檐下,纳着鞋底做着针线活,然后东家长西家短的议论着。

     小城以一层楼为主,偶尔有几处二层楼房,街道门面全是砖木结构房,木板揿在石凹中,可拆下。城内最高的楼是县委县政府大楼,有三层,但只是局部三层,呈凸型状。当年我们这些小孩特喜欢爬到这三楼平台上,常趁守门人不注意时,冲进大楼。在三楼平台上,我们沐浴着细风,俯视全城,顿时有种心潮澎湃的感觉。那种立足平台、展望中国、胸怀世界之豪情,现在的人很难感受到。看着眼前的小城,远处的小山,似乎体会到毛泽东当年在长沙橘子洲头的豪迈。“恰同学少年,风华正茂。” 解救全世界三分之二受苦民众的担子,历史的落到我们的肩上,我们责任重大。

    小城的美食还是很多的,因为贫穷,一碗九分钱的光头面对我都是十分诱人的。小城的小吃很有特色,糍粑、油炸饺子、馄饨都与众不同,味道是别处没有的。臭干子拌香菜也是一绝,倒点香油,加点花生米,那真是味道好极了。更让人难忘的是五小门口的薄皮饼,一张炉具和一个圆盘夹,勺一匙水面粉放在那圆盘上,两个圆盘一夹放在炉具烤,一张细薄的圆饼就出炉了,那味道香、甜、脆,回味无穷。每天那炉旁便会招来一群小孩儿,一分钱一张,一手交钱一手交货,大家舔着、啃着、笑着,充满童趣。 

    在我生活小城的这二十年中,小城它几乎没有什么变化,东门还是东门,西门还是西门,小巧玲珑,蕴含浓烈乡土气息。一辆破旧苏联轿车是县城唯一豪华车,是县委书记专车。我同学父亲是这车司机,让我们对她好是羡慕。大多数建筑都是解放前的,屈指可数的几个重大变化是,十几年的尘土飞扬的土石街路终于在文革末期简单柏油化。到了高中,小城不用下井下河挑水饮用,终于有了自来水了。城中医院在我小学时拆迁,准备建三层的门诊及办公大楼了。不过从我小学四年级建起,到我快进大学时,这栋非框架的三层大楼才落成,也算创造了一项奇迹。

     小城很安静,也很纯朴,文革的大批判声音也未改变它那清秀的气质。大多数人还穿着打着补丁的衣服,鱼肉是一种奢侈品,能填饱肚子就是一种幸福。小城的人们每天或劳作或聊天或晒太阳,似乎满足这贫困的生活。我家条件算好的,有一辆破旧的二手自行车,还有一台二手家电,那是五灯的电子管收音机,当年是我们那一栋房子中唯一一台。(后期这种收音机就多了)大家都很关心国家大事,议论着世界,声讨美帝苏修,评议着他人水深火热地生活,唯独对自己生活现状没有满腹牢骚。清贫而又满足,是小城大多数人的现状。

    小城以商业为主,没什么工业,整个城镇在上世纪七十年代中期才建有四个小工厂,即小化肥厂,小钢铁厂,农机厂和地区拖拉机厂。当我第一次看到那钢铁厂高耸的烟囱时,我为我的祖国工业突飞猛进的成果由衷的感到骄傲。正如毛主席所言:敌人一天天烂下去,我们一天天好起来。生活在毛泽东时代的我们,生活在社会主义中国的青少年,那是多么大的幸福呀。我们总是很容易满足,总是很相信宣传,总是充满原教旨式的自豪感。

    小城只有一个公园,叫中山公园。在小城民众的心目中,它很神圣。其实那个公园算不上是真正公园,只是三百米跑道的一个小小运动场,但却是小城唯一的空旷之地,小城的大型集会都在此进行,算是小城的天安门广场。

     小城没有什么古迹,也没有什么风景,老的夫子庙毁了,城中的一个古塔也推倒了。文革破四旧时,一切封资修的东西都属摧毁之列,小城也不例外。仅有的一点点古建筑也随着那高亢歌声中被被拆除破坏。

    虽然没有了古迹,也看不到风景,但小城仍质朴可爱。

    小城有土城墙,有护城河,有黄黄的油菜花,有青青的水稻田,江南的小城,总给人无限的遐想。有雨巷的韵味,有水乡的特质,而这就是我魂梦相萦的小城。

     自从上了大学离开小城,一晃四十年了,岁月如梭,不知不觉如今小城早已变了模样。宽阔的大街,鳞次栉比的高楼,各种店铺,来来往往的汽车,匆匆的行人,变化之大,让我惊讶。

    我心中的小城在哪?小城变成城市,曾经的小城,曾经的记忆,随着岁月流逝已无踪影了。

        它已不是我那个小城了,只有我心中,永远有一个宁静的小城,在梦中。

https://liweinlp.com/?p=12048大美南陵

 

外一篇:

   迎着阶级斗争风雨茁壮成长

 

    一九七六年三月,南陵中学组织师生成立创作组,仿《东方红》,集体创作大型音乐舞蹈组歌,即所谓的大联唱。创作人员中只有两个学生,我和陈琳,其他都是老师。我高中语文老师,北师大毕业的魏青平和我初中语文老师,校团委书记高发荣两人负总责。我的任务比较重,有三个东西要写,我把其中词表演和歌词交给我弟弟,请他帮忙替我完成,我自己只写了一个小韵白剧。后因唐山大地震等原因,大联唱未能如期上演。“四人帮”刚粉碎不久,在下放的农村,我就把韵白剧稍作改动,起名《校园的风波》,参加县文化馆组织的全县文艺会演。

 

迎着阶级斗争风雨茁壮成长

(南陵中学教育革命大联唱)

  1. 序曲

合唱:毛主席指引我们向前进

二.文化大革命前后的斗争

1.配乐造型诗朗诵:控诉十七年

2.领唱齐唱:春风赞

三.批林批孔当闯将

1.齐唱舞蹈:批林批孔当闯将(大批判场面)

2.群口词:批林批孔小分队

四.教育革命新花放

1.女声独唱:教育革命新花盛开

2.齐唱舞蹈:我的好课堂

3.群口快板:小小炼油厂

4.表演唱:夸夸红夜校的小老师

5.安徽琴书:好教员

6.韵白:我们的农场

7.齐唱:军训凯歌响四方

8.对口词:为革命而锻炼

9.二重唱:我是光荣的宣传员

10.对口词:和工农兵一起学理论

11.舞蹈:学习雷锋见行动

12.诗表演:广阔天地,大有作为

五.反击右倾翻案风

1.活报剧:把奇谈怪论脚下踩

2.齐唱:教育革命的方向不容篡改

3.词表演:行动起来,反击右倾翻案风

4.齐唱:党中央决议传四方

六.乘胜前进

1.独唱:革命红旗飘万代

2.合唱:将教育革命进行到底

 

 

分配创作情况:

 

  1. 二. 顾燕廷、陈兴礼 三.             魏青平

四.

  1. 3. 高发荣      4.  7.          陈琳       5.            王齐彦
  2. 9. 12.       李扬新      8.  11.         张静      10.            许宗英
  3. 五. 六. 刘美华、靳
  4. (五) 刘志祥    
  5. (五) 刘美华
  6. (六) 刘美华

 

交初稿:六月底

 

 

校园的风波(韵白剧)

 

人物表

高老师——男,二十岁,某小学五年级教师。

张主任——男,四十岁,某小学革委会主任。

王海萍——女,十四岁,某小学五年级学生,红小兵干部。

李  明——男,十四岁,某小学五年级学生,红小兵。

李小兵——男,八岁,某小学一年级学生,李明弟弟。

小学生若干人。

田  江——男,五十岁,省教育调查团团长。

洪  军——男,二十岁,调查团团员,高老师同学。

 

【幕启。

【一九七六年一月中旬的上午。

【某小学校,右边一排教室,外墙上书写着毛主席的“好好学习,天天向上”,还写着“深切掉念周总理”的标语。

【远外传来同学们革命歌曲。

【报幕人出场。

报幕人:这个故事发生在一九七六年一月,当时我们敬爱的周总理不幸逝世,教育界悲怮万分,决心化悲痛为力量,努力搞好教育革命。可是就在这时,在周总理领导下的教育部执行的正确路线,被当成“奇谈怪论”在批判,全国教育界出现一股逆流,我们的学校经受严峻的考验。

【报幕人下场。

【张主任身背挂包出场,高老师也迎面出场。

高老师:张主任。

张主任:噢,高老师。

高老师:怎么,有事,

        去什么地方?

张主任:上面来了位首长,

要到我们这儿了解情况,

说还有重要的报告,

要我们去听他的演讲。

高老师:那你几时可回返?

张主任:谁知道,现在的会,

有时几天都不散,

有时又无人主持,

去了跑空趟。

高老师:是的,我们做老师的也难办,

形而上学猖獗,

唯心主义泛滥,

真理谬误分不清,

思想上真是太混乱。

张主任:高老师,你看这篇文章,

简直不成样

【张主任拿出报纸,高老师接过来看,并读出声。

高老师:《教育革命的方向不容篡改》。

张主任:这是前几天的报纸,

文章又臭又长,

歪曲教育革命,

矛头直指中央,

他们修正马列主义,

还通篇说得冠冕堂皇。

唉,教育战线被糟蹋的不成样。

高老师:(富有同感)是啊,我也想不通,

现在的气候确实不寻常。

张主任:想想看:

为什么?

流言蜚语四处起,

生产革命大混乱。

为什么?

敌人高兴狂又欢,

我们气愤不快畅。

这说明,阶级敌人没睡觉,

走资派,总想破坏和诽谤。

同志啊,

要警惕,要严防,

不管是党内来党外来,

坚决抵制不照办。

高老师:(思孝)对,张主任,

我一定要认真读马列,

识别他们的真假相。

张主任:好,等我回来,

咱们开个教师会,

一起商讨怎么办,

让同志们坚定信心,

看准革命的方向。

高老师:对,我们不能受骗上当。

张主任:另外,告诉同学们,

要好好学习,

德智体全面发展,

决不能文化成绩是白卷零蛋。

高老师:好,我也要去备课,

咱们以后再细谈。

【两人分头下。

 

【李小兵上。

 

此处丢失

 

 

肩不能挑手不能提的半瓶醋(外一篇)

                                           ----自我吹嘘

 

    在表扬与自我表扬,吹嘘与自我吹嘘的年代,在自己赞美自己,自己肯定自己的社会氛围中,不吹白不吹,吹了也白吹,白吹谁不吹?男人十人有九人吹,不会吹的是棒槌,不吹你都不好意思称自己是男子汉大丈夫。好在牛皮吹破了也不会请去“喝茶”,那就跟着社会一起吹吧,使劲的吹,畅怀的吹,那怕吹过头,总比不吹闷声不语的强。

    闲话少说,听我吹来:

    我,原名叫李扬智,现名李扬新,按家谱属扬字辈,网名叫汉阳一江水。因我出生时,老家旧县镇改名叫新港镇,我爷爷提议将我名字改为扬新,以示纪念,同时也避免与叔伯同年堂兄弟同名的尴尬。

    本人身高1.76,体重150斤,巨蟹座,属狗,六十岁整,己婚,家庭出身:小土地出租,个人成分:学生,血型:AB型,星座:巨蟹座,是长年生活在武汉市的安徽省芜湖市人。

从出生到高中个人照片

 

一双小而有神的贼眼,一脸的横肉,脸上有一对可爱的小米酒窝(迷你小酒窝),依稀有少许雀斑点缀(也很有味)。头前有自然卷发,最有特色的是鼻子!最性感的是嘴!年轻时有点小帅,现在风采难觅了。

   我是二十岁心脏,三十岁心态,四十岁身体,五十岁面容,六十岁的年纪。

 

从大学毕业到现今个人照

 

一九五八年七月十六日,一轮红日升起,阳光普照,我在安徽省南陵县黄墓乡田间里出生了,上帝太不够意思了,给了太阳,却缩短了时间。母亲怀着我,仍然需参加巡回医疗队,下派到十分偏僻的农村,那是水乡,不通公路,没有电力。因工作劳累和营养不足,我早产了,提前三个月来到人间。听父母讲,生下我时,对我能否活下来都不抱希望。当年没有保育箱,又在穷乡僻壤之地,睁不开眼没有哭叫声的我,竟奇迹般地在交通极为不便的江南水乡里活了下来。算是傻人有福,上天眷顾。为此我的外婆让我带上银箍银锁,祈求神灵保佑我健康成长,直到进小学时才将银器摘下来。为了好养,外婆按我的生肖还给我起了个贱小名:大狗子。这小名一直叫到高中毕业,不论男女同学,都几乎不叫我大名,让我很是无奈。

我出生在这里水乡

带着银箍的我和弟妹

 

如果我足月生下来,应该比现在聪明,个子也应该比现在高,先天不足哟。

    我从事IT业的,是个理工男。但从小就喜爱文学与史哲,不喜欢理化,毕业于南京航大。

我有考试专业户美称,曾考过中国最难考的律师、注册会计师。律师资格考试,一次就过。注册会计师资格证考试,分两年考,第一年三门课通过了,第二年两门课,因工作原因未能参加考试。如果去考,想必应该也能过。考过政治学、新闻学和西方经济学,都取得不俗成绩。

    英语特差,语言细胞缺乏。不会讲武汉话,普通话也不会讲,现在又忘了家乡话,只能说带家乡调的普通话。所以居住地武汉人和家乡芜湖人都不承认我的身份。我这一生,关键几步都是栽在这该死的语言上,它成为我事业上的最大绊脚石。

    我本人也有缺点:

    那就是不会喝酒,不会抽烟,不会打麻将,不会唱歌,不会跳舞!所以别人说我活着毫无意义,白活了。而且眼高手低,金玉其表败絮其中,徒有虚名。

    虽有律师资格证,却是个真正法盲,十几年没有看过一本法律的书,连常用的法律条款也记不起来。

    系统学过财会知识,但从未做过一天账,也看不懂会计账表。

    有计算机专业高级工程师证书,且能熟用单片机51系列汇编语言,甚至16进制机器语言编程,但对PC机知之甚少,连中学生也不如。

    名正言顺的兼职教授,华中科大的,仅仅是兼职的哟,却没有为学生上过一堂正规课程。

    虽挂了个国家核准的民办学院院长,却是个无场地、无教师、无资金的空壳子。

    五音不全仍喜欢霸占话筒,不会跳舞却能在迪厅乱蹦一气。

    中国最早的股民,进入大户室也N年之久,但自己从未实战操作过股票。

    中国最早拥有高尔夫球杆的人之一,下过无数场,却不会打高尔夫球。

    从事保龄球运动十几年,培养一大批本公司高手员工,自己却从未打过一百分以上。

    从小学四年级开始和弟弟一起学英语,到高中时他已开始翻译英文小说,我还仅仅只会

Long live Chairman Mao.

Never forget class struggle.

Study hard and make progress every day.

    这三句,且一辈子未忘。大学四年也学不好英语,学了近二十年,花时最多,也最用神,结果仍是英语盲。

    小学时被父亲逼着学二胡和小提琴,结果有心栽花花不开,无心插柳柳成行。来我家玩的邻居数同学,陪学后,均学会拉一手好琴,如我的好友杨国民,而我仍只会拉1.2.3…七音。

    写过小说、散文、韵白剧、相声、诗歌、政经论文、长篇市场分析报告等共一百多万字,喜欢写作却没有一本书出版过,且连一篇文章也未发表过。

      自命不凡却无一技专长,是个无所事事有负社会的乐天派、开心果、老顽童。

    一首打油诗正是我真实写照:

    肩不能挑手无力,徒有其表败絮衣,半瓶墨水华不实,天上地下知毛皮。

     但我自我感觉良好,我很幽默爽朗,五十五岁前喜欢爬山、旅游、冒险和泡吧(不喝酒只蹦迪),有点点虚荣,也有点点好色,有色心无色胆。

     生命不息,色心不死,这是保持心态年轻的最佳良药。

    当年东三省一抢不放的逃帅,共产党西安事变的英雄张学良,曾经给自己写了一首打油诗:

    自古英雄多好色。未必好色尽英雄。我虽并非英雄汉,唯有好色似英雄。

    我常用这首诗为我隐藏在内心深处好色一闪念作辩解,有了一块可以理直气壮的遮羞布。更何况蜀汉开国皇帝刘英雄说过:女人如衣服。我们的领袖在延安也说过:女人就是一道菜,总不能只吃一种。我有点理直气壮了,性之食也,圣人与伟人给了我一点底气。

    我唯一不同之处就是我的知识、人品、风貌、谈吐和诚心,本人特能侃,青壮年时可以一刻不停侃四五个小时,仍声音宏亮情绪激扬。

    我的品质是待人真诚、与人为善、绝不欺骗、拒说假话,坚守底线,不昧良知。

    我是独一无二的!!!(谁都是独一无二的)

    我从小到三十六岁之前虽有点小挫折,如高考报学校专业等,但总的说来都极顺。

    我六五年进南师附小(韶山小学、南陵五小、中心小学)念书,是学校红小兵营营长,小学毕业前填写了入团志愿书,那可是文革中,团组织恢复时第一批。中学在南陵中学度过,是班级团支部书记,在南陵中学毕业前入了党。七七年三月下放东塘公社,任大队干部,县劳动模范,民办教师。

    文革结束恢复高考时,成为第一批大学生。我们那届中学生中,连大专一起考取不到八人,本科只有三个,而我和我弟弟是一届的,当年同时考取本科,轰动小县城。

    七八年三月入大学,八二年毕业,八四年我被单位预定为团委书记兼组织部付部长,正处级,但我未允诺。当时所领导都是参加过抗日三八式干部,一年后才开始年轻化。那个年代,学工科的人对政工人员极为反感,所以拒绝。差点弄个中国之最,丢失当年中国最年轻的处长这一荣耀。84年被借调省委组织部,搞整党工作半年,未抓住这次难得机会。担任过省委整党办公室军工区西北组组长。85年参加全国研究生统考(北大卷子)的中央党校国民经济管理专业研究生(不是现在干部混的那种党校文凭),但英语差四分而未录取(专业课考得不错,总分前几名,录十名),又一次丢失了当官的机会。

    同样,又是那个该死的英语,让我失去了外资企业高管的位置。

    九二年下海经商,从事过多种职业。办过驾校,弄过出租车公司,做过装修、从事过产权交易,创立过学校还管理过通讯、计算机,灯管制造等公司,曾打算参与朋友一起购买武汉中心百货和建民制药二家后来上市的公司,合同草签,因对方某些人反悔而遭毁约。

    曾经官场、商场都还算顺利。

    但我后期,经常是走下坡路多于走上坡路,官也未当上。商场上也是屡战屡败,屡败屡战。最艰难时,无所事事的我,三个多月时间基本在录像厅里度过的。总结起来,我这一生,前半生时,党、政府、单位和社会给我很多机会,这种机会,对别人来说有一个,都能翻身大解放。可我每次总抓不住这大好机会,这怪不得别人,只能怨自己太笨太蠢。我信命,命中注定我不能大富大贵,我认了。

    现在吗,应该还算生活无忧,虽不大富大贵,脱贫是没有悬念的,温饱问题基本解决,应该属于刚踏入小康生活大门的那批人之一。

   冬天去南方海边避避寒,夏天去山区小城避避暑,春、秋天去国内外到处转转。

度冬的海南临高的海滩

度夏的凉都恩施州利川市

空时老年大学待待,早晚就上上网乱看一通,偶尔忍不住也写写小文章,最近弄个公众号,自娱自乐。

    在中国,大抵算是个中产阶级吧。

    养老和医疗问题是我今后生活中最大隐患,一不小心有可能一夜回到解放前。另外对打土豪分田地的共同富裕有点担心,大土豪大官僚都早把财产转到国外去了,待宰的羔羊只能是我们这些辛苦一辈子,有点小资产,现在拿微薄退休金生活的中产阶级。更让我担心的是,俄罗斯、伊朗、津巴布韦和委内瑞拉那样的恶性通货膨胀有可能会在神州重演,一万元变一元,一亿元存款,瞬间也就变成区区一万元。个人那点存量资产一夕回零,过苦日子可能是大概率事件。除了“润”,资产外移,还真没有什么好的方法去防老养老。而“润”,资产外移对蚁民我来说,难于上青天,只能听天由命了。

    该吃的基本都吃了,该玩的也差不多都玩了。中国第一批用BP机的人,第一批用手机的人,上世纪九十年代中期就已经自己开上轿车了,总的来说,我还算是幸运的,比上不足比下有余,知足了。

     虽然六十岁时才拿到微薄退休金,但我胸无大志,实际上刚过四十九岁时就完全退休。对不起党和人民多年的培养,革命意志衰退,仗点那不算多的臭钱,忘乎所以,开始了吃喝玩乐、坐吃山空、颓废寄生、混吃等死、行尸走肉的资产阶级腐朽生活。从那时开始,我本人对社会只有消耗,完全没有贡献。混混然如梦中过,既没有胸怀世界的豪情壮志,也缺失“活到老革命到老”的初心使命,与奋进向上、激昂澎湃的新时代格格不入。有时很惧怕“正能量”者的蔑视目光,个人休闲自乐的生活中总伴随着隐隐的内疚、不安和慌恐,仿佛是作贼似的,似乎是偷钱维持不劳而获的生存状况,头上总是顶着雷,不知那天运动一来,就成了被改造、被批判、被歧视的另册分子,我真得很害怕,很害怕。

    我爱好文学,从初中开始每年大年三十,我都会在家里写我自传体小说,从一万字到十几万字不等。如<<班委会内幕>>、<<永恒的战斗>>、<<暗恋>>、<<走向生活on we go>>等。

    年轻时,我写过近一百万字的作品,但从未想发表,现在看来都基本是废品。我的文科成绩最好,尤其史地极好,对地理历史十分着迷,至今都是如此。数学还不错,但理化底子薄,基础极差,提不起兴趣。高考时本想考北京大学和复旦大学国际政治系,应该能考取。我当年的高考,文科理科都是考四门课,其中语、政、数完全一样,区别仅仅是理科考理化,文科考史地。我高考成绩还不错,过了重点线,当年我理化只考了区区34分。当年史地卷子,考后我就找来看了一下,不复习都几乎全会做,至少应该考八十五分以上,一念之差绝了北大的梦。

    我从小爱好国际政治,小学中学我拼命看书。中国哲学史、政治经济学、国际共运史、中共党史和国际知识都曾认真研读。我订阅了大量报纸与杂志,包括当时保密的《参考消息》。还似懂非懂地阅读了不少马恩列斯的原著,如马克思恩格斯《共产党宣言》、《哥达纲领批判》、列宁《怎么办》、《进一步退二步》、《左派幼稚病》、斯大林《苏联社会主义经济问题》、斯大林时期苏联编写的《联共(布)党史简明教材》、《政治经济学教科书》。甚至俄国马克思主义之父,理论家普列汉诺夫的《论一元论历史观的发展》也胡乱通读了一遍。

    我当时就能熟背世界绝大多数国家的首都、国家元首、政府首脑及该国基本情况。如阿尔及尼亚的尼迈理、坦桑尼亚的尼雷尔、埃塞俄比亚的塞拉西一世皇帝、日本的田中荣作、缅甸的吴奈温、巴基斯坦军人总统叶海亚汉、阿尔巴利亚的霍查和谢胡等等等等。对美国阿波罗登月和智利军人政变也十分关切。

    小学四年级时,我曾在一次大人的座谈话上(活学活用毛泽东思想积极分子座谈会),畅谈美国黑豹党运动的兴起的原因和发展状况,让与会所有人大吃一惊,也让我所念的小学的丁校长对我刮目相看,从此校长对我赞赏有加。

    小学时,我虽足不出县城,对祖国山川河流风景名胜十分熟谙,对工业基地矿产资源也能乱侃一气,对太阳系和四季白昼形成都很有兴趣,一直订阅《地理知识》杂志,至今还在订其演变的《中国国家地理》杂志,兴趣时终不减。

    高考时,我父母一定让我报考理工。他们希望我继承他们事业,学临床医学。他们怕我思想太开放,学文科,在中国会出现不可预料的麻烦。他们让我报了上海第一医学院(现复旦大学上海医学院)、安徽医学院、皖南医学院。

    我下乡所在地,东塘公社医院的沈毅院长(后任芜湖市第一医院院长)坚决反对我学医,他以自身为例,苦口婆心,反复劝我,促使我临时改了我志愿。医也未学上,(不然应该考取上海一医)去了南航大,学了航空。(沈院长可能不记得这件小事了,可他当年的强力劝说,完全改变了我一生的生命轨迹。)

我下乡的村前小塘

不过祸兮福之所倚,福兮祸之所伏,没有上北大和中央党校,可能对我是个幸事。我父辈人曾对我个人评价是:激情四射,才华横溢,口无遮拦,全身上下透着反骨。因为去念理工的大学,特别不喜欢理化的我,自然收敛很多很多,甚至从自傲转为自卑。如果去念文科,一定躲不过六四那场灾难,即使躲过了,也可能因为站错队或受大环境影响而受贿进监狱。况且当今当官的潜规则是:说人话做人事的基本没有,不说人话做点人事有那么一点点,不说人话不做人事大有人在,说人话不做人事才可飞黄腾达。只有工于心计、善于权斗、盘人整人的“人精”,才有可能成功。而我缺乏这样基因,所以根本走不进官场。我对独立人格、自由理念、民主向往都是刻录进骨髓中,很难被当今社会所包容,如果真去念文科,大灾难一定会降临到我头上。

    我现在的小家庭共三口人,夫人是武汉出生的湖南人,我们是绝对自由恋爱的,在长达八年的恋爱奔跑后,于一九八九年十月终于喜结良缘。夫人是在银行省分行机关工作,当个中层干部,是位科技工作者。认真、严谨、刻苦是她特点,虽学经济但工科天赋更高,有悟性,是行里科技专家。她性格上特别较真,很执着,或者说认死理,有点偏执和洁身自好。女儿九一年出生,一六年博士毕业,是名医务工作者。女儿是个传奇,小学、初中到高一成绩都很一般,高中进武汉排在十位以后的学校,以调剂生的名义在平行班学习,高一年级第一学期结束时,年级排名才提升到372位。老师对她的要求就是毕业时,能考进好一点的职业技术学院,那就很不错了。经过三年学习,她超过两个重点班几乎所有学生,直接考入985学校本博连读班。她是他那个博士班里唯一一个高中平行班的学生,能跨进这个班的,作为一个进校中等偏下成绩的女孩,真是了不起的奇迹。

    虽然现在我无法大富大贵,但一生基本平安,能吃能睡能玩,应该算是幸事了。

    当年我在公司时,常跟手下说:今天我是你们头,你们就必须听我的。也许明天你就成了我老板,我也一定当个好下属。后天说不定我可能为了生存,给你当司机和保安。出了公司,大家都是平等的,人的命运也很难预测,明天和意外那个先来,只有到明天再好说,谁也无法预测,过好生活每一天。

   人到老了一定会有失落,人生苦短要对得起人生。人不可强行自己做什么不做什么,顺其自然最好!

    但我从不让自己沉醉过去成功或忧伤现在的失败,我心态很平和。人不怕犯错误,不怕上当,而怕信心尽失,人一定要坚信生命最珍贵的也是最尊严的,其他都是次要的。

    我的人生哲学就是:

    快乐人生,享受生活,珍惜生命!!!!!!

    过好生活的每一天,对得起自己,不枉来这世上一圈。

    人分三类:一类是外表老实而实际狡猾,那是高人;一类是外表狡猾而实际老实,那是低人;还有一类外形与实际相符。至于我吗?好人与坏人很难说。同一人,如果把一个人缺点集中起来,他十恶不赦。把一个人优点集中起来,他就是活雷锋。人无完人,我应当还算不错,属于第二种类型人物,很吃亏的。说句大实话,我就是一个俗不可耐的人,生活在一个俗不可耐的时代,逐渐完成自己俗不可耐的一生,也形成了我的俗不可耐的人生经历。

    现隆重推出,闪亮登场,自我吹嘘,但愿不烦,如有夸张,敬请谅解。

 

 

外一篇:

    一九七六年十二月我念高二,作为入党培养对象,学校党支部通知我,写一份个人自传给党组织。从这一天开始,正式进入入党程序。我的入党介绍人是我年级主任史宏江老师和校团委书记李家英老师(她是抗美援朝特级英模李家发的妹妹,我们县有一个镇以她哥名字命名为家发镇)。全校四个高中毕业班三名学生被批准入党,四班团支书戴翠萍,二班班长陈琳和二班的我。

当年自传原件

 本人自传

我生于一九五八年七月,父母亲都是知识分子,从幼年到现在一直生活在南陵县。

    我五岁进入县幼儿园,八岁(注:实际上是七周岁)进南师附小(现城关第五小学)念书,九岁又随父母(支援何湾医院工作)到何湾公社中心小学念书。在此时间,我们伟大的领袖和导师毛主席亲自领导和发动的无产阶级文化大革命在全国轰轰烈烈展开,作为我,一个儿童也投入了这场反修防修的政治大运动。我积极参加学校造反队,并且领导和组织了“匕首小分队”的儿童造反队,带领不少儿童开展了散传单,帮助贴大字报的活动。在这关系到我党、我国的前途和命运的政治大革命中,我幼小的心灵受到了锻炼,留下了不可磨灭的影响。六七年我随全家调回县城,自己又回到南师附小念书。从三年级到五年级我一直担任班长,并又担任过学校红小兵营组织委员,红小兵纠察大队长,红小兵营长等职。连年评为“三好”学生。(注:那时有时不叫这个名字)在小学五年期间,本人一贯要求进步,认真读了一些毛主席书,积极参加批判刘少奇修正主义路线、一打三反、批修整风等各项政治活动。学习文化课自觉性一直很高,成绩也很好。特别是本人从四年级就非常关心国际时事,天天看报纸,受到小学领导赞赏和好评,并被评为县里活学活用毛泽东思想积极分子。

    自从小学毕业进入南中以来,积极参加了批林批孔、评《水浒》、农业学大寨普及大寨县等各项政治运动。特别是在伟大领袖和导师毛主席、敬爱的周总理和朱委员长相继逝世后,王、张、江、姚妄图篡党夺权,复辟资本主义,以华主席为首的党中央,继承毛主席遗志,一举粉碎了“四人帮”的反党活动的关键时刻,本人积极参加了这场批判“四人帮”的斗争,自己写批判文章,出刊栏,投入到这场伟大运动之中。另外,自己在政治学习上也有所进步,认真读了一些马列的书和毛主席的四卷光辉著作,研究了政治经济学、中国哲学史等理论问题,使自己政治思想水平有所提高。除此之外,自己在文化课学习、工作劳动中、开门办学中都很积极和努力。在初一和初二任班级学习委员,初二下学期加入共青团组织,在初三任班长,在高一、高二任团支部书记。在高二曾两次向敬爱的党组织递交了入党申请,积极要求进步。在初二到初三被评为“三好生”。(初一没有开展这项活动)高一到高二被评为“优秀团员”。两次到团县委帮忙工作,参加全县团的工作大检查,足迹遍及全县各公社。

 

                               自传人:李扬新

 

 

 

    花开花落,岁月流逝,卷走了青春,带走了苦难,但我一直忘不了在小城生活的那段青涩岁月。

    每个时代,青春都是最美好的;每个时代,青春都是值得留念的;每个时代,青春都有各自烦恼和困惑。青春与时代、政治、贫富无关,我们可以赞美青春,但决不可以赞美苦难,我们这一代人在苦难中度过青春,往往因为赞美青春而赞美苦难,这是需要重视和警惕的。我们当年没有独立性、缺乏安全感、迁徙不自由,户口、票证、城乡二元化束缚着所有下层民众,我们根本就没有自主选择的权力。在社会全面公有制和集体化后,在政党高度集中统一领导下,在领袖个人权威不受制约时,生活在这片土地上的所有人,他们的生活、工作、升迁等只能依赖、依附、依存于权力,权力掌控着我们一切。我们只能做一颗永不生锈的螺丝钉,成为现代社会的变相农奴。说什么“青春无悔、选择无怨”,可那是你的选择吗?在那个年代里,你有什么选择权?在受欺压、受侮辱、受磨难的环境下生活十多年,你还能无怨无悔,实在是非常可怕,非常难以理解的,这是典型的斯德哥尔摩综合症的表现。如此缺乏反思反省,神经错乱,我们会给后人展现一段虚幻的、不真实的历史,让国人无法吸取那沉重的经验和那惨痛的教训。会永远走不出循环、重复、轮回的怪圈,遗祸我们整个民族的复兴和人民的幸福。

    有的人攻击我们文化传统,听起来似乎有点道理。他们说我们这个民族一方面普遍缺乏反思和检讨,另一方面还掌握高超自我麻痹的技巧。我们的名言金句是:吃得苦中苦,方为人上人。所以我们老百姓总是说:丢失钱财叫破财免灾,摔了器物叫碎碎平安,经历生命危险叫大难不死必有后福,国难临头叫多难兴邦。这是什么样的民族?胸怀如此宽广,坏事总能变成好事,丧事总能办成喜事。多大危机,多大灾害,多大苦难,我们民族总能默默承受,一笑而过。我们常常欢呼,感谢送我们拐杖的人,而忘了正是送我们拐杖的人,打断了我们的腿。很多时候,给我们平反冤假错案的人,正是当年制造冤假错案的同一批人,生活往往就是这么荒诞、神奇和诡异。

    那个时代,我们不需要思考,答案是官方公布的,统一的,标准的,不能质疑的,更不可能反对的。而我们知道质疑是社会发展最大动力,知识创新是由批评、反驳,猜想和质疑而获得的,讨论、质疑、证伪是科学理论形成的必备条件。因各人背景、环境和教育程度不同,人类社会没有标准答案。文明与野蛮的最大区别之一,就是社会能否包容不同意见,个人能否自由选择投票给自己认同的人和接受自己不认同人的胜利。按统一标准的思维去思考和规范自己的道德标准和行为,只能产生愚昧和野蛮,不可能产生现代文明。总之文革是一场浩劫,它迫使大家接受愚昧,摒弃理性、常识、科学、逻辑和思考、判断,让人们或被迫或自愿装疯作傻,以求得自己生存的权利,这样的苦难百年难遇,一定要摒弃和清算。

    曾经最深入人心的诡辩邪理就是:把贫穷、灾祸、逆境和苦难看成个人成长的强大动力、人生磨练的必要条件和阶级革命的社会基础,这在逻辑和常理上都是十分荒谬的。

    以贫富分敌我,以财产分界线,是那个年代主流意识形态,这就是所谓的阶级斗争观点。越贫穷越革命、越苦难越能锻炼人、穷人的孩子早当家、第三世界理论等这些都是这种理论的具体体现,流毒非常深远。持有这种观点的人,往往对历史进行“正义”的歪曲,对反思从来不屑一顾,以革命名义掩盖一切,看似真理在手,实质祸国殃民。

    当今这类人不少,能量也不可小觑,是中国大地我们民族最大悲哀。绝对权力造成高层之恶,但底层的恶,也超出我们的想象。底层的互害更可怕,是典型的欺软怕硬,斗不过更强的,就欺负更弱的。他们恨官,是因为他们当不了官;他们仇富,是因为他们挣不到钱;他们拥护反贪,是因为他们没机会贪污。假如你给他一个机会,他们会比最贪婪的贪官疯狂十倍百倍。权贵们的“高层之恶”如果想恢复集中营,完全不愁找不到“底层之恶”的看守。我们这个民族的文化出了大问题,不是个别人的问题,我们根烂了,不治根,我们国家全面现代化没戏。

    实际上苦难和逆境从来都不是人类成长的充要条件,只有知识技能、文化素养和心理建设才是个人健康成长的最重要因素。我们偏爱宣传战胜苦难的经历,常常忽视探究造成苦难的原因。所以千万不要人为刻意制造苦难和赞美苦难,这是专制者为自己失德、失能、失政披起的一块遮羞布。绝对没有什么中国真理,拿文化特色来抵抗现代文明,拿民族主义来混淆普世价值,拿人民至上来剥夺公民权力,这绝不是进步,这是在摧毁现代宪政制度、人文自由理念和契约守信精神的基石,是文明的大倒退。追求和平民主的安逸环境、过上自由快乐的幸福生活、享受法治平等的公正地位是人类的共同理想、民众的向往目标、人民的现实追求,这是全人类的初心和使命。

    壮志可以没,善心不可无;理想可以没,良知不可无;信仰可以没,质疑不可无;抱负可以没,爱心不可无。一切的美好源于真挚和坦诚,我相信人性、公义和未来。

    我一九六五年九月七周岁时进入小学,七二年二月进入中学,七七年二月中学毕业,十一年半中小学的学生生活都是在那座江南小城里度过,时间完全覆盖那史无前例的“火热年代”的十年中。

    那十年是动乱的十年,灾难的十年,荒谬的十年,是不讲常识,不讲逻辑,只讲政治的十年,我无法选择。命运让我的青少年几乎全都生活在那十年之中,在劫难逃,那既是我的不幸,也是整个民族的不幸。当生产资料和生活资料都被他人全面掌控时,有户籍和档案做后盾,此处不留爷,就没有了留爷处了,除了服从,就只能毁灭。个人的独立的思考、自由的精神、个性的张扬就成了贱民的奢望,成了不可承受之重。当生命、生存和家人的吃喝拉撒睡都被人为控制时,人自然就成了奴隶。那时的我们只能停止思考,只能闭嘴,只能说假话,只能忍气吞声。愚昧成为个人安全的护身符,告密成为个人进阶的敲门砖,互斗成为个人出头的垫脚石。这是不可避免的,是制度之恶,个人是难以抗拒的。以生命相威胁,从而剥夺人的思考权利;以饭碗相威胁,从而令人闭嘴;以亲人安危相威胁,从而令人放弃抗争。你除忍辱负重,委曲求全,还能干什么?十年文革这场人为灾难不仅扭曲了一代中国人,而且深深影响中国的未来。有些东西一旦深入骨髓,几代人都难以消除,其遗毒犹存,至今阴魂难散。逐渐在社会上形成愚昧对文明的仇视、传统对现代的抵制、落后对普世的追杀的这股不小逆流。虽然七八年不可能再来一次,但谁也无法保证未来不会以某种形式再来。达摩克利斯之剑始终悬在头上,文革2.0版有其社会基础。被愚昧和被迫害是专制的专利,专制不灭,浩劫难免,我们任重而道远。

     只有改革与开放、民主与法治、自由与独立、科学与创新、平等与公平,才是中国走向现代化的唯一正确之路。权力不可私有、财产不可公有、新闻不可官派、司法不可依附、监督不可一元,才是避免那荒唐年代重演的必由之路。

    这本文集收集了我过去四十多年来不同时期断断续续写的那段时代生活的回忆文章,是一个中小学生的文革生活记实。虽多有重复,但如实反映那段不寻常的青春岁月。文虽稚嫩,贵在真实,欢迎各位读者不吝指出,多多提出宝贵意见。

    我的弟弟立委说:“回忆文章是没有绝对的真实,所谓真实,也只是记忆中的真实,而记忆肯定有不可靠之处。绝对真实不一定更有价值,除了写史以外, 而感受的真实才有文学。”我认为这话很中肯,绝对符合人的思维规律,四十年过去了,我无法保证我过去的记忆十分准确,但我保证绝不会胡编乱造,弄虚作假。

    文集中的最珍贵和最有史料价值的是当年的中学日记、原汁原味的中学作文和当年写的其他文学创作作品。虽然那些文字摆脱不了那个时代的烙印,十分幼稚,违反人性,突破常理。但文章从一个侧面真实地反映“左”的一套对青少年思维逻辑无孔不入的伤害, 隐隐暗示当年“灌输”及洗脑对青少年产生的认知偏差的灾难性后果。从这一点看,我的文集还是有一定史料价值和现实意义的。

    文集是为了纪念那难以忘却的热血青春,纪念那世所罕见十年人造的苦难,纪念那不平静的中小学学生生活,但愿苦难与青春永不共存,但愿生命、财产、自由三大基本权利得到法律保障。

  走向世界、走向文明、走向未来、走向现代化。

 

    下面是我一九七五年文革期间偷偷地写的一首诗,反映了当年一个中学生发自内心的真实呼喊,特献丑,作为此序的结尾。

小诗原件

 

抗死亡

死亡,

    死亡,

        可怕的字眼,

似魔鬼

    绕着我心灵。

 

去魔,

    去魔,

        借助钟馗去魔,

让魂魄

    扣住我心弦。

 

我不愿

    死亡追随我,

更不想

   坟墓做故乡,

我要活着,

   我要强烈地活着,

我要化作雄鹰,

   我要化作海燕,

       去迎接那满天的光明。

 

可怕,

    可怕,

        阎王的告示,

已经呀

    点出我的名。

 

反抗,

    反抗,

        我要举手反抗,

砸碎那

    死亡的锁链。

 

 

作者寄语

    不出版,不发行,不售卖,只作个人资料,内部交流学习,自娱娱人。祝贺一下鄙人作品电子版编辑完成。

    经年累积,敝帚自珍,本人蹦哒近两个月,汇编成册,不知算功劳还是苦劳?小民自有小民活法,咱不能为人类命运提供路径,为世界发展指明方向,但咱可躲进自己的小天地,思绪飞扬,孤芳自赏,物我两忘,快乐趟平。这本中小学学生的文革生活记实,文字浅稚,文笔不精,但寸有所长,贵在真实。不揣粗陋,呈给同学亲友,或可唤起回忆,纪念我们的青春年代。井底之蛙,只知天空就那么大,内部交流也好,免费赠送也罢,咱不就是图个新鲜劲,满足一下作家梦呗,较真干么?半辈子都过去,滥竽充数挺好。

    从小学起,到考大学止,我十二年半时间,覆盖了文革全过程。这部文集全是我个人鸡零狗碎的生活,细枝末节的体验,凡夫俗子的故事,带有很深的时代烙印。邓公开启改革开放,此后社会转型,人世沧桑,书中的故事恍如隔世。本人这部微不足道、无病呻吟之作,有闲无聊之人可以在打发时间时拿来阅读消遣,正能量满满有抱负的人必须视之如草芥,弃之如敝屐。好在我不在乎别人的评论和蔑视,任你嬉笑怒骂,我自心宽似海。

    其实,每个人的眇乎小哉的生活汇聚到一起,就会展现出一幅波涛汹涌的真实历史画卷,就会戳穿历史虚无主义无耻嘴脸,就会揭秘尘封许久的历史谜底。小人物的命也是命,小人物的历史更加客观。一切假历史、伪历史、遵命历史在大量小人物历史史实面前就会露出马角,不攻自破。真希望每个年代都能进行群众征文,让人们看到平民的具体生活细节,可惜“反右一日”、“饥荒一日”、“文革一日”我们都不可能看到了,唯一能看到的是“志愿军一日”,那是官方组织编辑的,虽受各种限制,但还是有一定历史价值的。

    我真诚希望大家都向我学习,不论文笔好坏,把自己个人真实历史记录下来,为后人辨明真伪,识破骗子,还原真相,贡献自己小小的力量。

 

 

 

 

《小城青葱岁月》电子版(目录)

小城青葱岁月

 --------一个中小学生的文革生活记实

      汉阳一江水  著

 

 

 

目录

 

作者寄语

 

自我吹嘘(外一篇:本人自传)

(外一篇:迎着阶级斗争风雨茁壮成长)

 (外一篇:新的征途)

(外一篇:永做毛主席的红小兵)

(外一篇:青涩少年记事)

(外一篇:师弟轶事)

四人不成帮 (外一篇:建军自述)

 (外一篇:千万不要忘记阶级斗争)

 (外一篇:我的中小学学生生活)

 (外一篇:千年的铁树开了花)

 (外一篇:北风那个吹)

 (外一篇:论社会主义时期的长期性)

(外一篇: 狼狗--刘邓)

 (外二篇:对话 我对鲁迅感觉很复杂)

 (外一篇:三兄弟惊叹学大寨)

(外一篇:那小说中的情节,也能亲身感受)

 (外二篇:土布洋布 不成故事)

 (外一篇:铁姑娘金小霞)

 (外一篇:受伤的一代)

 (外二篇: 我的邻居 苦命的外婆)

(外二篇:思考  悼念我的同学戴翠萍)

(外一篇 立委小传)

(外一篇:勤工俭学)

 (外一篇:插队的日子)
(外一篇:看病两则)
真话?假话?(外一篇:家乡的老屋)
《虹南作战史》与《前夕》(外一篇:小说《小铁》抅思、提纲和思路)
咸菜(外一篇:美德和减肥)
入学历程 (外二篇:高考随想; 跳龙门)
代后记:我们和你们 (长篇政治抒情诗) (外一篇:同学联谊会记实)

 

 

 

 

 

 

数字人形象设计:为什么选她?

关于数字人的形象,那真是萝卜青菜各有所爱了,最终也是要让用户配置才是出路:配置的结果肯定会出现一批数字人明星,为多数人喜欢。这要到用户群起来以后,会自然呈现。

数字人的形象设计是一个审美过程的落地。我最近推出的女性数字人候选形象有下面几款,都是AIGC生成的,不确定讨喜不讨喜,但都有各自的考量。

为什么选她?

这是一张典型的中国电影杂志封面愿意登载的女星新秀的形象。可以说大俗。但感觉具有代表性。

为什么选她?

因为她让人想起老电影中的女特务。她的眼睛很特别 ,“勾人”。

By the way 对于经历过 wen/ge 的人, “女特务” 绝对是最大的褒义词,虽然当年精神分裂:认知上认为是狐狸精,感性上却忍不住欣赏女特务,不放过女特务的任何镜头。

她肯定不是人人讨喜的大美人形象,但别有特点。现如今生成漂亮或艳丽的形象很容易,但要生成有特点有好看的人,就不容易了。因为人都越来越挑剔。

 

为什么选她?

就是一个黄毛丫头,但并不俗气。她让我想起其身世可能是流落在民间的皇家公主。如果精心挑选合适的配音,她作为数字助理 应该会满足一些人的偏好的。

为什么选她?

你不觉得她太萌了吗?完美符合国人对金发小女孩的定义。当然,配音还可以再做适配,这些数字IDs 都具有一定的可以持久站住的理由。

为什么选她?

老友建议把她改名为小稚,像个女孩子的名字,我觉得有理。

小稚是小雅以后最接近小雅的艺术肖像了。自从半年前我千里挑一 ,创造并营销了小雅的独特数字ID以来,就再也无法创作类似的数字人形象了,让人感叹艺术创作的可遇不可求。难道小雅就成为我数字人形象创作的绝唱,连一个替代者都没有可能?

小稚就是作为替代者推出的,气息上接近小雅,所以戏说她是小雅的 twin sister。当然,她不如小雅,形象独特性不够。

回看一下小雅的数字形象:她的解说,她的歌唱,是不是一个已经可以活起来了的数字ID?进一步的工作就是借助大模型给她塑造有趣而独特的性格和灵魂了。

小雅绝对不是完美的形象,她甚至眼睛有瑕疵,对不上焦,但作为艺术肖像 她有站得住的独有的清新气质。

小雅的原作如下,被批评为穿着太西方,我让 txt2img 给她换一套服装,结果模型决定给她盖了一条毯子 lol

诗云:

蒹葭苍苍,白露为霜。所谓伊人,在水一方。溯洄从之,道阻且长。溯游从之,宛在水中央。

AI浪潮博客目录

《AI浪潮:ChatGPT 的传统与开放的NLP 能力》

 

信息抽取

这条新闻讲的是美国共和党遭遇议长选举的闹剧和挑战。送进去,我让它给我抽取:(1) 实体;(2)引语;(3)关系;(4)事件;(5)情感分析。用的是大白话,这些以前都是 NLP 的专项任务,现在“zero shot”它,给个指令即可。

情感分析显示了其NLP的超能力。传统的 sentiment analysis 不过是一个正负二级分类。在这里不大合适,而它会把带有情绪的洞察(insights)抓出来,显得非常灵活精当。

自动摘要

以上算是传统的NLP任务零样本测试。下面也看看其他文字类任务的表现,表现其NLP新能力。意想不到的能力发掘的根本原因是听懂了人话。在此之前,NLP 社区为了定义一个任务,需要耗费很多的精力去设计目标,准备数据和统一标注标准,组织社区竞赛。这就必然限定了任务的种类。现在每个人都可以尝试让它做各种任务,人民群众的创造力得到了极大的发挥。以前太多的死角,现在都可以去尝试。

推荐信

自从 chatGPT 横空出世,应用文辅助写作案例已经水漫金山,见奇不怪了。但这不改变辅助写作是一个具有巨大应用场景和价值的方向,虽然大概率与机器翻译也差不多,最后作为行业可能被做死,或成为白菜价。下面是我自己前一阵子做的一些试验,摘录如下。

请帮助我用规范的英文写一篇推荐信,内容包括:1. 推荐张三到清华做博士后,研究AGI;2. 我是张三的博士导师; 3. 张三博士论文获到全国优秀论文大奖。

Dear Admissions Committee,

I am writing to highly recommend Zhang San for admission to your PhD program in AGI research at Tsinghua University.

As Zhang San's doctoral advisor, I have had the pleasure of working with him for the past three years and have been consistently impressed by his intellectual curiosity and dedication to his research. His thesis on AGI has been recognized with the National Outstanding Thesis Award, a testament to the quality and originality of his work.
In addition to his impressive research abilities, Zhang San is a team player and has proven to be a valuable asset to our research group. He is able to work well with others and consistently contributes fresh ideas to our discussions. I am confident that he will thrive in a collaborative environment like your PhD program.

I strongly believe that Zhang San would be an excellent fit for your program and would make a valuable addition to your community of researchers. I wholeheartedly endorse his application and hope that you will consider him for admission.

Sincerely,

[Your Name]

请增加一些具体生动的细节,让推荐信更为有力。

Dear Admissions Committee,

I am writing to highly recommend Zhang San for admission to your PhD program in AGI research at Tsinghua University.

As Zhang San's doctoral advisor, I have had the pleasure of working with him for the past three years and have been consistently impressed by his intellectual curiosity and dedication to his research. His thesis on AGI has been recognized with the National Outstanding Thesis Award, a testament to the quality and originality of his work. In particular, his contribution to the development of a novel AGI algorithm has garnered attention from researchers in the field and has the potential to significantly advance the state of the art.

In addition to his impressive research abilities, Zhang San is a team player and has proven to be a valuable asset to our research group. He is able to work well with others and consistently contributes fresh ideas to our discussions. I have seen him take the lead on several collaborative projects, always ensuring that all team members are on the same page and making valuable contributions to the final product. I am confident that he will thrive in a collaborative environment like your PhD program.
I strongly believe that Zhang San would be an excellent fit for your program and would make a valuable addition to your community of researchers. I wholeheartedly endorse his application and hope that you will consider him for admission.

Sincerely,

[Your Name]

好了一些,但请增加下列事迹:1. 废寝忘食 他总是最后一个离开实验室;2. 发表了5篇一级刊物论文,成为青年学术新星;3. 虽然AGI被认为是难以实现目标,张三在定义AGI实现的不同步骤上提出了具有操作性的建议,并实现了10个步骤中的前5个。

Dear Admissions Committee,

I am writing to highly recommend Zhang San for admission to your PhD program in AGI research at Tsinghua University.

As Zhang San's doctoral advisor, I have had the pleasure of working with him for the past three years and have been consistently impressed by his intellectual curiosity and dedication to his research. His thesis on AGI has been recognized with the National Outstanding Thesis Award, a testament to the quality and originality of his work. In particular, his contribution to the development of a novel AGI algorithm has garnered attention from researchers in the field and has the potential to significantly advance the state of the art. Zhang San has also published five papers in top-tier journals, establishing himself as a rising star in the field of AGI research.

Despite the challenges and setbacks that are inherent in AGI research, Zhang San has remained committed to his work and has often stayed in the lab long after everyone else has gone home. His dedication to his research has paid off, as he has already achieved significant progress in his work. In particular, he has proposed operational steps towards the realization of AGI, and has successfully implemented the first five steps of his proposed framework.

In addition to his impressive research abilities, Zhang San is a team player and has proven to be a valuable asset to our research group. He is able to work well with others and consistently contributes fresh ideas to ......

中国教授头疼的为学生写推荐信问题,已经完美解决。只要你能列出零星哪怕是散乱的要点,机器就会给你拽成一篇看上去非常 professional 的规范推荐信。有没有问题? 当然可能有。例如明明是要求博士后推荐,它写成了 to your PhD program, 但关键是语言方面的困难都给你搞定了,只要通读一遍把个别词改正一下即可。

写段子

还行吧,这些段子水平不高。但比憋不出来强。

本来写出好段子就是最具挑战性的人类创作活动之一,只要采访几个著名的脱口秀演员就知道其中的甘苦了。很多大火的脱口秀演员,为此绞尽脑汁。台上五分钟,台下无数不眠夜。让人开口笑,并不容易啊。

wow,不知道这是抄袭的,还是“涌现”的,联想一下还真像是个搞笑的段子:

gou (go) 我不会飞,可我很快。
niu 所以我那么大(大妞儿?)

猫猫 miao 或 mao, 耗子 mou,也蛮形象,有声有色的样子。

哈,看来只学会了一个套路:羊/yang (young),所以我害羞。

写情书

ChatGPT 写情书不重样。这是陷入爱河但苦于笨嘴拙舌的人的福音了。

人的爱意,哪怕有套话,也是要表达才行,藏在心里不行。“I love you” 是鹦鹉学舌完全可以做到的,但并不因为是套话而失去其神奇效应。无数的情感矛盾和关系恶化,其实就是缺少了这三个字的表达频度。

但热恋要求更高一点,需要营造浪漫。营造需要形式,而有的人就是不懂形式,不善言辞,不会表达(俗话说,不会来事儿 lol)。你便是真情如海,但羞于表达或表达不出来也没戏。谁愿意与木头谈一场恋爱?

有问,机器代写的情书能有真情吗?这就好比询问:毛笔写的情书能有真情吗?ChatGPT 不过就是个工具,就跟你用毛笔还是钢笔一样。这个工具见识过无数的情书。工具帮助你产生形式,至于真情表白还是虚情假意,那要看使用工具的人了。

顺着这个话题延伸一下,说说 chatGPT 作为文字助手的作用,尤其是对于不善言辞的人。

出口成章的人是少数。见过很多人在一些场合需要应景,却憋不出话来,十分窘迫。现在好了。不知道有没有办法把 ChatGPT 制成一个可以植入的东西,就不说老马说的脑机接口了,只要能让它成为一个隐藏的招之即来,但无人察觉的暗器,也许类似传说中的苹果眼镜,让它编制的应景台词,跟提词器似的,崩到眼镜上,我见人不见。那会是社恐人士多大的福音。

不同程度的社恐据报道是一个相当普遍的困扰,我自己也深受其害:人稍多就哑巴了,插不上话,却要硬着头皮应付。看社交场合如鱼得水的人,知道他们是胡喷,但人家给气氛啊,自己啥贡献也没有,成为社交累赘。有情商的的人,还要照顾你情绪,不时还要引一两句给你,带你玩的意思。ChatGPT 可以改变这一切,让笨嘴拙舌秒变伶牙俐齿,让只懂本行的老专家也能成为百科地保。 

看到一条朋友圈信息: “ChatGPT是中庸主义者的福音,完美地让你泯然众人、符合社会的基本期待。ChatGPT不需要提升生产力(不需要empower人类的语言能力),只需中庸地鹦鹉学舌,帮助人类在其没有表达意愿的场景、完成表达的义务。”

 

 

《AI浪潮: 辛顿的 AI 威胁论与马斯克如出一辙》

前些时候的一条爆炸新闻来自纽约时报:

伊弗里·辛顿 (eoffrey Hinton) 与另外两位所谓的“人工智能教父”一起获得了 2018 年图灵奖,以表彰他们的基础性工作导致了当前人工智能的繁荣,现在他表示自己的一部分对自己一生的工作感到遗憾。根据《纽约时报》对这位 75 岁老人的采访,欣顿最近辞去了在谷歌的工作,以便畅所欲言地谈论人工智能的风险。

“我用通常的借口安慰自己:如果我没有这样做,其他人也会这样做,”已在谷歌工作了十多年的 Hinton 说。“很难看出如何防止坏人利用它做坏事。”

听上去,与原子弹制造者或投放者的反省、懊恼类似。辛顿团队在10年前的深度学习元年在 ImageNet 图像识别大赛中以CNN碾压以前的所有机器学习系统,随后被谷歌请去。他在谷歌的10年,是AI的爆炸性发展的10年。

“正是这项工作最终促成了 ChatGPT 和 Google Bard 的诞生。
这位终身学者在谷歌收购了一家由 Hinton 和他的两名学生创办的公司后加入了谷歌,其中一名学生后来成为 OpenAI 的首席科学家。Hinton 和他的学生开发了一个神经网络,在分析了数千张照片后,它可以自学识别狗、猫和花等常见物体。正是这项工作最终促成了 ChatGPT 和 Google Bard 的诞生。

根据NYT 的采访,Hinton 对谷歌对该技术的管理感到满意,直到微软推出新的 OpenAI 注入的 Bing,挑战谷歌的核心业务并在搜索巨头内部引发“红色代码”反应。Hinton 说,如此激烈的竞争可能无法停止,导致世界上充斥着如此多的虚假图像和文字,以至于没有人能够分辨“什么是真实的”。

但这只是 Hinton 最关心的问题。在更长的时间内,他担心人工智能会消除死记硬背的工作,并可能随着人工智能开始编写和运行自己的代码而消除人类本身。

“这种东西实际上可以变得比人类更聪明的想法——一些人相信了,”欣顿对纽约时报说。“但大多数人认为这还很遥远。我认为这还很遥远。我认为它是 30 到 50 年甚至更长的时间。显然,我不再这么想了。”

就是说,以前以为还有半个世纪的人类反应和防范的时间,可是显然所有人都没有想到科技发展的加速度涌现。所以:

1. 我们已经进入真假莫辨的时代,但人类没有准备好如何应对;

2. 人类飞蛾扑火似地加速AI进程,生产力的提升和资本的回报所带来的兴奋和诱惑不可抵挡。

怪就怪当年辛顿用CNN炸平ImageNet后,突然有了商业算计,搞什么竞标拍卖,于是率团投入谷歌。要是随了百度(第一个追求者),何至于今日。没有谷歌,就不会有 Open AI;没有Open AI,就不会有 chat;没有chat,人类社会就依然是 good old days。

鲁老师说,嗯,这个思维链是没问题的。lol

马少平老师说,辛顿凡尔赛。

没见过这么巨大的凡尔赛了,绝对创迪尼斯纪录,而且后无来者。人家也有这个底气和资格,千年不遇。他这一来,对于AI威胁的社会警醒,秒杀老马的呼吁,以及那封成千上万名人的公开信。名人效应的极化表现。

世界上唯一可以更加“凡尔赛”的事件想来只能是爱因斯坦了,如果老爱生前高调表示自己后悔发现了质能方程 E=mc²,因为它促成了原子弹。

我当时说,估计还会有后戏。果然,最近,辛顿有一个长篇访谈: 人类可能只是AI演化过程中的一个过渡阶段。这与马斯克的说的“人类可能只是硅基生命体的引导程序”如出一辙。这两位毫无疑问是AI威胁论的最有影响力的呼吁者。

辛顿:如果你看看这些大型语言模型,它们有大约一万亿个连接,像GPT-4这样的东西知道的比我们多得多,它们具有关于所有事物的常识性知识,它们可能比一个人知道的多1000倍。

但是它们只有一万亿个连接,而我们有100万亿个连接,所以它们比我们更擅长将大量知识放入仅一万亿个连接中。

我认为这是因为反向传播可能是比我们拥有的更好的学习算法。

这是可怕的。

纯粹从数字看,辛顿说,

1. 已知 GPT4 比我们人类的知识量多了三个量级(千倍)

感觉上这是保守的估计,assuming 作为个体的人,甭管什么专家。

2. 人类大脑的神经元比 GPT4 数量高了两个量级

这种类比合理与否存疑。是不是 apples to apples,另外,人类很多神经元并不直接参与智能工作。等等。

3. 结论:(算法)原理上,back prop (反向传播) 比人类的内部学习机制(天知道是什么)更加高效。

主要是说,电脑比人脑聪明。

辛顿花了很长时间解释反向传播(back prop)算法,试图用中学生能听懂的语言解释,感觉是很好的大师科普(让人想起小时候爱看的华罗庚给中学生普及的数学原理):

主持人:

在谈论GPT-4的前景之前,让我们回顾一下反向传播,以便我们都理解你提出的论点,并告诉我们反向传播是什么。这是一个算法,你在1980年代与几位同事一起开发的

Hinton:

许多不同的小组都发现了反向传播,我们做的特别之处在于使用它,并表明它可以发展出良好的内部表示。有趣的是,我们是通过实现一个很小的语言模型来做到这一点的。它的嵌入向量只有6个组件,训练集有112个案例。大约10年后,Yoshua 使用基本相同的网络处理自然语言。如果使网络变得更大,它实际上应该适用于自然语言。

反向传播的工作原理,我可以为您提供一个简单的解释,知道它如何工作的人可以得意的坐下来,嘲笑我提出的解释方式,好吗?因为我有点担心它不够好。(观众笑)

想象一下,你想要在图像中检测鸟类,所以在图像上,假设它是100像素×100像素的图像,那是10,000个像素,每个像素有3个通道,红绿蓝,那是30,000个数字。计算机视觉问题是如何将这30,000个数字转换为是否存在鸟类的决策,人们试图长时间做到这一点,但他们做得不是很好。

这里有一个建议,你可能会有一层特征检测器,检测图像中的非常简单特征,比如边缘。所以一个特征检测器可能有很大的正权重对应一列像素,然后对邻近的一列像素有很大的负权重,所以如果两列都很亮,它就不会启动;如果两列都很暗,它也不会启动,但如果一侧的列很亮,而另一侧的列很暗,它会非常兴奋,那就是边缘检测器。

我刚刚告诉你如何手动连接一个边缘检测器。我们可以想象一个(神经网络)有大量的类似检测器检测不同方向和不同尺度的边缘来覆盖整个图像,我们需要(检测)相当多的数量。

主持人:

你是指线条,例如一个形状的边缘。

Hinton:

从亮到暗的地方变化的地方。嗯,就是那样。

然后我们可能在上面有一层检测边缘组合的特征检测器,例如,我们可能有一个检测两个边缘以尖锐角连接的特征检测器。如果这两个边缘同时出现,它会变得兴奋,那将检测到可能是鸟嘴的东西,也可能不是;在那一层,还可能有一个特征检测器检测到一圈边缘,那可能是鸟的眼睛,可能是各种其他东西,可能是冰箱上的旋钮之类的东西;然后在第三层,你可能有一个未来检测器,检测潜在的鸟嘴和潜在的眼睛并连接起来。继续这样连接,最终可能会有一个检测到鸟类的东西。

然而,手动连接所有这些内容将非常困难,决定应该连接什么权重应该是多少,尤其困难,因为你希望这些中间层不仅适用于检测鸟类,还适用于检测各种其他事物。所以这几乎不可能手动实现。

反向传播的作用是从随机权重开始,这些特征检测器完全是垃圾(不真也不能用)。然后你放进一张鸟的图片,输出可能是0.5表示是鸟(假设你只有鸟和非鸟)。接下来,你需要改变网络中的每个权重,让它不再说0.5,而是说0.501表示是鸟,0.499表示不是鸟。你需要改变权重的方向,使得更可能说鸟是鸟,更不可能说非鸟是鸟。这就是反向传播的原理。

反向传播实际上是如何消除差距,在你想要的(也就是概率1表示是鸟)和现在得到的(也许是0.5)表示是鸟之间。如何消除这个差距,把它反向传播到网络,这样你就可以计算网络中每个特征检测器,你希望它更活跃还是更不活跃。一旦你计算出来,如果你知道你想要一个特征检测器更活跃一些,你可以增加权重,来自特征检测器的权重,并也许加入一些负权重到特征检测器。这样,你就有了一个更好的检测器。

所以反向传播就是反向遍历网络,找出每个特征检测器,你是否希望它更活跃一点,还是更不活跃一点。

back prop 实在太关键了,是深度革命的命根子,是LLM智能的学习机理,值得反复科普。

辛顿的下一个论证,说的是为什么AI可怕。

简单说,就是模型可以复制,而人脑不可以复制:一个师傅要培养出一个同等知识的徒弟需要经过漫长的教育过程。辛顿论证说,LLM 可以复制任意份,每个 LLM 可以去根据不同领域的更多的数据做微调(他没说是 fine tune,但从复制的基础模型的源头以及会改变模型权重看,他指的是 fine tune,而不是随学随忘的 in context learning)。

这些被微调了的不同专家模型可以有效沟通,只要不发生直接冲突,他们所学到的新的专业知识(新的模型权重)可以互通有无,最后形成更超级的大脑模型。辛顿论证的这最后一步,也许我孤陋寡闻,没见这种有效沟通成为更强模型的学术报道。但他这么说,觉得应该相信他。

可复制,可融合。有了这两条的 AI 演进,于是人类面临一个完全超出我们想象和理解的可以野蛮发展的新的智能形态。

它们可以学到更多的东西。以一个医生为例,想象一下,有一个医生,他已经看了1000名患者,另一个医生已经看了1亿名患者,你会期望,第二个医生如果没有太健忘,他可能已经注意到了数据中的各种趋势,而这些趋势在只看过1000名患者的情况下是看不到的。

第一个医生可能只看过一个罕见病患者,另一个看过1亿患者的医生已经看过很多这样的患者,所以他会看到一些规律,这些规律在小数据中是看不到的。

这就是为什么,能够处理大量数据的东西可能看到的数据结构,我们永远看不到。

这就是我们以前议论过的情形:在超大数据超大模型中,原来的小数据不再稀疏,因此可以“涌现”出新能力、新知识。

接下来,辛顿举的下面这个例子我觉得并不牢靠、鲁棒(完全可以从非严格常识推理的其他角度解释他列举的案例)。不过,他所感受到的 GPT有时候让人惊掉下巴的推理能力,我们都曾在不同的案例中感受过多次,虽然并不是每一次都经得起严格检验,但这种感觉是真实的、普遍的。

主持人:

那么,给一个我应该对此感到恐惧的点?

Hinton:

好吧。请看看GPT-4,它已经能够进行简单的推理。我明白推理是我们人类的强项,然而,GPT-4在几天前展示出的表现使我感到震惊。它完成了我认为不可能的常识性推理。

我问它,我想要我房子里的所有房间都是白色的,目前有一些白色房间,一些蓝色房间和一些黄色房间,黄色油漆在一年内会褪成白色。那么,如果我想要两年后所有的房间都变成白色,我应该怎么做呢?

它回答说,你应该把蓝色的房间漆成黄色。尽管这不是直观的解决方案,但它是正确的。这相当令人印象深刻。

这种常识性推理,用符号AI很难实现,因为它必须理解什么是褪色,它必须理解时间问题。所以,它们在做一种合理的推理,智商大概是80或90左右。

正如我的一个朋友说的,这就好像基因工程师声称,我们要改进灰熊,我们已经把它们的智商提高到65了,现在它们能说英语了,而且在各种方面都非常有用,但我们认为我们可以把智商提高到210。


主持人:

我有过,相信很多人也有过类似的感觉:与这些最新的聊天机器人互动时,脖子后面的头发会竖起,有一种奇怪的感觉。

但当我感到不舒服时,我只需关闭我的笔记本电脑。。。

辛顿说:“政治系统如此破碎,以至于我们甚至不能决定不给那些十几岁的男孩攻击性武器。如果你不能解决那个问题,你如何解决这个问题?”

说的是美国的枪支泛滥,到了几乎每两天就有一次滥杀无辜的恶性案件出现,而政治家无所作为。这种德行的人类社会,我们还敢指望它能应对AI威胁吗?在这样的人类世界,辛顿的警钟是:

“我不认为我们会停止发展它们,因为它们非常有用。它们在医学和其他方面都非常有用。所以,我不认为有什么机会阻止发展。我们想要的是某种方法,确保即使它们比我们聪明,它们会做对我们有益的事情。这就是所谓的对齐问题。

但我们需要在一个有恶意行为者的世界里尝试这样做。他们想要制造杀人的机器人士兵。对我来说,这似乎非常困难。”

技术是中性的,很多人拿技术做好事,但怎么防止坏蛋拿技术做坏事呢,例如制造机器人士兵。

辛顿的最后结论,与马斯克完全一致。这很有趣,不是简单的英雄所见略同。辛顿是这场AI技术革命的源头,是最有资格从技术角度看人类命运问题的人选。马斯克本来是局外人,他对于技术的了解跟我们一般人本质上无区别。当我们上升到人类命运的角度,当技术必须从哲学或更广的视角去审视的时候,山内人与山外人所见完全相同,这是辛顿受了马斯克影响呢,还是辛顿受了马斯克影响呢?lol

从时间线条的唯一性上看,只能是深度学习之父受到了一个技术商人的影响,而不是相反。我不大相信,这是辛顿独立发展出来的AI威胁论。更可能的是,老马发表“高论”后,辛顿开始是持怀疑态度的。随着LLMs的推进,尤其是 GPTs 系列的发布,特别是 GPT4 的出现,辛顿开始接受,并信服了老马的观点。然后他开始从技术角度做“权威”阐述。

老马的高论中最著名的比喻以前说过,他把在超级智能面前的人类比做蚂蚁,说:超级智能对于人类不必有恶意,他们对人类没有恶意,但这并不妨碍他们消灭人类。因为根本就不需要恶意,只要人类在超级智能的实现目的的路上挡道了,就好比人类在开一条路的时候遭遇了蚂蚁,我们并不需要对于蚂蚁的恶意,我们会不眨眼睛就把挡道蚂蚁铲平。

人类其实就是蚂蚁。

辛顿在比喻中,异曲同工,他一再把人类比做两岁的儿童,把超级智能比做成年人。一个成人操纵一个两岁儿童,太容易了。比如你给儿童两个选择,儿童的智商是不会想到还有第三种选择的。

在野蛮发展的LLMs面前,人类就是这么可怜。

我以前觉得这种AI威胁论有耸人听闻之嫌,但也找不到对此的有力反驳。起码,在我们难以想象的加速度发展的AI智能面前,人类如何自处,始终是一个很难想象的挑战。

外一篇 斯坦福五月7日记

有朋自远方来,天气好。下了几天雨,今日转晴,不热不冷。

与黄老师一路辩LLM哲学,@梁焰 从旁添油加火,时有妙语内插(interpolation), 警句外推(extrapolation),人智涌现,不亦乐乎,此斯坦福之记也。

我们的共识是:人与机器肯定不同,但机器从表现上无限接近于人。

黄老师坚持,只要机器不是人,就肯定会有软肋人类可抓。窃以为并非如是简单,例如, LLM 无以离散符号程序化,无论步骤几何,非透明逻辑可解。人类乃逻辑生物,既如此无知,何来抓其软肋,人类胜机器之一筹?是故辛顿与老马之忧似非空穴来风。

我故信人之异于机器者几希,莫名某点而已。盖因面片咸为AGI侵蚀殆尽,创造性几近失守,自主性面临夹击,鲜能辨其异何在。黄老师言,人与机器本质不同,机器纵为悟空,亦跳不脱人类如来之手心。(听上去类似马云的论调?) 

思辩乘兴而起,兴未尽而暂停,无解而终,复归俗世。

是日也,天不高而气爽,人不多而闲散。绿草成茵,白塔耸立,三五儿童,嬉戏其间,现代伊甸园之乐也。今日何日,LLM有知乎?GPT4 奈何之?

唯愿此景长存,杞人忧天。

令 ChatGPT4 将以上文白夹杂日记改写为文言,得文如下:

 

 

 

【相关】

AI教父最新MIT万字访谈: 人类可能只是AI演化过程中的一个过渡阶段

【AI 浪潮:GPT-4 的上下文逻辑与常识还是不够稳固】

 

先问GPT4一道不大不小的烧脑题。

这一段链条中断链的地方在 “小船空着返回,这不算一次过河”。什么算过河,什么不算过河,这牵涉到常识。具体说就是:

常识-1:人过河具有方向性,必须到达彼岸才算过河(成功)。

结论:从彼岸返回虽然技术上也跨越了河床,符合过河的字面意义,但因为是逆方向,不能算过河。
常识-2:过河必须有实体,无论实体是开船的还是坐船的。

结论:空着返回没有实体,不能算过河,这也是对的。

所以,“小船空着返回,这不算一次过河” 符合两个常识,是合理的。这里问题不出在算不算过河,而是出在“空着返回”的可行性上:没有实体开船,船是怎么返回的呢?加上一个预设前提就正确了:自动驾驶。但是默认是没有自动驾驶的。常识告诉我们,非默认的预设是必须显式表明的,必须作为此题的一个前提。

这里的看点是,GPT4 貌似一点就透,这悟性了得。

好像是丝丝入扣,对答如流啊。且慢。

这个加强了的提问(所谓提示词工程)有意思,就是说 prompt 写得细致的话,是会激发它加深思索的深度和逻辑性,不必经过数轮对话引导就可能绕过陷阱(当小船返回时,它需要携带至少1个人来驾驶)。但是结论却不对,那是因为它违背了常识-1,把返回也算成过河了。

咱们继续练它。

ChatGPT4 与ChatGPT3.5类似,也同样不能坚持原则,坚持真理。这其实是与人类偏好对齐工作做过头了的后果(偏好之一其实是迎合人类,礼貌顺从),而不是它的本性。

总结一下,从对话角度,ChatGPT4 的确不掉链子,你怎么引导,它怎么 follow。但从逻辑角度和常识角度,你点一下它,它貌似悟性很好,很快就改正,并顺着你的指引,进一步发挥。但这些 in context 学到的知识和逻辑并不稳定,很快就动摇了,有时候甚至颠三倒四,转眼就忘。

 

 

AI浪潮博客目录

【AI 浪潮:自主性是人类智能的最后堡垒吗】

 

听到一个新成语:日新昼异,脱胎于日新月异,形容这个LLM世界变化之快,此言不虚。例如,AutoGPT 出来不久,AgentGPT 又出来了,二者都是在LLM上再包了一层“自主”计划的AI。

这个称为自主AI(autonomous AI)的研发方向很诱人:用户只要启动一个目标(人定义 what),模型们就开始计划实现这个目标(机器做 how):首先是拆解这个目标任务成为子任务,子任务成为子子任务,然后用这些子子任务递归调用 chatGPT 去得到中间结果,最后把结果层层推进,最后组装起来,完成目标。看机器边想边干(think then act),不亦乐乎。听上去有些匪夷所思,仿佛机器能够自主完成任务的全过程了,而不是需要人通过对话或编程一步步引导模型去实现目标。

自主AI更加接近科幻小说中的“回形针”陷阱:科幻中说的是机器一旦具有自主计划的能力,为了自主实现一个目标,例如“制造尽可能多的回形针”,机器就会不惜一切手段达成目标。而人类面对这样一个自主实现目标的机器,很可能陷于灭顶之灾,因为人类有可能成为这种目标的障碍物而被机器铲除。现在的实现当然还是小菜,粗糙得很,但这个方向是机器“自主”的前奏。不知道老马会不会把这种研究当成是 危险AI 的范围,要求予以封杀。

AgentGPT 有个类似于 ChatGPT 的友好页面:https://agentgpt.reworkd.ai/

我尝试给它一个“编写童话故事”的目标。

看着它在那里think...think..., 做任务分解,“无人监督下” 自个儿在那里忙活,一步步按照计划走,感觉很神奇。揉揉眼睛,确认不是在做梦。

Embarking on a new goal:请汇编一本适合儿童的童话故事手册,选择国内外的童话名篇,所围绕的主题词包括:善良,勤劳,怜悯,乐观。
Thinking...(Restart if this takes more than 30 seconds)
Added task:Scrape and gather a list of popular domestic and international fairy tales
.........

煞有介事,各种策划,让人开眼了。

看看最近退出来的这一长串的相关工具:HuggingGPT / AutoGPT / AgentGPT / GPT4ALL / BabyAGI / MS Jarvis / ChaosGPT / .............,每天都在增长的这个清单中的 keywords 是: agent,action。action 是行动,agent 怎么翻译好?常规翻译是施事(采取行动的实体),或代理人或代理机构,就好像律师代理客户一样,客户只给目标,律师代理决策和行动的过程去实现目标。什么意思?就是 ChatGPT 带来的风暴,越来越激发人们把科幻似的机器人想象带到可实际操作的空间。

什么是科幻中最热衷的机器人故事(之一)?那就是机器人造反,灭了人类。造反的事情能够发生,其前提条件是: 自主决策,可以行动,这与几千年前的陈胜吴广起义也没什么两样。陈胜吴广先密谋,后行动(序列是利用绝境危机 -- 无论如何必然被处死,假托天意组织动员,然后是正式起义)。

为什么这种匪夷所思的科幻情节突然在这个当口开始了工程化的尝试和涌现呢?一个关键的因素是,ChatGPT 之前,从来没有一个可以协调各种实体的通用的“语言”,幻想只能止于幻想,工程无可施展。更大的挑战是缺乏自主性的实现路径,所有的AI都是按照人类(码农)事先编制好的程序走。Chat 改变了前者;GPT 改变了后者。

GPT 是如何导致自主性(或“类自主性”)的,从而机器可以成为自我策划和行动的 agent?现在看来其实很粗糙,但的确可以产生一种让人觉得它自(作)主(张)的感觉。原理就是 GPT 的随机性。

没有随机性,那么一切都是 deterministic,预先决定好的路径,也就谈不上自主。GPT 的好处是它的本性就是随机(生成)。但万变不离其宗。这个就厉害了。随机如果发散,那就谈不上计划和实施。

随机必须遵循目标指向,万变不离其宗的“宗”就是宗旨或目标。目标函数不变(这个是人类赋予代理的),具体过程和路径随机应变,这才是 agent 的本义。作为所有实体的主人,人类关心的也就是目标。

微观层面,GPT 的 next token prediction 就是万变不离其宗的缩影,每个 next token 都有随机性。但所有的生成都在目标生成的空间里,例如你让它翻一句话,它每次翻译可能是不同的文字序列,但你会发现,不仅每一个翻译字通句顺,而且意义基本不变。从模型微观的“基因”上的可控随机到宏观上的 agent,这里面需要一个粘合剂,这就是 ChatGPT,用到的也就是人机接口、机机接口的最重要的媒介 -- natural language prompts(自然语言提示),这些进展既让人兴奋 刺激,也让人细思有恐。

其实,最近这些框架下 agent 表现出来的自主性,微观层面就是 ntp(next token prediction)的随机性,宏观层面实际上是由于大模型消化了人类的知识和经验(的数据表述),所以 ChatGPT 可以利用大模型在现有目标的指引下,随机选取一种经验路径。这时候的随机性表现在系统给自己的每一个分解子任务的完成设置了时间限度,尝试不成功就会转向另一个路径。任务分解这种策略型的设计看上去是“自主”的,但实际上也是从大模型中得到的人类经验套路。可是,反过来看人类的决策,人类所谓的自主性就是自己做主么?

这与哲学界一直在辩论的“自由意志”类似,自由意志自由么?正方认为是自由的,所以一个人要为自己的选择负责:对了有回报,错了有惩罚,甚至入罪坐牢。反方认为其实是不自由的,我们每个人表面上看起来的自由意志,其实冥冥之中有命数,这个命数有一个人从父母身上带来的基因的作用,也有后天的生存环境(包括有意无意的在家庭、学校和社会的熏陶和被教育)的影响,真正属于那个人自己能决定的空间其实很小很小。(这个理论推向极端就是所有罪犯都是病人,应该治病,而不是惩罚,更不是肉体消灭。)

回到 LLM 为中心的 agent,这个 agent 的自主性利用的是大模型(蕴含的人类经验)。而人的“自主性”其实很大程度上也是建立在对于人类既往经验知识的学习或被教育的基础之上。这个意义上,自主性的神秘感消失了,就跟创造性的神秘感早已消失一样,很难以自主性作为人之区别于机器的最后灵性堡垒。A(G)I 的圈对于 humanity (人类特性)的领地在进一步挤压中,以至于除了碳基的生命特征(生物性状:例如 喜怒哀乐相伴的血压升高、荷尔蒙分泌等)硅基实体无法跨越以外,几乎所有的智能和灵性的表现都已经不再构成支持人作为万物之灵独特存在的不可动摇的论据了。

创造性和自主性的被冲击,是 LLMs 给我们带来的最大心灵震撼之一。我们曾经多么迷信这些人类特质。

从此,我也许不再像以前那样仰望智者和艺人,因为山外有山,人外有模型。更值得仰慕的是那些平凡的人表现出来的善良和感情(良心及其善举),也许这些表现而不是人类智能才构成了 LLMs 的真正挑战?(当然,这也不能深想:第一,机器也可以模拟善心和善举,倾听你,同情你,给你帮助和疏导,不见得比人差;第二,“良心”到底有多大比例植根于生物特质,多大比例受到人类经验知识的影响,也很难说。)

 

 

AI浪潮博客目录

 

快讯:腾讯科技AI未来指北系列 今天直播间与鲁总唠一唠大模型(LLM)

https://view.inews.qq.com/a/RLV2023042100143500?openid=o04IBAOB4T30mPQknm5XFPoX63gU&key=&version=28002259&devicetype=android-31&wuid=oDdoCtyMntVVLyLfpVT-VJVNBcaU&sharer=o04IBAOB4T30mPQknm5XFPoX63gU&uid=&shareto=&openwith=wxmessage

这是今天LLMs纵论LLM的直播地址 周日北京时间上午10点 美国西部时间晚上6点(东部时间夜9点) 亲们不见不散。

北京时间周日上午10点,@Wei-Min Lu/MoPaaS 鲁总逗哏 我捧哏,再唠一唠劳碌命(LLM)。

现如今,专家遍地走,各种访谈早就轰炸疲劳了,既不少咱一份,也不多咱一块。好在鲁总是老友,就算唠唠嗑吧,愿者上钩。上次源码还有我的母校各拉我讲过一次,但都是内部组织,不得尽兴,而且有些看法也来不及沉淀和更新:这个领域发展是太快了。倚老卖老,希望能带来一些启发。

LLM202304tengxun (这是老 slides 算是个开场白铺垫)

 

AI浪潮博客目录

 

ChatGPT海啸狂飙,谁将被取代?谁将借力跃升?

AIGC“尖峰系列”丨李维博士:ChatGPT海啸狂飙,谁将被取代?谁将借力跃升?

2023/03/10

在上一篇文章

《AIGC“尖峰系列”丨李维博士:人类语言“通天塔”建成,ChatGPT的辉煌与挑战》

中,我们分享了李维博士关于ChatGPT对于人类和机器交互的意义,以及其背后LLM(Large Language Model)语言大模型是如何炼成的等话题。

本篇文章我们将分享李维博士对于“ChatGPT让AI生态重新洗牌”“语言大模型(LLM)的生态和应用”等话题的独到观点,以下为演讲内容精选。

01

经历ChatGPT海啸之后

AI生态面临洗礼和洗牌

ChatGPT海啸引发的直接影响就是,NLP生态面临全面洗礼或洗牌,每一个现存的NLP产品服务或赛道都要在LLM参照系下重新审视。

一开始我们内部AI老友热议ChatGPT的时候,大家首先思考的是,ChatGPT怎么和搜索技术结合起来,它能颠覆搜索吗?

搜索是可追踪的,返回的每条结果都有记录,谈不上信息融合。ChatGPT是不可追踪的,长于信息融合:ChatGPT本质上不存在抄袭的可能性,它给你吐出来的每句话,都是自己消化之后的语言。可见,传统搜索与ChatGPT是两个完全不同的处理方式,各有优缺点。

搜索是信息服务之王,无处不在,有自己的巨头(谷歌,还有中国的百度)和非常稳定的商业模式。自从Web1.0时代搜索崛起以来,搜索的形态和模式基本没有改变,二十多年了。其实,多年来一直不断有新技术和创业者企图挑战搜索,风险投资界也一直关注可能成为“next Google”的潜在的搜索颠覆者,但搜索的地位一直固若金汤。但这一次有所不同,微软携ChatGPT的独家代码授权,大刀阔斧高调发布所谓“new Bing”。躺着赚钱的谷歌不得不紧急动员,正面迎战。一场搜索+LLM的大戏正在上演,像个活话剧,告诉我们虽然融合两项技术还有很多困难需要克服,但大势所趋,重塑搜索新生态势在必行。

除了搜索,那些被打磨得很圆的定向信息产品和服务,现在全部面临被重新审视和洗礼的宿命,包括聊天、功能对话、文法纠错、机器翻译、文摘、知识问答等等,这些方面的代表作品(Siri、小冰、Gramnarly等)以前曾有的技术护栏,一下子被降低了,真好像大水冲了龙王庙。

NLP龙王庙中,虽然不少产品由于多年的打磨以及用户的惰性,还不至于面临灭顶之灾,有的还可能存续很长时间,毕竟都在走下坡的路。这是通用AI对于传统AI的划时代胜利。是我们以前不敢相信的,曾经那么地怀疑通用路线,就等着看鼓吹AGI人的笑话,谁想到人家不笑则已,一笑倾城,甚至“倾国倾球”,所向披靡。

看看13年前苹果就发布的Siri。13年比深度学习革命黄金十年的历史还要长,但搞到现在Siri才刚刚推出两轮或者三轮的对话能力。现在来了个ChatGPT降维打击,苹果怎么办?肯定只有拥抱LLM。亚马逊的风云产品Alexa也是一样,也打磨了好几年了,积累了那么多的用户数据。虽然它在边边角磨得很圆,不可能马上被取代,但依然会面临技术上的调整。

再者是大家常见的电商客服,众所周知,无论是阿里、还是京东的在线售后客服都打磨得很圆了。因为售后服务的问题相对比较集中,问题集不大,在积累了足够数据以后,用户体验就慢慢好起来了。但客服不仅仅局限于售后的问题答复,当客户提出的问题超越了预期的问题集的时候,目前客服常常显得“人工智障”,无论理解和回应都捉襟见肘。面对ChatGPT的问答超能力和多轮对话的丝滑性,怎么办?除了拥抱它,没有别的出路。

在ChatGPT之前,小冰算是把多轮聊天推到了极致,据报道有人痴迷于与她聊天,聊一个晚上还意犹未尽。它打造具有人格化的形象,可以与人做情感上的交流。在前ChatGPT时代,小冰是聊天的绝对天花板,多轮交互的能力把对手远远抛在后面。谁料想半路杀出个程咬金,ChatGPT出来后,小冰的地位就显得非常尴尬。ChatGPT可不是为了闲聊设计的,chat只是它为了达到多任务的一个桥梁,本质上是人机接口,聊天只是它的副产品,即便如此,通用大模型还是实现了降维横扫定向产品的效果。在ChatGPT的丝滑度和通用性面前,一个人格化的聊天机器人跟它不在一个层次上。除了去拥抱它,仍别无他法。

在国外,怎么修改作文的拼写、语法错误这一块,用户体验做得最好,唯一活下来站稳市场的只有Grammarly,有上亿用户了。现在它的地位也极为尴尬,因为同样的辅助写作,ChatGPT也是拿手好戏。长远一点来看,Grammarly的选择也终将如此,要么去拥抱ChatGPT,要么就走向末路。

谷歌MT是机器翻译领域的代表,国内的有道、搜狗和百度也是用的神经机器翻译,但同属神经路线的ChatGPT出来以后,仍然是一种降维打击。用ChatGPT去做机器翻译,译文更加地道而且多样化。生成大模型的随机本性使得每次翻译出来的结果都有所不同,你可以拿同一个文本不断的试它,然后挑其中一个你最满意的。专项机器翻译系统显然面临如何拥抱LLM的问题。

最后谈谈教育。ChatGPT大模型降维碾压所有的教育产品,是很显然的。在教育赛道,搞生态产品应用的人,都需要在大模型的框架下重新审视一遍怎样拥抱这个LLM新时代。教育本身是跟语言打交道的,无论文理。虽然现在的大模型理工科能力不怎么强,但这个知识短板应该很快就会得到不同程度的弥补。ChatGPT必然对教育带来颠覆,同时也为教育现代化提供了一个最大的机遇。语言学习与电脑编程教育就不用说了,ChatGPT本身就是一个语言大模型。虽然目前它的编程还不到专业工程师的水平,但是常用的代码形式已经学得很好了,至少它能辅助你的编程,实际上,GPT赋能的Co-pilot已经成为越来越多码农的辅助工具了。

往后退一步,我们同时也面临着一个巨大的风险,比如说假新闻。如果你希望吹捧一家公司,你可以让ChatGPT生成出五花八门的软文来,讲得头头是道。那些大众点评将来也会被真假莫辨的评论所掩盖,因为制造假新闻的成本趋近于零。如果没有很好的防范措施,这一切就会把人类置于真假莫辨的世界之中。我们现在一直在讲它的好处,LLM怎样赋能新生态,相信在新生态下,今后的五到十年一定会出现新的阿里、百度等等,这是从发展的角度看技术生态的大转变。但我们面对的LLM滥用的危险同样巨大,人类准备好了吗?显然还没有。当然,这是另一个话题,我们这里就点到为止。

02

大模型:万众创业的浪潮正在到来

以ChatGPT为巅峰的LLM好比核弹,有了它,还有更多的产品形态和赛道等待创业者开拓和落地。

关于这个话题,我们需要特别强调ChatGPT带来的前所未有的创业条件:ChatGPT本身已经成为一个产品的试验场,它就是一个门槛无限低、人人可玩的playground(游乐园)。门槛低是因为前面提到的人机接口的范式改变(paradigm shift)。AI历史上第一次,机器开始迁就人,而不是人迁就机器。是人类语言,而不是计算机代码成为人机交互的工具,这个改变对于NLP新生态大爆发的意义,怎么强调也不过分。实际上,这是为“万众创业”提供了条件。

AI创过业的人应该都有这个体会。创业团队要有成功的机会,最基本的一条是产品老总与技术老总能够密切配合和沟通。产品老总凭着自己的市场直觉和对于客户需求的了解,努力寻找技术转化为服务的最佳市场切入角度,形成产品的设计方案。这个设计方案的可行性需要技术老总来验证和背书。然而,很多时候,由于不同的专业背景和知识结构,产品老总与技术老总鸡同鸭讲的情况也不罕见,一旦出现这种情况,这个创业公司基本上注定没戏。

ChatGPT根本上杜绝了鸡同鸭讲的问题。以前只有技术老总和码农可以验证一个方案的可行性,现在好了,产品老总/CXO、工程技术人员、数据分析员、用户这些不同背景和专长的人,都有一个统一的平台ChatGPT,可以交流产品的创意。大家可以在上面去做模拟的服务。不仅是人机之间,而且人类之间的交流障碍都被克服了。这个东西的发生,就是一个产品大爆发和万众创业的先机条件。

在美国,有好几百家初创公司,现在跟着大模型去做,你上游的大模型还没有完全理顺,他们在下游做的东西就是正在进行时了。还有无数的普通大众,不断的在网上现身说法,告诉大家如何两三个小时就能利用ChatGPT赚到5000块钱,这一类分享越来越多,这意味着草根群众的创业积极性被调动起来了。每个人似乎都可以利用这个机会去找到一个创业视角。归纳总结这些草根的创意,也可能找到可以流程化规模化的满足市场需求的信息服务的新赛道。

ChatGPT这样的大模型最终是一种操作系统级别的存在,每一个与AI有关的,特别是语言和知识有关的信息产品和服务,都离不开它。当年英特尔主导的时候,那个著名的logo是Intel Inside,将来就是Chat-Inside,这还不够准确,应该叫Chat-In&Out。怎么讲?ChatGPT这样的大模型赋能产品的时候,它既是服务员也是大厨,服务员可以跟你接单子,对话交互,了解需求,同时,它还自己去做工,满足你的信息需求,交付也还是它。既有表又有里,既用到它的语言天才,也要用它的知识技能。

这就是我说的在未来的五年可能是最大发展的一个新生态形式,叫做LLM专家坐台,它或许会打开了无数的创业大门。基本的服务形态就是各行各业的在线信息服务,不管是在线教育、在线律师、在线顾问、在线金融、在线旅游,都是奔着大幅度提高服务的效率去的。有了ChatGPT之后,你只需要雇一个专家,来代替以前需要10个专家甚至100个专家才能应对的任务,最后迎来的就是生产力大爆发。

至此,应用生态很清晰了,也靠谱。原则就是对结果要专家最后把关(human judge as final filter)。这是最基本的设置,当然也不排除专家对于输入做提示词的调配,以便激发LLM回应更好的结果。

对几乎每一个场景应用,都有一个打造专家工作台(“坐台”)的任务。下游创业沿着这个思路去,有无数切入市场的机会,包括补充现有产品或服务的不足,例如在线教育的每一个细分场景,还有在线医生,在线律师,在线金融咨询,等等,也包括去开拓以前不敢想或没想到的业务场景。这是看得见的即将发生的生态形态的大变革,或重新洗牌,提供的是高效专家建议(expert-in-loop services)。

说到坐台,国内电商大厂都曾经打造过有相当规模的客服坐台,那是在用户需求和满意度无法用全自动方案满足,更无法用全人工应对的压力下出台的。现在有了LLM,继承这种形态推广到所有在线服务领域的条件已经成熟。这件事所能带来的生产率大爆发,超出想象。

“Human as judge”的设计理念在近几年的低代码平台(例如RPA平台、parser-enabed信息抽取平台等)已经验证了其有效性和有效率性。我的最新几个专利就专门讲的这个过程(human as judge to replace human as coder),但这是说的低代码快速开发环境,这个human虽然不必要手工写代码,但还是要熟悉软件开发的流程,例如单元测试、回归测试和debug等等,不是仅仅就做个judge。这里说的是全新的形态,human只需要做judge即可完成服务。现在完全有可能打造针对各种细分赛道或场景的在线信息服务“坐台”。具体说,专家的作用只是在最终go or no-go 的当口,以他的知识和经验做出判定。做裁判比做运动员,效率要高太多了。

值得强调的是,这次ChatGPT横空出世带来的新鲜事儿是,ChatGPT既是后台也坐前台。这就好比找对象娶媳妇,通常都是漂亮的见识短,能干的不漂亮。突然来了一位既“万能”又漂亮的,这无法不激发无数追求者的想象极限。我们信息产业的创业者就是ChatGPT的追求者。上得厅堂下得厨房,说的就是ChatGPT,这是因为chat只是ChatGPT的表,本质是人机接口,而能够完成NLP各种任务才是它的里子。有表有里,就可以围绕它建立下游生态的产品或服务。英特尔时代,电脑产品的品牌广告记得是Intel inside,今后的新生态应该叫chat in&out,指的就是LLM赋能的新生态,不仅赋能人机交互的表面,同等重要的,或者更重要的(看具体落地服务的性质了),是也赋能产品服务的内涵,只是要让专家最后把个关。在这种形态下,专家也还是隐身在台后的。就是说,活交给它做,出面交付也还是它,只是后面安插一个专家督导和裁决而已。再打个比方,LLM既是服务员也是大厨,只是出餐前需要一个经理过一下目,为服务质量把关,也承担责任(例如在线医生、在线律师、在线咨询师等)。

在这样的生态下,今后5年会是在线服务的大爆发时期。赶巧的是,三年疫情也极大推动了在线服务的草根意识(awarenss),帮助养成了用户的在线习惯,培育了市场。例如我个人疫情前从来不用外卖的apps,也不用在线医生,可是现在二者都用了,比以前自己到餐馆点外卖,为个伤风感冒自己去预约诊所,不知道方便了多少,再也不想回到以前的低效率线下服务了。天时地利,借着这个东风,新生态不可能没有机会。

怎样建造坐台?既然已经LLM in&out了,听上去好像这个坐台谁都可以建,每个坐台配上专家,明天就可以在线开业服务了,那还有创业者什么事儿?当然不是这么简单。这是因为ChatGPT这样的LLM作为工作引擎(work horse),显示出各种专业知识的潜力,但这种潜力却是漏洞百出、有内伤的。这些内伤前面论过,按照现在的路线是不可根治的。就是说,表面光,里子并不扎实,结果不可靠,甚至会要人命的。坐台的建设就是要试图解决这个问题:如何加强内功,使得其在线服务,仅仅需要expert的流程化介入,而不是专家的生产性投入(例如RPA)。要的是坐台部署以后output一端的结果审核(go/no-go及校订post-editing),这都是在线的介入,而不是离线的调教(fine tune)。离线调教是坐台建设者的任务,这就开始有点渐入新生态的深水区了,其中有些路线图是蛮清晰的,有些是可以预见不久会解决的,还有较少的一些点,目前不够清晰,还需要探索和进一步验证。

细看一下这里的主要问题在哪里,有哪些可能的突破点和解决方案呢?首先,论专业知识的广度,LLM很厉害。没办法,人家记忆力强,肚子大,消化的材料多,这些都超出了专家,你可以用一个领域的专有术语去试试就知道了,LLM对任何一个很偏很狭窄的主题都会有自己的消化总结,成套成套的,可能细处有错漏,但在面面俱到方面碾压专家。为什么这一点也很重要,因为LLM弥补了人类包括专家的缺陷,用软件的话说,人类precision(精度)有余,recall(召回)不足;而LLM正相反,precision不足,recall有余。LLM可以把可能遗漏的东西,从大数据的黑洞翻上来,随时提到人类认知的雷达上。因此,坐台建设的重中之重就是要克服LLM的precision瓶颈。

我们并不企图彻底解决这个问题:话说回来,如果彻底解决了,就没有人类什么事儿了,前景很诡异,不论。我们是要把精度提高到这样的程度,其结果不至于严重影响坐台的在线专家的工作效率。LLM如果用一堆垃圾轰炸专家肯定是不行的。只要LLM输出的结果有1/4可以达到手工专家自己调研所能达到的水平,这个坐台的效率就得到了保障,这个在线服务就可能站得住。因为专家不过就是4个go/no-go的裁决而已,由于这4个结果的最优解的出场是随机的,对于专家的实际工作体验,大约也就是每看两个结果,就可以放行一个,GO!这不是负担,也不会降低在线服务的效率和竞争性。1/4是一个容错性很大的预期,现在的求精方案达到这个门槛,总体是具有可行性的。正因为有了这个总体具有可行性的基本判断,才可以结论说:LLM新生态下的创业大门的确是打开了。

https://new.qq.com/rain/a/20230310A01FH200

 

见鬼,才发现,我早期的发在科学网的发表记录,居然也被屏蔽了:复制如下,并加上后来的一些

立委发表记录

屏蔽已有 4554 次阅读 2010-2-19 05:44 |个人分类:立委其人|系统分类:论文交流| NLP, extraction

专著

商务印书馆:李维 郭进《自然语言处理答问》(2020

机械工业出版社:李维 等《知识图谱:演进、技术与实践》(2023, 已定稿,最后编辑校对中)

人民邮电出版社:李维《巴别塔影:符号自然语言处理之旅》(2023,已定稿,最后编辑校对中)

电子工业出版社:《大模型风暴:LLM与ChatGPT专家辨析》(2023, 初稿完成,与编辑在编选调整中)

学术杂志和国际会议论文选要

《规则系统的移植性太差吗?》W Li, T Tang

【计算机学会通讯】2014年第8期(总第102期)                                                                                             2014

Mining public opinions from Chinese social media, Wei Li, Lei Li, Tian Tang

《海外学人》杂志【大数据专刊】                                                                                                                          2013

《主流的傲慢与偏见:规则系统与机器学习》 W Li, T Tang

【计算机学会通讯】2013年第8期(总第90期)                                                                                               2013

长篇译文:《Church:钟摆摆得太远》 W Li, T Tang

【计算机学会通讯】2013年第12期(总第94期)                                                       2013

Publications

Srihari, R, W. Li and X. Li, 2006.
Question Answering Supported by Multiple Levels of Information Extraction, a book chapter in T. Strzalkowski & S. Harabagiu (eds.), Advances in Open- Domain Question Answering. Springer, 2006, ISBN:1-4020-4744-4.
online info

Srihari, R., W. Li, C. Niu and T. Cornell. 2006.
InfoXtract: A Customizable Intermediate Level Information Extraction Engine. Journal of Natural Language Engineering, 12(4), 1-37, 2006.
online info

Niu,C., W. Li, R. Srihari, and H. Li. 2005.
Word Independent Context Pair Classification Model For Word Sense Disambiguation.. Proceedings of Ninth Conference on Computational Natural Language Learning (CoNLL-2005).

Srihari, R., W. Li, L. Crist and C. Niu. 2005.
Intelligence Discovery Portal based on Corpus Level Information Extraction. Proceedings of 2005 International Conference on Intelligence Analysis Methods and Tools.

Niu, C., W. Li and R. Srihari. 2004.
Weakly Supervised Learning for Cross-document Person Name Disambiguation Supported by Information Extraction. In Proceedings of ACL 2004.

Niu, C., W. Li, R. Srihari, H. Li and L. Christ. 2004.
Context Clustering for Word Sense Disambiguation Based on Modeling Pairwise Context Similarities. In Proceedings of Senseval-3 Workshop.

Niu, C., W. Li, J. Ding, and R. Rohini. 2004.
Orthographic Case Restoration Using Supervised Learning Without Manual Annotation. International Journal of Artificial Intelligence Tools, Vol. 13, No. 1, 2004.

Niu, C., W. Li and R. Srihari 2004.
A Bootstrapping Approach to Information Extraction Domain Porting. AAAI-2004 Workshop on Adaptive Text Extraction and Mining (ATEM), California.

Srihari, R., W. Li and C. Niu. 2004.
Corpus-level Information Extraction. In Proceedings of International Conference on Natural Language Processing (ICON 2004), Hyderabad, India. [PDF(to be added)]

Li, W., X. Zhang, C. Niu, Y. Jiang, and R. Srihari. 2003.
An Expert Lexicon Approach to Identifying English Phrasal Verbs. In Proceedings of ACL 2003. Sapporo, Japan. pp. 513-520.

Niu, C., W. Li, J. Ding, and R. Srihari 2003.
A Bootstrapping Approach to Named Entity Classification using Successive Learners. In Proceedings of ACL 2003. Sapporo, Japan. pp. 335-342.

Li, W., R. Srihari, C. Niu, and X. Li. 2003.
Question Answering on a Case Insensitive Corpus. In Proceedings of Workshop on Multilingual Summarization and Question Answering - Machine Learning and Beyond (ACL-2003 Workshop). Sapporo, Japan. pp. 84-93.

Niu, C., W. Li, J. Ding, and R.K. Srihari. 2003.
Bootstrapping for Named Entity Tagging using Concept-based Seeds. In Proceedings of HLT/NAACL 2003. Companion Volume, pp. 73-75, Edmonton, Canada.

Srihari, R., W. Li, C. Niu and T. Cornell. 2003.
InfoXtract: A Customizable Intermediate Level Information Extraction Engine. In Proceedings of HLT/NAACL 2003 Workshop on Software Engineering and Architecture of Language Technology Systems (SEALTS). pp. 52-59, Edmonton, Canada.

Li, H., R. Srihari, C. Niu, and W. Li. 2003.
InfoXtract Location Normalization: A Hybrid Approach to Geographic References in Information Extraction. In Proceedings of HLT/NAACL 2003 Workshop on Analysis of Geographic References. Edmonton, Canada.

Li, W., R. Srihari, C. Niu, and X. Li 2003.
Entity Profile Extraction from Large Corpora. In Proceedings of Pacific Association for Computational Linguistics 2003 (PACLING03). Halifax, Nova Scotia, Canada.

Niu, C., W. Li, R. Srihari, and L. Crist 2003.
Bootstrapping a Hidden Markov Model for Relationship Extraction Using Multi-level Contexts. In Proceedings of Pacific Association for Computational Linguistics 2003 (PACLING03). Halifax, Nova Scotia, Canada.

Niu, C., Z. Zheng, R. Srihari, H. Li, and W. Li 2003.
Unsupervised Learning for Verb Sense Disambiguation Using Both Trigger Words and Parsing Relations. In Proceedings of Pacific Association for Computational Linguistics 2003 (PACLING03). Halifax, Nova Scotia, Canada.

Niu, C., W. Li, J. Ding, and R.K. Srihari 2003.
Orthographic Case Restoration Using Supervised Learning Without Manual Annotation. In Proceedings of the Sixteenth International FLAIRS Conference, St. Augustine, FL, May 2003, pp. 402-406.

Srihari, R. and W. Li 2003.
Rapid Domain Porting of an Intermediate Level Information Extraction Engine. In Proceedings of International Conference on Natural Language Processing 2003.

Srihari, R., C. Niu, W. Li, and J. Ding. 2003.
A Case Restoration Approach to Named Entity Tagging in Degraded Documents. In Proceedings of International Conference on Document Analysis and Recognition (ICDAR), Edinburgh, Scotland, Aug. 2003. [PDF(to be added)]

Li, H., R. Srihari, C. Niu and W. Li 2002.
Location Normalization for Information Extraction. In Proceedings of the 19th International Conference on Computational Linguistics (COLING-2002). Taipei, Taiwan.

Li, W., R. Srihari, X. Li, M. Srikanth, X. Zhang and C. Niu 2002.
Extracting Exact Answers to Questions Based on Structural Links. In Proceedings of Multilingual Summarization and Question Answering (COLING-2002 Workshop). Taipei, Taiwan.

Srihari, R. and W. Li. 2000.
A Question Answering System Supported by Information Extraction. In Proceedings of ANLP 2000. Seattle.

Srihari, R., C. Niu and W. Li. 2000.
A Hybrid Approach for Named Entity and Sub-Type Tagging. In Proceedings of ANLP 2000. Seattle.

Li. W. 2000.
On Chinese parsing without using a separate word segmenter. In Communication of COLIPS 10 (1). pp. 19-68. Singapore. [PDF(to be added)]

Srihari, R. and W. Li. 1999.
Information Extraction Supported Question Answering. In Proceedings of TREC-8. Washington

Srihari, R., M. Srikanth, C. Niu, and W. Li 1999.
Use of Maximum Entropy in Back-off Modeling for a Named Entity Tagger, Proceedings of HKK Conference, Waterloo, Canada

Li. W. 1997.
Chart Parsing Chinese Character Strings. In Proceedings of the Ninth North American Conference on Chinese Linguistics (NACCL-9). Victoria, Canada.

Li. W. 1996.
Interaction of Syntax and Semantics in Parsing Chinese Transitive Patterns. In Proceedings of International Chinese Computing Conference (ICCC’96). Singapore

Li, W. and P. McFetridge 1995.
Handling Chinese NP Predicate in HPSG, Proceedings of PACLING-II, Brisbane, Australia.

Liu, Z., A. Fu, and W. Li. 1992.
Machine Translation System Based on Expert Lexicon Techniques. Zhaoxiong Chen (eds.) Progress in Machine Translation Research , pp. 231-242. Dianzi Gongye Publishing House.Beijing.
(刘倬,傅爱平,李维 (1992). 基于词专家技术的机器翻译系统,”机器翻译研究新进展”,陈肇雄编辑,电子工业出版社,第 231-242 页,北京)

Li, Uej (Wei) 1991.
Lingvistikaj trajtoj de la lingvo internacia Esperanto. In Serta gratulatoria in honorem Juan Rgulo, Vol. IV. pp. 707-723. La Laguna: Universidad de La Laguna http://blog.sciencenet.cn/blog-362400-285729.html

Li, W. and Z. Liu. 1990. Approach to Lexical Ambiguities in Machine Translation. In Journal of Chinese Information Processing. Vol. 4, No. 1. pp. 1-13. Beijing.
(李维,刘倬 (1990). 机器翻译词义辨识对策,《中文信息学报》,1990年第一期,第 1-13 页,北京)
[JPG1][

Liu, Z., A. Fu, and W. Li. 1989. Outline of JFY-IV Machine Translation System. In Journal of Chinese Information Processing. Vol. 3, No. 4. pp. 1-10. Beijing 
刘倬,傅爱平,李维 (1989), JFY-IV 机器翻译系统概要,《中文信息学报》,1989年第四期,第 1-10 页,北京

[JPG1][JPG2][JPG3][JPG4][JPG5][JPG6][JPG7][JPG8][JPG9][JPG10] 
(Its abstract published in Computer World 1989/7/26 [JPG])

Liu, Z., A. Fu, and W. Li. 1989. JFY-IV Machine Translation System. In Proceedings of Machine Translation SUMMIT II. pp. 88-93, Munich.

Li, W. 1988. E-Ch/A Machine Translation System and Its Synthesis in the Target Languages Chinese and Esperanto. In Journal of Chinese Information Processing. Vol. 2, No. 1. pp. 56-60. Beijing 
(李维 (1988). E-Ch/A 机器翻译系统及其对目标语汉语和英语的综合,《中文信息学报》,1988年第一期,第 56-60 页,北京)

Li, W. 1988. Lingvistikaj Trajtoj de Esperanto kaj Ghia Mashin-traktado. El Popola Chinio. 1988. Beijing [JPG1][JPG2][JPG3]

Li, W. 1988. An Experiment of Automatic Translation from Esperanto into Chinese and English, World Science and Technology 1988, No. 1, STEA sub Academia Sinica. 17-20, Beijing. [JPG1][JPG2][JPG3][JPG4]

Liu, Y. and W. Li 1987. Babelo Estos Nepre Konstruita. El Popola Chinio. 1987. Beijing (also presented in First Conference of Esperanto in China, 1985, Kunming) [JPG1][JPG2][JPG3]

Li, W. 1986. Automatika Tradukado el la Internacia Lingvo en la Chinan kaj Anglan Lingvojn, grkg/Humankybernetik, Band 27, Heft 4. 147-152, Germany.
[JPG1][JPG2][JPG3][JPG4][JPG5]

Other Publications

Chinese Dependency Syntax

SBIR Grants (17 Final Reports published internally)

Ph.D. Thesis: THE MORPHO-SYNTACTIC INTERFACE IN A CHINESE PHRASE STRUCTURE GRAMMAR

M.A. Thesis in Chinese: 世界语到汉语和英语的自动翻译试验 
–EChA机器翻译系统概述

《立委科普:Machine Translation》 (encoded in Chinese GB)

Li, W. 1997. Outline of an HPSG-style Chinese Reversible Grammar, Vancouver, Canada.

Li, W. 1995. Esperanto Inflection and Its Interface in HPSG, Proceedings of 11th North West Linguistics Conference (NWLC), Victoria, Canada. [PDF(to be added)]

Li, W. 1994. Survey of Esperanto Inflection System, Proceedings of 10th North West Linguistics Conference (NWLC), Burnaby, Canada. [PDF(to be added)]

《ChatGPT:人类语言的“通天塔”》

【立委按:ChatGPT 横空出世,标志着人类语言通天塔的建成,对于做了一辈子NLP的老司机,岂止是美梦成真。古人云,朝闻道夕死可矣。亲眼看到通天塔的建成对于我超过了朝闻道,感觉后去每一天就是赚着了,可以见证ChatGPT引发的信息产业的新生态大爆发。】

ChatGPT导读:

自然语言处理(Natural Language Processing,NLP),是AI皇冠上的明珠。AI主要分为感知智能和认知智能,从感知智能到认知智能的飞跃,主要的标志就体现在NLP任务的完成能力上。人类语言是人类知识的载体,把语言搞定,是进入人类认知智能的一扇大门。千百年来,消除语言障碍一直是人类的梦想。《圣经》中的巴别塔指的就是人类语言的通天塔,但这被认为是一种空想,注定无法建成。我们NLP从业人员也一直在追求这个梦想,感觉真比登天还难。


Download

但是,2022年11月30日,请记住这个日子,以美国人工智能企业OpenAI正式发布ChatGPT模型为标志,通天塔正式落成!它不仅成功消除了人类语言的障碍,还把人类和机器交互的桥梁也建立了起来。这个历史性时刻在国内当时没有引起大的反响,国内同胞不幸正处于疫情高峰期。两个月后等我们从疫情中走出来后,才发现人世间发生了如此巨变,一场ChatGPT海啸开始席卷海内外。

为什么说ChatGPT就是人类语言的通天塔呢?因为它的语言能力其实比Native还要Native:native speakers难免有口误和表达不规范,而大模型做底的ChatGPT的生成却总是那么地道、合乎语言习惯。从输入端来看,它能听,就没有它听不懂的语言,理解能力特别好。从输出端来看,它能说,常常口若悬河。最让人震撼的是,从它的语言表现我们看到了背后的“思维链”和一定的逻辑推理能力,给人的印象是条理清晰。输入输出的背后是大家称为LLM(Large Language Model)的语言大模型,我们用户看它就是个深不见底的黑洞,里面有很多层的神经网络,内部表示是多维向量,俗称“劳碌命”,是它在那里劳碌,分析理解,组词成句。这个“劳碌命”的工作以ChatGPT的形式表现出来,就完美实现了人机的自然语言接口。

我们看看ChatGPT背后的LLM怎么炼成的。这方面的技术性介绍已经汗牛充栋了,我们简述一下背后的原理。它的背后是GPT3,准确的说是被称作达芬奇的GPT3.5最新版作为基础。这个模型首先是规模超大,大力出奇迹。千亿级的tokens作为训练数据,形成千亿级参数的模型。研究表明,通用大模型到了一定规模以后会出现一种技能“涌现”现象,这些涌现技能稍加提示就可以在各种多任务中表现出色。以前笼统地归结为量变引起质变,基本上是把奇迹发生当成一个谜。就好像是说上帝的垂顾,现代版的愚公移山的故事:现代愚公大力不止,感动了上帝。现在看来并没有那么神秘:多任务能力的涌现必须以超大数据LLM为基础,这是因为没有LLM,就没有根据人类偏好来调教模型的空间。

从语言序列学到的生成大模型,最大的特点就是能产性,给一个前文提示,后续有很多种“接龙”的可能性,但这些可能性中只有很小的一个比例是我们希望看到也感觉得益的,还有很多生成是肤浅的、空洞的,甚至有毒的。ChatGPT的突破就是在这最后一步的调教中,以强化学习为核心,找到了一条与人类偏好对齐的有效的方法。这就好比有一个巨大的沙盆,里面装着1000颗大大小小的钻石藏在沙中,现在想把沙子倒掉,有没有一个好的办法倒完沙子又不倒掉钻石呢?试了很多次,几乎不可能。但可以粗线条操控,结果沙子是倒掉了,但也倒掉了900颗钻石。人们知道的是它有效地留下了一批合格的宝贝。能够这么做的前提是,盘子要大。能这么做,敢这么做,只有超大数据的模型。举个例子,正常的语料中,直接与翻译、问答技能相关的数据有多大比例?是个零头吧,数据规模不大的时候,从序列学习的模式中很难学到这些技能。但超大数据就不同了,小的比例乘以一个大数,就有了学习的条件和土壤,这时候如果模型足够大,这些技能就会被潜在地学到。在一个有几乎无限生成可能性的基础模型中,如果不做足后来的功夫,大概率生成的还是水货。于是“符合人类预期”就成为后期调教(fine tune)的最大目标。这个过程中,很多宝贝也给倒掉了,文献中称为 alignment tax(指的是打造自然语言接口模型为与人类对齐必须缴的“税”)。不怕,因为人们看不见被倒掉的宝贝,只要看见的是钻石就行。大模型有足够的冗余,不怕层层过滤和减枝。其实,不是大模型本身出奇迹,而是大模型为奇迹的出现准备了温床。

ChatGPT和以前的大模型不同的地方是它精心筹划了一个人类反馈的强化学习。对于一个通用的开放系统,人类其实也讲不清楚好坏,但是至少可以说你这一轮跟我的对话回答得好还是不好。拿这种反馈去强化训练和微调大模型,ChatGPT突然就显得善解人意了。人机交互从以前的人迁就机器,不得不编写代码,变成了机器迁就人,听懂人话了。这是一个巨大的转变。

强化学习在诸多学习算法中是很不好伺候的一种,因为链条长,而且对于最终目标的定义不是显式和直接的,而是间接以效果论英雄。调教说的是把原基础模型的大概率水货压下去,让隐藏在原模型中的小概率宝贝浮上来:孩子才是符合人类预期的强化目标,但并不是特定的孩子作为优化目标。反正这个世界没有唯一的答案形式,生成通常没有黄金标准,我们有的就是模模糊糊的人类基于偏好而给的反馈:这个回答好,那个是胡扯;这个对路,那个是歧视。能够较好利用这种终局反馈的典型方法正是强化学习。这个反馈回路一旦建立起来,模型可以不断强化和迭代, 表现自然越来越好。于是,强化到了公元2022年11月30号,帷幕揭开,这是人类见证奇迹的时刻。

如实说,我一辈子从事NLP,从没想过在有生之年能够看到这样的奇迹。老祖宗说过,朝闻道夕死可矣。亲眼看到通天塔的建成对于我超过了朝闻道,感觉后去每一天就是赚着了。ChatGPT到现在已经过去3个月了,还是感觉像在做梦一样。有时看着ChatGPT的图标出神,反问自己,这难道就是通向新生态星辰大海的语言之门吗?不得不说,所有的迹象都表明,ChatGPT的背后有着无限的可能性。

 

《ChatGDP 搞定了人类语言》

立委:从语言与语言学角度,chatGPT 的的确确证明了自己万能的语言能力。千百年来的人类巴别塔之望终于美梦成真。巴别塔建成了,建成日期2022年11月。这个成就超出了一般意义的里程碑。这是划时代的进步。

南山:我看不懂它是鹦鹉学舌还是真的掌握了语言。我比较认同一个说法:语言是思想的表象。计算机掌握语言与计算器做计算,也许没有本质区别。

毛德操:对。和蒸汽机胜过人的臂力也没有本质区别。

詹卫东:一个机器是否具备人类的语言能力,本身就是一个比较难判断的问题吧?按照语言学区分competence和performance的考虑,机器和人,在测试语言能力方面的范式是一样的,总是用performance去估计competence。所以,真正的“语言能力”,大概也只能是一种“感觉”吧。chatgpt现在的表现,应该是让很多人“觉得”它掌握了语言。人们似乎还没有想出比图灵测试更高明的方法,来判断机器是否具有语言能力。

邬霄云:图灵测试 is not for language only, it is end to end “common sense “ test, human intelligence via language.

詹卫东:是的。它包含了语言能力。

南山:所以纠结机器是否智能在可预见未来是无解的,相关的判别标准和概念大家都没有清晰、一致,对于chatgpt、alphzero这类,看疗效才是王道。

邬霄云:单独测 language 是不是 翻译 或者别的 normalization 就可以? @詹卫东

詹卫东:不知道。我想不清楚语言跟其他能力是怎么分开的。简单的区分,比如语言考试,语文考试这类的。具体的题目,像是近义词辨析。我测了100题。chatgpt的表现跟LSTM的水平差不多。但是这类考试,并不是真实的语言应用场景。实际上是教师凭空想象的。题目形式是选择题,就是把一个句子中的一个词拿掉,给两个近义词,让它选一个填回去。100题得分不到60分。

南山:有唯一正确答案的题目吗?判断正确的标准只针对句法还是要结合语义和常识?

詹卫东:从出题的角度考虑,是有唯一正确答案的,但语言题还是跟数学题不同,总会有“更多的视角”和“更开放的标准”隐藏着,导致答案很难唯一。 近义词组是考虑了很多因素挑选的,包括句法、搭配、语义协同、常识等。

立委:语言理解能力可以看 同样的意思 你变着花样不同问法,然后看他的回应。体验下来 结论是 它是真理解了 不比人差。

詹卫东:差不多是这个体验。我测试它对不及物动词的反应。故意不在“引语句”打引号。但它准确地识别出引语句片段。不过,线性符号串接续层面形成的“结构”意识,似乎还是不能跟树结构完全重合。这就让人担心它的理解能力。我的感觉是人的智能有一个突出的特征,就是“整体性”。如果没有“整体性”,就是工具智能,不是“通用智能”。

Li Chen:整体性其实是神经网络的强项,毕竟最后都变成向量了。难的反倒是细节。

詹卫东:我说的整体性比较含糊,大概是这个意思:一个智能实体,不应该能做奥赛的数学题,但却在算24点的时候犯“低级”的错误。就是chatgpt在给人感觉很厉害的同时,又表现出存在犯低级错误的能力。

Li Chen:我觉得这个现象可以理解。因为像24点这种东西,某种意义上讲就是一个特殊的游戏,需要说明规则,理解规则的基础上来玩。chatgpt真的理解这个规则了么?这个感觉也就是toB难的地方,不同行业的规则不一样,通用模型没见过这么多具体的规则。即便是人,有很强的学习能力,换个行业也得学习工作一段时间才能玩得转。

南山:对于一个有阅读能力的人,将一段话打乱之后,ta仍然可以把整体意思掌握了。chatgpt可以吗?一个有阅读能力的人不需要特殊训练就可以读懂这段话

立委:可以测试一下。应该没问题,因为汉字本身就是形义结合的词素。

詹卫东:这个可能是chatgpt的强项,我之前测试不及物动词“见面”的句子中就包含了这类乱序的句子。它理解得非常准确。

立委:这个实验好。语言理解从效果上看就是要鲁棒有包容,同一个语义可以有多种不同的表达形式,表达形式不规范也没关系,只要上下文的关键词及其相谐性可以让语句的意义有区别性就好。chatGPT 这方面游刃有余,总是可以把同义的不同说法映射到语义空间的同一个区域。

詹卫东:100分!

原文是今天新浪网一段新闻。

南山:你不用提醒它顺序被人为打乱了,它怎么理解

詹卫东:

南山:这么说可以认为它的语义理解能力是没有问题了。

詹卫东:是的,感觉可以“跳过语法”,直达语义。

白硕:乌兰克

南山:可以理解为它的常识或常识运用有问题吗?

詹卫东:其实很难评判应该是“乌兰克”还是“乌克兰”。chatgpt不改也不能认为是错。

Li Chen:是的,也许真有个国家地区或者可以当主语,修饰语的确实叫乌兰克。

詹卫东:从我受到的语言学训练角度讲,chatgpt的汉语语言学知识(人类假设的那些知识,可能对,也可能不对)还是比较贫乏的,按照这个标准,它应该还不算掌握了语言。一个典型的表现是,语言学比较重视打*号的句子的分析,也就是所谓“不合语法”的句子。但实际语料中这样的句子极少。应该是训练数据缺乏。chatgpt对这样的句子的判断能力就不太灵。不过,这似乎也不太影响它进行语言信息的分析和处理。从这个角度讲,chatgpt对语言学的刺激是:句子结构的分析,包括对正例和负例的结构分析和解释,到底意义是什么?

立委:关于文法书上强调的带有星号 * 的反例,那不是为了语言理解,主要是从语言生成的角度,实践中追求的是合法和地道(nativeness),理论上追求的是 internal grammar/language,需要防止反例出现。

从语言生成角度,LLM 的大数据回归的属性天然实现了 nativeness,反例不仅少见,即便出现,统计上也沉底了。语言生成能力的效果观察,可以让它生成几次,看回应是不是还在同类水平上,是不是走题或掉链子。这一关表现不错。除了特别的风格输出(例如洋泾浜:这种“风格”可以看成 sub-language,里面的正例恰好是规范英语的反例)外,它是不会出现低级文法错误和违背习惯用法的笑话的。所以 native speakers 听着也觉得舒服。

说到底还是图灵,如果不告诉你背后是谁,你是不是会觉得对象是人。

从语言理解角度,文法书上的绝大部分反例都在包容的范围之内。语文老师让学生改正反例的那些练习题,其出题的前提就是这些所谓反例其实同样承载了正句一样的语义。没有这个预设,人怎么知道如何改正才能保留原有的意义呢。反例不过就是形式上的违规而已,通常不影响内容。

当然,在 input 较短 context 不足以确定内容完整性的的时候,有些反例会呈现歧义或甚至与原意相左的语义,这时候形式的违规的确与内容的混乱或不确定发生关联了。这时候,句法手段的修正(例如次序的调整、功能词的使用以及西方语言中的形态的正确应用等)才会有实质性意义,而不仅仅就是为了 native speaker 听上去顺耳而已。

解析和理解的能力,LLM 特别宽容鲁棒,主要是它的 embedding(编码嵌入,成为其内部的向量表示)可以容纳很长的 input,在 context 相互邻近的关键词之间相互制约下(我们叫篇章中的 semantic coherence,包括词义之间的搭配关系),形式上的偏离规范已经不影响它在语义空间的意义定位,从而“它”可以轻易与“非它”区分开来。

一个符号串 吃进去就是向量空间的某个或某组位置 其意义表现在与其他位置的距离和区别。因此 位置偏差一点 不影响意义 只要它与其他的不同意义的符号串映射可以区别开来。鲁棒性根植于此。换个角度 意义不是要问是什么,更要紧的是 不是其他(什么),只要能维持这种意义空间的区别性,规范不规范就都可以包容。区别之间有足够的空间/距离,即可容忍局部的种种口误 错误。

邬霄云:Llm 的 position encoding is linearly attached not cross product,so it is a weak form 

立委:词序影响意义的机会不大。当年 一包词模型用了很久 也是因为 词序是较弱的约束,构成区别要素的场景并不频繁。

我把一句话,完全反过来,从:explain quantum computing in simple terms 映射成类似回文:terms simple in computing quantum explain,它毫不迟疑。

人家训练的是next token,现在是处处反着来,本想让它找不着北,但实际上一点也不影响它的“理解”。就是说,当一个模型可以对较长的 input string 做编码嵌入的时候,次序的约束已经很弱了。因为那一小袋词之间的物理距离(proximity constraints)加上它们语义的相谐性(semantic cosntraints)已经足够让这个整体的语义表示与其他对象区分开来,这时候纯粹语言学意义的句法约束(syntactic constraints,包括严格的词序)就可以松绑。

我怀疑 position encoding 即便不做,LLM 也不见得性能会下降很多。

邬霄云:Could be, popular code base all use it still

立委:换句话说,在 bigram / trigram 建模的年代,词序是重要的 (“我爱她”与“她爱我”,“打死”与“死打”,可不是一回事)。到了ngram 中 n 可以很长的时候,ngram list 与 ngram set 已经语义相等了。

句长不够,词序来凑。长度足够,序不序无所谓。句法地位急剧下降。

论鲁棒,人如何与模型比,差了不止一个段位。

Li Chen:想想确实是这个道理,在有很多词的情况下,还要能组成符合语法的句子的可能性是有限的,也就意味着语义差异不大了。所以这个时候顺序确实已经不重要了,估计这个也是为什么即便是最简单的bag of words也能用来做相似度计算,一用就是几十年的道理。

詹卫东:跟ChatGPT逗个乐。

总的感觉就是chatgpt对语言的嵌套理解能力和指代关系理解力非常强。

川:LLM 没问题,ChatGPT is evil

Who is the master, machine or man?

立委:那是因为 chatGPT 太 human like,搞定了自然语言形式。

川:搞定是假象,现在就下结论太早。

A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity

立委:机器都是假象,AI 本性。Artifical 与假象可以看成是同义词。就本质而言,人工智能就是智能假象,这个论断没有问题,但这应该并不妨碍人类深度使用AI。

搞定的判断是,跟他说话感觉它听从指令、善解人意,而且回应也很顺溜贴心,不走题。

三个月玩 chat 下来,我在它生成的英语中,没有发现过语言的问题(内容的毛病不算),一例也没有。但在其中文的生成中,偶然还是会发现它有语言的瑕疵(不符合规范或习惯的用法),虽然它的中文生成能力已经超过多数同胞。这说明,目前 chat 语言训练的中文语料还可以进一步扩大,从爱挑剔、追求完美的语言学家视角,它还有一点点剩余的进步空间。

结论还是: ChatGDP 搞定了人类语言,无论听还是说,妥妥的。万能的语言巴别塔是真滴建成了。

说到chat里程碑的意义,盖茨比作电脑、互联网后的第三大里程碑,显然有点夸张了。可是我们进入计算机博物馆看里程碑展馆,有 1. 第一次下国际象棋打败人类 2. IBM 沃森问答打败人类,后面的还该有一系列打败人类的里程碑吧,例如围棋。

不得不佩服它条理化的能力,只有一个不妥:医学并入了教育。其余的综合 总结能力强过一干人,自然包括在下。在这一长串中,AI明星 chat 可以成为 top 几?

top 10 有点高抬了,top 20 似乎有余:就凭他建成了巴别塔,搞定了人类语言。

文字 应该是 语言/文字。宗教不该漏。

我是从语言角度。它的的确确证明了自己的万能的语言能力。语言能力其所以特别重要,不仅仅因为我是语言学家,难免强调它,更因为这是规模化机器能力的敲门砖,否则机器只是少数人的玩具。机器学会人话的意义,比人去适应机器,用程序去给它指令,意义大得多,这是人机接口的革命。

 

 

《不识数的 ChatGPT》

【立委按:能说会道的 ChatGPT 在数字和算术上常闹笑话,暴露了自己的短板。有意思的是,似乎可以现场教给它识数的技能,但很不稳定。总体而言,算术技能还是“外挂”合理,不必强求一个序列大模型学会算术。】

ChatGPT导读:

立委:都说当前的 ChatGPT 数学底子潮,它识数吗? 

陈利人:请看

立委:怎么着?确实是10个、也确实是有“喜”字的短语,只是可惜不是10个字。

知道它不识数,硬要逼它,道德上是否属于不尊重残障实体的不良行为呢:

numerically challenged entities should not be tested on math purely for making fun of it

认真地,以前我们做NLP训练的时候,所有的数字都被 NUM 替代,因为这家伙形式上无穷变体,实质只是一类。IE(信息抽取) 的传统里面,有一个与 “专名实体” (NE,Named Entity)并举的抽取对象,叫做 DE(Data Entity,MUC 社区称为 numex ),主要就是针对这些带有数字的对象(百分比、重量、温度、算术公式、年龄、时间等),NLP面对 DE 从来都是先分类,然后把它包起来。语言模型,无论统计的还是符号的,都不细究它。通常要到需要语义落地的时候,才打开这个包,去调用某个函数(所谓“外挂”)去做符号拆解和语义落地,包括把变体标准化并映射到合适的数据类型,这以后才好进入数学的操作和计算。LLM 在没有做特殊的外挂对接前,自然也是如此,于是上面的笑话是 “by design”:可以看成是 feature, 而不是 bug,lol。至于怎么对接来解决它,那是另一回事。

刘雪峰:纠正了一下,已经学会数汉字了。

这种对话之后便能更新自身的认识(程序模式),可以称之为有“自我进化”能力了。

立委:这叫 step by step 的现场调教法,很神奇,属于思维链(CoT)培训,背后的原理不是很清晰。有推测 step by step 的 CoT(Chain of Thought)方面的基本调教已经在他们内部的模型微调中做足了功夫,这才为现场特定的 step by step 的具体能力的调教提供了激发的基础。

不知道它学会了以后,能保持这个能力多久?在同一个session 里面多测试几次,需要确认它是真在现场学到了对汉字计数的能力。(当然 session一关闭,这个识数能力肯定消失,因为前面的调教场景没了。)

刘雪峰:据说 Open AI 不会根据和用户的对话更新其核心数据库。一段缓存期之后就丢掉了这个“认识”。这样可以防止恶意影响 ChatGPT。

立委:不是数据库的问题,是模型本身是恒定的。few shots 和 step by step 的现场调教,都不会影响模型本身。看看下例。

这是个很奇特的 in-context 的学习现象,学到的“技能”不稳定,你看最后不等一个 session 结束,转眼就还给老师了,声称10个汉字给出的却是8个字:“江雨霏霏江草齐齐”。甚至到底是不是真学到了,也是个问号。完全有可能在看似学到了的那个当口,它的网络空间中有一些strings正好与特定字数10相关联。

Dongdong:看来文科ChatGPT和理科能力不兼容。

立委:哪怕其实没有学到“识数”的技能,现场的调教能够激发其中高度相关的某个string,回应下来满足了我们的要求。加上它的能说会道的解释,也是一种很唬人的表现。不懂装懂,能装到这个段位,也是让人开眼了。

错误不可怕,可怕的是,错得那么像人。

生活中,我们都遇到过不会算术的人,尤其在国外,甚至收银员不识数的比例也很高。离开计算器,这类人遇到数字像个傻子,掰手指头都整不明白,更甭提心算。ChatGPT 与他们差不多,说话与他们一样顺溜地道,当然,数学底子也一样潮。

当一个实体看了那么多的书,记忆体那么大,到了我们无法想象的量级的时候,很多难以说清道明的所谓“涌现”的技能,更可能就是从他们的巨大网络空间中激发了最相关联的组合。我们凡人以常识和经验作为参考系来审视这些非常能力,无论如何也难相信这就是一种数据的关联恰好被触发,我们宁肯相信实体具有了技能,甚至灵性、意识。

前人不我欺,假作真时真亦假,无为有处有还无啊。

马少平:看下例

它不坚持真理。

立委:哈,这一类也见过n次了。这好像是在学到的能力与必须尊重人类的原则之间,有一个权重偏向后者的设置。它的设计者心里是明晰的:多数技能不稳定,完全可能是真理的假象,权重宁肯偏向迁就和同意人,而不是坚持这种不可靠的技能,因为坚持真理与坚持谬误只有一步之遥。

詹卫东:微软搜索BING引入了聊天能力,比chatGPT多了问句。要是有反问句就厉害了。

立委:这个厉害啊。

识别不同形式,我们知道 ChatGPT 是有这个能力的(当然数学上不好说,有时会栽跟头)。识别了后,开始这种口气说话,好像是微软引进后新调教出来的。

白硕:数学还是错的啊。

刘雪峰:刚才试着确认四则运算,变量。十分准确。这种对话能力,真是让人感叹!

刚才和数学系的几个老师解说了一下 ChatGPT。大家都是听说过,还没操作过。一脸吃惊。

詹卫东:New bing 跟 ChatGPT 一样,对汉字字符还是不能正常计数。让它生成一段300字的稿子,它洋洋洒洒写了快1000字,然后总结说自己写了304字。

立委:《大型语言模型系列解读(三):ToolFormer:语言模型教会自己使用外部工具》值得推荐,报告了LLM调用API的创新设计,很巧妙,例如计算百分比这样的API。这才是LLM学数学的正道啊。

学会调用外部的 API 对于保障 LLM 的数据质量很重要。以前讨论的与外部领域场景的数据库对接的难题,类似的思路应该也是可行的。其实到了场景落地的关口,外部数据库已经聚焦了。既然聚焦了,就有“倒逼”与“反推”来修正错误的可能性。解决这个问题的方案和尝试,都在路上,应该是可以预见的,稍安勿躁。LLM的领域壁垒和落地接口终究还是有望打通 ,我保持乐观。

退一步海阔天空。原则上,借外力克服LLM知识短板,防止“一正胡八”(一本正经胡说八道)和张冠李戴这类的低级笑话,应该可以找到路径。 指望一个模型走天下,硬靠无特定目标的增加序列数据,指望用越来越大的网兜住知识,修炼成全知全能,感觉不对劲。换句话说,场景聚焦相关的知识本来就不属于、也不应该属于基础模型的一部分。为外挂建立桥梁才是正道。关于外挂 @白硕 老师以及其他老司机,一定有很多思考,这是有价值的大方向,希望听到各位老师的高见。

白硕:就是我说的两件事:要么学到问题到答案的映射,要么学到问题到解决问题的资源的映射。

立委:这个问题的解决意味着什么?意味着几乎所有现存的 AI 产品,都要被重新审视和洗牌。

白硕:语言能力插上知识能力的翅膀。

立委:甭管你积累了多高的护城河,都面临新时代大模型降维冲击的挑战。这事儿是进行时,实实在在在我们眼皮底下发生着:微软谷歌搜索大战就是活话剧。

 

 

 

 

《AI浪潮博客目录》

立委按:值此 NLP 惊天动地之际,迎着 AI 新纪元的曙光,老字号【立委NLP频道】专设《AI浪潮》栏目研究切磋与同仁,记录科技革命的盛世风采,探究劳碌命(LLM)的奥秘与挑战,一叶知秋,展望未来。

《AI浪潮:不识数的 ChatGPT》

《AI浪潮:打造中国的 ChatGPT,挑战与机会并存》

《AI浪潮:chatGPT 搞定了人类语言》

《AI浪潮:chatGPT 能写出段子吗》

《AI浪潮:chatGPT 的里程碑意义》

《AI浪潮:chatGPT 写的情书能有真情吗》

《AI浪潮:LLM 凭什么能“涌现”超级能力?》

《AI浪潮:漫谈LLM与领域对齐》

《AI浪潮:神迹与笑话齐飞,chatGPT 也是大观了》

《AI浪潮:chatGPT 帮你写应用文》

《AI浪潮:人工智能当代简史》

《AI浪潮:chatGPT 辅导精读学术论文的实验》

《AI浪潮:因为见从而信,见证奇迹的时刻》

《AI浪潮:zero shot 抽取、摘要、吟诗、阅读理解》

《AI浪潮:玩不死的 chatGPT》

《AI浪潮:关于chatGPT 的 思维链能力 》

《AI浪潮:n-shot 是训练还是指令》

随笔:AGI 迷思与反思

AIGC 潮流扑面而来,是顺应还是(无谓)抵抗呢?

漫谈AI 模型生成图像

图灵测试其实已经过时了

RPA 是任务执行器还是数字员工?

《立委科普:自注意力机制解说》

《深层解析符号模型与深度学习预训练模型》(修订文字版)

NLP 新纪元来临了吗?

推荐Chris Manning 论大模型,并附上相关讨论

《我看好超大生成模型的创造前途》

立委随笔:机器翻译,从学者到学员

《AI浪潮:chatGPT 搞定了人类语言》

立委:从语言与语言学角度,chatGPT 的的确确证明了自己万能的语言能力。千百年来的人类巴别塔之望终于美梦成真。巴别塔建成了,建成日期2022年11月。这个成就超出了一般意义的里程碑。这是划时代的进步。

南山:我看不懂它是鹦鹉学舌还是真的掌握了语言。我比较认同一个说法:语言是思想的表象。计算机掌握语言与计算器做计算,也许没有本质区别。

毛老:对。和蒸汽机胜过人的臂力也没有本质区别。

卫东:一个机器是否具备人类的语言能力,本身就是一个比较难判断的问题吧?按照语言学区分competence和performance的考虑,机器和人,在测试语言能力方面的范式是一样的,总是用performance去估计competence。所以,真正的“语言能力”,大概也只能是一种“感觉”吧。chatgpt现在的表现,应该是让很多人“觉得”它掌握了语言。人们似乎还没有想出比图灵测试更高明的方法,来判断机器是否具有语言能力。

霄云:图灵测试 is not for language only, it is end to end “common sense “ test, human intelligence via language.

卫东:是的。它包含了语言能力。

南山:所以纠结机器是否智能在可预见未来是无解的,相关的判别标准和概念大家都没有清晰、一致,对于chatgpt、alphzero这类,看疗效才是王道。

霄云:单独测 language 是不是 翻译 或者别的 normalization 就可以? @詹卫东

卫东:不知道。我想不清楚语言跟其他能力是怎么分开的。简单的区分,比如语言考试,语文考试这类的。具体的题目,像是近义词辨析。我测了100题。chatgpt的表现跟LSTM的水平差不多。但是这类考试,并不是真实的语言应用场景。实际上是教师凭空想象的。题目形式是选择题,就是把一个句子中的一个词拿掉,给两个近义词,让它选一个填回去。100题得分不到60分。

南山:有唯一正确答案的题目吗?判断正确的标准只针对句法还是要结合语义和常识?

卫东:从出题的角度考虑,是有唯一正确答案的,但语言题还是跟数学题不同,总会有“更多的视角”和“更开放的标准”隐藏着,导致答案很难唯一。 近义词组是考虑了很多因素挑选的,包括句法、搭配、语义协同、常识等。

立委:语言理解能力可以看 同样的意思 你变着花样不同问法,然后看他的回应。体验下来 结论是 它是真理解了 不比人差。

卫东:差不多是这个体验。我测试它对不及物动词的反应。故意不在“引语句”打引号。但它准确地识别出引语句片段。不过,线性符号串接续层面形成的“结构”意识,似乎还是不能跟树结构完全重合。这就让人担心它的理解能力。我的感觉是人的智能有一个突出的特征,就是“整体性”。如果没有“整体性”,就是工具智能,不是“通用智能”。

Li Chen:整体性其实是神经网络的强项,毕竟最后都变成向量了。难的反倒是细节。

卫东:我说的整体性比较含糊,大概是这个意思:一个智能实体,不应该能做奥赛的数学题,但却在算24点的时候犯“低级”的错误。就是chatgpt在给人感觉很厉害的同时,又表现出存在犯低级错误的能力。

Li Chen:我觉得这个现象可以理解。因为像24点这种东西,某种意义上讲就是一个特殊的游戏,需要说明规则,理解规则的基础上来玩。chatgpt真的理解这个规则了么?这个感觉也就是toB难的地方,不同行业的规则不一样,通用模型没见过这么多具体的规则。即便是人,有很强的学习能力,换个行业也得学习工作一段时间才能玩得转。

南山:对于一个有阅读能力的人,将一段话打乱之后,ta仍然可以把整体意思掌握了。chatgpt可以吗?一个有阅读能力的人不需要特殊训练就可以读懂这段话

立委:可以测试一下。应该没问题,因为汉字本身就是形义结合的词素。

卫东:这个可能是chatgpt的强项,我之前测试不及物动词“见面”的句子中就包含了这类乱序的句子。它理解得非常准确。

立委:这个实验好。语言理解从效果上看就是要鲁棒有包容,同一个语义可以有多种不同的表达形式,表达形式不规范也没关系,只要上下文的关键词及其相谐性可以让语句的意义有区别性就好。chatGPT 这方面游刃有余,总是可以把同义的不同说法映射到语义空间的同一个区域。

卫东:100分!

原文是今天新浪网一段新闻。

南山:你不用提醒它顺序被人为打乱了,它怎么理解

卫东:

南山:这么说可以认为它的语义理解能力是没有问题了。

卫东:是的,感觉可以“跳过语法”,直达语义。

白硕:乌兰克

南山:可以理解为它的常识或常识运用有问题吗?

卫东:其实很难评判应该是“乌兰克”还是“乌克兰”。chatgpt不改也不能认为是错。

Li Chen:是的,也许真有个国家地区或者可以当主语,修饰语的确实叫乌兰克。

卫东:从我受到的语言学训练角度讲,chatgpt的汉语语言学知识(人类假设的那些知识,可能对,也可能不对)还是比较贫乏的,按照这个标准,它应该还不算掌握了语言。一个典型的表现是,语言学比较重视打*号的句子的分析,也就是所谓“不合语法”的句子。但实际语料中这样的句子极少。应该是训练数据缺乏。chatgpt对这样的句子的判断能力就不太灵。不过,这似乎也不太影响它进行语言信息的分析和处理。从这个角度讲,chatgpt对语言学的刺激是:句子结构的分析,包括对正例和负例的结构分析和解释,到底意义是什么?

立委:关于文法书上强调的带有星号 * 的反例,那不是为了语言理解,主要是从语言生成的角度,实践中追求的是合法和地道(nativeness),理论上追求的是 internal grammar/language,需要防止反例出现。

从语言生成角度,LLM 的大数据回归的属性天然实现了 nativeness,反例不仅少见,即便出现,统计上也沉底了。语言生成能力的效果观察,可以让它生成几次,看回应是不是还在同类水平上,是不是走题或掉链子。这一关表现不错。除了特别的风格输出(例如洋泾浜:这种“风格”可以看成 sub-language,里面的正例恰好是规范英语的反例)外,它是不会出现低级文法错误和违背习惯用法的笑话的。所以 native speakers 听着也觉得舒服。

说到底还是图灵,如果不告诉你背后是谁,你是不是会觉得对象是人。

从语言理解角度,文法书上的绝大部分反例都在包容的范围之内。语文老师让学生改正反例的那些练习题,其出题的前提就是这些所谓反例其实同样承载了正句一样的语义。没有这个预设,人怎么知道如何改正才能保留原有的意义呢。反例不过就是形式上的违规而已,通常不影响内容。

当然,在 input 较短 context 不足以确定内容完整性的的时候,有些反例会呈现歧义或甚至与原意相左的语义,这时候形式的违规的确与内容的混乱或不确定发生关联了。这时候,句法手段的修正(例如次序的调整、功能词的使用以及西方语言中的形态的正确应用等)才会有实质性意义,而不仅仅就是为了 native speaker 听上去顺耳而已。

解析和理解的能力,LLM 特别宽容鲁棒,主要是它的 embedding(编码嵌入,成为其内部的向量表示)可以容纳很长的 input,在 context 相互邻近的关键词之间相互制约下(我们叫篇章中的 semantic coherence,包括词义之间的搭配关系),形式上的偏离规范已经不影响它在语义空间的意义定位,从而“它”可以轻易与“非它”区分开来。

一个符号串 吃进去就是向量空间的某个或某组位置 其意义表现在与其他位置的距离和区别。因此 位置偏差一点 不影响意义 只要它与其他的不同意义的符号串映射可以区别开来。鲁棒性根植于此。换个角度 意义不是要问是什么,更要紧的是 不是其他(什么),只要能维持这种意义空间的区别性,规范不规范就都可以包容。区别之间有足够的空间/距离,即可容忍局部的种种口误 错误。

霄云:Llm 的 position encoding is linearly attached not cross product,so it is a weak form 

立委:词序影响意义的机会不大。当年 一包词模型用了很久 也是因为 词序是较弱的约束,构成区别要素的场景并不频繁。

我把一句话,完全反过来,从:explain quantum computing in simple terms 映射成类似回文:terms simple in computing quantum explain,它毫不迟疑。

人家训练的是next token,现在是处处反着来,本想让它找不着北,但实际上一点也不影响它的“理解”。就是说,当一个模型可以对较长的 input string 做编码嵌入的时候,次序的约束已经很弱了。因为那一小袋词之间的物理距离(proximity constraints)加上它们语义的相谐性(semantic cosntraints)已经足够让这个整体的语义表示与其他对象区分开来,这时候纯粹语言学意义的句法约束(syntactic constraints,包括严格的词序)就可以松绑。

我怀疑 position encoding 即便不做,LLM 也不见得性能会下降很多。

霄云:Could be, popular code base all use it still

立委:换句话说,在 bigram / trigram 建模的年代,词序是重要的 (“我爱她”与“她爱我”,“打死”与“死打”,可不是一回事)。到了ngram 中 n 可以很长的时候,ngram list 与 ngram set 已经语义相等了。

句长不够,词序来凑。长度足够,序不序无所谓。句法地位急剧下降。

论鲁棒,人如何与模型比,差了不止一个段位。

Li Chen:想想确实是这个道理,在有很多词的情况下,还要能组成符合语法的句子的可能性是有限的,也就意味着语义差异不大了。所以这个时候顺序确实已经不重要了,估计这个也是为什么即便是最简单的bag of words也能用来做相似度计算,一用就是几十年的道理。

卫东:跟chatgpt逗个乐。

总的感觉就是chatgpt对语言的嵌套理解能力和指代关系理解力非常强。

川:LLM 没问题,ChatGPT is evil

Who is the master, machine or man?

立委:那是因为 chatGPT 太 human like,搞定了自然语言形式。

川:搞定是假象,现在就下结论太早。

A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity

立委:机器都是假象,AI 本性。Artifical 与假象可以看成是同义词。就本质而言,人工智能就是智能假象,这个论断没有问题,但这应该并不妨碍人类深度使用AI。

搞定的判断是,跟他说话感觉它听从指令、善解人意,而且回应也很顺溜贴心,不走题。

三个月玩 chat 下来,我在它生成的英语中,没有发现过语言的问题(内容的毛病不算),一例也没有。但在其中文的生成中,偶然还是会发现它有语言的瑕疵(不符合规范或习惯的用法),虽然它的中文生成能力已经超过多数同胞。这说明,目前 chat 语言训练的中文语料还可以进一步扩大,从爱挑剔、追求完美的语言学家视角,它还有一点点剩余的进步空间。

结论还是: chat 搞定了人类语言,无论听还是说,妥妥的。万能的语言巴别塔是真滴建成了。

 

 

【相关】

A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity

《朝华午拾》电子版

李维 郭进《自然语言处理答问》(商务印书馆 2020)

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

chatGPT 网址:https://chat.openai.com/chat(需要注册)

《AI浪潮:chatGPT 能写出段子吗》

 

 

还行吧,这些段子水平不高。但比憋不出来强。

本来写出好段子就是最具挑战性的人类创作活动之一,只要采访几个著名的脱口秀演员就知道其中的甘苦了。很多大火的脱口秀演员,为此绞尽脑汁。台上五分钟,台下无数不眠夜。让人开口笑,并不容易啊。

By the way 国内脱口秀这几年蓬勃向上,有超越传统相声的态势,尤其是在年轻人中开始流行。这是以前没想到的,有传统相声的国度,居然让外来艺种抢了风头。制度接轨那么难,艺术接轨如此自然,水到渠成?

wow,不知道这是抄袭的,还是“emerging”的,联想一下还真像是个搞笑的段子:

gou (go) 我不会飞,可我很快。
niu 所以我那么大(大妞儿?)

猫猫 miao 或 mao, 耗子 mou,也蛮形象,有声有色的样子。

哈,看来只学会了一个套路:羊/yang (young),所以我害羞。

马少平:谐音梗:为什么不能吃藕?因为吃藕丑。

立委:这个强。马老师自己的灵感吗?

辞职算了,不要教书育人传授AI了,笑果文化更需要你。lol

马少平:不是,流行比较广的[Grin]

立委:lol

还有一个类似的感受,国内流行乐坛中的 rap 在大唐比想象的流行要广。在一个有数来宝的国度,rap 一样长驱直入。

马少平:我不喜欢rap,觉得就不是歌。

立委:可是很多年轻人喜欢啊。

马少平:确实。跟年轻人有沟。

立委:觉得文化的融合与流行 不是想象的那么难。

国内那些 rap,牵强的说辞泛滥,听着好别扭,觉得比虽然低俗但顺溜地道的数来宝或山东快书,是一种严重退步。但是我们的“成见”挡不住新一代的热情和迷恋,这里面可能有什么文化密码和奥秘。

最后就是日本动漫的文化,热度持续不减,横扫两个超级大国:引起中美年轻人的狂热。

陪女儿小时候看迪斯尼长大,没想到后来迪斯尼就被 anime 碾压了。anime,我不入,搞不清里面的奥秘。是为沟。

【相关】

《朝华午拾》电子版

李维 郭进《自然语言处理答问》(商务印书馆 2020)

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

chatGPT 网址:https://chat.openai.com/chat(需要注册)

《AI浪潮:chatGPT 的里程碑意义》

说到chat里程碑的意义,盖茨比作电脑、互联网后的第三大里程碑,显然有点夸张了。可是我们进入计算机博物馆看里程碑展馆,有 1. 第一次下国际象棋打败人类 2. IBM 沃森问答打败人类,后面的还该有一系列打败人类的里程碑吧,例如围棋。

不得不佩服它条理化的能力,只有一个不妥:医学并入了教育。其余的综合 总结能力强过一干人,自然包括在下。在这一长串中,AI明星 chat 可以成为 top 几?

top 10 有点高抬了,top 20 似乎有余:就凭他建成了巴别塔,搞定了人类语言。

文字 应该是 语言/文字。宗教不该漏。

我是从语言角度。它的的确确证明了自己的万能的语言能力。语言能力其所以特别重要,不仅仅因为我是语言学家,难免强调它,更因为这是规模化机器能力的敲门砖,否则机器只是少数人的玩具。机器学会人话的意义,比人去适应机器,用程序去给它指令,意义大得多,这是人机接口的革命。

 

【相关】

《朝华午拾》电子版

李维 郭进《自然语言处理答问》(商务印书馆 2020)

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

chatGPT 网址:https://chat.openai.com/chat(需要注册)

《AI浪潮:chatGPT 写的情书能有真情吗》

JJ: 

 

ChatGPT 写情书也不重样。

立委:这是陷入爱河但苦于笨嘴拙舌的人的福音了。人的爱意 哪怕是套话 也是要表达才行,藏在心里不行。

“i love you" 是鹦鹉学舌完全可以做到的,但并不因为是套话而失去其神奇效应。无数的情感矛盾和关系恶化 其实就是缺少了这三个字的表达频度。

但热恋要求更高一点,需要营造浪漫。营造需要形式,而有的人就是不懂形式,不善言辞,不会表达(俗话说,不会来事儿 lol)。你便是真情如海,但羞于表达或表达不出来也没戏。谁愿意与木头谈一场恋爱?

有问,机器代写的情书能有真情吗?这就好比询问:毛笔写的情书能有真情吗?

chatGPT 不过就是个工具,就跟你用毛笔还是钢笔一样。这个工具见识过无数的情书。工具帮助你产生形式,至于真情表白还是虚情假意,那要看使用工具的人了。

劝热恋中的人都去订阅 chatGPT pro,现在出来了,每个月20美元,太平价了,可以帮你制造浪漫的条件,无论是诗歌、两地书还是策划。

-- *声明:以上是脑残广告,不当真的 =)

顺着这个话题延伸一下,说说 chatGPT 作为文字助手的作用,尤其是对于不善言辞的人。

出口成章的人是少数。见过很多人在一些场合 需要应景 却憋不出话来 十分窘迫。现在好了。不知道有没有办法把 chat 制成一个可以植入的东西,就不说老马说的脑机接口了,只要能让它成为一个隐藏的招之即来 但无人察觉的暗器,也许作为穿戴设备,例如传说中的苹果眼镜,让它编制的应景台词,跟提词器似的,崩到眼镜上,我见人不见。那会是社恐人士多大的福音。

不同程度的社恐据报道是一个非常常见的问题,我自己也深受其害,人稍多就哑巴了,插不上话,却要硬着头皮应付。看社交场合如鱼得水的人 知道他们是胡喷 但人家给气氛啊 自己啥贡献也没有。成为社交累赘,有情商的的人,还要照顾你情绪,不时还要引一两句给你,带你玩的意思。chat 可以改变这一切 让笨嘴拙舌秒变伶牙俐齿,让只懂本行的老专家也能成为百科地保。 

为民:一位圈外朋友的朋友圈信息: "ChatGPT是中庸主义者的福音,完美地让你泯然众人、符合社会的基本期待。

ChatGPT不需要提升生产力(不需要empower人类的语言能力),只需中庸地鹦鹉学舌,帮助人类在其没有表达意愿的场景、完成表达的义务。

如果用ChatGPT写情书,说明你根本不爱收到情书的对象。但是也许你并不需要soul mate(不是每个人都需要),你只想要应付相亲对象。

作为情商不高的半社恐人士,我在很多场景都没有沟通互动的意愿,但是我得耗费精气神维持礼貌、得体、正常,ChatGPT作为AI助理可以帮我们这种人成为真正的中庸主义者。"

立委:

情商这东西 为什么人学起来那么笨 机器却行:估计主要是人自我中心 换位思考就难。机器根本没有自我 调教对齐一下就乖巧了。

白硕:机器没有脊梁

立委:情商优者治人 智商优者治于人。外行领导内行 由来已久 天经地义。

数量上也不成比例 情商强的人 远远少于智商好的,最后大多做了各级领导或企业老板。

 

【相关】

《朝华午拾》电子版

李维 郭进《自然语言处理答问》(商务印书馆 2020)

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】

chatGPT 网址:https://chat.openai.com/chat(需要注册)

《AI浪潮:chatGPT 帮你写应用文》

立委按:自从 chatGPT 横空出世,这类应用文辅助写作案例已经水漫金山,见奇不怪了。但这不改变辅助写作是一个具有巨大应用场景和价值的方向,虽然大概率与机器翻译也差不多,最后作为行业可能被做死,或成为白菜价。下面是我自己前一阵子做的一些试验,摘录如下。

其一:推荐信

请帮助我用规范的英文写一篇推荐信,内容包括:1. 推荐张三到清华做博士后,研究AGI;2. 我是张三的博士导师; 3. 张三博士论文获到全国优秀论文大奖。

Dear Admissions Committee,

I am writing to highly recommend Zhang San for admission to your PhD program in AGI research at Tsinghua University.

As Zhang San's doctoral advisor, I have had the pleasure of working with him for the past three years and have been consistently impressed by his intellectual curiosity and dedication to his research. His thesis on AGI has been recognized with the National Outstanding Thesis Award, a testament to the quality and originality of his work.

In addition to his impressive research abilities, Zhang San is a team player and has proven to be a valuable asset to our research group. He is able to work well with others and consistently contributes fresh ideas to our discussions. I am confident that he will thrive in a collaborative environment like your PhD program.

I strongly believe that Zhang San would be an excellent fit for your program and would make a valuable addition to your community of researchers. I wholeheartedly endorse his application and hope that you will consider him for admission.

Sincerely,

[Your Name]

请增加一些具体生动的细节,让推荐信更为有力。

Dear Admissions Committee,

I am writing to highly recommend Zhang San for admission to your PhD program in AGI research at Tsinghua University.

As Zhang San's doctoral advisor, I have had the pleasure of working with him for the past three years and have been consistently impressed by his intellectual curiosity and dedication to his research. His thesis on AGI has been recognized with the National Outstanding Thesis Award, a testament to the quality and originality of his work. In particular, his contribution to the development of a novel AGI algorithm has garnered attention from researchers in the field and has the potential to significantly advance the state of the art.

In addition to his impressive research abilities, Zhang San is a team player and has proven to be a valuable asset to our research group. He is able to work well with others and consistently contributes fresh ideas to our discussions. I have seen him take the lead on several collaborative projects, always ensuring that all team members are on the same page and making valuable contributions to the final product. I am confident that he will thrive in a collaborative environment like your PhD program.

I strongly believe that Zhang San would be an excellent fit for your program and would make a valuable addition to your community of researchers. I wholeheartedly endorse his application and hope that you will consider him for admission.

Sincerely,

[Your Name]

好了一些,但请增加下列事迹:1. 废寝忘食 他总是最后一个离开实验室;2. 发表了5篇一级刊物论文,成为青年学术新星;3. 虽然AGI被认为是难以实现目标,张三在定义AGI实现的不同步骤上提出了具有操作性的建议,并实现了10个步骤中的前5个。

Dear Admissions Committee,

I am writing to highly recommend Zhang San for admission to your PhD program in AGI research at Tsinghua University.

As Zhang San's doctoral advisor, I have had the pleasure of working with him for the past three years and have been consistently impressed by his intellectual curiosity and dedication to his research. His thesis on AGI has been recognized with the National Outstanding Thesis Award, a testament to the quality and originality of his work. In particular, his contribution to the development of a novel AGI algorithm has garnered attention from researchers in the field and has the potential to significantly advance the state of the art. Zhang San has also published five papers in top-tier journals, establishing himself as a rising star in the field of AGI research.

Despite the challenges and setbacks that are inherent in AGI research, Zhang San has remained committed to his work and has often stayed in the lab long after everyone else has gone home. His dedication to his research has paid off, as he has already achieved significant progress in his work. In particular, he has proposed operational steps towards the realization of AGI, and has successfully implemented the first five steps of his proposed framework.

In addition to his impressive research abilities, Zhang San is a team player and has proven to be a valuable asset to our research group. He is able to work well with others and consistently contributes fresh ideas to ......

中国教授头疼的为学生写推荐信问题,已经完美解决。只要你能列出零星哪怕是散乱的要点,机器就会给你拽成一篇看上去非常 professional 的规范推荐信。有没有问题? 当然可能有。例如明明是要求博士后推荐,它写成了 to your PhD program, 但关键是语言方面的困难都给你搞定了,只要通读一遍把个别词改正一下即可。

其二:快讯

AI,请按照严格的规范编写一个新闻稿,其内容包括:
1. 中国封控一夜取消,180度大转弯;2. 由此带来急剧的社会变化,包括大面积感染在各地同时蔓延,以及不同人对于这一波疫情的恐惧;3. 一方面广大群众为重新获得自由而欢呼雀跃,另一方面也对目前疫情可能失控深感忧虑;4. 专家前后不一致的说法,使得公众思想更加混乱;5. 各种滥用药品的情况开始出现;6. 政府无法对政策转变自圆其说, 权威下降。

新闻稿:

中国封控一夜取消,180度大转弯

近日,中国疫情突然爆发,导致政府决定实施封控措施。然而,这一措施在一夜之间被取消,导致社会发生急剧的变化。

首先,随着大面积的感染在各地蔓延,人们对于这一波疫情的恐惧感也在不断加深。一方面,广大群众为重新获得自由而欢呼雀跃;另一方面,人们也对目前疫情可能失控的情况深感忧虑。

此外,专家们在疫情发生后对于应对措施的建议前后不一致,使得公众思想更加混乱。同时,由于政府对于政策转变的解释不一,其权威也开始下降。甚至还出现了各种滥用药品的情况。

总之,中国疫情的发生和政策的转变,导致了社会的急剧变化。虽然广大群众为重新获得自由而欢呼雀跃,但人们对于目前疫情可能失控的恐惧感仍然存在。同时,政府权威下降也使得公众对于应对措施的信任度降低。

 

 

【相关】

chatGPT 网址:https://chat.openai.com/chat(需要注册)

《朝华午拾》电子版

李维 郭进《自然语言处理答问》(商务印书馆 2020)

【语义计算:李白对话录系列】

【置顶:立委NLP博文一览】