安娜是个很可爱的俄罗斯上进女青年,从小弹钢琴跳芭蕾,小学没毕业即随父母移民美国。她身材高佻,曲线优美,性情温和,举止得体,善解人意,给人一种古典但不古板,现代却不俗艳,阳光而浪漫的印象。大家知道,虽然俄罗斯大嫂大多偏胖粗线条,但俄罗斯姑娘却多有迷人的风采,老帮菜耳熟能详念念不忘的就有钢铁怎样炼成里面的资产阶级小姐冬妮亚,芭蕾舞天后乌兰诺娃,风华绝代的花样滑冰艺术家 Ekaterina Gordeeva。安娜也是这样一位俄罗斯女郎,每天就在身边,给满屋大多是 boys 的办公室带来了温馨柔和的气息。自然地,大家都喜欢她。
然而,安娜辞职了,很快就要离开,大家都舍不得。我心里也不是滋味,想到午餐时不再有她的说说笑笑,餐后也不能邀她打乒乓球了,失落落的。我问她一定要离开么,你不是说很喜欢这个环境么?You know this office is already too crowded with boys, and we are trying to change this situation, trying to find some girls with affirmative action, and you are leaving?
她回说,我喜欢这个环境,是因为在这里我接触的都是你这样的世界上最聪明的人,因为你们太聪明了,结果我的发展道路堵死了,只好痛下决心离开了,我还是去 consulting company 做我擅长的分析工作去吧。两年来,我亲眼目睹我的20小时的人工怎样被你的20秒的全自动搜索所替代,而且结果往往比人工更好更全更有一致性。
两年前我加入公司的时候,公司基本上是一个 professional service 类型的公司,虽然也开发了一个内部使用的系统,但系统的输出只是缩小了人工范围,必须有长时间的后编辑,手动增删修补,分析归纳,才能提供给客户。编辑人员我们称为信息分析员,要求语言能力强,阅读理解一目十行,并具有分析综合的技能。安娜就是信息分析员中的佼佼者。经她过手的分析报告,客户特别满意。
可是公司需要成本核算。核算的结果是,肉工可以,要适度,否则入不敷出,是亏本买卖。当时平均每个搜索分析的订单需要肉工22小时方能完工,这22小时叫做 pain time (既是分析员的pain, 更是公司的pain)。要想赚钱,理想的 pain time 支出需要控制在两个小时之内,在当时有点天方夜谭。老板找我谈的时候,就把它定为主要目标,但并没有设置时间限度,因为没有人知道其可行性以及达成这样的目标需要多少资源。我自己也不明白,只是感觉到了这个重担。我以前做过的工作,都是先研究,后做原形引擎,然后寻找应用领域,最后开发产品。而这家公司与多数技术创新公司截然相反,它是先有客户,后有粗糙的引擎,最后才引进人才和技术,把希望寄托在技术的快速转移身上。这条路子让我觉得新鲜和刺激,觉得可以试一下,我的技术转移技能能不能如鱼得水,发挥出来。先有客户和应用领域的好处是显而易见的,就向搞共产主义有了遵义会议的明灯一样,省却了在黑暗中的漫长摸索。道路是光明的,就看路怎样走才能赚钱了。
人心不足蛇吞象,老板告诉我,Wei,你知道,你的技术给我们的业务带来了革命性变化。我们的立足已经不成问题,只要我们愿意,维持一个机器加人工的服务,发展成年入几千万的企业指日可待。但是,只要有人工,就不能 scale up, 赚钱就有限,盘子就做不大。我知道你是有雄心的人(我心里说,子非鱼),肯定不满足小打小闹。不管多大风险,我们还是决定放弃这条道路,而走全自动的路子,让系统可以服务所有的分析客户,而不是只供我们内部人工(安娜这样的)或者需要专门训练的 power users 使用。我们的目标是让世界上每个分析员都离不开我们,就如大家离不开Google一样。为此,我们必须做到 pain time 为零,这是着险棋,但是前景不可限量。
Big data 与 云计算一样,成为当今 IT 的时髦词 (buzzword / fashion word). 随着社会媒体的深入人心以及移动互联网的普及,人手一机,普罗百姓都在随时随地发送消息,发自民间的信息正在微博、微信和各种论坛上遍地开花,big data 呈爆炸性增长。对于信息受体(人、企业、政府等),信息过载(information overload)问题日益严重,利用 NLP 等高新技术来帮助处理抽取信息,势在必行。
对于搜索引擎,big data 早已不是新的概念,面对互联网的汪洋大海,搜索巨头利用关键词索引(keyword indexing)为亿万用户提供大海捞针的搜索服务已经很多年了。我们每一个网民都是big data搜索的受益者,很难想象一个没有搜索的互联网世界。可是对于语言技术,NLP 系统需要对语言做结构分析,理解其语义,这样的智能型工作比给关键词建立索引要复杂千万倍,也因此 big data 一直是自然语言技术的一个瓶颈。不说整个互联网,光社会媒体这块,也够咱喝一壶了。
目前的状况如何呢?
我们的语言系统每天阅读分析五千万个帖子。如果帖子的平均词量是30,就是 15 亿词的处理量。This is live feed,现炒现卖,立等可取。 至于社会媒体的历史档案,系统通常追溯到一年之前,定期施行深度分析并更新数据库里的分析结果。我们的工程师们气定神闲,运筹帷幄之中,遥控着数百台不知身处哪块祥云的虚拟服务器大军,令其在“云端”不分昼夜并行处理海量数据,有如巨鲸在洋,在数据源与数据库之间吞吐自如,气派不凡。
when we talk about NLP scaling up to big data, it is this BIG
This is the progress we have made over the last two years. I feel extremely lucky to work with the engineering talents and product managers who made this possible. It is hardly imaginable that this can be done at this speed in other places than the Valley where magic happens everyday.
Where are we?
deep parsing 50 MILLION posts a day!!!
For one year NLP-indexing of social media data we use to support our products, we have
11 billion tweets (about 6-7% of the entire sample from twitter)
1 billion Facebook posts
1 billion forum posts from 5 million domains
430 million blog posts from 160 million domains
30 million reviews from 300 domains
55 million news reports from 55,000 domains
225 million comments from 100 million domains
And that is by no means the limit for our NLP distributed computing: the real bottleneck comes from the cost considerations rather than the technical barriers of the architecture. Money matters. Archimedes said, "Give me a place to stand on, and I will move the Earth." With the NLP magic in hands, we can say, give me a large cloud, we can conquer the entire info world!
I never responded to this. Actually please notice that I have a space between 性 and 交. Furthermore, please notice the difference between the last one (where I have < [ 一 次 ] 性 > and the first two. What behind is, I have the assumption (a truth I think) that ALL (well, except for 葡萄, 玻璃 and the like) multi-character 'words' are ambiguous (so-called hidden ambiguity) and hence have to be handled with dictionary at 'application' time (在‘用’字上狠下功夫). This is consistent with your 词汇主义 and your rule-of-thumb "keeping ambiguity untouched". I actually pushed that one step further by keeping ambiguity only one level (that is, you only need to look ONE level deeper). This is consistent with your 自底而上 but more concrete/specific -- whenever I see potential ambiguity at my level, I keep them there (as in < 性 交 > and then 断链.
I mean I agree with you fully. And by today if I have a bit more added info in dictionary, I think I can do 'shallow parsing' better.
很 < 不 [ 明 白 ] > < [ 北 大 ] [ 法 ( 学 院 ) ] > < [ 怎 么 ] 会 > < 变 成 > < [ 法 轮 ] [ 大 法 ] > 的 < 大 法 >
At that time I have entity but no event.
回复 : “消费品公司预测未来的客户需要的开发”,正是我们所做的主打之一,在那里,了解why客户喜欢或不喜欢某种产品至关重要。科技文献检索方面的应用我们也做过,主要是帮助解决 how 的问题。至于文章的错误或者信息的过时,说到底是人的判断,机器最多可以帮助排一下序,比如把最新的文献信息排在前面。一个问题出来了,解决问题的答案分门别类给你列出来就完成使命了。根据这些信息做判断或决策,那是万物之灵自己的事儿。
说起教英语,我当年的学生中名人可不少,皆因中国音乐学院是中国民族音乐的最高学府,能够攻读研究生的都不是等闲人物,甚至名冠中外的作曲家金湘(当时是作曲系主任,曾创作歌剧《原野》,华夏文摘当年为他出过专集,说他集古今中外之大成)也是我的编外学生。其他学生如今有的官至音乐学院副院长,有的是中国琵琶皇后,还有的被誉为某少数民族偶像级“夜莺”。最知名的当然是彭丽媛。平时聊起来,她对媒体恭维她是歌唱皇后或巨星什么的很不以为然,她 preferred 的称号是歌唱艺术家。其实彭丽媛一个学期也就能上5-6节课意思意思。就这样,常常她在上课,门外就有记者等着采访她。因为长期缺课,她实际上跟不上进度,但她到堂了,总不能晾在一边。所以,当我循环提问时,就找比较容易的给她,比如让她重复我的句子。让人惊异的是,无论句子多长,我说得多快,她都可以八九不离十的复述出来。有些句子显然她并不理解,看来她的音乐训练培养了她敏感的听觉。这样一学期下来,到期末我开始犯愁,怎样给这个特殊人物评分呢?跟学院教导处一商量,说特殊情况,特殊处理,你看着办吧。我体会的言下之意是,总不能不让她及格吧。音乐学院的公共外语虽然是研究生必修课程,毕竟不是他/她们 career 的重要内容。后来,我网开一面,期末给她单独出题,允许查词典,让她带回家做,第二天交来。她大概是熬了夜认真做的,可以看出是个很有天分的人,也确实花了功夫。里面存在一些低级错误,可以判断她是诚实的(其实她那样的地位请人代劳是很容易的)。看在她对这份试卷的认真态度上,我最终给了65分。
我1986年硕士研究生毕业留语言研究所,受到导师器重,春风得意。除了组里的日常研究开发外,每个周末都泡在所里,干些自己感兴趣的项目,都与世界语(Esperanto)的研究和应用有关。第一个项目是把自己的硕士毕业设计从封闭系统转为开放系统。这是我用 BASIC 编写的一款从世界语自动翻译成汉语和英语的系统 E-Ch/A。麻雀虽小,五脏俱全,是当年少有的一个一对多系统,也算填写了“空白”。这项工作的直接结果有三。一是在演示后,受到德国控制论专家 Frank 教授激赏,除了决定在他的控制论杂志发表该系统的论文外,教授还写了长信,要资助我到他的实验室去继续开发这个系统(“我非常希望,北京的立委硕士能到德国工作数月以便使他的国际语到民族语的翻译程序能适应我们的需要”)。这本是一个千载难逢的出国机会,又不用考TOFEL, GRE和到处发信申请。当年出国热已经持续升温,而我和太太却浑然不觉,自得其乐。并没有把这次机会认真当回事,加上我的老板和导师刘教授巧妙劝阻,说要继续开发可以,让Frank教授出钱,承包到语言所来。知道自己走不成(觉得中途离开,跟导师面子抹不开),我就做顺水人情,把我的同事兼师兄乔毅介绍给 Frank 教授,成就了他的出国。研发世界语系统的第二个结果是,我发表在El Popola Chinio(中国报道)上的世界语语言学特点的粗浅论文引起了一个著名的西班牙教授 Juan Regulo 的注意。这位老先生是世界语界老前辈,在他的大学和城市威望极高,以他名字命名街道、广场等。正值他退休,学校决定给他出四大卷印制精美的专辑,表彰他的贡献。其中一卷是关于世界语学(Esperantologio)的论文专集,于是老先生邀请我在《中国报道》的论文基础上,扩展加工,单成一章。我文思泉涌,洋洋洒洒写了17页,有老先生来来回回多次校改修正,发表了我平生第一次的Book Chapter ” Lingvistikaj trajtoj de la lingvo internacia Esperanto”(发表时老先生已经过世,他的去世在国际世界语界引起很多纪念,老先生千古!)。 我的世界语活动的第三个结果,是使我一夜之间成了万元户。在那个年头,市场经济刚刚萌芽,开始出现了第一批市场经济催生的万元户,但与多数知识分子无关。我们这些助理研究员,每月工资100元左右,即便加上工余的兼课外快(我由导师和师母引荐,在中国音乐学院兼职教授研究生英语,每课时不到10块钱,还要备课和自理交通),做梦也不敢指望哪天成为万元户。
话说当年荷兰有一家软件公司 BSO,从政府申请到一笔科研资金,公司本身补足另一半,做一个以世界语为媒介语的分布式多语机器翻译项目 DLT。五年下来,成绩斐然,开发了一个很像样的原型系统(但是分布式翻译的设想有点超越时代,最终没有找到后续资金去做商业开发)。为了对多语言机器翻译做可行性研究,BSO 要求按照一个统一的依存关系句法的理论框架,对十几种主要语言编写形式句法,用来支持媒介语和自然语言的相互转换。他们看到我在世界语机器翻译上有研究,于是请我承包汉语的依存句法的编写项目。也算他们找对了人,我周末日以继夜,努力工作五六个月,编写了一部比较完整的汉语形式句法-现代汉语依存关系句法(A Dependency Syntax of Contemporary Chinese),给他们交活,极受欣赏。他们先给了我1000荷兰盾的支票作为报酬,于是拿到中国银行托收。大概是荷兰太遥远,需要通过多次银行间的中转,结果三个月了,钱还收不到,我就写信抱怨。过了一周,突然接到中国银行通知,让我去取一笔电汇。我跟太太去王府井中国银行,惊奇地发现在我的名下有1000美元汇款。拿到这笔折合人民币约万元的“巨款”,当时没有顾上高兴,一路走一路嘀咕,难道钱真可以从天上掉下来。太太甚至坚持这肯定是搞错了,说要回去把不义之财退还。第二天接到荷兰公司的信,才明白是他们电汇的,作为对我的工作的额外奖赏,同时对支票不能及时兑现致歉(后来还是兑现了)。汉语是主要语言,我承包的项目对于他们的多语研究和寻找后续资金意义重大。后来乘我1989年去德国开机器翻译高峰会议,他们还特地邀请我和我的导师去他们实验室访问一周,进一步探讨汉语用于多语机器翻译的一些问题。
1989年夏天,我和导师去德国慕尼黑应参加第二次国际机器翻译最高级会议。此前,我跟荷兰BSO(Buro voor Systeemontwikkeling BV)公司的机器翻译研究组一直有联络,应约为他们的以世界语作为媒介语的多语机器翻译系统 DLT,编写了一部现代汉语依从关系的形式句法。他们听说我们要来欧洲,就邀请我和我的导师,还有中国机器翻译界知名人物董老师,会后顺道访问他们的实验室一周,做学术交流,共同讨论汉语句法里的一些疑难问题。这次活动,他们称作 Chinese Week.
游览阿姆斯特丹后,我们按计划去Utrecht的BSO公司访问一周。DLT 项目研究组十几个人,一半是语言学家,一半是工程师,看得出来,这是个气氛融洽的团队。德国世界语者 Klaus Schubert 博士是系统枢纽“依存关系句法”(dependency grammar)的设计人,在项目第二阶段继 Witkam 成为项目组长。71届大会后招进来的美国世界语者 Dan Maxwell 博士,负责东方语言的句法项目的承包、质询和验收,是我的直接领导(十年河东,十年河西,后来我成为他的 boss,这是后话,见《朝华午拾:水牛风云》)。Dan一看就是老实人,照顾我们客人殷勤有加。我看到他早上骑自行车来上班,笑着跟他说:“我在北京上班跟你一样”。
研究组的骨干还有国际世界语协会的财务总监,知名英国籍世界语者Victor Sadler 博士,我在71届国际世界语大会上跟他认识。作为高级研究员,他刚刚完成一项研究,利用 parsed (自动语法分析)过的双语对照的语料库(BKB, or Bilingual Knowledge Base)的统计信息,匹配大小各异的翻译单位(translation unit)进行自动翻译,这一项原创性研究比后来流行的同类研究早了5-10年。显然,大家都看好这一新的进展,作为重点向我们推介。整个访问的中心主题,仍然是解答他们关于汉语句法方面一些疑难问题。他们当时正在接洽欧洲和日本的可能的投资人,预备下一步大规模的商业开发,汉语作为不同语系的重要语言,其可行性研究对于寻找投资意义重大。
期间,Victor以世界语朋友身份,请我到他家吃晚饭。他住在离公司不远的一栋公寓里,太太来开门,先跟丈夫轻吻,然后招呼我进来。太太也是世界语者,忘了哪国人了,总之是个典型的世界语之家,家庭用语是世界语。Victor告诉我,太太实际上会一些英语,但是用英语对她不公平啊。太太很和善,跟我说,他们俩非常平等,她做饭,Victor洗碗。我说,这跟我家的分工一样,我最爱洗碗这种简单劳动。她笑着说,“Victor, vi havas helpanton hodiau (你今天有帮手了)”。饭后Victor洗碗,并没有让我插手,我站在旁边陪他聊天,一边看他倒进大把的洗涤液,满是泡沫把餐具拿出来,用干布擦
干。我告诉他们,这跟我的做法不同,我们总是怀疑化学制品有毒或副作用,最后必须用清水涮净才好。太太不解地问:“洗涤液如果有毒,厂家怎么能生产呢?” 这倒把我问住了。Victor夫妇和蔼可亲,我感觉在老朋友家一样,饭后一边吃甜点和水果,一边闲聊,尽兴而归。
说得多了,实际的意思是大家没有必要在美国这么干耗自己的青春年华,仰天大笑出门去,从此投军从戎,回到中国多快好省建设社会主义也不错,兴许还能和一把大的,比自己在北美30岁就可以看到自己60岁是什么样子好得多,无非就是住House跟Condo的区别,开大奔与开Focus的区别,别人儿子女儿上哈佛耶鲁,自己的孩子因为学区不好只能上个洋野鸡,其实说白了有什么区别,都是一嘴听着巨恶的ABC英文,中国人不是中国人,洋人不是洋人的怪物,而且大部分都有心理阴影,对自己的root and identity怀疑。特别是男孩子, 在学校受很多欺负,精神上就是一侏儒,搞不好成为新的VT小赵。
IT 中除了软件硬件工程师外,还有一些专门的方向工作前景也不错。一种是 DBA (data base administer 数据库管理员),还有 graphic design,包括网页设计、产品UI设计等,都是需要一定编程能力、operations support 或更多的设计技能,都是有职业市场的行当。DBA要保证DB的运行,要随时处理出现的问题,要做performance tuning。现在稍大的DB就是TB级的,而且很多都是要7x24不间断运行,这里面名堂多了。网页设计产品界面设计,也有很多才华、经验和技能成分。以前我们引擎开发出来以后需要做应用,就高价请过一个有名的UI设计家,对用户体验有深刻的理解,他的蓝图做得那个漂亮,工程师实现的时候基本就是照葫芦画瓢。所以,DBA和图形设计在IT行业中也是收入比较高的。高级DBA和设计者都是稀缺人才。
MBA 其实没必要有多年工作经验。有更好,但是也有从学校到学校去修这个的。不过,MBA 在专业学位中,是属于万金油性质。将来的职业发展,主要是做项目经理、产品经理、marketing 宣传、sales 销售、物流管理、分析员等,也有做到高级管理CEO/COO/CMO等的(老中能做到的很少)。能把这条路走通,需要很强的沟通能力、严谨的办事风格,这些素质不是短短一年的 MBA 培训可以学到的。因此,职业顺利发达与否,一多半决定于本人的素质, MBA 最多就是一个敲门砖。后去更多决定于个人素质和实际职场上的磨练。有些人适合,有很多人不适合。(我就不行。)另外要注意的是,MBA programs 特别讲究牌子,名牌学校的很难进,但出来前景好。也有很多杂牌的 programs,混一个牌子而已,后去如何,看造化了。
美国的孩子一进入最后一年高四就要着手大学申请了,全部申请圣诞节前搞定,来年春天逐步发榜。一般是选择8-10所大学分别申请,包括自己梦寐以求的名校(dream school),理想也现实的学校,以及几所保底的学校。申请过程很繁琐,很多 paper work,因此各种助学机构遍地开花。尤其是在亚裔社区,大家为尽量考取名校都不惜血本。
1) Please list the public and private colleges/universities that you will be applying to.
2) For each of the schools listed, please indicate the average GPA and test scores for admissions.
3) Which college is your first choice and why?
4) Describe your educational goals and possible career(s) you envision for yourself.
5) Why do you want to go to college?
6) What are three adjectives that best describe you? Please explain.
7) Which high school courses have you enjoyed most and why?
8) Is your high school record an accurate measure of your ability and potential? If not, why not?
9) How do you spend your time outside of school?
10) Describe your volunteer/community service and approximately how many hours you have completed.
11) What accomplishments are you most proud of?
12) What are you passionate about?
13) Please explain if there are any unusual or personal circumstances that have affected your educational experiences in a positive or negative way?
14) What points or qualities would you like to be included in your letter of recommendation? Responses can include traits from academics, personal life, activities, athletics, community, religious, work experience, special talents, etc.
删除回复 |赞[2]刘苏峡 2013-9-4 08:44Thanks for share. Is religious very important? Besides athelets, communities, special talents, what on earth do the activities mean?
李维 回复 刘苏峡 : leadership experience is important.
prizes or winners on all events, especially at national or international levels, are shining.
删除回复 |赞[1]虞左俊 2013-9-3 16:16Each school is different. In my son's case, he was told to identify and contact the teachers who knew him well. So, during the junior year each student should have a list of the teachers for writing him/her recommendation letters
【立委按】英国泰晤士报的世界名校排名据说更加客观公正,调查的范围之广和问卷之多,无出其右。可它与美国的排名相差真不小。要说英国也是老牌权威了,不时想表现自己的不俗,可多少人信他呢?不过美国排名也明显 favor 私校了。二者应该折中一下。美国公校大哥大加大伯克利(UCB)排名老六(去年是老八),加大洛杉矶(UCLA)也高居第10(去年是12),居然超过老牌长春藤哥大(Columbia)和宾大(UPenn)呢。真长社会主义志气,灭资本主义威风啊。可是其实在美国的百姓眼中,这种排法是倒置了,不是说一流公校不好,但论师资比例和生源等条件,无法与一流私校比。泰晤士看重的是科研,其次才是教学,说是2比1的权重差,所以这个排名似乎更适合研究生做参考。另外,美国人青睐的与长春藤比肩的一流文理学院(liberal arts schools),由于其规模较小,研究能力不足,虽然其本科被广泛认为是超一流的个性化教育,也几乎无一入围。而在美国,进入一流文理学院的难度和光荣,绝不亚于进入长春藤牛校。
The promise of an elite public university education for California’s top high school students continues to fade as record numbers of qualified in-state applicants are being rejected from every UC campus they applied to.
Admission rates at UC Berkeley, UCLA, UC San Diego and UC Santa Barbara have plummeted to less than half of what they were in the mid-1990s, a new analysis by this newspaper shows. This year, 11,183 freshman applicants who qualified for UC admission had no offers from their chosen campuses and were referred to UC Merced, the Central Valley campus that opened in 2005.
Some strove mightily and successfully in high school but found their aspirations opened few doors.
Student tour guide and Cal senior Sam Kirschner, right, leads a tour group past South Hall for students that have been accepted to the University of California in Berkeley, Calif. on Tuesday, April 29, 2014. Kirschner, originally from Louisville, CO, but now a California resident, is part of the trend to accept greater numbers of out-of-state students at the university. (Kristopher Skinner/Bay Area News Group) (Kristopher Skinner)
Aman Shergill — an A student who juggled an after-school job with a boatload of Advanced Placement classes and extracurricular activities — applied to seven UC campuses and got into one: UC Santa Cruz.
“It was within two weeks that I got all my rejections. It was pretty bad,” the Folsom teen said. “I just thought that with what I had done and all my hard work, I was hoping for a little more.”
Every year, more college-bound Californians feel the sting of rejection as spaces for the state’s college-bound students lag further behind the soaring demand for Cal and other popular UC campuses.
The ease of applying to many campuses online, the relatively low sticker price for in-state students compared to private colleges and population growth have radically changed the outlook for applicants. Growing numbers of out-of-state and international students, who pay nearly three times the tuition and fees, also fuel the competition for a spot in the class.
By Thursday, students must make the difficult decision about where to go in August. UC Berkeley gave thousands of fall applicants another option to consider: Wait until the spring term for a spot, when graduating students free up more space.
The options are more limited than parents and educators from past generations might assume, one expert said.
“Students need to be exposed to the truth,” said Lisa Garcia, director of outreach projects for USC’s Pullias Center for Higher Education. “I tell all my students, even the valedictorians, ‘You can’t just apply to Berkeley and (UCLA) and San Diego and Santa Barbara.’”
Excellent grades, solid SAT scores and a long list of activities these days might not be enough to get you noticed by Cal, which turned away some 20,000 more applicants this year than Stanford, the nation’s most selective campus.
Berkeley’s admitted class, as described in a campus announcement, included national robotics and debate winners, “a ballerina who has danced internationally,” Junior Olympics athletes, a Disney Channel series actor and “musicians, dancers and other artists who have performed at prestigious venues around the world.”
But three justices in the majority, Chief Justice John Roberts, Anthony Kennedy and Samuel Alito. concluded that the lower court did not have the authority to set aside the law.
"This case is not about how the debate about racial preferences should be resolved. It is about who may resolve it," Kennedy wrote.
"Michigan voters used the initiative system to bypass public officials who were deemed not responsive to the concerns of a majority of the voters with respect to a policy of granting race-based preferences that raises difficult and delicate issues," he added.
如果不想进UC,可以考虑州立大学里的学校。Cal Poly SLO, San Jose State, 等在湾区的高科技界口碑不错。湾区也有一些“Wild bird",主要赚外国人钱的,也能签证出来。但我不会推荐给ABC。回复穿鞋的蜻蜓2014-5-13 10:16伯克利加大一直有“中国城”的绰号,达特茅斯别说在中国鲜为人知,在美国知道的人也不多:)这两种学校互相借鉴一下可能更有好处,伯克利可以再贵族俗气一点,达特茅斯可以再大众高端(科研)一点。回复看得开2014-5-13 10:59
那么谁是伯克利的这个如意算盘的失意者哪?毫无疑问是加州的学生和他们的家长。如果你感觉到伯克利比以前难考了,You are right!总人数没有增加,非本州学生增加了800,当然是本州学生就减少了800。就这么简单。因为亚裔占伯克利学生的40%,所有肯定首当其冲的受到影响。而最有可能被挤掉的是那些在录取的边缘上又是低收入的学生。
屏蔽已有 10652 次阅读2014-5-16 22:40|个人分类:留学资讯|系统分类:海外观察|Berkeley, 伯克利, cal
今年去参加了伯克利每年一度的开放日,叫 Cal Day,人满为患,热闹非凡。伯克利人对UC Berkeley 自称 Cal,源于当年加大球队 California 的缩写,那时候加大别无分店,伯克利就是加大,加大就是伯克利,如今加大已经开了10所分校,成为公立大学的巨无霸,这个简称(比UCB的简称更常见)却沿用至今。
本来想写一篇详细的校园观感,配上图片,但后来在网上发现一位美国教育的业余顶级专家(是一位湾区藤妈,成功把两个女儿送进顶级长春藤名校,对美国高等教育了如指掌,如数家珍,相关博文行文流畅,图文并茂,靠谱得一塌糊涂,叹服),叫白露为霜,她已经写了一篇 Cal Day 观感:伯克利新生录取日:寻找劳伦斯- 白露为霜的日志。想,我怎么写也写不了她那么好,富有知识和历史感,精致、全面而有趣。罢了,就随便写几句,配上照片,意思意思吧,聊胜于无:没有伯克利,我这个《美国校园之旅》系列就太不完整 了。
排名放在一边,必须承认伯克利超强的综合实力。它的科研能力以及教育资源的广度和深度,完全可以媲美全美五强(哈佛、斯坦福、耶鲁、普林斯顿和MIT),是其他小藤无法比拟的。不过,也必须承认超级公校的伯克利对于本科教育和本科生的照顾,比起私校,落差很大。学生的毕业率远不及私校,一度有多达四分之一的学生不得不辍学或转学(伯克利的应对之道是任其自然淘汰,然后再从无数渴望转学来伯克利的社区学院或其他大学的学生中选拔顶尖学生予以补充),这一点影响了伯克利的排名。课业负担沉重,学生心理压力大,有不少学生有畏惧感,怕进来就没有 life 了。网上就有被伯克利和私校南加大(USC,在洛杉矶,排名稍低于伯克利,以前被称为富家子弟的派对学校)同时录取的学生,宁肯放弃伯克利,多缴两倍多的学费去排名低于伯克利的 USC,理由就是 I want to enjoy college life。
劳伦斯当时马上想到是要造更大的加速器。到了1931年的夏天,劳伦斯和他的同事开始建造11英寸的加速器。更大的加速室需要更多的磁铁,更多的电线,更大的地方。他的11英寸的加速器被安装在LeConte Hall的329号房间。这台像冒汽锅炉的加速器被称为第一个真正成功可用的环形加速器,可以把粒子加速到1.2 MeV (million electron volts)。
在以后的8-9年里,劳伦斯在伯克利建造一系列越来越大的加速器,从27寸,37寸,60寸,最后到达184寸。184寸的加速器,磁铁及其附属设备已经大到伯克利的校园都装不下了,劳伦斯的幅射实验室(Radiation Laboratory)最后只好搬到伯克利后面的山上。幅射实验室后来被改名为劳伦斯-伯克利国家实验室(Lawrence Berkeley National Laboratory),是美国能源部主力实验室之一。
有关劳伦斯的故事并没有到此结束。1961年劳伦斯-伯克利国家实验室发现了化学元素103号。它被命名为“铹”(lawrencium),用来纪念他。 1968年,劳伦斯科学馆(Lawrence Hall of Science)成立。用这座俯瞰伯克利的科学馆来向这样一位终生都在积极倡导公众,尤其是小学生,对科学的兴趣的人致敬是非常合适的。科学馆设有劳伦斯一生事迹的永久展览,也是湾区孩子最喜欢的去处之一。
I don't know much about Stanford as I've only visited for brief periods of time. I'm familiar with both MIT (I graduated from MIT) and Tsinghua (many friends from there, and been there many times) and in all honesty I think it's very hard to compare the two schools.
There are many fundamental differences in the school culture, many of which on the Tsinghua side don't stem from the school itself. Many people ask me why there is a lack of startups coming out of Tsinghua and so many from MIT, and of all the reasons, the one biggest reason I can identify is freedom.
In Tsinghua, they turn out the lights in the dorms at night. The network is pretty restricted. There are guards standing at the entrances to every building. In Tsinghua, the overall university culture is to study first. It's evident in Larry Zhang's answer that people in Asia think MIT students are successful because of studying hard. It couldn't be further from the truth.
Well, we do study hard. But that's not where strong computer engineers come from. At MIT, studying isn't why we are here. We're here to hack everything we can lay our eyes upon. In my undergraduate dormitory, we had welding equipment, wood cutting equipment, plenty of EE stations, spare concrete and wood lying around the hallways. We had easy access to supply rooms, machine shops, and all kinds of other facilities for non-academic personal use. We had a mailing list called Reuse where you could race around campus picking up all kinds of wacky stuff labs didn't want, from rack-mount servers to old nitrogen dewars. We have an open network without port restrictions, free static IP addresses, gigabit network drops to dorm rooms with unlimited symmetric bandwidth. And MIT encourages us to use these resources to the fullest extent possible and go build the future. I had 15 computers in my dorm room, until the advent of virtualisation. My neighbor across the hall picked up an industrial laser and built his own laser cutter. Another neighbor was busy with home-made RF electronics analysing security deficiencies of the local subway and the school ID system. Another neighbor built a second floor in his dorm room. Another neighbor managed to launch a camera into space for under $200 in parts just to prove it could be done. Another managed to build a 3D display, another was fooling with virtual reality headsets, another was busy hacking at the Linux kernel for fun.
When was all this stuff done? At the dead of the night. When Tsinghua pulls the power on its dormitories. In fact I'm not sure if I can think of a bigger showstopper to a country's technological future than forcefully pulling power on the brightest students. How are you supposed to build projects? How are you supposed to run your servers in the early stages? Over at MIT, we build companies out of dorm rooms and our bedrooms become datacenters and laboratories.
Did we sacrifice study time to build stuff? Totally. A lot of us weren't at MIT to study anyway, we came here to build, and so build we did.
Did we break any rules? All the time! But fortunately, MIT doesn't watch us. No guards standing everywhere, no cameras, nothing telling us what we can and can't do unless we really do something physically unsafe. And so we hack the hell out of the campus too with high-tech (safe) pranks, not just our dorm rooms, and by doing them I learned about everything from Python to RF circuitry to power electronic design. In Tsinghua, they wouldn't even let me take pictures inside; there was a silly guard at the entrance to every building. Good luck hacking anything there.
Where are these people today? Half of them are CEOs of major computer engineering companies, software companies, or hacking away at the next big innovation from a large Silicon Valley company. Computer engineering skills comes first and foremost from practical experience, not from classes. And that's precisely what we were getting in our dorm rooms at obscene hours of the night.
Don't get me wrong, Tsinghua students are extremely intelligent, bright, smart, and in fact no different from us in the passions they have for inventing the future. I've been there many times. I have tons of friends from Tsinghua. The real problem is not the students, it's the environment of the school, traditional Asian academic value system, and everything else that quickly stops them from putting their dreams and future first rather than studies. That's been my general observation over the years.
Anyway, I was going to check out this new class they're teaching this term, but think I'm just going to screw it and get back to hacking at my app instead ...
市场化是不是能解开这个死结不知道,但是这个制度需要改造是无疑的。而且改造的方向不要向美国学,尽管美国的“德智体美全面考量、黑箱作业”的升学选拔机制听上去确实比东土强。不跟美国学 是因为这边的制度也在检讨,对青少年的四年(高中)摧残几乎不亚于国内的高考。美国有草根运动做调研、拍电影呼吁减轻学生负担,改革升学制度(如草根纪录片《Race to nowhere》)。
老邱并不老, 还不到五十岁。他的中文原名叫邱芳全, 可能没几个人听说过,连我自己也是不久前才知道的。但若提起老邱的英文名字 David Chiu, 那可是江湖上响当当的人物,对于见过点儿世面的玩扑克的人可以说是无人不知无人不晓。梁山一百零八条好汉,真牛的都在三十六天罡数内。在扑克比赛中扬名立万的人物多如牛毛,就我能说出名姓来的也不止一百零八条。我查了一下PokerPages 网站的统计,若按比赛赢的奖金来排,前一百名基本都有三百万以上,老邱以将近六百五十万美元排在第二十四名,绝对是位列天罡的牛人。其实网上的统计不是很准, 比如老邱在1996年拿的 US Open 冠军和1999年TOC 冠军的奖金都给漏掉了。
(一) 技惊四座
我知道有老邱这么个人物,是在十年前。当时老邱刚拿了TOC 冠军,被很多人认为是 Best Limit Holdem player, 也就是最牛的有限豪胆玩家。这个TOC 是 Tournament of Champions ,就是冠军赛的意思, 不是谁都可以报名参赛的,必须是在WSOP 等重要比赛中拿过冠军的人才有资格参赛。1999年是第一届,搞了个入场仪式,三十几个国家的牌手,跟奥运会似的有礼仪小姐打着国旗引领入场。跟随五星红旗入场的选手只有老邱一人。最后咱们的老邱不单拿了第一成为冠军中的冠军,而且展现了令人惊叹的牌技。直到今天还不时有人提起他在 FLOP 前放掉KK的那手牌。TOC比赛前面是Limit Holdem, Omaha Hi-Low, 7 Card Stud 几项混合比赛, 到最后还剩下54个人的时候转为No-Limit Holdem。那把扑史留名的牌的经过是这样的:
盲注为5000/10000, 前面两个人跟进1万,老邱在Button上加注到7万5,小盲全进。大盲和前面跟进的两人都缴枪了。小盲有60多万的筹码,老邱当时有大约85万。老邱冷静地思考了一会儿,淡淡地说道“我放弃”,然后把一对老K面朝上扔到了废牌堆里。网上可以找到一些当时在场者的记述,即便不读这些记述我也可以想象当时在场观战者是怎样的惊诧莫名。KK, 仅次于AA的第二好牌,平均每玩221把才能拿到一次,就这样轻易地给扔了?对手也同样的惊诧,但可能更多的是敬佩老邱非凡的读牌能力,友好礼貌地亮了他的底牌:AA。我们还可以想象观战者是怎样的更加惊愕。虽然佩服,但怎么也不能明白老邱是如何能读出对手底牌的。当时为比赛做解说的迈克-塞克斯顿(Mike Sexton)和费尤-海尔姆斯(Phil Hellmuth)惊叹道“Wow, What a lay down!” (多么了不起的放弃呀). 在FLOP之前能放掉KK,老邱并不是第一个人, 之前Hamid Dastmalchi 也曾在WSOP中干过,但那是经过三次加注之后,而且对手是很紧的牌手。即便这样,也被认为是很了不起的。现在这把牌,对手在老邱加注之后直接全进,实话说,从牌局的进程来看,根本不能断定对手是AA。连大高手泰德-佛瑞斯特(Ted Forest)当时都很不解地说“what the hell is going on(这他妈是怎么一回事)?”是啊,这究竟是怎么一回事呢?直到这次我去拉斯维加斯比赛期间和老邱聊天,他向我道出了其中奥妙,我才恍然大悟,更加佩服老邱的读牌能力,也不由慨叹:大概我永远也做不到了。 老邱少年时游泳耳朵感染,导致部分失聪。这个不足使他在牌桌上格外注意用眼睛观察对手,再加上他在赌场当发牌员的几年,阅尽三教九流牌手,每个牌手的一举一动他都细心观察,养成了他敏锐的观察能力。耳朵失聪正好排除干扰,更专注比赛。长久的磨练,使他即使在WPT和 WSOP的终桌比赛观众呐喊不断,在电视台长枪短炮的摄像镜头下听着现场解说,也能全神贯注比赛而心无杂念。这手牌老邱观察到了以下迹象: 第一,小盲在微微捻开底牌看牌的时候,两张牌分得比他每次分的稍微有点宽, 这是上面那张牌是A的一个迹象,因为只有A要稍微多露一些才能看清楚;第二,看完牌后他小心地放了一个筹码压住底牌;第三,他喊“全进”之前,头向右偏,对他左手边的下家大盲以及跟进的两家连看也不看;是什么牌能够让他有这样的自信?几点综合一起,可以断定他手里一定是AA。
其实,这把牌虽然被人广泛议论称道,但老邱说这并不是他在那次比赛中最得意的一把。他在终桌还有一把惊人的跟进。在桌上全部5张牌都出来之后, 对手下了很大的注。老邱一个对子都没有,手里的大牌是一张K,就是个king high。但他通过观察研究,认定对手就是Q high, 就勇敢地跟了,而对手果然就是Q high!“What a great call!” 天才牌手斯杜-恩戈在和曼苏尔比赛中那J high 惊人的一跟,作为读牌能力和胆略的一个经典范例而载入史册。但白瑞-格林斯坦(Barry Greenstein)曾经说过“大家都谈论斯杜-恩戈的跟进如何天才,但谁见过他什么时候有过了不起的放弃?没有。”伟大的放弃比天才的跟进更难做到。而老邱在同一场比赛中,既展示了一把伟大的放弃,也表演了一把天才的跟进, 能不得意乎?实在是该拿冠军,也拿到了。
跟老邱聊完后我自感也有所悟,在当天的比赛中也有出色表演,上演了一把不算太伟大的放弃(QQ Preflop 放掉,对手亮了KK)和一把不算太天才的跟进(在河牌后A high 跟进Q high 的一个大注),呵呵。所以俺那个比赛进了钱圈也是应该的。但是最后还是没经受住考验,AA在转牌放不掉,输给了对手的同花, 没能拿大钱,教训深刻,也深深体会到理智的放弃比勇敢的跟进更难于做到。还得修炼啊。
扑克有 bad beat, 就是愤输的意思,指的是这样的情形:自己优势很大的情况下把很多筹码推进去了,但运气不佳来了邪门牌让对手赢了。老邱这场牢狱之灾也是愤输,运气不佳的小概率事件发生了,损失惨重。然而,高手毕竟是高手,打牌愤输是常事。愤输以后,低手往往控制不住自己的情绪楞来(术语叫 On Tilt), 通常是损失更加惨重。高手更多的是在乎自己是否做了正确的判断和决策,运气因素不是自己能控制的,愤输也是一把牌,不能把坏情绪带到下一把牌里。老邱是一等一的大行家, 知道怎样控制自己的情绪。出狱之后,很快就赶上第一届TOC 冠军之赛,老邱技惊四座成为冠军中的冠军。当然,那场愤输经历沉淀在老邱的心底,更增加了他对自己的民族和文化的认同感。我觉得,后来老邱在TOC比赛中代表中国出场,以及去年正当奥运火炬传递变成政治风波之后,老邱在世界扑克巡回赛总决赛上赢得冠军后当场身披五星红旗,都折射出这场无妄之灾的沉淀效应。
(五)惊天逆转 (上)
说起扑克比赛来, 最重要的两个赛事是世界扑克系列赛(World Series of Poker, 简称WSOP)和世界扑克巡回赛(World Poker Tour, 简称WPT)。WSOP 有点像奥运会,每年五月底至七月中在拉斯维加斯的 RIO赌场(2004年以前在马蹄赌场)举行,天天有赛事。WPT是2002年才创立的。加盟WPT举办比赛的赌场选择不同时间分别举办比赛,每一站 WPT比赛像个小WSOP,除了主赛(一般为一万元报名费)还有很多报名费比较低的比赛。最后主赛的终桌(Final Table)比赛经过剪辑解说后在电视上播出。每年四月份,在拉斯维加斯的比拉揪(Bellagio)赌场举办的报名费为两万五千美元的比赛,为WPT的冠军赛,获胜者成为年度WPT冠军。由于两万五报名费的门坎儿太高,大部分业余选手因负担不起而被挡在了门外,参赛者基本都是职业选手,因此这个比赛是最难打的比赛之一。因为照顾电视转播时间的原因, WPT比赛的终桌人数限定为6人。
六位牌手中最引人注目的非戈斯-汉森莫属。这不光是因为他的筹码最多,更因为他名头最大。戈斯虽然跟WSOP金手链总是缘悭一面,但在WPT比赛中风头最盛,曾夺得三站比赛的冠军, 并夺得2005年澳大利亚百万冠军赛(Aussie Millions Champinship)冠军,是电视里最脸熟的牌手之一。这位有着威猛面孔的丹麦人曾被时尚杂志评为性感男星。他牌风松猛诡诈,什么牌都玩,别人很难猜出他手上的牌。一旦让他打顺了,收起别人的筹码来就像城管见了街头摆摊儿卖菜的,想怎么来就怎么来,没什么道理好讲。但是,在他貌似胡来的牌风背后,其实是有着十分精明的计算。他所著《Every Hand Revealed》是我读过的扑克书中为数不多的好书之一。
老邱筹码翻身之后有了些回旋余地,但仍然落后。Card Player杂志描述这一段时这么说“He now had some breathing room, and he made good use of it. He stayed out of Hansen’s way, but won the pots he needed to win to keep the momentum shifted his way” 通俗点说,就是老邱充分利用这一喘息机会,避免跟戈斯按他的战法搞阵地战,避开敌人猛烈火力,但是该赢的锅还都赢了,并把战局拉到自己习惯的运动战中来。我听了老邱对这一阶段的自战解说又长学问了。原来老邱翻了个身有了喘气的空间后立即调整战略施缓兵之计。实话说,这么高级战法我此前根本没什么主动意识。一般人也不会跟你讲,书上也不会告诉你。老邱说他非常希望看到有更多华人牌手出人头地,他不在乎用中文讲他的心得。我呢,一时半会好像还出不了头儿,也乐于跟讲中文的朋友吹牛交流,就给抖落出来,相信很多跟我差不多水平的人会从中受益。从整体策略来讲,老邱希望打小锅,慢慢往上追赶,而不是轻易搏命。戈斯气势逼人,抢锅加注比较大,这样进去看FLOP三张牌的成本就很高。而老邱的策略是要打太极,借力打力,希望打小锅,看FLOP之后看再发力。为了把戈斯拉到自己擅长的打法上来,就要缓解他的攻势,让看FLOP的成本降下来。这样,就相当于把盲注变小,自己的筹码相对盲注变多了,生存压力就小了。怎么实施这个战略意图呢? 老邱故布疑兵,几次拿到如AQ这类强牌故意不加注而是平进。在FLOP戈斯放弃之后,老邱又故意亮了几把牌。这样,给戈斯造成老邱在慢打强牌设陷阱的疑虑,戈斯不由的开始防范,不自觉地放慢了攻势,加注变小甚至平进变多起来, 让老邱达到了低成本多看FLOP的战略意图。
这段看似你来我往大体均衡的折冲中,还有一件值得一提的趣事,但我又觉得全写出来可能不一定合适,我就透露一半吧。前边说过,大部分人有tell,连戈斯这样的顶尖高手居然也被老邱读出了破绽!比赛前老邱做了大量的准备,他以前有很多和戈斯同桌竞技的经历,也和其他一些高手讨论过戈斯的打法,也细心研究过电视录像。大家从电视上可以看到,戈斯在打牌时偶尔有转头活动脖子的动作。这么个细微动作被老邱看出了蛛丝马迹。他的头先向哪边歪并不是随机的,呵呵。他向某一侧先歪的时候心态比较消极,看到这个动作后老邱就主动进攻,甚至手里拿着不同花的(2,4)就去 bet in the dark , 就是在发牌员还没开出牌来就提前下注。拿着7 high 什么都没有,在FLOP 上check-call (先过再跟对方的注),然后转牌再主动下注巧取豪夺。老邱曾跟我讲“你们这样看书比较多的,对概率很清楚,这是好的。但是,如果你看到机会不能很好利用,那就是浪费机会”所以呀,要想在大赛中取得好成绩,还得多练习捕捉战机的能力和随机应变的心理素质。
有一次,我说话漏嘴了,女儿大笑,说:“Dad, it does not make sense at all”。我就趁机跟女儿介绍了上述名言,她居然极感兴趣,整整一天都在那里一边唠叨,一边自娱:“haha, this is the most stupid sentence I have ever heard. How can ideas sleep? Ok, even if it can sleep, how can it sleep furiously? Ideas have color? Green? Come on. Ok, if it is green, how can it be colorless.”
就是,在这个短短的句子中,所有发生语法关系的词,在概念上都不具有兼容性,不 make sense. 可是,每一个 native speaker, 都发现这是 perfect grammatical English,否则我们怎么能够理解这个句子的荒谬(how do we make sense of nonsense?)。乔姆斯基的这个俏皮的思维实验是要表明,句法结构是可以独立于语义(和概念)的。语言学家在研究语言的时候,应该排除语义的干扰,才能深入了解语言结构及其转换规律。这个观点实际上是有隐患的(此处不谈),但是把句法(syntax)和语义(semantics)分开,在当时确实极大地推进了语言学的研究深度。
Interpreting “colorless green ideas sleep furiously”
Does it make sense?
In a certain domain, the Chomsky’s famous sentence is well imaginable.
Colorless green ideas sleep furiously.
Imagine the following context:
As we know, Esperantists wear a badge of “a green star”, a symbol for Esperanto
and its ideals. From there, “green ideas” would be easily conprehensible to
their minds.
Suppose now comes an opponent to Esperanto, he may say,
“Your green ideas are really colorless, not only colorless, those ideas are no
longer popular! Colorless green ideas sleep now!”
Well, what is a possible reaction from some Esperantists?
“Yes, our ideas sleep now. But remember,
colorless green ideas sleep furiously! ”
2006年06月18日
———————————————————————–
立委补记:
老乔研究语言学的一个出发点就是:人一辈子在有限的语言exposure的环境里面,input is full of fragments, errors, slips of the tongue, etc. 怎么可能学会语言?他最后归结到人与生俱来的universal grammar机制。外在的imperfect input不过启动了这个机制,对其做微调而已。所以再笨的人母语也还是学会了,有语感。不过学第二语言就不同了,因为universal grammar 的 parameters 一旦置值,就有了固化的顽固。第二外语学得好坏各个不同,看造化了,总体来说,女孩比男孩强,所以立委虽为师兄,也不敢在师妹面前逞强。
推荐一个不知道共产主义饿死人的无知老美干嘛?
到立委地面上来踩踩。
在德赛园左派声音太少。以我的经历,在此处发表左派言论,会立即招致怨恨,一些人甚至会堵在门口谩骂。
这应该正是中国读书人争取的“民主”。十方明确,这种“民主”并不是西方意义上的民主,而更接近墨西哥式的“民主”。
按照我对美国的体会,这种情况在美国是不存在的。而且,美国的顶尖大学往往都有左派大本营。象Harvard, MIT,Berkeley.