[转载]再转一篇导师最近的短文:Google翻译器 VS Baidu 翻译器
屏蔽已有 4648 次阅读 2011-8-2 14:33 |个人分类:立委推荐|系统分类:海外观察| 导师, 百度, 机器翻译, 翻译器 |文章来源:转载
Google翻译器 VS Baidu 翻译器
1954年美国乔治敦大学,在IBM公司的支持下,进行了第一次机器翻译试验,把俄文译成了英文。五年之后,1959年中国试验成功了俄汉机器翻译。当年,由于计算机软硬件能力有限,只能在有限的范围内进行很简单的翻译试验。如今,机器容量和速度已不成问题,翻译能力大增,在线翻译也已实现。但总的说来,还有不少问题。例如, Google的翻译工具,把I don’t go to the party 和 I didn’t go to the party 都翻译成“我没有去参加派对”。
最近,Baidu(百度)也推出了一种翻译工具。上述两句话分别译成“我不去参加派对”和“我没有去参加派对”。在这一点上,Baidu比Google技 高一筹。
然而,在其他一些例句中,两个系统的翻译效果各有千秋,请比较:
1) [英译中] I played basketball at school this morning.
我打了今天上午在学校的篮球。[Google]
我在学校打篮球,今天上午。[Baidu]
[中译英] 我今天上午在学校打篮球了。
This morning I played basketball in school. [Google]
Today I am playing basketball at school. [Baidu]
2) This black granite wall includes the names of over 58,000 American soldiers who died or disappeared during the Vietnam War.
这个黑色花岗岩墙包括超过58,800人死亡或在越南战争期间失踪的美国士兵的名字。[Google]
这个黑色的花岗岩壁包括姓名,超过58000名美国士兵死亡或失踪,在越南战争。[Baidu]
3) The newest of the Presidential memorials is dedicated to Franklin Delano Roosevelt. Located in west Potomac Park, it includes four open air rooms made of rough granite blocks. The four rooms symbolize the four terms that President Roosevelt served guiding the nation through the Great Depression and World War ll.
新的总统纪念馆是致力于富兰克林德拉诺罗斯福。位于西部波托马克公园,它包括四个露天粗糙的花岗岩荒料的客房。四个房间的象征,罗斯福总统曾经历过大萧条和第二次世界大战会指导全国的四个方面。[Google]
最新的总统纪念碑是献给罗斯福总统。位于西波托马克公园,它包括四个开放气室,由粗花岗岩块。四间客房,象征四条款,罗斯福总统曾指导国家通过大萧条和二战。[Baidu]
以上两个系统的优劣,大家可以分析,并得出自己的结论。不过,我可以在这里提供一些线索,让大家考虑。机器翻译系统主要分规则型和统计型两类。Google的翻译器自称是统计型的,即在数百万篇文档中找出最佳模式,从而生成译文。规则型就是根据语言学原理建立的。Baidu 翻译器究竟根据什么建立的, 没有明确指出,只提到四大技术亮点,即卓越的机器翻译核心技术、领先的语料挖掘技术、强大的海量计算技术、可靠的web前端技术。
总起来说,半个多世纪以来,机器翻译的进步是很大的。但机器翻译归根到底是一个语言学问题,单靠统计是不够的。在此基础上,努力挖掘语言规则和翻译技巧,相信在二三十年后,定会出现能在某种程度上与人工翻译媲美的译文。
*注:应该指出,本文谈的只是中英文互译的一些情况。实际上,Google翻译器强大得多,它能支持57种语言的翻译。
白水 2011-07-28
转载本文请联系原作者获取授权,同时请注明本文来自李维科学网博客。
链接地址:http://blog.sciencenet.cn/blog-362400-471050.html
上一篇:“纟”的官称是什么呢?
下一篇:保持患者求生的 希望也算是个“治疗手段”
当前推荐数:2 推荐人: 吴吉良 朱新亮
推荐到博客首页
发表评论评论 (1 个评论)
删除 回复 |赞[1]蒋迅 2011-8-3 11:44Google translation has a feature that allow users to provide input. But most people don't know or don't use it