为您搜集整理歌曲曲谱歌谱、简谱、吉它谱、钢琴谱!

王海峰:他打制了“百度翻译”2021/12/8

流行类(作词:佚名 作曲:佚名)  演唱:佚名2021-12-08 07:59

  “有木有、我勒个去、神马都是浮云”,这些汇集时髦语,何如能更确实翻译?记者以“神马都是浮云”为例,百度翻译为“Everything is nothing”,较量亲切原意,而谷歌则翻译成了“Horses are clouds of God”,基础不知所云。与百度翻译比拟,谷歌翻译显然表现出当地化不敷的特征。而控造组队竣工百度翻译技艺攻闭的则是百度根源技艺首席科学家王海峰。

  2011年8月,正在北京大学软件与微电子学院2011级重生开学仪式上,王海峰以新任道话消息工程系主任的身份,给重生们作了题为“互联网期间的天然道话惩罚”的学术陈诉。至此,北大虚位以待2年之久的道话消息工程系的系主任人选终归尘土落定。

  王海峰正在估计打算机周围是一位声名显赫的人物。由于切磋的了得成绩,2010年11月,王海峰被选为“国际估计打算道话学学会(ACL)副主席,正在ACL 近50年的汗青上,他是第一位被选副主席的华人。

  “这不但是国际同业对我自己的认同,也是他们对中国及华人学者正在本周围奉献的认同,别的,这也是对百度如此的中国企业的认同。”王海峰呈现。

  王海峰和估计打算机结缘依然有20余年的光阴。1989年秋,王海峰以优异的成效考入哈尔滨工业大学研习估计打算机,就正式与估计打算机打上了交道。

  王海峰告诉记者,他的父母都是上个世纪60年代的大学生,父亲结业于清华大学,母亲结业于哈尔滨医科大学,受家庭、学校及周遭境遇的影响,他从幼就立志成为一名科学家。

  还正在哈尔滨工业大学读本科时,王海峰就依然进入呆板翻译这个充满挑衅的周围。正在上硕士时刻,仅用一年就斥地出了当时正在国度“863”评测得到第一的汉英呆板翻译体例,并得到了部级科技前进奖。

  1999岁首,从哈尔滨工业大学博士结业时,依然学有所成的王海峰成了许多单元、包含极少核心切磋机构争抢的香饽饽。面临繁多诱人的采取,王海峰断然地采取了当时刚才设置不久的微软中国切磋院。2010年1月,王海峰加盟百度,早先了本人职业生活的新篇章。

  随后,百度就组筑了王海峰博士领衔的呆板翻译中央研发团队。因为百度具有超大界限的双语语料,行动呆板翻译周围的顶级专家,王海峰卓殊了了这些双语资源正在呆板翻译中的价钱。于是,对双语语料的探测、抓取和惩罚,就成了百度呆板翻译团队初期的紧要作事之一。

  王海峰和他的团队抓取的双语语料很速也到达了1000万句的界限。然则很速题目相继而来:翻译质地远比预期要低。比如“how old are you”这么常用而单纯的英文正在网上却被大批地翻译为“如何总是你”,“好好研习、天天向上”这句专家耳熟能详的中文,正在抓取回来的语料中,大无数都被翻为了“good good study,day day up”。进程1个多月的攻闭,王海峰和总共团队行使新的技艺技术将1000万语料过滤到400万操纵,大批低质语料依然正在过滤中被减少,呆板翻译的质地获得了大幅进步。

  从早先组筑团队,到百度翻译正式上线年多光阴。目前依托于百度正在中文互联网技艺上的上风,百度翻译对中文汇集道话有着怪异的应对才力。

  对王海峰来说,就百度而言,这还只是一个早先。由于除了呆板翻译,王海峰正在百度还控造天然道话惩罚、数据收录、数据开采、呆板研习、推举与特性化、语音技艺等支柱着百度各类产物的繁多根源技艺,他也心愿本人另日正在这些周围的切磋和产物斥地中可以有更大的成绩。

曲谱之家 ©2021 All Rights Reserved.
Powered by www.hpppw.com 
本站歌谱来源于网友自行上传及网络转载,如涉及版权及隐私问题,请来信至,本站会及时删除。