在刚完结的WMT2018国际机器翻译大赛上,阿里巴巴达摩院机器智能-NLP翻译成团队击败多个国外巨头与研究机构,在所有递交的5项比赛中,全数取得冠军,沦为此次比赛的仅次于赢家。这5个项目还包括英文-中文翻译、英文-俄罗斯语互译、英文-土耳其语互译,达摩院在这几个项目的自动评测指标BLEU都位列第一。图片说明:达摩院取得5个项目自动评测第一名WMT全称WorkshoponMachineTranslation,是国际普遍认为的顶级机器翻译赛事之一,也是各大科技公司与学术机构展出自身机器翻译实力的平台。
2018年更加更有了还包括翰霍普金斯大学、爱丁堡大学、亚琛工业大学、马里兰大学、微软公司、腾讯等几十个海内外团队参予。由达摩院机器智能技术实验室资深算法专家陈博兴博士率领的达摩院机器翻译团队,在此次比赛中,基于业界近期的Transformer结构,展开了网络结构的改良和对词语方位信息的充分利用,全面改良了机器翻译的性能。同时充分利用阿里的计算资源优势,训练数据和模型的规模都超过了行业最低纪录。
陈博兴博士是国际权威的机器翻译专家,曾任加拿大国家研究委员会研究员,兼任过NLP领域所有顶级会议和期刊的审稿人,并曾经在各类机器翻译评测中获得优异成绩。达摩院机器智能实验室资深算法专家陈博兴博士此次达摩院不仅在竞争最白热化的英中翻译成上之后维持优势,值得一提的是,阿里还将机器翻译的技术优势伸延至俄语、土耳其语等多个语种。
以往这些语言的机器翻译技术,都由谷歌等国外公司与研究机构维持领先。据透漏,阿里巴巴的电商机器翻译总量早已超过每日7.5亿次。对于阿里的国际化发展而言,“语言”是众多门槛。
以阿里巴巴国际车站为事例,七成买家以英语交流,还有30%为小语种。而卖家端的调研数据表明,约96%的卖家对小语种无能为力。
这一现状,也促成了对机器翻译的极大市场需求。阿里达摩院机器智能实验室NLP首席科学家司罗回应:“机器翻译的发展无法瓦解用户与场景,阿里机器翻译的不断进步,归功于在电商、新零售、物流等领域累积的非常丰富场景和数据。
特别是在俄语、土耳其语、西班牙语的探寻上,让我们看见了机器翻译的极大商业价值与应用于潜力。”阿里的机器翻译技术除了应用于电商仅有链路服务之外,还普遍应用于菜鸟物流通关口、阿里云国际社区、飞猪旅行翻译成助手、钉钉社交口语翻译等一系列产品。
本文来源:九游会·(J9)-www.sykdfs.com