首页 -- >> 新闻频道-- >> 国内新闻
APP下载

勇摘国际大赛桂冠!微信AI赢得WMT国际大赛中英方向冠军

发布时间:2020-07-09 20:24 来源:经济日报-中国经济网 

  经济日报-中国经济网北京7月9日讯 作为全球学术界最具权威的机器翻译比赛,近日,WMT2020国际机器翻译大赛的榜单停止提交结果并发布排名,其中腾讯微信AI团队在「中文-英文」翻译任务上夺得冠军。

  提交结果BLEU评分第一,微信AI斩获中英翻译方向冠军

  WMT 是机器翻译领域的国际顶级评测比赛之一,自2006年创办至今,WMT已经成功举办15届。大赛每年都吸引了众多来自全球的企业、科研机构和高校所组成的顶尖团队,包括微软、Facebook、百度、金山、日本情报通信研究机构(NICT)。

  在赛制上,组委会根据中英、英中、中日等不同翻译任务提供测试集,参赛者在线提交机器翻译结果,组委会将根据在国际上具有广泛认可度的BLEU自动评估指标对参赛者提交的机器译文和标准答案进行拟合计算,拟合程度高者排在前面。其中「中文-英文」翻译任务是大赛历年来竞争最激烈的领域,也是最大的看点之一,在历届冠军中,微软、腾讯翻译君、搜狗都榜上有名。

  此次大赛竞争激烈,各参赛方共计提交近300次数据,最终微信AI团队经过多次角逐脱颖而出,成功占据自动评估指标的榜首,斩获桂冠。值得一提的是,BLEU评分前两名的机器译文均由微信AI团队提交。同时,今年微信AI仅使用了官方提供的数据(也就是受限资源),超过了所有使用受限资源和无限资源的系统。

  两种结构、三种训练方法,微信AI打造翻译领先技术

  在国际上斩获佳绩与认可,离不开微信AI团队在人工智能领域持续不断的深耕和产品体验的持续打磨。自2017年以来,基于业界最前沿的神经网络机器翻译技术,微信AI团队进行了持续迭代,引入了最前沿的机器翻译算法,不断创新算法和架构,提升翻译能力。

  在本次大赛上,微信翻译在技术上以更深和更宽的Transformer结构(包括Self-attention和Average-attention)和自研的Deep Transition结构(DTMT)为基础,用融合领域内知识的数据增强方法迭代生成高质量的伪数据,并利用Self-Bleu的组合剪枝策略集成模型并利用集成模型的知识蒸馏单模型,除了常规的交叉熵训练,还采用三种改进的训练方法来缓解偏差问题,包括改进的Scheduled Sampling训练方法、针对目标端输入的抗噪训练和更稳定的最小化贝叶斯风险训练。

  目前,微信翻译已成为一个日翻译数十亿字符的大型多语言机器翻译引擎,支持多语种间的双向翻译,在翻译质量上均达到业界领先水平。服务场景已涵盖微信对话翻译、朋友圈翻译、微信扫一扫等,同时还为腾讯小微、微信对话开放平台、微信读书、QQ邮箱等提供翻译服务支持,后续会陆续运用于更多的场景。

  (微信对话翻译场景)

  基础研究与技术开源,微信持续深耕人工智能

  除了在智能翻译领域取得优秀成绩外,微信AI团队在其他领域也建树颇多。不仅在2018、2019蝉联DSTC冠军,还在2019年获得RACE中高考题榜单第一名、DROP数学推理榜单第一名和QuAC多轮交互推理榜单第一名,凸显了微信AI团队在对话和推理方面的技术实力。

  在自然语言处理领域顶级会议ACL 2019中,由中科院计算所和微信AI等团队合作的文章“Bridging the Gap between Training and Inference for Neural Machine Translation”,获得了最佳长论文奖项(Best Long Paper),这也是中国大陆第一篇获此奖项的文章。随后,在ACL 2020中,微信AI团队亦有7篇论文入选,覆盖机器翻译、信息抽取、对话系统等领域研究成果。两年来,微信AI团队已有16篇论文入选ACL。

  基于深度学习研发的微信智聆语音识别技术,每天处理超过4亿条语音,语音识别正确率达到97%,并在微信语音输入、语音转文字、王者荣耀、QQ音乐等产品中提供了技术支持。而专注智能对话和NLP的微信智言,则以腾讯小微开放能力为核心,为除了家居硬件、PaaS、行业云和AI Bot等领域提供技术支持,让人与机器以最自然、最便捷的方式交流沟通。

  在技术开源方面,微信AI开发自研并开源了Transformer推理引擎,这也是腾讯对外开源的第100个项目。该推理引擎在CPU/GPU两种硬件平台上都可以获得最佳性能表现,速度快于pytorch/tensorflow和目前主流Transformers加速方案,且更适合NLP任务特点,无需图层次预处理,支持变长输入序列输入。TurboTransfromers在腾讯内部的游戏、内容生态、广告与金融等领域获得了广泛使用和认可。

  在未来,微信AI将持续加大对人工智能领域的学习与投入,积极将技术升级运用在产品之中,并创新整合新型能力,基于微信平台生态带来覆盖更广的应用场景和更智能的产品体验,为12亿微信用户提供更优质的智能服务。

【责任编辑:何明 流程编辑:何明】
相关文章
图片阅读更多>>
推荐
我看见
  • 井下作业先后四名工人缺氧被困 消防紧急营救
    7月8日下午,山东聊城经济技术开发区一名工人在一处管道井内施工时,因井底缺氧,被困井下。在场的其余3名工人发现情况后立即拨打119报警求助,并下井施救。消防人员到达现场后发现,由于井口狭小,井深三米多,氧气极度缺乏,下井营救的3名工人也出现晕厥,意识模糊等症状。此时,现场多名工人已经将其中一名症状较轻的工人救出,正在对第二名工人展开营救。消防人员利用绳索先后将其他几名被困工人成功营救,并交由现场医护人员,目前身体已无大碍。 消防部门提醒:进行井下作业时,由于井盖内或下水道内长期处于密闭缺氧状态,打开井盖后,应先通风一段时间,然后再使用可燃气体探测器进行检测。直到检测出井下气体足够安全时,才能下井工作。同时,作业时还要做好安全防护措施。一旦发生意外情况,切勿盲目营救,应第一时间拨打119、120报警电话寻求帮助。(文:中青报·中青网记者 邢婷 ;视频拍摄:李文浩 宋建洲)
  • 于丹:一条信息是特别好的作文题目
    于丹认为,在这个疫情期间,人心的起伏动荡,人们最渴望的是信息,人们最惶惑迷失的也常常是在假信息里。参加高考的孩子们已经是作为一个公民的年纪,可以有独立判断。
  • 王旭明:赞诗歌体裁回到高考作文
    “这道题目终于对诗歌放开了!”教育部前新闻发言人,著名学者王旭明对北京卷的其中一个小作文命题特别赞赏。
1/3
新闻排行榜