写点什么

阿里国际发布首个大规模商用翻译大模型,效果据称超 Google、DeepL 等

  • 2024-10-17
    北京
  • 本文字数:793 字

    阅读完需:约 3 分钟

大小:394.50K时长:02:14
阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等

在 AI 调用量最高的场景之一——机器翻译,阿里国际的 AI 团队有了新进展。


10 月 16 日,阿里国际副总裁、AI 负责人张凯夫在接受彭博社专访时表示,阿里国际最新研发的 Marco 翻译大模型,支持中、英、日、韩、西、法等 15 种全球主流语种。目前已在阿里国际 AI 官网 Aidge 上发布,面向全球用户开放使用。


据称,基于目前广泛使用的开源评测数据集 Flores,Marco 翻译大模型在 BLEU 自动评测指标上,超过市面上的其他翻译产品,如 Google 翻译、DeepL、GPT-4 等。



图:根据公开榜单数据的测评结果


Marco 的主要优势就是由大语言模型驱动,能够基于语境进行精准翻译,而不是根据字面意思,造成哭笑不得的歧义。“你的宝贝正在路上”,不会再被翻译成“Your baby is on the way”。以“尊嘟喜欢”这一网络用语为例,一些 AI 翻译产品会将这句话翻译为“Zundu likes it”,而在 Marco 大模型中,这句话非常地道地翻译为“I really like it”。


如何实现这一效果呢?据介绍,Marco 翻译大模型通过面向多语言的数据筛选技术,如多语种混合语料甄别、多维度数据质量评估,获得高质量、大规模的多语言数据,再结合多语言的混合专家、参数扩张方法,从而保证主导语言(如中、英)性能不下降的情况下,提升其他语种的质量。同时,通过模型量化和加速、多模型规约等优化策略,大幅降低大模型的服务成本,甚至与传统小模型相比,成本也具有优势。


目前,Marco 翻译大模型已实现大规模商用。得益于阿里国际在跨境电商领域多年的积累,Marco 在跨境电商领域的表现尤为亮眼。对于个人用户来说,Marco 能够根据上下文提供高质量的翻译和良好的可读性,甚至支持不同的翻译风格,满足多样化的翻译需求。


根据媒体公开报道,阿里国际在去年成立了 AI 团队,过去一年在 40 多个场景里测试了 AI 能力,帮助 50 万中小商家、对 1 亿款商品进行优化。商家的 AI 需求也不断增长,近半年的数据显示,平均每两个月,商家对于 AI 的调用量就翻 1 倍,AI 的调用量已经突破日均 1 亿次。

2024-10-17 08:4910960

评论

发布
暂无评论
发现更多内容

爬虫实例:爬取中国大学排名Top20

Bob

Python python 爬虫 4月日更

Flutter 学习笔记(一) Text 组件

U2647

flutter 4月日更

重读《重构2》- 封装变量

顿晓

重构 4月日更

跨链技术如何破解区块链的可扩展性难题?

CECBC

区块链

浪潮云说丨打造网络安全“铜墙铁壁”

云计算

面向对象编程九诫

风翱

面向对象编程 4月日更

架构实战营模块二命题作业

Vic

架构实战营

我把这个软件,推荐给了总监

yes

第二课作业

杰语

四种软件架构概述

xcbeyond

Serverless 微服务 分布式架构 单体架构 4月日更

Python-Net编程

若尘

Python 网络编程 net

架构实战业命题二学习总结

Vic

架构实战营

计算机原理学习笔记 Day7

穿过生命散发芬芳

计算机原理 4月日更

华仔训练营第二次作业

方堃

架构实战营模块二总结

竹林七贤

混沌工程缓存实战系列一Redis

心远

缓存 混沌工程

微服务中台技术解析之sso登录实践

小江

Java 后端 架构设计 SSO

推荐!看完全面掌握,最详细的 Docker 学习笔记总结(2021最新版)

民工哥

Docker 程序员 容器 DevOps 运维

2021最新发布:Java面试突击大全 带你摸熟20+互联网公司面试考点

比伯

Java 编程 架构 程序人生 计算机

8421的数学含义

山@支

【架构实战营】第二模块总结

烟雨濛濛

架构实战营

跨省通办,海淀在全国率先推出“区块链+”服务新模式

CECBC

让孩子爱上阅读(一)

箭上有毒

读书笔记 4月日更

「前端初学者、硬件爱好者、编程自学者」微信小程序开发很简单!

智能物联实验室

大前端 硬件设计 硬件研发

如何避免团队里出现搭便车现象

石云升

团队建设 28天写作 职场经验 管理经验 4月日更

分布式系统当中的CAP理论

五分钟学大数据

分布式 CAP理论 4月日更

【架构实战营】第二模块作业

烟雨濛濛

架构实战营

streamlit:算法工程师快速编写demo的利器

行者AI

算法

【得物技术】得物前端性能监控实践

得物技术

大前端 体验 监控 用户体验 实践

Service Mesh 从“趋势”走向“无聊”

阿里巴巴云原生

Java 运维 云原生 dubbo 中间件

自学软件测试怎么学?(送思维导图+学习资源)

程序员阿沐

学习 软件测试 性能测试 自动化测试 测试开发

阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等_AI&大模型_赵钰莹_InfoQ精选文章
OSZAR »