文章来源:万象ai发布时间:2025-03-24 14:12:01
AI奇点网12月4日报道丨当地时间12月2日,Meta对外发布了新一代Seamless翻译大模型的新版本—— SeamlessM4T v2,这是一项新的多任务语音转换技术。SeamlessM4T v2 能够同时将语音转换成多种语言,并且能够保持语音的流畅度和自然度。

SeamlessM4T v2 在多种语言转换任务上都取得了优异的效果。例如,在英语到法语的转换任务上,SeamlessM4T v2 的准确率达到了 98%。在英语到中文的转换任务上,SeamlessM4T v2 的准确率达到了 97%。

Meta透露,SeamlessM4T第二代的改进包括跨语言更加精准地保留表达的原意,并将延迟降低到约两秒。
在世界各地,语言差异可能成为沟通的障碍,翻译系统可以使来自不同语言背景的人更无缝地分享知识和经验。然而,如今许多这些系统并不能保留人类沟通所具有的关键要素。此外,语调、停顿和强调都传递着帮助人们沟通情感和意图的重要信号。
AI大模型模仿的是人类口译员的工作模式,人类的语音和翻译对于诸如轮流发言和时间控制等微妙之处也非常敏感。例如,想象一下人类口译员的工作方式:他们在低延迟和准确翻译之间找到了恰到好处的平衡。等待时间过长会阻碍沟通的流畅进行,而速度过快则会影响翻译的整体质量。能够实现真实对话的翻译系统应该在所有这些沟通要素上都能够交付。

SeamlessM4T v2 支持以下任务:
语音到语音翻译(S2ST)语音到文本翻译(S2TT)文本到语音翻译(T2ST)文本到文本翻译(T2TT)自动语音识别(ASR)
Meta进行了大量的人工智能研究,旨在表达丰富、快速和高质量的人工智能翻译来消除语言障碍。Seamless Streaming模型可以实现最快2秒的延迟内进行语音和文本的翻译。任何人都可以通过SeamlessM4T v2 实现语音和文本的相互转换与翻译,实现更轻松的跨语言交流。

Meta已经在官网发布了一系列的开源模型,以促进开放研究和合作。如果你感兴趣使用这款翻译大模型的话,它是免费体验的,点击下方的卡片即可:
体验地址:
https://seamless.metademolab.com/expressive
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25