文章来源:08ai导航网发布时间:2025-10-14 15:28:36
9月13日消息,据外媒Neowin今晚报道,微软发布了“突破性(breakthrough)的”LiveInterpreterAPI,将实时多语言翻译能力引入AzureSpeechTranslation。用户无需设置输入语言,就能实现流畅的跨语言沟通。
该功能支持76种语言和143个地区,具备自动识别语言、低延迟、接近人工口译的实时效果,还能使用个人语音保留说话者的风格和语气。目前已开放公测。
附地址:AnnouncingLiveInterpreterAPI-NowinPublicPreview
这项API可用于多语言呼叫中心、在线会议、课堂教学、社交电商直播等场景,软件开发者可以借此取消语言切换菜单,让对话过程中自由切换语言。
其中的个人语音功能尤为亮眼,其能够完整保留原说话者的语调和节奏,让翻译后的声音听起来更自然,并提供企业级的隐私和同意控制。
LiveInterpreterAPI基于AzureSpeechTranslation打造,能够实现连续语言识别、覆盖所有支持语言、并提供低延迟的语音翻译。
微软官方的新闻稿提到,公司已与安克创新合作展示实际应用。安克创新表示:“我们很高兴能与微软合作,展示AI与日常科技结合的可能性。借助LiveInterpreter,我们为全球用户带来更智能、直观且沉浸的视听体验。”
微软还提供了快速入门指南,方便开发者集成该功能。普通用户无需直接操作API,就能通过接入该能力的应用或网站体验跨语言交流。
相关攻略 更多
最新资讯 更多
微软推出突破性实时翻译API,支持143个地区76种语言实时交流
更新时间:2025-10-14
释放AI数据中心价值:SolidigmQLCSSD成应对海量数据挑战的关键
更新时间:2025-10-14
特斯拉、华为与新势力决胜:世界模型大战
更新时间:2025-10-14
支付宝发布AI就业助手“晓叶”:支持“岗位找人”、职业规划、职业培训
更新时间:2025-10-14
外滩大会首发!蚂蚁密算推出AI密态升级卡实现零改动“即插即用”
更新时间:2025-10-14
AI对话“动口不动手”鸿蒙版豆包全面升级语音交互能力
更新时间:2025-10-14
临近机器人GPT-3时刻,具身智能开源模型的加速演进
更新时间:2025-10-14
马斯克力挺AMD:在中小型AI模型方面相当不错,暗示将降低对英伟达依赖
更新时间:2025-10-14
重磅发布|北京数基建发布“知行IntAct”混合智能体产品以AI定义城市治理新范式
更新时间:2025-10-14
腾讯宣布开源Youtu-GraphRAG框架,解决图检索增强技术难题
更新时间:2025-10-14