文章来源:万象ai发布时间:2025-07-16 18:11:07
作为聚焦年轻用户社交需求的平台,SoulApp近日正式升级自研端到端全双工语音通话大模型,通过技术突破,让AI自主决定说话时机,打破传统“轮次对话”模式,为用户带来更自然、沉浸的人机交互体验。此次升级不仅是Soul在AI社交领域的又一探索,更彰显了其以技术赋能情感连接的持续努力。
新模型摒弃了传统语音交互中依赖的VAD(话音激活检测)机制与延迟控制逻辑,打破行业中普遍存在的“轮次对话”模式,赋予AI自主决策对话节奏的能力。AI可实现主动打破沉默、适时打断用户、边听边说、时间语义感知、并行发言讨论等。同时,模型具备**度感知(包括时间感知、环境感知、事件感知等),口语化表达(如语气词、结巴、明显情绪起伏),音色复刻等能力,让AI更具“真人感”,支持打造更沉浸、类现实交互的语音互动新体验。
为了尽可能保证全双工对话模型的基础对话能力,避免模型“降智”,新模型采用了双LLMs的结构。由负责对话理解与生成的DialogueModel和处理语音生成的SpeechModel协同工作,实现跨模态信息的完整传递。通过精准建模“说话时机”与“沉默持续时间”,AI获得了自主决策对话节奏的能力,让AI的“真人感”大幅提升。
在社交陪伴场景中,Soul的AI能力展现出显著创新:不仅能通过情绪起伏、语气词等细节传递鲜明情感,还能深度整合人设与上下文,构建连贯的“数字人格”故事线。此外,除了一对一的情感倾诉,目前Soul团队还在探索多人语音中的话题引导,让AI能自然融入,成为用户社交关系网络的重要补充。
通过技术创新打破人机交互的边界,Soul正不断丰富着社交场景的可能性,让AI真正成为传递情绪价值、增强用户归属感的重要力量。此次全双工语音模型的升级,进一步推动了人机互动向“情感与信息双向交流”演进。未来,Soul还将探索多人交互场景的技术应用。
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25