
在XXXX年XX月XX日,豆包APP惊喜更新了一款引人注目的功能,即其崭新的实时语音通话功能。这个新功能是对全体用户敞开的,为他们带来了全新的交互体验。
过去,传统的语音对话系统常常采用ASR+LLM+TTS的级联模式,这难以满足真人级语音对话在理解完整性、生成自然度、交互低延时等多方面的要求。豆包的全新语音能力基于创新的端到端框架,使用原生方法将语音与文本模态进行统一建模。这一创新最终实现了从多模态输入直接到多模态输出的效果,为AI语音对话注入了“灵魂”。
据豆包相关负责人介绍,在用户体验方面,豆包的语音对话不仅具备了强大的理解和逻辑能力,能够即时回答时效性问题,同时还具备超低延时和流畅打断的能力。这一切都使得用户在交流中感到自然、流畅。
