
Soul App团队表示,当前阶段,Soul的3D虚拟人技术已经完成了全面进化,形成了一个集成了3D虚拟人能力的多模态AI交互方案。这一方案结合了文字、语音和动作交互,致力于为用户提供更接近人类模式的互动体验以及更高效、自然、度的信息传递。
至今,Soul已经陆续推出了多种自研语言大模型,包括Soul X以及一系列语音大模型能力,如语音生成、语音识别、语音对话等。今年6月,该应用还在社交行业中率先推出了自研端到端全双工语音通话大模型。这一模型具备超低的交互延迟、快速自动打断、超真实声音表达和情绪感知能力等特点,可以充分理解复杂的声音信息,支持多样化的语言风格,实现更贴近日常生活的交互对话和真实的情感陪伴体验。
未来,结合最新集成的3D虚拟人技术和多模态端到端大模型的AI交互方案,用户创建的3D虚拟形象将在Soul平台上扮演多模态全能助手的角色。在群聊派对、瞬间广场等丰富的社交场景中,这一形象将全面助力用户的关系发现、建立和沉淀,拓展新的社交关系。通过提供高质量、有趣味性、沉浸式的交互体验,为用户带来真实、自然的情感陪伴。
Soul App的CTO陶明表示:“社交是AI技术率先落地的理想场所之一,而Soul作为一个集聚大量用户的社交平台,将不断加大对AI技术的投入,以满足用户的社交需求。预计在今年年底,我们的多模态端到端大模型将迎来又一次升级,推出全双工视频通话功能。这将使用户在Soul平台上体验到包括文字、语音和视觉在内的多模态创新交互,带来更加便捷、真实的交流方式。”
