首个语音大模型权威综述入选ACL 2025,多模态AI迎来新突破
2025-06-17
香港中文大学团队撰写的《Recent Advances in Speech Language Models: A Survey》被ACL 2025主会接收,这是首个系统梳理语音大模型(SpeechLM)的权威综述。论文分析了SpeechLM的技术架构(语音分词器、语言模型、声码器)、训练策略(预训练、指令微调、后对齐)、应用场景(自然对话、语音翻译、情感生成等),并提出评估体系与未来挑战。该成果被视为语音AI技术突破,将推动多模态AI在人机交互领域的应用发展。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
