腾讯突破语音合成技术瓶颈,零样本克隆性能大幅提升
2025-04-19
腾讯研究团队在语音合成技术上取得突破,提出F5R-TTS系统,首次将GRPO优化应用于非自回归模型,显著提升零样本语音克隆的可懂度和说话人一致性。该技术通过概率化转换和两阶段训练策略,解决了非自回归TTS模型强化学习的难题,在WER和SIM指标上分别提升29.5%和4.6%。实验验证其在复杂场景下的稳定性,为语音合成领域提供新思路。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
