重大突破!稀疏注意力技术助力英伟达GPU资源效率提升超60%
2025-06-14
美国卡内基梅隆大学团队提出动力学扩展定律,通过稀疏注意力机制在英伟达B200 GPU上实现资源需求降低至三分之一,AIME和LiveCodeBench测试中问题解决率最高提升60%。该技术降低计算成本,支持更长文本生成和更多并行处理,强调硬件与模型协同设计对大模型扩展的重要性。实验显示Qwen3-0.6B模型吞吐量增长23.6-33.3倍,成果适用于各类硬件平台。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
