英伟达推出1分钟连续长视频ai生成技术Test-Time Training(TTT)
Test-Time Training(TTT)技术由英伟达联合斯坦福大学、加州大学圣地亚哥分校等机构的研究人员开发,成功构建了一个“一分钟视频”生成器。
该技术通过在预训练的Transformer模型中引入TTT层,解决了传统Transformer在处理长序列数据时的效率瓶颈,能够生成长达一分钟的复杂多场景视频。
核心技术
TTT层:TTT层的核心在于将隐藏状态设计为神经网络,突破了传统RNN层隐藏状态为固定大小矩阵的限制。它通过自我监督学习,将历史上下文信息压缩到隐藏状态中,从而在处理长序列时能够不断学习和记忆关键信息。
多阶段...
点击查看剩余70%
网友评论