英伟达推出文本生成视频模型PYoCo

英伟达推出文本生成视频模型PYoCo

一组来自英伟达、芝加哥大学和马里兰大学的研究人员发布了PYoCo,这是一个大规模的文本到视频扩散模型。

800_auto

它建立在eDiff-I这个先进的图像生成模型的基础之上,并增加了一个新的视频噪声先验。

根据开发者的说法,该模型结合了以前研究中的许多有效技术,如时序注意力、联合图...

点击查看剩余70%

{{collectdata}}

网友评论