超越stable diffusion与Imagen的开源文生图模型DeepFloyd IF来了-BFW编程笔记

超越stable diffusion与Imagen的开源文生图模型DeepFloyd IF来了

DeepFloyd Lab与StabilityAI联合,开源了新一代文生图大模型DeepFloyd IF。这是对Google之前发布的顶级文生图模型Imagen的完全复现,效果甚至超越了Imagen。

800_auto

Imagen使用预训练的T5-XXL模型(参数量46亿)编码文本,再训练3个不同的扩散模型实现不同分辨率图像的生成。DeepFloyd IF基本采用了同样的架构:

800_auto

DeepFloyd IF使用Frozen T5-XXL做文本编码

3个级联的像素扩散模型,分辨率分别是64x64、256x256、1024x1024

...

点击查看剩余70%

打赏博主×