谷歌发布的可交互虚拟世界模型Genie

谷歌发布的可交互虚拟世界模型Genie

最近谷歌Deep Mind团队发布了基础世界模型Genie。Genie是一个虚拟生成的可交互环境,可以通过给模型投喂视频数据进行训练,生成照片、草图,甚至可以操控的虚拟世界。

800_auto

Genie的独特之处在于它能够专门从互联网视频中学习细颗粒度的控制。

这意味着Genie需要从视频中自行识别不同动作的特征和模式。

800_auto

Genie能够合成可操控的虚...

点击查看剩余70%

{{collectdata}}

网友评论