Meta发布跨六种模态(图像、文本、深度、热度图、音频和IMU数据)的整体化人工智能模型ImageBind

Meta发布跨六种模态(图像、文本、深度、热度图、音频和IMU数据)的整体化人工智能模型ImageBind

当人类吸收信息时,我们会同时使用多种感官,例如通过看到繁忙的街道和听到汽车引擎的声音来获取信息。

为了使机器更接近于人类地、整体地、直...

点击查看剩余70%

{{collectdata}}

网友评论