微软发布“升级版”多模态大模型KOSMOS-2

微软发布“升级版”多模态大模型KOSMOS-2

昨天,微软推出了Kosmos-2升级版。相较于Kosmos-1,Kosmos-2增加了“定位能力”,能将语言与视觉世界相互联系。

举例来说,当输入“the left eye of emoji”,Kosmos-2不仅可以回答,还可以定位到图片中的心形;当要求描述图片内容时,Kosmos-2还能指出每项描述所指的对...

点击查看剩余70%

{{collectdata}}

网友评论