腾讯发布同时支持文字、声音、视频、图片的多模态模型VITA

腾讯发布同时支持文字、声音、视频、图片的多模态模型VITA

800_auto

近日,腾讯优图实验室等团队发布了VITA,首个开源的多模态大语言模型(MLLM),能够同时处理视频、图像、文本和音频。

800_auto

VITA...

点击查看剩余70%

{{collectdata}}

网友评论