NemoStation开源Marlin-2B:20亿参数视频理解小模型,普通显卡就能跑

NemoStation开源Marlin-2B:20亿参数视频理解小模型,普通显卡就能跑

近日,NemoStation宣布开源视频视觉语言模型Marlin-2B。该模型仅拥有20亿参数,专注于解决视频分析中最核心的两大问题——“视频中发生了什么?”以及“这些事件发生在什么时间?”。

800_auto

尽管参数规模小巧,Marlin-2B在密集字幕生成与时间定位...

点击查看剩余70%

{{collectdata}}

网友评论