华为开源7B多模态模型openPangu-VL? 视觉定位与OCR能力亮眼

华为开源7B多模态模型openPangu-VL? 视觉定位与OCR能力亮眼

近日,华为正式开源昇腾原生多模态模型openPangu-VL-7B,该模型以70亿参数的轻量化优势,凭借出色的视觉定位与OCR能力成为昇腾端侧“新甜点”,为端侧部署及个人开发者提供高性价比方案。

实测显示,该模型可精准完成物体定位计数,如逐一点位菜品图中樱桃番茄并统计数...

点击查看剩余70%

{{collectdata}}

网友评论