华为开源7B多模态模型openPangu-VL? 视觉定位与OCR能力亮眼

私信我

近日，华为正式开源昇腾原生多模态模型openPangu-VL-7B，该模型以70亿参数的轻量化优势，凭借出色的视觉定位与OCR能力成为昇腾端侧“新甜点”，为端侧部署及个人开发者提供高性价比方案。

实测显示，该模型可精准完成物体定位计数，如逐一点位菜品图中樱桃番茄并统计数...

点击查看剩余70%

私信我

最新提问

打赏博主×