阿里发布无需ocr技术就能识别图片文字等内容的开源多模态大模型mPLUG-DocOwl

阿里发布无需ocr技术就能识别图片文字等内容的开源多模态大模型mPLUG-DocOwl

800_auto

mPLUG-DocOwl是一个阿里发布的一个创新开源项目,旨在通过大型语言模型实现文档理解,无需依赖光学字符识别(OCR)。

该项目的核心是一个模块化的多模态大型语言模型,能够处理文本、图像和图表等不同类型的数据。

800_auto

最新版本DocOwl1.5已在ModelS...

点击查看剩余70%

{{collectdata}}

网友评论