阿里发布无需ocr技术就能识别图片文字等内容的开源多模态大模型mPLUG-DocOwl

私信我

800_auto

mPLUG-DocOwl是一个阿里发布的一个创新开源项目，旨在通过大型语言模型实现文档理解，无需依赖光学字符识别（OCR）。

该项目的核心是一个模块化的多模态大型语言模型，能够处理文本、图像和图表等不同类型的数据。

800_auto

最新版本DocOwl1.5已在ModelS...

点击查看剩余70%

私信我

最新提问

打赏博主×