分享一款开源通用端到端 OCR 模型GOT

分享一款开源通用端到端 OCR 模型GOT

800_auto

Vary 团队近期发布了 GOT,这是一个完全开源的通用端到端 OCR 模型。

800_auto

800_auto

GOT 支持多种输入类型,如现场文本 OCR、文档 OCR、细粒度 OCR 等,能够生成可读和可编辑的文本输出,并且在处理高分辨率图像和多页文档方面表现出色。

800_auto

800_auto

尽管如此,GOT 目前在多种语言支持和对复杂几何体及图表的 OCR 性能上仍有限制,开发团队认为 OCR-2.0 的研究仍有很长的路要走,而 GOT 也...

点击查看剩余70%

{{collectdata}}

网友评论