搜索

首页/笔记/详情

分享一款开源通用端到端 OCR 模型GOT

博文: 35 作品: 188 开源: 0

私信我

分享一款开源通用端到端 OCR 模型GOT

800_auto

Vary 团队近期发布了 GOT，这是一个完全开源的通用端到端 OCR 模型。

800_auto

800_auto

GOT 支持多种输入类型，如现场文本 OCR、文档 OCR、细粒度 OCR 等，能够生成可读和可编辑的文本输出，并且在处理高分辨率图像和多页文档方面表现出色。

800_auto

800_auto

尽管如此，GOT 目前在多种语言支持和对复杂几何体及图表的 OCR 性能上仍有限制，开发团队认为 OCR-2.0 的研究仍有很长的路要走，而 GOT 也...

点击查看剩余70%

{{collectdata}}

网友评论

{{item.title}}

{{item.summary}}

博文: 35 作品: 188 开源: 0

私信我

bfwsolo，与ai对话就能生成部署全栈web系统

最新提问