python识别票据身份证手写字等图片中的文字(OCR识别)

python识别图片的中文手写文字(OCR识别)

python识别票据身份证手写字等图片中的文字(OCR识别)

ocr识别的全称是Optical Character Recognition中文光学字符识别,在日常的使用中还是比较广泛的,比如不愿意打字的朋友可以直接通过ocr将照片中的文字识别,减少了打字的时间,提高了工作效率,那么今天我们来说说如何通过python来识别照片中的中文并提取出来,我们先看看几张识别提取效果图吧。

python识别票据身份证手写字等图片中的文字(OCR识别)

火车票识别

python识别票据身份证手写字等图片中的文字(OCR识别)

身份证识别

python识别票据身份证手写字等图片中的文字(OCR识别)

A4打印纸文字识别

python识别票据身份证手写字等图片中的文字(OCR识别)

手写文字识别

是不是很强大,下面我来讲怎么识别的,上面的识别效果主要靠github上一个开源库chineseocr。

此项目基于yolo3 与crnn 实现中文自然场景文字检测及识别,采用darknet深度学习框架。主要功能如下:

★文字方向检测 0、90、180、270度检测(支持dnn/tensorflow)

★支持(darknet/opencv dnn /keras)文字检测,支持darknet/keras训练

★不定长OCR训练(英文、中英文) crnn\dense ocr 识别及训练 ,新增pytorch转keras模型代码(tools/pytorch_to_keras.py)

★支持darknet 转keras, keras转darknet, pytorch 转keras模型

★身份证/火车票结构化数据识别

★新增CNN+ctc模型,支持DNN模块调用OCR,单行图像平均时间为0.02秒以下

★CPU版本加速

★支持基于用户字典OCR识别

★新增语言模型修正OCR识别结果

★支持树莓派实时识别方案

darknet 优化版本:https://github.com/chineseocr/darknet-ocr.git

▊ 环境部署

GPU部署 

conda create -n chineseocr python=3.6 pip scipy numpy jupyter ipython ##运用conda 创建python环境
source activate chineseocr
git submodule init && git submodule update
pip install easydict opencv-contrib-python==4.0.0.21 Cython h5py lmdb mahotas pandas requests bs4 matplotlib lxml -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install -U pillow -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install keras==2.1.5 tensorflow==1.8 tensorflow-gpu==1.8
pip install w...

点击查看剩余70%

{{collectdata}}

网友评论0