opencv+python机读卡识别 - 文章 - 开发者社区

picture.image

向AI转型的程序员都关注了这个号 👇👇👇

机器学习AI算法工程公众号：datayx

1 .预处理

这次的机读卡识别项目来源暑期培训，主要包括内容一张手机拍摄的机读卡位置定位，识别其中选择题模块及少量数字识别，

picture.image

预处理目的 ：

对于这个识别问题而言，把图像变成二值图应该是最简单粗暴的方法了。为了找准边界，才能良好切割。而对于边缘检测的函数也只能传入灰度图……

所有代码获取：

本文相关代码项目获取方式：

关注微信公众号 datayx 然后回复 cv 即可获取。

AI项目体验地址 https://loveai.tech

1.1.环境配置：环境是python3.5的，大体部分需要配置的是numpy+mlk版本，scipy，来支持opencv，另外辅助以imutils，这个包里面含有4点变换函数以及matplotlib来辅助绘图

picture.image

1.2.图片预处理为了方便找出图片的4个顶点，所以需要一次自适应二值化，为了使图片效果更好，所以在二值化之前还加了一层高斯滤波

picture.image

2.图像切割

图像切割的目的是将图像定个便于识别的样子。比如这里四角变换结束以后会吧图像变为2400*2800的大小，无论是什么样的案例图片，都是这个格式，这样最后在局部分割，如选择题答案的识别和数字区域的确定这套程序才能有较好的通用性

2.1.边缘检测预处理得到二值图像就很容易做边缘检测了，找出4个点，方便之后的4点变换

picture.image

3.3.计算选择题题号及答案比较绕，主要还是根据取余和倍数关系

picture.image

4.数字识别，调用百度api

数字识别经过测试总的感觉还是可以。需要注意的地方是要对数字板块需要切割出来这样给机器会好认点，但也不能单个字拿出来。最好能有一串，同时也需要注意图片尺寸

4.1.对数字图像部分进行处理预处理部分同样需要，步骤与选择题模块相似，但目的不同，文字部分主要将数字变粗，便于识别。其实也就是和选择题模块相比变了几个参数

picture.image

4.2.调用百度ocr api 试过多种检测方式，还是用别人家现成的好http://apistore.baidu.com/ 百度api使用方法：首先需要注册一个百度云账号，这样在个人中心里就会看到apikey。这个就是和百度进行交流的钥匙。然后找到百度ocr的入口找到接口地址。虽然这里给出了但还是可以看下文档，里面有些细节，比如图片想免费就要300k以内。上面给的python示例代码是py2的，这里给出py3的方式（http://apis.baidu.com/idl\_baidu/baiduocrpay/idlocrpaid）

picture.image