EAST+CRNN银行卡号识别，附数据集

picture.image

向AI转型的程序员都关注了这个号 👇👇👇

机器学习AI算法工程公众号：datayx

实现功能与方法

卡号识别（CNN-BLSTM-CTC）
卡号定位（EAST）
交互界面（PyQt5）

使用方法

下载源码
下载训练好的模型
卡号识别模型放置于 crnn/model（建立model文件夹），卡号定位模型放置于 east/model
使用PyCharm打开（或其他IDE），或者直接执行 python demo.py
出现GUI后即可使用

注*：因CRNN模型代码更新，此模型故已弃用。可在下文下载其预训练网络。

数据集，模型，代码以及运行教程获取：

关注微信公众号 datayx 然后回复
银行卡 即可获取。

AI项目体验地址 https://loveai.tech

功能介绍

卡号识别

在这里因为给定的数据集都是每一个上有四个数字（有些为空格），但是所识别的最终目标——银行卡号有不定的长度。现在比较流行的解决方案是CRNN和CTC损失函数。于是我就这么做吧，CNN部分参考自VGG网络，RNN则使用的是双向LSTM（简称BLSTM），使用GRU也可以实现，可以下来试试。

这个模型不好的地方是训练。训练参数可以在 crnn/cfg.py中设置，性能较为一般的显卡推荐使用默认设置，性能卓越的显卡可以增大 BATCH_SIZE或 EPOCH。识别效果如下图：

picture.image

模型的训练方法如下：

下载预训练模型.并将其路径写入 crnn/cfg.py的 PRE_TRAINED_MODEL_PATH变量中
python crnn/preprocess.py
python crnn/run.py

注：模型训练的数据集是由子数据集（4-6个）拼凑而成的不定长度的数据， crnn/cfg.py中的 MAX_LABEL_LENGTH用来设置数据的最大长度。这部分数据是通过运行 crnn/preprocess.py生成，可以通过 AUG_NBR设置生成数据集个数。其效果如下:

picture.image

卡号定位

这一部分是重中之重，考虑到自己还没有能力去研究新的图像字符定位算法，就参考了许多这类算法。现在比较成功的莫过于CTPN了，其次也有Faster-RCNN，EAST，Seg-Link等等。而偏偏选用EAST的原因可能是一见钟情吧（名字好听）。

此部分引用的是EAST的Keras实现，但此EAST并非原生的EAST，而是改进的AdvancedEAST

picture.image

这个模型特点之一就是方便训练，直观也简练。训练方法及更多原理参见原文部分。

特别值得提起的是数据集，是我自己从互联网上搜罗来的，然后还进行了标注。过程比较痛苦。面临的问题是，几百张数据可能训练不出好的模型，所以后期使用自动定位不成功的，可能原因之一就是数据集太小（我…尽力了…）。但是用于这样的小系统开发，还是有一定的使用价值。

如果你有更多的数据的话，若想进行标注。懂的同学可以标注直接标注为 ICDAR 2015的格式，不懂的同学则可以使用 dataset/tagger.py简陋的标注器来标注，标注方法：以目标区域左上角开始，顺时针的点击物体的角点，直到最后一个点，可在数据同目录的 txt下看到形如 x1,y1,x2,y2,x3,y3,x4,y4,###的值 ###表示忽略目标内容。如果成功标注完成，在 east目录下运行 python east/preprocess.py得到形如以下形式的图像，就代表成功了。

picture.image