向AI转型的程序员都关注公众号 机器学习AI算法工程
票证检测矫正模型在实际生活中有着广泛的需求,例如信息抽取、图像质量判断、证件扫描、票据审计等领等场景,可以大幅提高工作效率和准确性。该模型具有以下优点:
- 支持任意角度、多卡证票据等混贴场景,同时检测输入图像任意角度的多个子图区域;
- 基于海量真实数据训练,效果满足国内常见的卡证票据的检测矫正需求;
- 支持子图区域复印件判断、四方向判断,准确率高达 99%;
- 矫正效果、推理速度远高于 modelScope 同类模型。
模型描述
图是实现流程:输入图片,基于 Resnet18-FPN 提取特征后,在 1/4 尺寸处通过三条分支分别识别出票证的中心点、偏移量(中心点到4个顶点距离)、中心点偏移量(为了得到精准的中心点),即可解码数出票证区域的四边形框;再用透视变换将票证拉平得到矫正后的票证信息;与此同时,分类分支识别出子图朝向,用于而切割的子图转正。
算法流程
测试时的主要预处理和后处理如下:
-
图像预处理:将输入图片按照比例缩放,长边 Resize 到 768,短边 Pad 到长短边相等,同时有减均值、除方差等归一化操作。
-
模型卡证区域检测:对输入图像中的卡证票据区域进行检测,并对
卡证票据的方向和复印件类型进行分类; -
后处理矫正:根据
卡证区域检测框和卡证票据的方向对卡证区域进行透视变化,并转为水平方向;
项目全部代码下载地址:
关注微信公众号 datayx 然后回复 卡证 即可获取。
模型训练
卡证生成数据集
-
合成卡证数据集(代码)
本数据集的生成过程如下:首先随机生成6.2万余张卡证板式,每个板式的底纹、布局、长宽比、语种等均不相同,然后每个固定板式填充10次生成卡证,包括人脸、字段文字等,共计生成60余万张虚拟卡证。然后,每次随机从中选取1~4张卡证摆放于各种背景图案下,并加入透视变换、旋转、光照变化等,生成用于训练和评测的数据。
按 如下结构准备数据集
模型效果
机器学习算法AI大数据技术
搜索公众号添加: datanlp
长按图片,识别二维码
阅读过本文的人还看了以下文章:
整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主
基于40万表格数据集TableBank,用MaskRCNN做表格检测
《深度学习入门:基于Python的理论与实现》高清中文PDF+源码
2019最新《PyTorch自然语言处理》英、中文版PDF+源码
《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码
PyTorch深度学习快速实战入门《pytorch-handbook》
【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》
李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材
【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类
如何利用全新的决策树集成级联结构gcForest做特征工程并打分?
Machine Learning Yearning 中文翻译稿
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx
