OCR:加水印身份证图像要素提取,准确率99+%

技术

picture.image

向AI转型的程序员都关注了这个号 👇👇👇

机器学习AI算法工程 公众号:datayx

本任务是准确识别出身份证中包含姓名、出生日期、地址、签发机关等在内的多个关键信息,然而赛题所提供的训练集数据中,图像在亮度、清晰度等方面差别很大,初赛和复赛分别添加不同样式的水印。上述内容都对关键信息的提取带来了巨大的挑战。

picture.image

我们的系统采取了将传统计算机视觉算法与深度学习方法相结合的方案,通过模板匹配、腐蚀膨胀、二值化等传统的方法,从原始不规则的数据集中得到规则身份证图片的切片,简单快速,效果出色。接着规则的身份证图片输入到去水印模块中,去除水印带来的干扰。然后将处理后的图像输入到文本识别模块中,对各个文本元素进行识别。为了进一步提高识别的准确率,最后将识别的结果输入到文本纠正模块中,对识别出错的文本信息根据事先设定的规则进行最大程度上的纠正,输出最终识别的结果。

本文相关代码 项目获取方式:

关注微信公众号 datayx 然后回复 OCR 即可获取。

AI项目体验地址 https://loveai.tech

picture.image

去除水印的过程在一定程度上可以看做是图像恢复的工作,而生成对抗网络能够有效处理这类任务。我们采用条件生成对抗网络来完成去除水印的工作,生成器输入带水印的图片,生成去除水印之后的图片,判别器对生成不带水印的图像和真实不带水印的图像进行真伪的判别,输入原始带水印的图像作为条件约束,通过判别器和生成器之间的对抗训练,提高生成器的能力,改善去除水印的效果。

picture.image

picture.image

最终去水印的效果如图所示,可以看到我们的去水印模块在不同亮度、模糊程度、透明度的图像上都有非常出色的表现。即使一些图片人眼无法识别出被遮挡的文字内容,我们的模型也依然能够很大程度上恢复出被遮挡的信息,大大减小了文本识别的难度。

picture.image

文本识别的模型采用的是CRNN。我们的识别模型可以识别6030个字符(包含汉字、部分标点、阿拉伯数字),由于训练出一个鲁棒的模型需要大量数据,因此训练过程中使用了生成图片用于训练,同时在训练过程中随机调整图片亮度、对比度,达到数据增强的效果。

picture.image

身份证上很多信息都有着明确的组成格式要求,如果能够充分利用这些先验条件,即使一些文本识别出错,我们也能够将其纠正,得到正确的结果。我们的文本纠正模块采用了规则纠正法和最大字符匹配法,规则纠正法利用了身份证中不同关键信息的冗余,比如身份证号码中包含出生年月日信息,前六位包含省市县三级行政区域的信息,可以用来与住址,签发机关相互纠正;民族信息使用相近字来纠正,在这个纠正过程中,我们搜集了全国的行政区号,签发机关,具体地址信息(具体到村级),用于辅助纠正。而对于性别和民族的识别结果,则通过最大字符匹配法进行纠正。

picture.image

我们提出的文本识别方案识别准确率高,各个模块之前相对独立,灵活性好,即使更换不同的文本识别场景,依然能够快速部署,完成相关的识别任务。此外,我们的方案抗干扰的能力好,训练的方法通用,更换其他样式的水印干扰,水印去除模块也能够有效完成去干扰的工作。如果使用更出色的去模糊方法,文本识别的准确率还能有望得到进一步的提高。


阅读过本文的人还看了以下文章:

【全套视频课】最全的目标检测算法系列讲解,通俗易懂!

《美团机器学习实践》_美团算法团队.pdf

《深度学习入门:基于Python的理论与实现》高清中文PDF+源码

python就业班学习视频,从入门到实战项目

2019最新《PyTorch自然语言处理》英、中文版PDF+源码

《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

PyTorch深度学习快速实战入门《pytorch-handbook》

【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》

《Python数据分析与挖掘实战》PDF+完整源码

汽车行业完整知识图谱项目实战视频(全23课)

李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材

笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源!CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师,你的面试为什么过不了?

前海征信大数据算法:风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

VGG16迁移学习,实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七):图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师(共四面)通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

搜索公众号添加: datayx

picture.image

长按图片,识别二维码,点关注

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论