CRNN+CTCLoss中文手写汉字识别

picture.image

向AI转型的程序员都关注了这个号 👇👇👇

人工智能大数据与深度学习 公众号:datayx

现在各种手写输入法很容易就能识别出各种各样的,潦草的字体。而OCR则还停留在对打印字体的识别上。为什么不能把手写输入法的算法用在OCR上呢。

手写识别和OCR是有一定区别的。

  1. 手写识别通常包涵更多的信息(这里指的是在线识别,我接触到的高识别率手写识别都是在线识别), 如笔画顺序, 连笔等。 这些细节看似简单, 却在无形之中给识别提供了不少的特征, 有助于识别率的提升。

  2. 手写识别的样本预处理比较容易。 与OCR相比,手写输入的文字需要的预处理步骤较少。 通常手写是一个字符一个字符录入,位置比较固定,不会有太大的旋转角度。 而OCR, 你是无法预知文字排布的。 OCR的样本通常来自于扫描,拍照,样本在分辨率上显然不如手写识别, 而且会有很多噪声。 特征提取一般都是像素级别的, 因此这些噪声对于识别来说是一个很大的挑战, 尤其是对于中文这种字符集庞大且复杂的语言。

  3. 手写识别还有一个特性是它的识别过程是人为干预的。当输入一个字符时,识别引擎会根据输入给出若干的识别结果,得分最高的为默认结果。如果这个结果不是你想要的,你仍然可以在若干个候选结果中选择。而OCR,一个输入对应一个输出,最终你看到的只是分类得分最高的结果不能对识别进行实时的控制。

CRNN+CTCLoss中文手写汉字识别

代码获取方式

关注微信公众号 datayx 然后回复 手写 即可获取。

AI项目体验地址 https://loveai.tech

picture.image


阅读过本文的人还看了以下:

分享《深度学习入门:基于Python的理论与实现》高清中文版PDF+源代码

《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源!CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师,你的面试为什么过不了?

前海征信大数据算法:风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

VGG16迁移学习,实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七):图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师(共四面)通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

搜索公众号添加: datayx

picture.image

长按图片,识别二维码,点关注

AI项目体验

https://loveai.tech

picture.image

0
0
0
0
评论
未登录
暂无评论