企业级智能OCR平台助力票据电子化|社区征文

1. 背景介绍

目前银行同业间竞争日趋激烈,同时一线互联网巨头的布局也在驱动银行业的技术变革。相应的,银行金融机构也在通过不断扩大自己的业务范围来使自己保持足够的竞争力。在银行业务不断发展的过程中,产生了林林种种的纸质凭证,但传统人工稽核票据模式在海量的凭证到来时,往往令银行稽核部门不堪重负。长期以来,在票据处理方面,多数银行仍停留在“人工分散处理+纸质库房保存+人工查询”的阶段,成为阻碍金融电子化的薄弱环节之一。因此,建设“集中、统一、规范、高效”的电子化票据处理中心,已成为银行亟待解决的问题。
当前基于OCR技术的文本识别,是票据电子化的技术基础与核心,但传统的OCR识别算法主要采用的是图像处理+统计学习的方法,存在很大局限性,只能对比较规范、清晰的印刷文字进行识别,而对于手写字符、文字不是很规整的内容,识别错误率就会大大增加,以至于根本无法使用。因此,我司充分发挥所在企业AI团队自身的技术优势,自研了具有完全知识产权的基于深度学习的企业级智能OCR平台。

2. 解决方案

我司的企业级智能OCR平台的整个架构均为自主研发。针对业务部门提出的多种OCR需求,如下图1所示,我司以所在企业内部的图片、PDF文件、视频流等多种数据源为基础构建OCR数据层,并基于文本定位、表格识别、手写识别、印章识别、通用文本识别、文本方向识别等识别引擎组建基础能力层。在服务层、平台层以及应用层,我司分别部署了多项图片及文档OCR识别服务、OCR自主配置与标注平台、智能化录入与自动化比对应用,以便为客户提供多样化、个性化服务。目前,该平台自研OCR服务可支持业务场景共18种,可识别证件三十余种,整体实现了对我司的高频OCR业务场景的实时响应,总体识别准确率达90%以上。
我司自研的智能OCR平台助力业务人员准确高效地从大批量票据中提取所需字段信息,大幅降低了业务部门压力,为业务稳步高效地开展提供了有力的技术支持。在服务层,该平台所部署的OCR服务具备票据模板自动分类、文本内容智能识别等多种场景识别功能,可一键完成票据电子化转换;在平台层,业务人员可通过OCR自主配置平台以拖拉拽的方式实现票据模板的快速定制;在应用层,该平台通过远程银行存单激活、开户流程重塑为客户提供智能化录入、自动化比对服务,显著提高了客户业务办理效率,进一步优化了客户的使用体验。
图1. 智能OCR平台建设架构.png

图1 智能OCR平台建设架构

3. 企业级智能OCR平台

3.1 数据层:炼气于数据

数据资源是机器学习训练的基本素材,通过对数据的学习,模型能不断积累经验和优化决策参数,从而实现一定的人类智能。因此,智能OCR平台的建设首先以我司内部实际业务场景采集到的图片、PDF文件、视频流等作为数据源,构建了具有银行金融业特色的数据层,进而为上层应用提供源源不断的数据服务。

3.2 基础能力层:筑基于能力

在基础能力层,我司的OCR平台以技术为核心,以业务需求为导向,通过自研/采购结合的方式,打造了具备一系列通用OCR功能的强劲底层引擎。该引擎包括文本定位(对图片、PDF等文件中的文本区域进行定位)、表格识别(定位并检测表格结构及表格文字内容,结构化输出可编辑的表格结果)、手写识别(将在手写设备上书写时产生的有序轨迹信息化转化为文字)、印章识别、通用文本识别(将图片、PDF等文件上的文字内容转化为可编辑的文本)、文本方向识别等功能。

3.3 服务层:结丹于服务

在服务层,以数据层数据为源,结合基础能力层的多种识别引擎,自主研发了图2、图3等多项OCR文本识别服务。该服务层经过多次升级迭代,目前已能够支持涉及较多的身份证、火车票、发票、营业执照、业务委托书等多种业务场景下60余种版式的快速智能分类、识别以及关键信息提取输出;同时方便部署人员测试服务效果,且可以提供定制化服务。总体上,自研的OCR文本识别服务能够广泛应用于我司的内部会计结算、财务网上报销、供应链发票管理等众多需要人工录入票据结构化数据的实际业务场景。相比银行传统票据处理服务,我司自研的OCR文本识别服务有以下优势:
(1)覆盖我司绝大部分金融票据类型,每类票据均有对应的定制化识别接口;
(2)提供全自动智能分类功能,人员劳效提升明显;
(3)提供数据自动采集功能,省去人工录入的繁琐工作,降低运营成本。

图2 OCR识别服务31085-02.jpg

图2 OCR识别服务


图3 OCR票据识别服务31091-03.jpg

图3 OCR票据识别服务

3.4 平台层:大乘于平台

上述自研OCR文本识别服务已能覆盖我司的大部分应用场景,但对特定版式文件的结构化文字数据及非固定版式的非结构化数据识别仍力有不逮。为满足日益多样化复杂化的业务场景需求,赋能业务人员订立个性化方案,同时尽可能降低操作人员的使用门槛,我司进一步研发了OCR自主配置平台。借助该平台,业务人员无需算法、编程基础,也不需要收集大量训练数据,如下图4所示,仅需4步简单的图形化操作,即可在2-5分钟内定制新的特定样式票据、卡证、合同的识别模板,实现完全拖拉拽式的交互。我司自研的OCR自主配置平台能够提供个性化模板产品独有的属性规则关系,可对规则进行行业知识定义,辅助识别率的提升;同时通过对待识别内容中key和value部件的空间拓扑关系进行关键元素的定位配置,并直接对识别结果进行文字修改,辅助校正结果,进一步帮助提升结构化模板配置的成功率。
图4 自主配置平台应用.png

图4 自主配置平台应用

3.5 应用层:飞升于应用

在应用层,目前OCR平台提供的服务主要以智能化录入、自动化比对两个核心应用场景为主。为减少客户自助办理首次录入信息时的操作,我司在业务端进行了开户流程重塑。当客户使用手机银行app进行开户操作时,在客户本人上传身份证、营业执照、基本存款账户信息表等文档图片后,OCR服务自动识别图片中的文本字段。对于字段结果不匹配的情况,经业务人员修订后即可一键录入系统。经统计,现在每名业务人员每天仅需对OCR服务的识别结果进行简单检查和校正,即可完成之前需要4名业务人员一天才能完成的400张左右证件和发票信息的整理,人员劳效提升3倍以上。截至目前每日处理实时OCR服务请求累计5000余次。为降低客户线下办理存单激活业务的时间成本,提高业务办理效率,我司通过拓展远程银行承接基础服务类的业务范围,实现了远程银行存单激活功能,以辅助柜面工作人员进行线上存单内容比对,快速高效地完成存单激活业务的线上办理。具体来说,当客户在银行开具存单时,存单内的字段已经录入银行内部系统中,后续办理存单激活功能时,客户经理需要确认存单是否为行内之前开具的存单,而借助我司提供的OCR自动化比对应用,客户经理只需要关注个别内容不一致的字段,大幅降低了客户经理的工作量。

4. 结论与展望

目前,我司企业级智能OCR平台立足业务需求,建立了广泛覆盖大部分金融业务场景的OCR识别模型库及版本库,为减轻业务人员的劳动强度,提高业务开展工作效率,保证业务开展效果提供了坚实的平台基础。
与此同时,在票据电子化存储与应用方面,我司距离票据处理全流程自动化办公仍有差距。因此,下一步我司将在优化界面交互、提高识别精度、完善识别模板的同时,进一步深挖业务需求,以票据数字化为发展方向,以“自动集中处理+电子安全保存+数据有效应用”的票据全流程智能化处理为平台建设目标。其中,在服务层,优化合同识别、资金证明材料等文本识别服务;在平台层,优化并上线自主配置平台非结构化数据功能,并进一步建设结构化数据自主配置功能及图片标注平台。

248
8
1
1
关于作者
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论