AI时代 你不是一个旁观者。文末可领DSL文件及token福利。
前言
在数字化浪潮席卷各行各业的今天,处理海量的、种类各异的票据(如增值税发票、普通发票、出租车票、火车票等)仍然是财务、报销及个人记账流程中的一大痛点。传统的手动录入方式不仅效率低下、耗时耗力,还极易出错。幸运的是,以 Dify 为代表的大语言模型应用开发平台,凭借其强大的工作流功能,让零代码构建自动化、智能化的票据识别工具成为可能。
本文将带你深入实战,利用 Dify 工作流,一步步构建一个能够智能识别多种常见票据类型、提取关键信息,并具备一定容错能力的自动化助手,同时探讨进一步优化的方向。整体工作流如下:
实战步骤:构建多类型票据识别工作流
第一步:创建与初始化工作流
1.登录 Dify 平台。
2.创建新应用,选择“工作流”类型,命名(例如:“智能多票据识别助手”)。
3.在工作流画布上,找到默认的“开始”节点。点击配置,添加一个文件类型(单文件)的输入变量,命名为 ticket_file,并设置为必填项。这将是用户上传票据文件的入口。
第二步:初步类型判断(LLM 节点)
1.从左侧节点库拖拽一个“LLM”节点到画布,命名为 初步分类器。
2.将“开始”节点的 ticket_file 输出连接到 初步分类器 节点的输入。
3.配置 初步分类器 节点:
·模型选择: 选择一个具备强大视觉理解能力的大语言模型(如qwen2.5-vl-72b-instruct)。
·提示词: 精心设计提示词,指令模型进行大类判断,并强制按指定格式输出。
提示词太长了,我放到DSL文件中了,详见文末。
第三步:大类分支处理(条件节点)
1.拖拽一个“条件”节点到画布,命名为 大类分支。
2.将 初步分类器 节点的 输出连接到 大类分支 节点的输入。
3.配置 大类分支 节点,设置不同的条件分支:
·分支 1 (IF): 条件设置为{初步分类器text} 是 " Valueadded_invoice ",此分支用于处理所有识别为“增值税发票”的票据。
·分支 2 (ELIF): 条件设置为{初步分类器text}是"Common_invoice",此分支用于处理“普通发票”。
·分支 3 (ELIF): 此分支对应 {初步分类器text}是"Quota_invoice",此分支用户处理“定额发票”。
·以此类推添加出租车发票识别、火车票识别。
·分支6(ELIF)及 {初步分类器text}是"未知发票类型,请重新上传。"
ELSE分支对应结束节点。
第四步:配置各类型票据的精准提取节点(LLM 节点)
1.为每种最终确定的票据类型(增值税发票、普通发票、出租车发票、火车票)分别创建一个 LLM 节点,用于信息提取。命名建议清晰,如 增值税发票提取器、火车票提取器 等。
2.关键连接: 将“开始”节点的 ticket_file 输出,分别连接到每一个提取器节点的输入。
3.放置位置: 将每个提取器节点放置在对应的条件分支路径下。例如,增值税发票提取器 放在步骤五的分支 1 下;火车票提取器 放在步骤三的分支 2 下。
4.配置提取器节点的提示词(核心环节):
·为每个提取器节点设计高度定制化的提示词,明确告知模型正在处理的票据类型,列出需要提取的所有关键字段,并强制要求以包含处理状态(status)和错误信息(error_message)及置信区间的 JSON 格式输出。
·增值税发票提取器提示词:详见DSL文件(文件见文末)
·出租车发票提取器提示词: 详见DSL文件(文件见文末)
·(为普通发票、火车票也编写类似的、字段和格式要求清晰的提示词)
第五步:配置结束节点,统一输出
1.将所有可能的最终路径(包括所有成功的提取器节点、以及各个表示“未知类型”或“无法细分”的分支末端)都连接到工作流的“结束”节点。
2.配置“结束”节点,定义最终输出变量。目标是形成一个包含所有必要信息(识别出的类型、提取数据或错误信息)的统一结构。
第六步:测试、调试与优化
1.发布工作流。
2.使用大量、多样化的真实票据样本进行测试:不同版式、清晰度、来源的增值税发票、普票、定额票、出租车票、火车票,以及完全无关的图片。
3.测试置信区间,根据不同的置信区间,决定后续是否需要人工复审。
结语
通过 Dify 工作流的分层设计和精心配置,我们成功构建了一个零代码、能够智能识别处理多种发票和火车票,并具备基本容错能力的自动化助手。这不仅展现了 Dify 平台在赋能业务自动化方面的巨大潜力,也为解决企业和个人面临的实际票据处理难题提供了一条高效、灵活的路径。
关注我可领DSL文件及token福利
往期工作流文章
10分钟构建基于 Dify 的智能文章仿写工作流:配置指南,效率飙升300%!
20分钟从零到一构建Dify智能客服工作流教程(附DSL文件下载)
更多工作流案例,请到公众号主页查看
dify相关资源
如果对你有帮助,欢迎点赞收藏 备用。
回复 DSL 获取公众号DSL文件资源
回复 入群 获取二维码,我拉你入群
回复 tk 获取免费token资源
对你有用就点赞后(不点也无妨)从如下地址下载本文 DSL文件:
链接:https://pan.baidu.com/s/12WAyN9hFVLsjQqspMKl\_Sg
提取码: kimt
如地址失效,请到公众号主页获取回复 DSL 获取。