告别手工录票!Dify 工作流分享:打造多票据识别机器人(附DSL文件)

大模型向量数据库NoSQL数据库

AI时代 你不是一个旁观者。文末可领DSL文件及token福利。

前言

在数字化浪潮席卷各行各业的今天,处理海量的、种类各异的票据(如增值税发票、普通发票、出租车票、火车票等)仍然是财务、报销及个人记账流程中的一大痛点。传统的手动录入方式不仅效率低下、耗时耗力,还极易出错。幸运的是,以 Dify 为代表的大语言模型应用开发平台,凭借其强大的工作流功能,让零代码构建自动化、智能化的票据识别工具成为可能。

本文将带你深入实战,利用 Dify 工作流,一步步构建一个能够智能识别多种常见票据类型、提取关键信息,并具备一定容错能力的自动化助手,同时探讨进一步优化的方向。整体工作流如下:

picture.image

实战步骤:构建多类型票据识别工作流

第一步:创建与初始化工作流

1.登录 Dify 平台。

2.创建新应用,选择“工作流”类型,命名(例如:“智能多票据识别助手”)。

3.在工作流画布上,找到默认的“开始”节点。点击配置,添加一个文件类型(单文件)的输入变量,命名为 ticket_file,并设置为必填项。这将是用户上传票据文件的入口。

picture.image

picture.image

第二步:初步类型判断(LLM 节点)

1.从左侧节点库拖拽一个“LLM”节点到画布,命名为 初步分类器。

2.将“开始”节点的 ticket_file 输出连接到 初步分类器 节点的输入。

3.配置 初步分类器 节点:

·模型选择: 选择一个具备强大视觉理解能力的大语言模型(如qwen2.5-vl-72b-instruct)。

·提示词: 精心设计提示词,指令模型进行大类判断,并强制按指定格式输出。

             提示词太长了,我放到DSL文件中了,详见文末。

picture.image

第三步:大类分支处理(条件节点)

1.拖拽一个“条件”节点到画布,命名为 大类分支。

2.将 初步分类器 节点的 输出连接到 大类分支 节点的输入。

3.配置 大类分支 节点,设置不同的条件分支:

·分支 1 (IF): 条件设置为{初步分类器text} 是 " Valueadded_invoice ",此分支用于处理所有识别为“增值税发票”的票据。

·分支 2 (ELIF): 条件设置为{初步分类器text}是"Common_invoice",此分支用于处理“普通发票”。

·分支 3 (ELIF): 此分支对应 {初步分类器text}是"Quota_invoice",此分支用户处理“定额发票”。

·以此类推添加出租车发票识别、火车票识别。

·分支6(ELIF)及 {初步分类器text}是"未知发票类型,请重新上传。"

ELSE分支对应结束节点。

picture.image

第四步:配置各类型票据的精准提取节点(LLM 节点)

1.为每种最终确定的票据类型(增值税发票、普通发票、出租车发票、火车票)分别创建一个 LLM 节点,用于信息提取。命名建议清晰,如 增值税发票提取器、火车票提取器 等。

2.关键连接: 将“开始”节点的 ticket_file 输出,分别连接到每一个提取器节点的输入。

3.放置位置: 将每个提取器节点放置在对应的条件分支路径下。例如,增值税发票提取器 放在步骤五的分支 1 下;火车票提取器 放在步骤三的分支 2 下。

4.配置提取器节点的提示词(核心环节):

·为每个提取器节点设计高度定制化的提示词,明确告知模型正在处理的票据类型,列出需要提取的所有关键字段,并强制要求以包含处理状态(status)和错误信息(error_message)及置信区间的 JSON 格式输出。

·增值税发票提取器提示词:详见DSL文件(文件见文末)

·出租车发票提取器提示词: 详见DSL文件(文件见文末)

·(为普通发票、火车票也编写类似的、字段和格式要求清晰的提示词)

第五步:配置结束节点,统一输出

1.将所有可能的最终路径(包括所有成功的提取器节点、以及各个表示“未知类型”或“无法细分”的分支末端)都连接到工作流的“结束”节点。

2.配置“结束”节点,定义最终输出变量。目标是形成一个包含所有必要信息(识别出的类型、提取数据或错误信息)的统一结构。

picture.image

第六步:测试、调试与优化

1.发布工作流。

2.使用大量、多样化的真实票据样本进行测试:不同版式、清晰度、来源的增值税发票、普票、定额票、出租车票、火车票,以及完全无关的图片。

3.测试置信区间,根据不同的置信区间,决定后续是否需要人工复审。

结语

通过 Dify 工作流的分层设计和精心配置,我们成功构建了一个零代码、能够智能识别处理多种发票和火车票,并具备基本容错能力的自动化助手。这不仅展现了 Dify 平台在赋能业务自动化方面的巨大潜力,也为解决企业和个人面临的实际票据处理难题提供了一条高效、灵活的路径。

关注我可领DSL文件及token福利

往期工作流文章

10分钟构建基于 Dify 的智能文章仿写工作流:配置指南,效率飙升300%!

20分钟从零到一构建Dify智能客服工作流教程(附DSL文件下载)

使用 Dify 打造自己的免费 AI 写作神器

Dify工作流教程|以电费单分析为例详细讲解工作流编排过程

更多工作流案例,请到公众号主页查看

dify相关资源

如果对你有帮助,欢迎点赞收藏 备用。


回复 DSL 获取公众号DSL文件资源

回复 入群 获取二维码,我拉你入群

回复 tk 获取免费token资源

对你有用就点赞后(不点也无妨)从如下地址下载本文 DSL文件:

链接:https://pan.baidu.com/s/12WAyN9hFVLsjQqspMKl\_Sg

提取码: kimt

如地址失效,请到公众号主页获取回复 DSL 获取。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论