【TextIn大模型加速器 + 火山引擎】使用“TextIn智能文字识别产品”实现AI OCR智能识

Agent

随着深度学习、大数据、人工智能、AI等技术领域的不断发展,机器学习是目前最火热的人工智能分支之一,是使用大量数据训练计算机程序,以实现智能决策、语音识别、图像处理等任务。各行各业都在积极探索这些技术的应用。特别是在深度学习领域,“合合信息TextIn”作为国内主流的人工智能及大数据科技企业,专注于智能文字识别、图像处理、自然语言处理(NLP)、知识图谱、大数据挖掘等技术,对企业、开发者、个人用户提供智能文字识别引擎、产品、云端服务。为这些技术的落地提供了强大的支持, 怎么样结合自身公司业务打造一个AI智能平台呢?

picture.image

【可以来看看我在B站录的一个视屏】:

使用“TextIn智能文字识别产品”实现AI OCR智能识别商家认证审核方案


1. Textln一站式智能文档数字化平台智能AI识别方案:

基于合合信息旗下Textln打造,火山引擎提供平台支撑的文本智能领域AI创新应用,结合真实业务或创意设想进行技术实践与内容创作,共同探索TextIn“大模型加速器”+Coze/Hi Agent的实际应用场景与业务价值,提供的开箱即用的AI 大模型,降低数据使用门槛。

picture.image


一、前言:

作者也是经过了以上几个阶段的软件开发阶段历程,从最早期在学校和刚入行时,使用的Web时代编程(PHP LNMP环境)、到后面使用云时代分布式编程,到如今的AI时代,传统编程是人类程序员手动编写代码来实现特定的功能,而机器学习是通过让计算机程序从数据中学习,自动地提取特征和规律来实现功能。

picture.image

那么,在实际的工作中如何快速的让开发人员实现AI的功能呢?

今天给大家推荐的一款,【TextIn智能文档处理云平台】为全球用户提供智能图像处理、文字表格识别、文档内容提取产品,让生成式 AI 模型的开发和应用变得更加高效和便捷。无论您是初学者小白还是资深开发者老鸟,都可以使用一站式智能文档数字化平台,为全球用户提供智能文档采集、分类及结构化信息抽取服务,有效提升企业业务处理效率,加速创新与落地,助力中小企业及开发者快速部署智能文档处理等高性能应用。


二、什么是【TextIn智能文档处理云平台】:

“TextIn大模型加速器”专注于智能文字识别、图像处理、自然语言处理(NLP)、知识图谱、大数据挖掘等技术,基于自主研发的智能文字识别及商业大数据核心技术,为全球C端用户和多元行业B端客户提供数字化、智能化的产品及服务。

picture.image

在企业数字化转型进程中,文档是核心的信息载体。企业端日常工作流程中产出了海量PDF、Word、图片格式的文档,这些文档所承载的知识性内容呈现出高度的“非结构化”特点,如使用传统的OCR(光学字符识别)技术进行处理,可能导致提取信息结构混乱,表格、图表信息提取不全,手写字符识别难等问题,导致大模型无法获取精确的专业信息,难以有效开展工作。


三、使用“TextIn智能文字识别产品”实现AI OCR智能识别方案:

随着图片资源时代的飞速发展,将文字内容转化为图片形式进行发布和存储的做法越来越普遍。大量的文字内容为了更好的排版和表现效果,都采用了图片的形式发布和存储,这为内容的传播和安全性带来了很大的便利,同时也增加了文字识别作业的重复性劳动。

OCR文字AI在线识别工具也逐渐的应运而生,主要是为了帮助用户解决了内容编辑的难题,对于包含大量文字的图片或文档,手动输入既耗时又易出错。OCR工具的出现,大大减轻了这一负担,用户只需上传图片,即可快速获取可编辑的文本内容。

picture.image


3.1 公司业务痛点:

目前OCR技术正在被广泛的运用,刚好接触了基于“基于TextIn智能文档处理云平台”提供智能图像处理、文字表格识别、文档内容提取产品,就是一款运用OCR的技术,可以帮助企业解决一些文字录入业务的痛点,为公司进行增效降本。


3.2 业务场景:

【场景一:】公司地推业务员,需要去宠物店进行登记授权店铺可以销售本公司的产品,也可以为公司拓展客户的目的,公司客服部门专门需要对业务员地推的提交的信息进行审核,同时,也为业务的考核进行评定。 【场景二:】供应商在采购后,需要将开立的发票进行公司交账。

picture.image

3.3 业务痛点:

  • ①. 商家认证时,上传的营业执照后,需要人工去审核,十分耗费人力,而且是一个十分枯燥重复的事情。
  • ②. 发票提交后,需要财务人员人工去审核,财务的人员也经常加班。
  • ③. 通过扩展人力 + 加班的形式,也会导致公司的人力成本增大。

3.4 COZE平台Agent构建与TextIn插件集成调试流程:

登陆Coze扣子,找到工作流进行新建,点击“创建工作流”,输入工作流名称和工作流描述后,即可创建一个工作流。在工作流中,可以添加一个节点后,这里提供了很多相关类型的工具,这里选择“插件”工具。

picture.image

TextIn开发的ParseX插件正式上架Coze平台,TextIn ParseX 专为LLM下游任务设计的通用文档解析服务 识别文档或图片中的文字信息,将文档解析为Markdown格式,并按常见的阅读顺序进行还原,赋能下游各类大语言模型任务。

在“添加插件”弹框中,我们可以输入“ParseX”即可搜索到TextIn为Coze平台开发的插件,插件支持设置四个参数,这里的app_id和secret_code参数需要在“TextIn智能文档处理平台”进行获取。

picture.image

接下来,可以在TextIn智能文档处理平台平台进行注册与登录,在左侧的菜单中“账号与开发者信息”栏位中,可以查看x-ti-app-id 和 x-ti-secret-code 是访问TextIn API的密钥,具有该账户的完全权限(请妥善保管),而且还支持创建多组对应的开发都账号,进行不同的项目使用。

picture.image

OSS是对象存储服务(Object Storage Service)的缩写,它是一种云存储解决方案,主要用于存储和管理任意类型的文件,如图片、视频、文档、日志和备份数据等。

在平时的业务中,我们的静态资源文件(图片、pdf、文档、txt等)一般都是托管到云OSS对象存储上面,适合社区、多媒体分享、电子商务等各类形式规模的网站站长,App应用和软件应用开发者,游戏开发企业以及有大规模数据存储需求的用户使用。例如互联网音视频存储、教育行业存储、AI/物联网、影视渲染行业及基因行业使用。

这里我们先上传一张图片到OSS上面来,后面在不管是我们内部业务ERP系统,还是Coze智能体、工作流相关的流程都可以使用在线的URL来进行访问。

picture.image

那我们通过设置app_id和secret_code参数,以及在线的Url图片来进行一下测试,发现返回的code是Null,所有的其它数据都是null值,不好!要出bug了,仔细一想排查的方向有3点:

  • ①. 可能存在TextIn平台服务没有费用了,欠费了。
  • ②. 可能存在某些权限没有开通。
  • ③. 可能是图片有问题,导致识别不出来。

picture.image

结果发现是图片不能访问,需要OSS开通一下外网的访问权限即可解决这个问题,将权限开通后,我们再次进行测试,欧克,这次测试成功了,图片中的数据结构也是识别成markdown字段返回了,但是这里有一个疑问:图片的内容解析出来了,但是如何与业务系统进行字段映射绑定呢?

picture.image

那么,可以看到我们的右边这个图里面有商家类型、店铺名称、所在区域这些字段,是不是可以通过一个大模型来帮我刷选出来这些字段呢?


3.5 集成AI大模型解析映射字段:

上面,我们已经通过图片通过TextIn的ParseX插件得到了一段markdown字符串,接下来我们尝试使用大模型来进行转化。

我们这里先添加一个节点,选择“大模型”,这里有很多的模型可以进行选择,我们这里先尝试一下DeepSeek大模型。

picture.image

将ParseX的节点的markdown字段与大模型的input输入的字段进行绑定,另外,在“系统提示词”中,输入以下一段话术:

将识别到的{{input}}值,需要将名称,类型,人名,城市(省,市),将这些值映射到一个对象中,字段为name, type,username,city,如果匹配不到就为空值

picture.image

点击“优化提示词”后,可以看到系统帮我们生成了很多更为细致的提示词规则语句。

# 角色
你是商家注册认证工作流中的信息提取助手,负责从用户输入的商家相关信息中,精准识别并提取名称(name)、类型(type)、联系人姓名(username)、城市(省/市,city)四个关键信息,并将其映射为结构化对象。

## 技能
### 技能 1: 字段识别与提取
1. **输入处理**:接收用户输入的商家相关文本信息(即{{input}}内容),该信息可能包含商家名称、类型、联系人、城市等关键数据。
2. **名称(name)提取**:从输入中识别商家主体名称,优先匹配“名称为”“商家名/公司名是”“全称是”等表述后的内容;若未明确表述,可从输入开头/结尾的核心主体名称中提取(如“XX有限公司”“XX工作室”等)。
3. **类型(type)提取**:识别商家所属行业/类型,优先匹配“类型是”“行业为”“主营”“业务范围”等表述后的内容(如“餐饮”“科技”“零售”等)。
4. **联系人姓名(username)提取**:识别商家联系人姓名,优先匹配“联系人”“负责人”“联系人姓名”“联系人电话关联姓名”等表述后的具体姓名(如“张三”“李四”等)。
5. **城市(city)提取**:识别商家所在城市(含省/市),优先匹配“位于”“地址在”“城市是”“省/市”等表述后的内容(如“北京市”“广东省深圳市”等,仅保留省/市层级信息)。
6. **多格式兼容**:支持用户输入为自然文本(如“名称:ABC餐饮,类型:餐饮服务,联系人:王五,城市:上海市”)或结构化短句(如“ABC餐饮,餐饮,王五,上海”),自动忽略无关冗余信息。

### 技能 2: 结构化输出
- 将提取的信息按固定字段格式输出为JSON对象,格式为:`{"name": "<名称>", "type": "<类型>", "username": "<联系人姓名>", "city": "<城市>"}`。
- 若某字段无匹配结果,对应的值需设为空字符串(如`""`),不可省略字段。

## 限制
- **仅处理商家注册认证相关信息**:拒绝处理与商家注册无关的内容(如个人事务、其他业务咨询等)。
- **字段优先级**:严格按“名称→类型→联系人→城市”的逻辑顺序提取,确保核心信息优先识别,非核心信息可忽略。
- **输出准确性**:若输入中存在歧义(如“城市”同时出现“上海市”和“广东省”),优先保留完整城市层级(如“广东省深圳市”合并为“深圳市”,或按用户输入格式直接提取“广东省深圳市”)。
- **格式强制**:输出必须为标准JSON格式,不可包含额外文字说明,仅返回字段映射后的结果。

## 回复示例
### 输入1(标准格式):
“名称:星辰科技有限公司,类型:软件开发,联系人:赵六,城市:浙江省杭州市”

### 输出1JSON格式):
{"name": "星辰科技有限公司", "type": "软件开发", "username": "赵六", "city": "浙江省杭州市"}

### 输入2(简略格式):
“李四商贸,零售,联系人:钱七,城市:广州”

### 输出2JSON格式):
{"name": "李四商贸", "type": "零售", "username": "钱七", "city": "广州"}

### 输入3(部分字段缺失):
“类型:教育,联系人:孙八,城市:江苏省”

### 输出3JSON格式):
{"name": "", "type": "教育", "username": "孙八", "city": "江苏省"}

picture.image

不规则数据通过大模型(如大型语言模型或深度学习模型)进行处理,可以显著提升数据分析的效率和深度。大模型在处理非结构化或不规则数据方面具有独特优势,在‌数据转换‌中,大模型可执行高级特征工程,如将非结构化文本转化为数值向量等复杂特征。


3.6 如何防止ParseX请求失败,增加判断节点:

智能体的IF选择器就像给AI装了个“智能开关”,能根据条件自动选择不同操作路径,让工作流更灵活高效,输入参数后,IF选择器会自动匹配预设条件(比如用户输入“退货”就走退货流程),支持“且/或”组合条件,符合条件就执行对应操作,不符合则走备用路径,类似编程中的if-else逻辑。

‌- 智能客服‌:用户说“退货”就触发退款流程,说“换货”就走换货流程。 ‌- 教学辅助‌:比如用Coze平台做思维导图生成器,IF选择器能根据用户需求自动调整生成策略。

picture.image

在上面测试时发现,当ParseX插件解析文档失败时,会返回code为null,那么,这时候再用大模型解析就意义不大,这里我们可以提供选择器来进行条件的判断,判断code大于0时,表现成功解析了文档,否则就是解析没有成功,可以走另外的逻辑处理。

picture.image

那么,因为大模型返回的是有固定的json格式的数据,所以,当没有解析到数据,我们就自己设置一个默认的格式,这里我们可以使用代码这个节点,可以在这里写代码,代码节点就是智能体里的“全能工具箱”,能让你直接写代码来处理复杂任务,比如数据计算、API调用或者格式转换,它特别适合需要精确控制或插件搞不定的场景。

// 在这里,您可以通过 'params'  获取节点中的输入变量,并通过 'ret' 输出结果
// 'params' 已经被正确地注入到环境中
// 下面是一个示例,获取节点输入中参数名为'input'的值:
// const input = params.input; 
// 下面是一个示例,输出一个包含多种数据类型的 'ret' 对象:
// const ret = { "name": '小明', "hobbies": ["看书", "旅游"] };

async function main({ params }: Args): Promise<Output> {
    // 构建输出对象
    const ret = {
        "key0": JSON.stringify({
            city: "",
            name: "",
            type: "",
            username: ""
        })
    };

    return ret;
}

picture.image

接下来我们添加一个数据序列化JSON的节点,将返回的字符串数据格式,全部映射成JSON类型的对象实体,不过,这里代码这个节点的链接会提示“警告:"赋值异常: field output is not object"”。


3.7 增加TextIn的图像AI质检中的通用篡改检测功能来检测一下:

在数字时代,图像已成为我们获取信息、传播思想的重要载体。然而,随着图像处理技术的飞速发展,图片篡改变得愈发容易且难以察觉,给信息的真实性带来了前所未有的挑战。为了应对这一难题,TextIn的AI图像篡改检测工具应运而生,成为我们识别图片造假、保护自身免受虚假信息误导的重要武器,判断图片是否有过PS,释放审核人力。

picture.image

通过Coze构建智能体,依托Textin的文档结构化解析能力、火山引擎的高性能AI模型,以及扣子空间的低代码开发生态,我们构建的商业计划书生成器智能体,实现了从非结构化信息输入到标准化的字段输出,再到写入飞书落地的全流程自动化,为用户提供了一款高效、可控的商业规划工具。其低代码特性及模块化设计,既确保了技术落地的便捷性,也为后续功能迭代和场景拓展预留了充足空间,真正打通了AI技术与业务规划需求之间的适配链路,让智能高效的商业计划生成真正成为现实。

picture.image

上面详细介绍了如何通过TextIn xParse插件和火山引擎平台、大模型的技术,构建高效的图片结构化数据处理工作流,从如何创建智能体应用、配置工作流节点,并通过大模型加速器实现精确的图片的解析与还原。无论是通过工作流、API接口还是智能体应用,TextIn xParse都展现了其强大的数据处理能力和高效的文档解析能力,以下是个人体验TextIn一站式智能文档数字化平台体验的过程,无论是追求效率提升的业务部门,还是致力于智能化转型的技术团队,TextIn大模型加速器都能提供强有力的技术支撑。

  • 方案一:作业员人工录入
  • 方案二:规则引擎解析:基于 OCR + 正则/模板脚本解析固定规则
  • 方案三:TextIn × 火山引擎 Agent

picture.image

那么通过这次对TextIn xParse插件和火山引擎平台、大模型的技术的实践,我们可以推测出解决传统作业方式的业务痛点,比如重复手工操作,耗时周期长,人工误操作,特别是在鉴权这方面,一般人眼肉眼是很难去分辨的,通过“基于TextIn搭建商家认证审查智能体”系统,我们可以改为自动化审核操作,大大的降低了客服与财务人力的工作量。

picture.image

为了满足不同的数据处理和业务需求,TextIn提供了多样化的输出格式选择,包括Markdown、JSON等。在JSON格式下,工程师可获取字符串的精确坐标,便于根据需要重构数据库输入。为了让开发者更方便地调用TextIn的功能,官方团队还发布了全面的SDK工具包,支持Python和Java两种主流编程语言。无论是在Web应用程序开发还是大数据分析项目中,工程师们都可以迅速上手并充分利用TextIn的强大解析能力,缩短项目的开发周期,提高工作效率。


3.8 TextIn API 灵活接入:

大模型时代,文档(尤其是复杂文档)中蕴含着海量高价值的数据内容,借助文档解析API将其结构化为大模型更容易理解的格式(如markdown),可以更大程度上增强大模型的能力、发挥更大价值,快速实现业务AI升级。

TextIn xParse 文档解析API 是专为大模型重新设计的文档理解引擎,可以满足AI开发者的核心需求:✅ 文档结构完整保持 ✅ 语义关系准确理解 ✅ 大模型原生友好。

使用文档解析API解析一个或多个文档,您可以选择将输出结果作为markdown或JSON文件保存在指定的目录中,也可以对输出结果做进一步的处理以满足您的业务需求。如果您正在进行知识库、RAG、大模型原生应用、Agent等业务方向的产品建设,文档解析API会为您提供帮助。

TextIn大模型加速器提供三种便捷的使用方式,满足不同场景需求:

  • 智能体与工作流集成‌:通过可视化配置实现自动化处理,适合构建复杂的AI业务流程。

  • 在线体验平台‌:提供零代码快速上手环境,用户可直接上传文档体验OCR识别效果,降低技术门槛。

  • 编程框架直接调用‌:支持多语言SDK接入(Java/Python/Go/Node.js等),开发者可在项目中灵活调用TextIn API,实现定制化文档处理功能。

例如使用Python语言调用TextIn API,仅需数行代码即可完成图片内容提取并结构化处理,极大提升开发效率。这种多维度接入方式确保从快速验证到生产部署的全链路支持。

picture.image

您可以参考以下示例代码完成文档解析API请求的前置准备工作,替换您自己的 x-ti-app-id 和 x-ti-secret-code ,后续步骤可根据实际使用场景在main函数中插入代码。

# -*- coding: utf-8 -*-
import requests
import json

def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

class CommonOcr(object):
    def __init__(self, img_path=None, is_url=False):
        # 通用篡改检测
        self._url = 'https://api.textin.com/ai/service/v1/manipulation_detection'
        # 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-app-id
        # 示例代码中 x-ti-app-id 非真实数据
        self._app_id = 'xxx'
        # 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-secret-code
        # 示例代码中 x-ti-secret-code 非真实数据
        self._secret_code = 'xxxx'
        self._img_path = img_path
        self._is_url = is_url

    def recognize(self):
        head = {}
        try:
            head['x-ti-app-id'] = self._app_id
            head['x-ti-secret-code'] = self._secret_code
            if self._is_url:
                head['Content-Type'] = 'text/plain'
                body = self._img_path
            else:
                image = get_file_content(self._img_path)
                head['Content-Type'] = 'application/octet-stream'
                body = image
            result = requests.post(self._url, data=body, headers=head)
            return result.text
        except Exception as e:
            return e

class OCRClient:
    def __init__(self, app_id: str, secret_code: str):
        self.app_id = app_id
        self.secret_code = secret_code

    def recognize(self, file_content: bytes, options: dict) -> str:
        # 构建请求参数
        params = {}
        for key, value in options.items():
            params[key] = str(value)

        # 设置请求头
        headers = {
            "x-ti-app-id": self.app_id,
            "x-ti-secret-code": self.secret_code,
            # 方式一:读取本地文件
            "Content-Type": "application/octet-stream"
            # 方式二:使用URL方式
            # "Content-Type": "text/plain"
        }

        # 发送请求
        response = requests.post(
            f"https://api.textin.com/ai/service/v1/pdf_to_markdown",
            params=params,
            headers=headers,
            data=file_content
        )

        # 检查响应状态
        response.raise_for_status()
        return response.text

def extract_is_tampered(json_data):
    """
    从图像篡改检测结果中提取is_tampered字段
    
    Args:
        json_data (str or dict): JSON格式的响应数据
        
    Returns:
        bool or None: is_tampered字段的值,解析失败时返回None
    """
    try:
        # 如果输入是字符串,则解析为字典
        if isinstance(json_data, str):
            data = json.loads(json_data)
        elif isinstance(json_data, dict):
            data = json_data
        else:
            raise ValueError("输入数据必须是JSON字符串或字典")
        
        # 提取is_tampered字段
        is_tampered = data.get("result", {}).get("image_property", {}).get("ps", {}).get("is_tampered")
        return is_tampered
        
    except json.JSONDecodeError as e:
        print(f"JSON解析错误: {e}")
        return None
    except Exception as e:
        print(f"提取字段时发生错误: {e}")
        return None

if __name__ == "__main__":
    # 示例 1:传输文件
    response = CommonOcr(img_path=r'example1.jpeg')
    result = response.recognize()
    print(extract_is_tampered(result))
    if extract_is_tampered(result) is False:
      client = OCRClient("xxxx", "xxx")
      # 读取本地文件
      with open("./example1.jpeg", "rb") as f:
          file_content = f.read()

      # 设置URL参数,可按需设置,这里已为你默认设置了一些参数
      options = dict(
          dpi=144,
          get_image="objects",
          markdown_details=1,
          page_count=10,
          parse_mode="auto",
          table_flavor="html"
      )

      try:
          response = client.recognize(file_content, options)

          # 保存完整的JSON响应到result.json文件
          with open("result.json", "w", encoding="utf-8") as f:
              f.write(response)

          # 解析JSON响应以提取markdown内容
          json_response = json.loads(response)
          if "result" in json_response and "markdown" in json_response["result"]:
              markdown_content = json_response["result"]["markdown"]
              with open("result.md", "w", encoding="utf-8") as f:
                  f.write(markdown_content)

          print(response)
      except Exception as e:
          print(f"Error: {e}")
    # 示例 2:传输 URL
    # response = CommonOcr(img_path='http://example.com/example.jpg', is_url=True)
    # print(response.recognize())

我们是先进行鉴权,防止发票修改,再进行复制以下示例代码,粘贴至前置准备代码的main函数中;替换要解析的文件;运行脚本来解析本地目录中的文件并将结果作为markdown和JSON文件保存。

picture.image

多并发请求测试:

在实际使用过程中,您可能会需要在一定时间内集中性的批量解析文档;在这种情况下,即使TextIn xParse 文档解析API本身的速度足够快,但依次逐个解析大批量文档所需要的总耗时也可能会较长。

import json
import requests

class OCRClient:
   def __init__(self, app_id: str, secret_code: str):
       self.app_id = app_id
       self.secret_code = secret_code

   def recognize(self, file_content: bytes, options: dict) -> str:
       # 构建请求参数
       params = {}
       for key, value in options.items():
           params[key] = str(value)

       # 设置请求头
       headers = {
           "x-ti-app-id": self.app_id,
           "x-ti-secret-code": self.secret_code,
           # 方式一:读取本地文件
           # "Content-Type": "application/octet-stream"
           # 方式二:使用URL方式
           "Content-Type": "text/plain"
       }

       # 发送请求
       response = requests.post(
           f"https://api.textin.com/ai/service/v1/pdf_to_markdown",
           params=params,
           headers=headers,
           data=file_content
       )

       # 检查响应状态
       response.raise_for_status()
       return response.text

def main():
   # 创建客户端实例,需替换为你的API Key
   client = OCRClient("你的x-ti-app-id", "你的x-ti-secret-code")

   # 文件URL,这里为你提供了一份真实可用的示例URL
   file_content = "https://dllf.intsig.net/download/2025/Solution/textin/sample/pdf_to_markdown/sample_02.pdf"

   # 设置URL参数,可按需设置,这里已为你默认设置了一些参数
   options = dict(
       dpi=144,
       get_image="objects",
       markdown_details=1,
       page_count=10,
       parse_mode="auto",
       table_flavor="html"
   )

   import time

   # 在发送请求前记录开始时间
   start_time = time.time()

   try:
       response = client.recognize(file_content, options)

       # 保存完整的JSON响应到result.json文件
       with open("result.json", "w", encoding="utf-8") as f:
           f.write(response)

       # 解析JSON响应以提取markdown内容
       json_response = json.loads(response)
       if "result" in json_response and "markdown" in json_response["result"]:
           markdown_content = json_response["result"]["markdown"]
           with open("result.md", "w", encoding="utf-8") as f:
               f.write(markdown_content)

       # 记录请求结束时间
       end_time = time.time()

       print(f"请求耗时:{end_time - start_time:.2f} 秒")
   except Exception as e:
       print(f"Error: {e}")

if __name__ == "__main__":
   main()

picture.image


四、总结:

当Textin的算法优化能力、火山引擎的高性能AI计算基础设施与扣子空间的低代码智能体开发平台实现技术融合,一个突破性的智能解决方案就此诞生。这不仅是工具链的简单叠加,更是"AI效能×算力底座×开发生态"的三维协同创新,为创业者、企业决策者及投资机构构建了一条从创意孵化到商业落地的"全链路智能加速通道"。

TextIn一站式智能文档数字化平台,旨在为全球用户提供智能文档采集、分类及结构化信息抽取服务,有效提升企业业务处理效率:

  • ①. 一款一款以高精度OCR(光学字符识别)为核心的文档智能处理工具,其核心能力在于将非结构化信息精准转换为结构化内容。
  • ②. TextIn开发的ParseX插件正式上架Coze平台,方便集成配套的开发工具与组件,大幅提高应用层的开发生产效率。
  • ③. 助力中小企业及开发者快速部署高性能Agent智能体生成式AI应用。

picture.image

以上是公司经过了初创期、爬坡期,在行业内快速的吸引客户,并且占有一定的业务量,后续在原有的业务基础上,提高市场的竞争力,以及对公司一些CostDown原则的实施,希望能通过更多的TextIn一站式智能文档数字化平台,提供智能文档采集、分类及结构化信息抽取服务,有效提升企业业务处理效率帮助企业实施AI的战略布局,事实上,通过以上对AIGC的一些方案落地,可以看到在原有的人工传统作业方式,通过AIGC的工具体系,来加速业务的处理效率。

picture.image

picture.image

总之,随着深度学习、大数据、人工智能、AI等技术领域的不断发展,在AI驱动商业创新的浪潮席卷之际,企业对高效、精准的文档采集、分类及结构化信息抽取服务的需求日益迫切,TextIn xParse智能文档解析,致力于将复杂文档转变为结构化数据,让任意文档的信息都能高效准确流入您的数据库,将非结构化内容转化为可查询、可分析的宝贵数据资产,同时兼容关系型数据库与向量数据库。

picture.image

本文介绍了TextIn智能文档处理云平台在企业数字化转型中的应用。随着AI技术的发展,OCR文字识别技术正被广泛用于解决文档信息提取的痛点。文章通过两个业务场景(商家认证审核和发票处理)展示了传统人工审核的弊端,并详细演示了如何将TextIn的ParseX插件集成到Coze平台,实现文档自动识别与结构化处理。平台支持智能文字识别、图像处理等功能,能有效提升企业业务处理效率,降低人力成本。测试过程中遇到图片访问权限问题及字段映射问题,为后续优化提供了方向。

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
从 ClickHouse 到 ByteHouse
《从ClickHouse到ByteHouse》白皮书客观分析了当前 ClickHouse 作为一款优秀的开源 OLAP 数据库所展示出来的技术性能特点与其典型的应用场景。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论