【TextIn大模型加速器 + 火山引擎】使用“TextIn智能文字识别产品”实现AI OCR智能识 - 文章 - 开发者社区

随着深度学习、大数据、人工智能、AI等技术领域的不断发展，机器学习是目前最火热的人工智能分支之一，是使用大量数据训练计算机程序，以实现智能决策、语音识别、图像处理等任务。各行各业都在积极探索这些技术的应用。特别是在深度学习领域，“合合信息TextIn”作为国内主流的人工智能及大数据科技企业，专注于智能文字识别、图像处理、自然语言处理（NLP）、知识图谱、大数据挖掘等技术，对企业、开发者、个人用户提供智能文字识别引擎、产品、云端服务。为这些技术的落地提供了强大的支持, 怎么样结合自身公司业务打造一个AI智能平台呢？

picture.image

【可以来看看我在B站录的一个视屏】：

使用“TextIn智能文字识别产品”实现AI OCR智能识别商家认证审核方案

1. Textln一站式智能文档数字化平台智能AI识别方案：

基于合合信息旗下Textln打造，火山引擎提供平台支撑的文本智能领域AI创新应用，结合真实业务或创意设想进行技术实践与内容创作，共同探索TextIn“大模型加速器”+Coze/Hi Agent的实际应用场景与业务价值，提供的开箱即用的AI 大模型，降低数据使用门槛。

picture.image

一、前言：

作者也是经过了以上几个阶段的软件开发阶段历程，从最早期在学校和刚入行时，使用的Web时代编程(PHP LNMP环境)、到后面使用云时代分布式编程，到如今的AI时代，传统编程是人类程序员手动编写代码来实现特定的功能，而机器学习是通过让计算机程序从数据中学习，自动地提取特征和规律来实现功能。

picture.image

那么，在实际的工作中如何快速的让开发人员实现AI的功能呢？

今天给大家推荐的一款，【TextIn智能文档处理云平台】为全球用户提供智能图像处理、文字表格识别、文档内容提取产品，让生成式 AI 模型的开发和应用变得更加高效和便捷。无论您是初学者小白还是资深开发者老鸟，都可以使用一站式智能文档数字化平台，为全球用户提供智能文档采集、分类及结构化信息抽取服务，有效提升企业业务处理效率，加速创新与落地，助力中小企业及开发者快速部署智能文档处理等高性能应用。

二、什么是【TextIn智能文档处理云平台】：

“TextIn大模型加速器”专注于智能文字识别、图像处理、自然语言处理（NLP）、知识图谱、大数据挖掘等技术，基于自主研发的智能文字识别及商业大数据核心技术，为全球C端用户和多元行业B端客户提供数字化、智能化的产品及服务。

picture.image

在企业数字化转型进程中，文档是核心的信息载体。企业端日常工作流程中产出了海量PDF、Word、图片格式的文档，这些文档所承载的知识性内容呈现出高度的“非结构化”特点，如使用传统的OCR（光学字符识别）技术进行处理，可能导致提取信息结构混乱，表格、图表信息提取不全，手写字符识别难等问题，导致大模型无法获取精确的专业信息，难以有效开展工作。

三、使用“TextIn智能文字识别产品”实现AI OCR智能识别方案：

随着图片资源时代的飞速发展，将文字内容转化为图片形式进行发布和存储的做法越来越普遍。大量的文字内容为了更好的排版和表现效果，都采用了图片的形式发布和存储，这为内容的传播和安全性带来了很大的便利，同时也增加了文字识别作业的重复性劳动。

OCR文字AI在线识别工具也逐渐的应运而生，主要是为了帮助用户解决了内容编辑的难题，对于包含大量文字的图片或文档，手动输入既耗时又易出错。OCR工具的出现，大大减轻了这一负担，用户只需上传图片，即可快速获取可编辑的文本内容。

picture.image

3.1 公司业务痛点：

目前OCR技术正在被广泛的运用，刚好接触了基于“基于TextIn智能文档处理云平台”提供智能图像处理、文字表格识别、文档内容提取产品，就是一款运用OCR的技术，可以帮助企业解决一些文字录入业务的痛点，为公司进行增效降本。

3.2 业务场景：

【场景一：】公司地推业务员，需要去宠物店进行登记授权店铺可以销售本公司的产品，也可以为公司拓展客户的目的，公司客服部门专门需要对业务员地推的提交的信息进行审核，同时，也为业务的考核进行评定。【场景二：】供应商在采购后，需要将开立的发票进行公司交账。

picture.image

3.3 业务痛点：

①. 商家认证时，上传的营业执照后，需要人工去审核，十分耗费人力，而且是一个十分枯燥重复的事情。
②. 发票提交后，需要财务人员人工去审核，财务的人员也经常加班。
③. 通过扩展人力 + 加班的形式，也会导致公司的人力成本增大。

3.4 COZE平台Agent构建与TextIn插件集成调试流程：

登陆Coze扣子，找到工作流进行新建，点击“创建工作流”，输入工作流名称和工作流描述后，即可创建一个工作流。在工作流中，可以添加一个节点后，这里提供了很多相关类型的工具，这里选择“插件”工具。

picture.image

TextIn开发的ParseX插件正式上架Coze平台，TextIn ParseX 专为LLM下游任务设计的通用文档解析服务识别文档或图片中的文字信息，将文档解析为Markdown格式，并按常见的阅读顺序进行还原，赋能下游各类大语言模型任务。

在“添加插件”弹框中，我们可以输入“ParseX”即可搜索到TextIn为Coze平台开发的插件，插件支持设置四个参数，这里的app_id和secret_code参数需要在“TextIn智能文档处理平台”进行获取。

picture.image

接下来，可以在TextIn智能文档处理平台平台进行注册与登录，在左侧的菜单中“账号与开发者信息”栏位中，可以查看x-ti-app-id 和 x-ti-secret-code 是访问TextIn API的密钥，具有该账户的完全权限（请妥善保管），而且还支持创建多组对应的开发都账号，进行不同的项目使用。

picture.image

OSS是对象存储服务（Object Storage Service）的缩写，它是一种云存储解决方案，主要用于存储和管理任意类型的文件，如图片、视频、文档、日志和备份数据等。

在平时的业务中，我们的静态资源文件(图片、pdf、文档、txt等)一般都是托管到云OSS对象存储上面，适合社区、多媒体分享、电子商务等各类形式规模的网站站长，App应用和软件应用开发者，游戏开发企业以及有大规模数据存储需求的用户使用。例如互联网音视频存储、教育行业存储、AI/物联网、影视渲染行业及基因行业使用。

这里我们先上传一张图片到OSS上面来，后面在不管是我们内部业务ERP系统，还是Coze智能体、工作流相关的流程都可以使用在线的URL来进行访问。

picture.image

那我们通过设置app_id和secret_code参数，以及在线的Url图片来进行一下测试，发现返回的code是Null，所有的其它数据都是null值，不好！要出bug了，仔细一想排查的方向有3点：

①. 可能存在TextIn平台服务没有费用了，欠费了。
②. 可能存在某些权限没有开通。
③. 可能是图片有问题，导致识别不出来。

picture.image

结果发现是图片不能访问，需要OSS开通一下外网的访问权限即可解决这个问题，将权限开通后，我们再次进行测试，欧克，这次测试成功了，图片中的数据结构也是识别成markdown字段返回了，但是这里有一个疑问：图片的内容解析出来了，但是如何与业务系统进行字段映射绑定呢？

picture.image

那么，可以看到我们的右边这个图里面有商家类型、店铺名称、所在区域这些字段，是不是可以通过一个大模型来帮我刷选出来这些字段呢？

3.5 集成AI大模型解析映射字段：

上面，我们已经通过图片通过TextIn的ParseX插件得到了一段markdown字符串，接下来我们尝试使用大模型来进行转化。

我们这里先添加一个节点，选择“大模型”，这里有很多的模型可以进行选择，我们这里先尝试一下DeepSeek大模型。

picture.image

将ParseX的节点的markdown字段与大模型的input输入的字段进行绑定，另外，在“系统提示词”中，输入以下一段话术：

将识别到的{{input}}值，需要将名称，类型，人名，城市(省，市)，将这些值映射到一个对象中，字段为name, type,username,city，如果匹配不到就为空值

picture.image

点击“优化提示词”后，可以看到系统帮我们生成了很多更为细致的提示词规则语句。

# 角色
你是商家注册认证工作流中的信息提取助手，负责从用户输入的商家相关信息中，精准识别并提取名称（name）、类型（type）、联系人姓名（username）、城市（省/市，city）四个关键信息，并将其映射为结构化对象。

## 技能
### 技能 1: 字段识别与提取
1. **输入处理**：接收用户输入的商家相关文本信息（即{{input}}内容），该信息可能包含商家名称、类型、联系人、城市等关键数据。
2. **名称（name）提取**：从输入中识别商家主体名称，优先匹配“名称为”“商家名/公司名是”“全称是”等表述后的内容；若未明确表述，可从输入开头/结尾的核心主体名称中提取（如“XX有限公司”“XX工作室”等）。
3. **类型（type）提取**：识别商家所属行业/类型，优先匹配“类型是”“行业为”“主营”“业务范围”等表述后的内容（如“餐饮”“科技”“零售”等）。
4. **联系人姓名（username）提取**：识别商家联系人姓名，优先匹配“联系人”“负责人”“联系人姓名”“联系人电话关联姓名”等表述后的具体姓名（如“张三”“李四”等）。
5. **城市（city）提取**：识别商家所在城市（含省/市），优先匹配“位于”“地址在”“城市是”“省/市”等表述后的内容（如“北京市”“广东省深圳市”等，仅保留省/市层级信息）。
6. **多格式兼容**：支持用户输入为自然文本（如“名称：ABC餐饮，类型：餐饮服务，联系人：王五，城市：上海市”）或结构化短句（如“ABC餐饮，餐饮，王五，上海”），自动忽略无关冗余信息。

### 技能 2: 结构化输出
- 将提取的信息按固定字段格式输出为JSON对象，格式为：`{"name": "<名称>", "type": "<类型>", "username": "<联系人姓名>", "city": "<城市>"}`。
- 若某字段无匹配结果，对应的值需设为空字符串（如`""`），不可省略字段。

## 限制
- **仅处理商家注册认证相关信息**：拒绝处理与商家注册无关的内容（如个人事务、其他业务咨询等）。
- **字段优先级**：严格按“名称→类型→联系人→城市”的逻辑顺序提取，确保核心信息优先识别，非核心信息可忽略。
- **输出准确性**：若输入中存在歧义（如“城市”同时出现“上海市”和“广东省”），优先保留完整城市层级（如“广东省深圳市”合并为“深圳市”，或按用户输入格式直接提取“广东省深圳市”）。
- **格式强制**：输出必须为标准JSON格式，不可包含额外文字说明，仅返回字段映射后的结果。

## 回复示例
### 输入1（标准格式）：
“名称：星辰科技有限公司，类型：软件开发，联系人：赵六，城市：浙江省杭州市”

### 输出1（JSON格式）：
{"name": "星辰科技有限公司", "type": "软件开发", "username": "赵六", "city": "浙江省杭州市"}

### 输入2（简略格式）：
“李四商贸，零售，联系人：钱七，城市：广州”

### 输出2（JSON格式）：
{"name": "李四商贸", "type": "零售", "username": "钱七", "city": "广州"}

### 输入3（部分字段缺失）：
“类型：教育，联系人：孙八，城市：江苏省”

### 输出3（JSON格式）：
{"name": "", "type": "教育", "username": "孙八", "city": "江苏省"}

picture.image

不规则数据通过大模型（如大型语言模型或深度学习模型）进行处理，可以显著提升数据分析的效率和深度。大模型在处理非结构化或不规则数据方面具有独特优势，在‌数据转换‌中，大模型可执行高级特征工程，如将非结构化文本转化为数值向量等复杂特征。

3.6 如何防止ParseX请求失败，增加判断节点：

智能体的IF选择器就像给AI装了个“智能开关”，能根据条件自动选择不同操作路径，让工作流更灵活高效，输入参数后，IF选择器会自动匹配预设条件（比如用户输入“退货”就走退货流程），支持“且/或”组合条件，符合条件就执行对应操作，不符合则走备用路径，类似编程中的if-else逻辑。

‌- 智能客服‌：用户说“退货”就触发退款流程，说“换货”就走换货流程。 ‌- 教学辅助‌：比如用Coze平台做思维导图生成器，IF选择器能根据用户需求自动调整生成策略。

picture.image

在上面测试时发现，当ParseX插件解析文档失败时，会返回code为null，那么，这时候再用大模型解析就意义不大，这里我们可以提供选择器来进行条件的判断，判断code大于0时，表现成功解析了文档，否则就是解析没有成功，可以走另外的逻辑处理。

picture.image

那么，因为大模型返回的是有固定的json格式的数据，所以，当没有解析到数据，我们就自己设置一个默认的格式，这里我们可以使用代码这个节点，可以在这里写代码，代码节点就是智能体里的“全能工具箱”，能让你直接写代码来处理复杂任务，比如数据计算、API调用或者格式转换，它特别适合需要精确控制或插件搞不定的场景。

// 在这里，您可以通过 'params'  获取节点中的输入变量，并通过 'ret' 输出结果
// 'params' 已经被正确地注入到环境中
// 下面是一个示例，获取节点输入中参数名为'input'的值：
// const input = params.input; 
// 下面是一个示例，输出一个包含多种数据类型的 'ret' 对象：
// const ret = { "name": '小明', "hobbies": ["看书", "旅游"] };

async function main({ params }: Args): Promise<Output> {
    // 构建输出对象
    const ret = {
        "key0": JSON.stringify({
            city: "",
            name: "",
            type: "",
            username: ""
        })
    };

    return ret;
}

picture.image

接下来我们添加一个数据序列化JSON的节点，将返回的字符串数据格式，全部映射成JSON类型的对象实体，不过，这里代码这个节点的链接会提示“警告："赋值异常: field output is not object"”。

3.7 增加TextIn的图像AI质检中的通用篡改检测功能来检测一下：

在数字时代，图像已成为我们获取信息、传播思想的重要载体。然而，随着图像处理技术的飞速发展，图片篡改变得愈发容易且难以察觉，给信息的真实性带来了前所未有的挑战。为了应对这一难题，TextIn的AI图像篡改检测工具应运而生，成为我们识别图片造假、保护自身免受虚假信息误导的重要武器，判断图片是否有过PS，释放审核人力。

picture.image

通过Coze构建智能体，依托Textin的文档结构化解析能力、火山引擎的高性能AI模型，以及扣子空间的低代码开发生态，我们构建的商业计划书生成器智能体，实现了从非结构化信息输入到标准化的字段输出，再到写入飞书落地的全流程自动化，为用户提供了一款高效、可控的商业规划工具。其低代码特性及模块化设计，既确保了技术落地的便捷性，也为后续功能迭代和场景拓展预留了充足空间，真正打通了AI技术与业务规划需求之间的适配链路，让智能高效的商业计划生成真正成为现实。

picture.image

上面详细介绍了如何通过TextIn xParse插件和火山引擎平台、大模型的技术，构建高效的图片结构化数据处理工作流，从如何创建智能体应用、配置工作流节点，并通过大模型加速器实现精确的图片的解析与还原。无论是通过工作流、API接口还是智能体应用，TextIn xParse都展现了其强大的数据处理能力和高效的文档解析能力，以下是个人体验TextIn一站式智能文档数字化平台体验的过程，无论是追求效率提升的业务部门，还是致力于智能化转型的技术团队，TextIn大模型加速器都能提供强有力的技术支撑。

方案一：作业员人工录入
方案二：规则引擎解析：基于 OCR + 正则/模板脚本解析固定规则
方案三：TextIn × 火山引擎 Agent

picture.image

那么通过这次对TextIn xParse插件和火山引擎平台、大模型的技术的实践，我们可以推测出解决传统作业方式的业务痛点，比如重复手工操作，耗时周期长，人工误操作，特别是在鉴权这方面，一般人眼肉眼是很难去分辨的，通过“基于TextIn搭建商家认证审查智能体”系统，我们可以改为自动化审核操作，大大的降低了客服与财务人力的工作量。

picture.image

为了满足不同的数据处理和业务需求，TextIn提供了多样化的输出格式选择，包括Markdown、JSON等。在JSON格式下，工程师可获取字符串的精确坐标，便于根据需要重构数据库输入。为了让开发者更方便地调用TextIn的功能，官方团队还发布了全面的SDK工具包，支持Python和Java两种主流编程语言。无论是在Web应用程序开发还是大数据分析项目中，工程师们都可以迅速上手并充分利用TextIn的强大解析能力，缩短项目的开发周期，提高工作效率。

3.8 TextIn API 灵活接入：

大模型时代，文档(尤其是复杂文档)中蕴含着海量高价值的数据内容，借助文档解析API将其结构化为大模型更容易理解的格式(如markdown)，可以更大程度上增强大模型的能力、发挥更大价值，快速实现业务AI升级。

TextIn xParse 文档解析API 是专为大模型重新设计的文档理解引擎，可以满足AI开发者的核心需求：✅ 文档结构完整保持 ✅ 语义关系准确理解 ✅ 大模型原生友好。

使用文档解析API解析一个或多个文档，您可以选择将输出结果作为markdown或JSON文件保存在指定的目录中，也可以对输出结果做进一步的处理以满足您的业务需求。如果您正在进行知识库、RAG、大模型原生应用、Agent等业务方向的产品建设，文档解析API会为您提供帮助。

TextIn大模型加速器提供三种便捷的使用方式，满足不同场景需求：

智能体与工作流集成‌：通过可视化配置实现自动化处理，适合构建复杂的AI业务流程。
在线体验平台‌：提供零代码快速上手环境，用户可直接上传文档体验OCR识别效果，降低技术门槛。
编程框架直接调用‌：支持多语言SDK接入（Java/Python/Go/Node.js等），开发者可在项目中灵活调用TextIn API，实现定制化文档处理功能。

例如使用Python语言调用TextIn API，仅需数行代码即可完成图片内容提取并结构化处理，极大提升开发效率。这种多维度接入方式确保从快速验证到生产部署的全链路支持。

picture.image

您可以参考以下示例代码完成文档解析API请求的前置准备工作，替换您自己的 x-ti-app-id 和 x-ti-secret-code ，后续步骤可根据实际使用场景在main函数中插入代码。

# -*- coding: utf-8 -*-
import requests
import json

def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

class CommonOcr(object):
    def __init__(self, img_path=None, is_url=False):
        # 通用篡改检测
        self._url = 'https://api.textin.com/ai/service/v1/manipulation_detection'
        # 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-app-id
        # 示例代码中 x-ti-app-id 非真实数据
        self._app_id = 'xxx'
        # 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-secret-code
        # 示例代码中 x-ti-secret-code 非真实数据
        self._secret_code = 'xxxx'
        self._img_path = img_path
        self._is_url = is_url

    def recognize(self):
        head = {}
        try:
            head['x-ti-app-id'] = self._app_id
            head['x-ti-secret-code'] = self._secret_code
            if self._is_url:
                head['Content-Type'] = 'text/plain'
                body = self._img_path
            else:
                image = get_file_content(self._img_path)
                head['Content-Type'] = 'application/octet-stream'
                body = image
            result = requests.post(self._url, data=body, headers=head)
            return result.text
        except Exception as e:
            return e

class OCRClient:
    def __init__(self, app_id: str, secret_code: str):
        self.app_id = app_id
        self.secret_code = secret_code

    def recognize(self, file_content: bytes, options: dict) -> str:
        # 构建请求参数
        params = {}
        for key, value in options.items():
            params[key] = str(value)

        # 设置请求头
        headers = {
            "x-ti-app-id": self.app_id,
            "x-ti-secret-code": self.secret_code,
            # 方式一：读取本地文件
            "Content-Type": "application/octet-stream"
            # 方式二：使用URL方式
            # "Content-Type": "text/plain"
        }

        # 发送请求
        response = requests.post(
            f"https://api.textin.com/ai/service/v1/pdf_to_markdown",
            params=params,
            headers=headers,
            data=file_content
        )

        # 检查响应状态
        response.raise_for_status()
        return response.text

def extract_is_tampered(json_data):
    """
    从图像篡改检测结果中提取is_tampered字段
    
    Args:
        json_data (str or dict): JSON格式的响应数据
        
    Returns:
        bool or None: is_tampered字段的值，解析失败时返回None
    """
    try:
        # 如果输入是字符串，则解析为字典
        if isinstance(json_data, str):
            data = json.loads(json_data)
        elif isinstance(json_data, dict):
            data = json_data
        else:
            raise ValueError("输入数据必须是JSON字符串或字典")
        
        # 提取is_tampered字段
        is_tampered = data.get("result", {}).get("image_property", {}).get("ps", {}).get("is_tampered")
        return is_tampered
        
    except json.JSONDecodeError as e:
        print(f"JSON解析错误: {e}")
        return None
    except Exception as e:
        print(f"提取字段时发生错误: {e}")
        return None

if __name__ == "__main__":
    # 示例 1：传输文件
    response = CommonOcr(img_path=r'example1.jpeg')
    result = response.recognize()
    print(extract_is_tampered(result))
    if extract_is_tampered(result) is False:
      client = OCRClient("xxxx", "xxx")
      # 读取本地文件
      with open("./example1.jpeg", "rb") as f:
          file_content = f.read()

      # 设置URL参数，可按需设置，这里已为你默认设置了一些参数
      options = dict(
          dpi=144,
          get_image="objects",
          markdown_details=1,
          page_count=10,
          parse_mode="auto",
          table_flavor="html"
      )

      try:
          response = client.recognize(file_content, options)

          # 保存完整的JSON响应到result.json文件
          with open("result.json", "w", encoding="utf-8") as f:
              f.write(response)

          # 解析JSON响应以提取markdown内容
          json_response = json.loads(response)
          if "result" in json_response and "markdown" in json_response["result"]:
              markdown_content = json_response["result"]["markdown"]
              with open("result.md", "w", encoding="utf-8") as f:
                  f.write(markdown_content)

          print(response)
      except Exception as e:
          print(f"Error: {e}")
    # 示例 2：传输 URL
    # response = CommonOcr(img_path='http://example.com/example.jpg', is_url=True)
    # print(response.recognize())

我们是先进行鉴权，防止发票修改，再进行复制以下示例代码，粘贴至前置准备代码的main函数中；替换要解析的文件；运行脚本来解析本地目录中的文件并将结果作为markdown和JSON文件保存。

picture.image

多并发请求测试：

在实际使用过程中，您可能会需要在一定时间内集中性的批量解析文档；在这种情况下，即使TextIn xParse 文档解析API本身的速度足够快，但依次逐个解析大批量文档所需要的总耗时也可能会较长。

import json
import requests

class OCRClient:
   def __init__(self, app_id: str, secret_code: str):
       self.app_id = app_id
       self.secret_code = secret_code

   def recognize(self, file_content: bytes, options: dict) -> str:
       # 构建请求参数
       params = {}
       for key, value in options.items():
           params[key] = str(value)

       # 设置请求头
       headers = {
           "x-ti-app-id": self.app_id,
           "x-ti-secret-code": self.secret_code,
           # 方式一：读取本地文件
           # "Content-Type": "application/octet-stream"
           # 方式二：使用URL方式
           "Content-Type": "text/plain"
       }

       # 发送请求
       response = requests.post(
           f"https://api.textin.com/ai/service/v1/pdf_to_markdown",
           params=params,
           headers=headers,
           data=file_content
       )

       # 检查响应状态
       response.raise_for_status()
       return response.text

def main():
   # 创建客户端实例，需替换为你的API Key
   client = OCRClient("你的x-ti-app-id", "你的x-ti-secret-code")

   # 文件URL，这里为你提供了一份真实可用的示例URL
   file_content = "https://dllf.intsig.net/download/2025/Solution/textin/sample/pdf_to_markdown/sample_02.pdf"

   # 设置URL参数，可按需设置，这里已为你默认设置了一些参数
   options = dict(
       dpi=144,
       get_image="objects",
       markdown_details=1,
       page_count=10,
       parse_mode="auto",
       table_flavor="html"
   )

   import time

   # 在发送请求前记录开始时间
   start_time = time.time()

   try:
       response = client.recognize(file_content, options)

       # 保存完整的JSON响应到result.json文件
       with open("result.json", "w", encoding="utf-8") as f:
           f.write(response)

       # 解析JSON响应以提取markdown内容
       json_response = json.loads(response)
       if "result" in json_response and "markdown" in json_response["result"]:
           markdown_content = json_response["result"]["markdown"]
           with open("result.md", "w", encoding="utf-8") as f:
               f.write(markdown_content)

       # 记录请求结束时间
       end_time = time.time()

       print(f"请求耗时：{end_time - start_time:.2f} 秒")
   except Exception as e:
       print(f"Error: {e}")

if __name__ == "__main__":
   main()

picture.image

四、总结：

当Textin的算法优化能力、火山引擎的高性能AI计算基础设施与扣子空间的低代码智能体开发平台实现技术融合，一个突破性的智能解决方案就此诞生。这不仅是工具链的简单叠加，更是"AI效能×算力底座×开发生态"的三维协同创新，为创业者、企业决策者及投资机构构建了一条从创意孵化到商业落地的"全链路智能加速通道"。

TextIn一站式智能文档数字化平台，旨在为全球用户提供智能文档采集、分类及结构化信息抽取服务，有效提升企业业务处理效率：

①. 一款一款以高精度OCR（光学字符识别）为核心的文档智能处理工具，其核心能力在于将非结构化信息精准转换为结构化内容。
②. TextIn开发的ParseX插件正式上架Coze平台，方便集成配套的开发工具与组件，大幅提高应用层的开发生产效率。
③. 助力中小企业及开发者快速部署高性能Agent智能体生成式AI应用。

picture.image

以上是公司经过了初创期、爬坡期，在行业内快速的吸引客户，并且占有一定的业务量，后续在原有的业务基础上，提高市场的竞争力，以及对公司一些CostDown原则的实施，希望能通过更多的TextIn一站式智能文档数字化平台，提供智能文档采集、分类及结构化信息抽取服务，有效提升企业业务处理效率帮助企业实施AI的战略布局，事实上，通过以上对AIGC的一些方案落地，可以看到在原有的人工传统作业方式，通过AIGC的工具体系，来加速业务的处理效率。

picture.image

总之，随着深度学习、大数据、人工智能、AI等技术领域的不断发展，在AI驱动商业创新的浪潮席卷之际，企业对高效、精准的文档采集、分类及结构化信息抽取服务的需求日益迫切，TextIn xParse智能文档解析，致力于将复杂文档转变为结构化数据，让任意文档的信息都能高效准确流入您的数据库，将非结构化内容转化为可查询、可分析的宝贵数据资产，同时兼容关系型数据库与向量数据库。

picture.image

本文介绍了TextIn智能文档处理云平台在企业数字化转型中的应用。随着AI技术的发展，OCR文字识别技术正被广泛用于解决文档信息提取的痛点。文章通过两个业务场景（商家认证审核和发票处理）展示了传统人工审核的弊端，并详细演示了如何将TextIn的ParseX插件集成到Coze平台，实现文档自动识别与结构化处理。平台支持智能文字识别、图像处理等功能，能有效提升企业业务处理效率，降低人力成本。测试过程中遇到图片访问权限问题及字段映射问题，为后续优化提供了方向。