Mistral发布史上最强、最好用OCR模型 - 文章 - 开发者社区

Mistral AI发布世界上最好用的OCR模型，专注于高精度的文档理解和信息提取，特别适用于复杂 PDF、图像、表格、数学公式、多语言文档等多种格式。

picture.image

在严格的基准测试中，Mistral OCR 的性能始终优于其他领先的 OCR 模型。它在文档分析的多个方面都具有出色的准确性，如下所示。

picture.image

按语言

picture.image

目前可以再Le Chat上免费测试，也可以调用 API mistral-ocr-latest，价格1000页/美元。

主要特点

博客里显示了它的中文OCR能力比Gemini2.0 Flash好。简单体验了下，在下图的例子里，Gemini2.0 Pro OCR识别中文表现最好，Mistral OCR定位很厉害，中文识别能力一般，Gemini2.0 Flash一般

picture.image