Mistral OCR 4 : l'IA qui lit manuscrits et 170 langues

Résumé par IA, vérifié par Numerama

OCR 4 de Mistral promet de restituer la structure complète des documents — cadres, tableaux, signatures et notes manuscrites — au‑delà d’une simple transcription de texte.
Le modèle prend en charge 170 langues, y compris des langues peu documentées, ce qui le rend pertinent pour les corpus historiques et les manuscrits.
Ciblé sur la numérisation massive d’archives et de formulaires administratifs, OCR 4 mise sur l’auto‑hébergement pour répondre aux besoins de confidentialité des organisations.

Recevez tous les soirs un résumé de l’actu importante avec Le Récap’

Mistral met à jour son IA de lecture de documents (OCR) et la pousse vers les manuscrits et les langues rares. Derrière l’outil pour développeurs, l’enjeu est très concret : numériser des montagnes d’archives, jusque dans nos administrations.

Un document n’est pas qu’un bloc de texte parfaitement ordonné, dans un format bien lisible : il a une mise en page, des tableaux, des signatures, parfois une note griffonnée dans la marge ou des caractères devenus illisibles avec le temps. Ces subtilités propres à l’ère du papier qui n’est définitivement pas derrière nous (coucou les expats qui doivent remplir leurs impôts au stylo), c’est exactement ce que Mistral dit vouloir faire comprendre à sa nouvelle IA, OCR 4, présentée le 23 juin 2026. Le français ne se contente plus de transformer une page scannée en texte, il cherche à en restituer la structure.

L’OCR, en pratique, (reconnaissance optique de caractères) existe depuis des décennies et n’a pas eu besoin de l’IA pour se démocratiser. La nouveauté ici tient au niveau de détail. D’après le blog spécialisé MarkTechPost, OCR 4 localise chaque bloc d’une page avec des cadres de détection, le classe par type (titre, tableau, équation, signature) et attribue un score de confiance à chaque mot. Ainsi, le système qui reçoit le résultat sait non seulement ce qui est écrit, mais où ça se trouve et à quel point la machine est sûre d’elle.

Mistral revendique un modèle compact qui prend en charge 170 langues, y compris des langues peu documentées, que la plupart des outils lisent mal, et tourne dans un seul conteneur pour être hébergé en interne. Le tarif est fixé à 4 dollars (environ 3,70 €) pour 1 000 pages, qui tombe à 2 dollars (environ 1,85 €) en mode traitement par lots.

Les Prime Day sont là ! Yuka Mini 2 500

Jusqu’au 26 juin, le Yuka Mini 2 500 tombe sous les 550 € ! jusqu’à 500m², zéro perte de signal, sans RTK, Traitement d’Image à Trois Caméras boosté à l’IA… Bref, ne tondez plus votre pelouse en 2026 !

Les modèles OCR de Mistral // Source : Mistral

Le Français face à une vague de modèles chinois

Mistral n’est pas seul sur ce terrain. Les années 2025 et 2026 ont vu déferler une série de petits modèles d’OCR spécialisés, en grande partie chinois et souvent open source : DeepSeek-OCR, PaddleOCR-VL (Baidu) ou encore Qwen3-VL côté Alibaba. Plusieurs trustent les premières places du classement OmniDocBench, une référence du secteur. En face, les géants américains tiennent la corde : Google avec Document AI, Microsoft avec Azure, sans oublier les modèles de vision généralistes comme Gemini.

Pour se démarquer, Mistral met en avant deux arguments. Le premier : des annotateurs indépendants ont comparé OCR 4 à chaque système concurrent testé, sur plus de 600 documents réels dans plus de 12 langues, et l’ont préféré dans 72 % des cas en moyenne. Le second argument est plus tangible : la possibilité de faire tourner le modèle sur ses propres serveurs, sans envoyer ses documents sensibles vers le cloud d’un tiers. C’est un sujet mineur pour les particuliers, mais majeur pour les administrations publiques, les services de l’État ou les entreprises : autrement dit, les clients de Mistral.

La puissance d'OCR 4 sur les modèles européens

Un enjeu bien concret pour OCR 4 : les archives

L’intérêt de ce genre d’outil ne se joue pas dans une démo bluffante, mais dans le volume. Mistral cite des usages déjà en place : transformer des factures en champs structurés, numériser des archives d’entreprise, extraire le texte propre de rapports techniques. C’est là que la lecture des manuscrits et la gestion des tableaux complexes deviennent utiles : une grande partie des documents qui dorment dans des cartons sont des formulaires remplis à la main.

On pense forcément à notre bon vieux pays gangréné par son administrativite et sa passion formulaire CERFA, où la numérisation traîne et où des montagnes de dossiers attendent encore d’être exploitables. Mistral précise évidemment que son modèle est fait pour comprendre des documents, pas pour décider, ce qui nous semble évident. L’entreprise écarte explicitement le diagnostic médical, le jugement juridique ou les décisions financières à fort enjeu. Autrement dit, l’outil aide à trier et à chercher dans la paperasse, mais pas à valider. C’est déjà un grand pas qui pourrait, bien utilisé, au moins accélérer des traitements.

OCR 4 intéresse surtout les développeurs et les organisations qui brassent de gros volumes de documents. Et pour une administration ou une entreprise qui doit garder ses données chez elle, l’argument de l’auto-hébergement pèse lourd.

Mistral OCR 4 sont tous disponibles via API sur Mistral Studio, Amazon SageMaker, Microsoft Foundry, et bientôt sur Snowflake Parse Document.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Pour ne rien manquer de l’actualité, suivez Numerama sur Google !