Mistral met à jour son IA de lecture de documents (OCR) et la pousse vers les manuscrits et les langues rares. Derrière l’outil pour développeurs, l’enjeu est très concret : numériser des montagnes d’archives, jusque dans nos administrations.

Un document n’est pas qu’un bloc de texte parfaitement ordonné, dans un format bien lisible : il a une mise en page, des tableaux, des signatures, parfois une note griffonnée dans la marge ou des caractères devenus illisibles avec le temps. Ces subtilités propres à l’ère du papier qui n’est définitivement pas derrière nous (coucou les expats qui doivent remplir leurs impôts au stylo), c’est exactement ce que Mistral dit vouloir faire comprendre à sa nouvelle IA, OCR 4, présentée le 23 juin 2026. Le français ne se contente plus de transformer une page scannée en texte, il cherche à en restituer la structure.

L’OCR, en pratique, (reconnaissance optique de caractères) existe depuis des décennies et n’a pas eu besoin de l’IA pour se démocratiser. La nouveauté ici tient au niveau de détail. D’après le blog spécialisé MarkTechPost, OCR 4 localise chaque bloc d’une page avec des cadres de détection, le classe par type (titre, tableau, équation, signature) et attribue un score de confiance à chaque mot. Ainsi, le système qui reçoit le résultat sait non seulement ce qui est écrit, mais où ça se trouve et à quel point la machine est sûre d’elle.

Mistral revendique un modèle compact qui prend en charge 170 langues, y compris des langues peu documentées, que la plupart des outils lisent mal, et tourne dans un seul conteneur pour être hébergé en interne. Le tarif est fixé à 4 dollars (environ 3,70 €) pour 1 000 pages, qui tombe à 2 dollars (environ 1,85 €) en mode traitement par lots.

Les modèles OCR de Mistral
Les modèles OCR de Mistral // Source : Mistral

Le Français face à une vague de modèles chinois

Mistral n’est pas seul sur ce terrain. Les années 2025 et 2026 ont vu déferler une série de petits modèles d’OCR spécialisés, en grande partie chinois et souvent open source : DeepSeek-OCR, PaddleOCR-VL (Baidu) ou encore Qwen3-VL côté Alibaba. Plusieurs trustent les premières places du classement OmniDocBench, une référence du secteur. En face, les géants américains tiennent la corde : Google avec Document AI, Microsoft avec Azure, sans oublier les modèles de vision généralistes comme Gemini.

Pour se démarquer, Mistral met en avant deux arguments. Le premier : des annotateurs indépendants ont comparé OCR 4 à chaque système concurrent testé, sur plus de 600 documents réels dans plus de 12 langues, et l’ont préféré dans 72 % des cas en moyenne. Le second argument est plus tangible : la possibilité de faire tourner le modèle sur ses propres serveurs, sans envoyer ses documents sensibles vers le cloud d’un tiers. C’est un sujet mineur pour les particuliers, mais majeur pour les administrations publiques, les services de l’État ou les entreprises : autrement dit, les clients de Mistral.

La puissance d'OCR 4 sur les modèles européens

Un enjeu bien concret pour OCR 4 : les archives

L’intérêt de ce genre d’outil ne se joue pas dans une démo bluffante, mais dans le volume. Mistral cite des usages déjà en place : transformer des factures en champs structurés, numériser des archives d’entreprise, extraire le texte propre de rapports techniques. C’est là que la lecture des manuscrits et la gestion des tableaux complexes deviennent utiles : une grande partie des documents qui dorment dans des cartons sont des formulaires remplis à la main.

On pense forcément à notre bon vieux pays gangréné par son administrativite et sa passion formulaire CERFA, où la numérisation traîne et où des montagnes de dossiers attendent encore d’être exploitables. Mistral précise évidemment que son modèle est fait pour comprendre des documents, pas pour décider, ce qui nous semble évident. L’entreprise écarte explicitement le diagnostic médical, le jugement juridique ou les décisions financières à fort enjeu. Autrement dit, l’outil aide à trier et à chercher dans la paperasse, mais pas à valider. C’est déjà un grand pas qui pourrait, bien utilisé, au moins accélérer des traitements.

OCR 4 intéresse surtout les développeurs et les organisations qui brassent de gros volumes de documents. Et pour une administration ou une entreprise qui doit garder ses données chez elle, l’argument de l’auto-hébergement pèse lourd.

Mistral OCR 4 sont tous disponibles via API sur Mistral Studio, Amazon SageMaker, Microsoft Foundry, et bientôt sur Snowflake Parse Document.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Pour ne rien manquer de l’actualité, suivez Numerama sur Google !