AFM Core, AFM Core Advanced, AFM Cloud, ADM Cloud et AFM Cloud Pro : Apple ne lance pas un, mais cinq modèles d’IA. Contrairement à ce que beaucoup écrivent, la marque californienne ne se contente pas d’utiliser les modèles Gemini de Google pour son nouvel assistant Siri AI : la réalité est bien plus complexe. Numerama a assisté à plusieurs sessions techniques à Cupertino et vous explique tout.

Apple peut-il réussir sa remontada en intelligence artificielle ? Deux ans après le lancement raté d’Apple Intelligence, la marque a profité de la WWDC 2026 du 8 juin 2026 pour repartir de presque zéro.

Apple dévoile un nouveau Siri propulsé par un vrai modèle de langage avec une application façon ChatGPT, intègre de l’IA partout dans ses systèmes, permet de générer des images nativement dans ses applications et s’émancipe d’OpenAI pour plusieurs fonctions Apple Intelligence. Un grand reset qui s’accompagne de beaucoup d’incompréhensions : on lit un peu partout qu’Apple utilise les modèles Google Gemini, que les nouveautés sont réservées aux iPhone 17 Pro et qu’Apple prive l’Europe de toutes les nouveautés. Ces trois affirmations sont fausses.

En réalité, Apple a utilisé Gemini pour entraîner ses propres modèles regroupés sous le nom AFM (Apple Foundation Models, de troisième génération). Les iPhone précédemment compatibles avec Apple Intelligence le restent (un seul de ces cinq modèles a besoin des iPhone 17 Pro pour des fonctions vocales). Et, enfin, si l’Europe est bien privée de Siri AI et de ses meilleures fonctions, les cinq modèles intégrés à iOS, iPadOS et macOS seront bien disponibles dans l’Union européenne. Encore mieux : ils parlent déjà français.

AFM Core, AFM Core Advanced, AFM Cloud… les cinq modèles d’Apple

Le 8 juin, après la keynote, Apple a réuni quelques médias à l’Apple Park pour une présentation technique avec Craig Federighi, son patron du logiciel, accompagné de trois responsables de la refonte de sa stratégie IA : Sébastien Marineau-Mes (Intelligent System Experience), Mike Rockwell (Siri Engineering) et Amar Subramanya (AI/ML). Un exercice rare pour Apple, manifestement conscient de la confusion autour de ses annonces. Numerama a pu assister à la présentation.

La session technique d'Apple à la WWDC 26, avec Tim Cook et John Ternus au premier rang.
La session technique d’Apple à la WWDC 26, avec Tim Cook et John Ternus au premier rang. // Source : Numerama

Première chose importante : il n’y a pas un modèle, mais cinq. Quand vous posez une question à Siri AI, un orchestrateur en local sur l’appareil choisit le ou les modèles les mieux adaptés à votre requête, et décide ce qui peut être traité sur l’appareil et ce qui doit partir dans le cloud. Voici la famille AFM 3 (Apple Foundation Model de troisième génération) au complet :

  • AFM 3 Core (local). Le plus petit modèle qui tourne sur l’appareil en local avec une architecture dense, avec 3 milliards de paramètres. C’est l’héritier du modèle on-device actuel, en plus performant. Il gère les tâches simples directement sur l’iPhone et effectue les premières analyses.
  • AFM 3 Core Advanced (local). Le modèle le plus puissant jamais conçu pour tourner en local chez Apple. Il mise sur une architecture sparse nativement multimodale : il comprend le texte, les images et l’audio. Il pèse 20 milliards de paramètres, mais n’en active que 1 à 4 à la fois selon la requête (pour optimiser la RAM et l’énergie). C’est lui qui génère les nouvelles voix expressives et la dictée améliorée. Et c’est aussi lui qui est le plus restrictif : seuls les iPhone 17 Pro, iPhone Air et iPad/Mac M3 sont éligibles.
  • AFM 3 Cloud (serveur). Le modèle par défaut côté serveur optimisé pour la vitesse et l’efficacité. Il tourne sur les serveurs Private Cloud Compute d’Apple avec des puces Apple Silicon.
  • ADM 3 Cloud (serveur). Le modèle de génération et d’édition d’images. C’est lui qui alimente le recadrage spatial dans Photos, la nouvelle version d’Image Playground et les Genmoji. C’est la première fois qu’Apple dispose de ce type de modèle. Il tourne aussi sur des serveurs Apple Silicon.
  • AFM 3 Cloud Pro (serveur). Le modèle le plus capable, réservé aux tâches les plus exigeantes comme le raisonnement complexe et l’agentique. Selon Apple, sa qualité est « similaire aux modèles frontier de Gemini ». C’est le seul à tourner sur des GPU Nvidia hébergés dans le Google Cloud.
Explications par Apple sur l'architecture inédite du AFM 3 Core Advanced.
Explications par Apple sur l’architecture inédite du AFM 3 Core Advanced. // Source : Apple

AFM 3 Core Advanced est le modèle le plus intéressant. Les grands modèles de langage, qu’ils soient denses ou sparse, doivent normalement charger l’intégralité de leurs poids dans la mémoire vive pour fonctionner. C’est gérable sur un serveur, mais impossible sur un téléphone, où la mémoire et la batterie sont limitées.

Apple a contourné le problème avec une architecture maison baptisée Instruction-Following Pruning. Le modèle complet est stocké dans la mémoire flash de l’iPhone, pas dans la DRAM. Comme la flash est trop lente pour échanger les poids à chaque mot généré, le modèle prend ses décisions de routage par requête et non par mot : il sélectionne un petit groupe d’« experts » au début, les verrouille, et ne charge en mémoire vive que le strict nécessaire. Résultat, on obtient la puissance d’un modèle de 20 milliards de paramètres au coût d’un modèle de 1 à 4 milliards.

Sur les appareils incompatibles, Apple Intelligence perd le support des voix expressives et la dictée améliorée. C’est dérisoire aujourd’hui. Aucun acteur de l’industrie ne dispose d’un modèle local aussi performant : nul doute qu’Apple s’appuiera de plus en plus sur Core Advanced à l’avenir, pour faire tourner localement des fonctions qui passent aujourd’hui par le cloud. Mais, aujourd’hui, la plupart des actions IA d’Apple passent par des serveurs.

Craig Federighi devant une inforgraphie qui explique ce qui se passe en local.
Craig Federighi devant une infographie qui explique ce qui se passe en local. // Source : Numerama

Private Cloud Compute : Apple s’obstine à faire différemment

Pour les requêtes que l’appareil ne peut pas traiter seul, Apple bascule vers ses serveurs Private Cloud Compute. L’orchestrateur local prépare la demande, récupère sur l’appareil les seules données utiles, les envoie au serveur qui renvoie une réponse de façon anonymisée avant d’effacer toute trace. Apple assure ne rien collecter ni stocker, et dit ne même pas pouvoir inspecter ce qui se passe sur ces serveurs.

Conséquence de ce choix pro-vie privée : Siri n’a pas de mémoire comparable à celle de ChatGPT ou Gemini. Siri AI ne retient pas vos préférences d’une conversation à l’autre. Si vous lui dites lundi que vous détestez les champignons, il l’aura probablement oublié mardi. Ensuite, l’utilisateur ne peut pas choisir le modèle le plus performant s’il le souhaite : c’est l’orchestrateur qui décide. Un fonctionnement qui peut sembler étrange : Apple s’obstine à vouloir faire de l’IA autrement alors que Google, OpenAI et Anthropic misent tout sur le cloud et que leurs utilisateurs ne semblent pas s’en inquiéter.

Quel est le vrai rôle de Google Gemini dans le nouveau Apple Intelligence ?

Le point qui a généré le plus de confusion concerne l’implication de Google : Craig Federighi a tenu à le clarifier. Le dirigeant d’Apple explique qu’Apple n’utilise aucun produit grand public de Google : « La part de l’assistant Google que nous utilisons, c’est zéro. »

Apple et Google ont officialisé un accord pluriannuel en janvier 2026. Mais cet accord ne porte pas sur l’usage de Gemini dans le produit final : il porte sur l’entraînement des modèles Apple. Apple a pré-entraîné ses modèles sur les puces TPU de Google, puis les a affinés à partir des sorties des modèles Gemini les plus performants. Autrement dit, Gemini a joué le rôle de « professeur » : il a aidé à former les modèles d’Apple qui s’inspirent de ses réponses quand ils vous répondent.

Apple a brièvement mentionné Google pendant la keynote, puis en a beaucoup plus parlé avec la presse.
Apple a brièvement mentionné Google pendant la keynote, puis en a beaucoup plus parlé avec la presse. // Source : Numerama

Les modèles AFM 3 sont donc des cousins de Gemini, conçus et entraînés selon les exigences d’Apple. ADM 3 Cloud, le modèle d’images, est très certainement un dérivé Nano Banana à la sauce Apple, et AFM 3 Cloud Pro un équivalent de Gemini 3 Pro. Mais ce sont bien des modèles maison conçus par Apple et optimisés pour le matériel d’Apple. Seul le modèle le plus performant tourne sur des serveurs Nvidia dans le Google Cloud.

Où sont disponibles les modèles Apple Intelligence de 3e génération ?

Les cinq modèles alimentent de nombreuses fonctions dans iOS 27, iPadOS 27 et macOS 27 : la gomme magique améliorée et le recadrage spatial dans Photos, la génération d’images dans Image Playground, les outils d’écriture intégrés au système, le regroupement automatique des onglets dans Safari, les suggestions dans Messages et Mail, ou encore la création de raccourcis en langage naturel… Tout passe par un des cinq modèles AFM.

Les modèles d’Apple sont disponibles en Europe dès la première bêta et supportent le français, contrairement aux idées reçues (il faut dire qu’Apple a manqué de clarté). Il n’y a pas de blocage des modèles dans l’Union européenne pour l’utilisation des modèles : c’est Siri AI et son index sémantique qui pose problème au regard du DMA. Il sera possible en septembre de modifier une image ou de générer du texte avec les modèles Apple. Les développeurs peuvent aussi intégrer les modèles d’Apple à leurs propres applications, en local ou dans le cloud, via le framework Foundation Models et le nouveau framework Core AI.

World Knowledge, le moteur de recherche maison qu’Apple n’a pas assez mis en avant

Autre annonce qui est presque passée inaperçue, alors qu’elle est immense : Apple lance son propre index web. Pour répondre aux questions sur l’actualité ou les connaissances générales, Siri AI ne s’appuie pas sur Google Search, mais sur un service maison baptisé World Knowledge : un index du web construit par Apple. Les éditeurs peuvent choisir de s’y exclure s’ils le souhaitent et Siri les citera si leurs sites sont utilisés. World Knowledge est une des raisons de la non-disponibilité de Siri AI en dehors de l’anglais : l’index web doit encore être entraîné pour les sources de différents pays.

Siri AI sur iOS 27. // Source : Numerama
Siri AI sur iOS 27. // Source : Numerama

Apple a-t-il choisi la bonne stratégie avec son nouveau Apple Intelligence ?

Le nouveau Apple Intelligence est techniquement une grande avancée, mais Apple a-t-il raison de s’entêter avec son traitement local après l’échec d’il y a deux ans ? La limitation du nombre de tokens, l’absence de sélecteur de modèle et le caractère très grand public des fonctions limitent le nouveau Siri : Apple ne rivalise pas avec ChatGPT ou Claude pour un usage intensif.

Apple ne cherche pas à gagner la guerre des benchmarks, mais veut s’installer comme l’IA facile, native, pour les questions du quotidien, et miser sur ce que personne d’autre ne peut offrir : l’intégration profonde au système (accès à l’écran, aux apps et aux données personnelles), le tout sans sacrifier la vie privée. Cette stratégie peut fonctionner à une condition : que Siri AI soit réellement à la hauteur des promesses, ce qu’on ne pourra vérifier qu’à l’usage. La remontada n’est pas garantie, mais Apple s’est redonné les moyens d’y croire.

Cet article existe grâce à

Les abonnés Numerama+ offrent les ressources nécessaires à la production d’une information de qualité et permettent à Numerama de rester gratuit.

Zéro publicité, fonctions avancées de lecture, articles résumés par l’I.A, contenus exclusifs et plus encore. Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Pour ne rien manquer de l’actualité, suivez Numerama sur Google !