
Lors de la WWDC de cette année, Apple a annoncé une nouveauté majeure : pour la première fois, les développeurs tiers pourront utiliser directement l’IA sur appareil proposée par Apple grâce au nouveau cadre de modèles Foundation. Mais que valent réellement ces modèles comparés à ce qui existe déjà ?
Avec le cadre des modèles Foundation, les développeurs peuvent désormais s’appuyer sur la même pile d’IA utilisée par les applications natives d’Apple.
Cela signifie qu’ils pourront intégrer des fonctionnalités d’IA telles que le résumé de documents, l’extraction d’informations clés à partir de textes utilisateurs, ou même la génération de contenus structurés, entièrement hors ligne, sans frais d’API.
Mais quels sont les véritables atouts des modèles d’Apple ?
UNE CONCURRENCE PERTINENTE
D’après les évaluations humaines d’Apple, la réponse semble être : plutôt solide, surtout si l’on considère l’équilibre entre taille, vitesse et efficacité.
Dans les tests d’Apple, son modèle sur appareil de ~3 milliards de paramètres a surpassé des modèles légers similaires comme InternVL-2.5 et Qwen-2.5-VL-3B dans des tâches d’images, remportant 46 % et 50 % des thèmes, respectivement.
ET EN TERMES DE TEXTE ?
En ce qui concerne le texte, il maintient une bonne position face à des modèles plus lourds comme Gemma-3-4B, parvenant même à dépasser certains modèles dans des évaluations en anglais international et multilingue (portugais, français, japonais, etc.).
En d’autres termes, les nouveaux modèles locaux d’Apple semblent promettre des résultats cohérents pour de nombreuses utilisations pratiques sans avoir recours au cloud ou requérir que des données quittent l’appareil.
UN IMPACT SIGNIFICATIF DES MODÈLES INTÉGRÉS
La véritable actualité réside non seulement dans la performance des modèles d’Apple, mais aussi dans leur intégration. Grâce au cadre des modèles Foundation, les développeurs n’ont plus besoin d’incorporer de lourds modèles de langage dans leurs applications pour le traitement hors ligne, ce qui permet de réduire la taille des applications et de ne pas dépendre du cloud pour la plupart des tâches.
Résultat : une expérience plus privée pour les utilisateurs, sans frais d’API pour les développeurs, des économies qui bénéficient à tous.
Apple annonce que les modèles sont optimisés pour des sorties structurées à l’aide d’un système de « génération guidée » natif en Swift, permettant aux développeurs de contraindre directement les réponses des modèles dans la logique des applications. Pour les applications pédagogiques, de productivité et de communication, cela pourrait représenter une révolution, offrant les avantages des LLM sans latence, coût ou compromis sur la vie privée.
En conclusion, les modèles d’Apple ne sont peut-être pas les plus puissants au monde, mais ils n’ont pas besoin de l’être. Ils sont de bonne qualité, rapides, et désormais accessibles à tous les développeurs gratuitement, hors ligne, et sur appareil.