
Ollama, l’un des meilleurs outils pour exécuter des modèles d’IA localement sur Mac, vient de franchir un cap. Grâce à une mise à jour récente, les performances des modèles d’IA s’améliorent considérablement sur les Macs équipés de la puce Apple.
Pour ceux qui ne connaissent pas Ollama, il s’agit d’une application compatible avec Mac, Linux et Windows permettant de faire fonctionner des modèles d’IA directement sur votre ordinateur. Contrairement aux applications basées sur le cloud comme ChatGPT, qui nécessitent une connexion Internet, Ollama charge et exécute les modèles localement.
Ces modèles peuvent être téléchargés depuis des communautés open-source telles que Hugging Face ou même directement auprès des fournisseurs de modèles. Cependant, exécuter un LLM (modèle de langage de grande taille) localement peut s’avérer ardu, même pour des modèles légers qui consomment beaucoup de RAM et de mémoire GPU.
Pour remédier à cela, Ollama a publié une version préliminaire (Ollama 0.19) de son application, désormais construite sur le cadre d’apprentissage machine d’Apple, MLX. Cela permet aux modèles d’IA de s’exécuter plus rapidement sur les Macs à puce Apple grâce à son architecture de mémoire unifiée.
D’après Ollama, cette mise à jour engendre un gain de vitesse significatif sur tous les appareils Apple Silicon. Sur les puces M5, M5 Pro et M5 Max, Ollama utilise les nouveaux Accélérateurs Neuraux GPU pour améliorer le temps jusqu’au premier jeton (TTFT) et la vitesse de génération (jetons par seconde).
Avec cette mise à jour, Ollama affirme qu’il est désormais plus rapide d’exécuter des assistants personnels comme OpenClaw, ainsi que des agents de codage tels que Claude Code, OpenCode ou Codex. Toutefois, il est recommandé de posséder un Mac doté de plus de 32 Go de mémoire unifiée, ce qui n’est pas encore le cas de nombreux utilisateurs intéressés par l’exécution d’LLMs localement.
Pour plus d’informations sur Ollama, visitez leur site ici. Si vous souhaitez en savoir plus sur le projet MLX d’Apple, vous pouvez découvrir tous les détails ici.