
Alors que de plus en plus d’utilisateurs se tournent vers l’intelligence artificielle pour des tâches d’écriture comme la rédaction d’emails ou la synthèse de documents, un problème persistant demeure : le contenu généré reste souvent trop générique. Même avec des modèles comme ChatGPT ou Gemini, obtenir un ton ou une voix personnelle sans de nombreuses modifications manuelles est difficile. Apple propose désormais une solution.
Dans un nouvel article de recherche intitulé Aligning LLMs by Predicting Preferences from User Writing Samples, à présenter lors de la Conférence Internationale sur l’Apprentissage Automatique (ICML 2025) le mois prochain, les chercheurs d’Apple révèlent PROSE, une technique conçue pour aider les modèles de langage à mieux comprendre et adopter les préférences d’écriture uniques des utilisateurs en apprenant directement de leurs échantillons passés.
Fonctionnement de PROSE
L’idée centrale derrière PROSE (Preference Reasoning by Observing and Synthesizing Examples) est d’aller au-delà des techniques d’alignement habituelles, comme le « prompt engineering » ou l’apprentissage par renforcement basé sur les retours humains. Au lieu de cela, l’IA crée un profil interne et interprétable du style d’écriture réel de l’utilisateur.
PROSE fonctionne en deux étapes :
- Affinage itératif : L’IA compare ses réponses générées aux exemples réels de l’utilisateur, ajustant sa « description de préférence » jusqu’à produire quelque chose qui correspond étroitement au style d’écriture de l’utilisateur.
- Vérification de la cohérence : Pour éviter de se fixer sur un seul exemple, qui pourrait ne pas représenter le style d’écriture global de l’utilisateur, l’IA vérifie que toute préférence inférée (ex : « utiliser des phrases courtes » ou « commencer par une blague ») est valide à travers plusieurs échantillons d’écriture.
En somme, PROSE établit un profil de style évolutif, le teste contre plusieurs exemples de l’utilisateur, et utilise cela comme référence pour les générations futures.
Importance pour Apple Intelligence
Bien que l’article ne mentionne pas les produits ou services d’Apple par leur nom, la connexion est évidente. Avec un intérêt croissant pour des assistants plus personnalisés, des techniques comme PROSE pourraient jouer un rôle significatif dans la capacité d’Apple Intelligence à générer des textes qui ressemblent réellement à ceux de chaque utilisateur.
De plus, Apple permet maintenant aux développeurs d’accéder directement à ses modèles locaux via le nouveau cadre Foundation Models, il n’est pas difficile d’imaginer un futur où n’importe quelle application pourrait profiter d’un assistant d’écriture profondément personnalisé pour alimenter ses propres outils d’écriture.
Un nouveau référentiel
Dans cette étude, Apple introduit également un nouvel ensemble de données de référence, nommé PLUME (Preference Learning from User Emails and Memos), pour évaluer des techniques d’alignement de style d’écriture comme PROSE.
Cela remplace un ensemble de données précédent (PRELUDE) et vise à résoudre des problèmes courants liés aux tests de personnalisation des LLM, comme des définitions de préférence superficielles ou des tâches non représentatives.
En utilisant PLUME, les chercheurs ont comparé PROSE à des approches antérieures, comme une autre méthode d’apprentissage des préférences appelée CIPHER, ainsi qu’aux techniques d’apprentissage en contexte standard.
Le résultat ? PROSE a surpassé CIPHER de 33% sur des métriques clés et a même battu ICL lorsqu’il était associé à des modèles haut de gamme comme GPT-4o.
Il est intéressant de noter que l’article suggère que la combinaison de PROSE avec ICL offre le meilleur des deux mondes, avec une amélioration allant jusqu’à 9% par rapport à ICL seul.
La tendance plus large : une IA qui s’adapte à vous
Le projet PROSE s’inscrit dans une tendance plus large de la recherche sur l’IA : rendre les assistants non seulement plus intelligents, mais aussi plus personnels. Que ce soit par un réglage fin sur l’appareil, la modélisation des préférences ou des invites sensibles au contexte, la course est lancée pour réduire l’écart entre la sortie générique des LLM et la voix unique de chaque utilisateur.
Bien sûr, la véritable personnalisation comporte également d’énormes incitations commerciales, car elle prépare aussi le terrain pour un verrouillage ultime de la plateforme.