
Une équipe de chercheurs d’Apple s’est penchée sur les attentes réelles des utilisateurs vis-à-vis des agents IA et sur la manière dont ils souhaiteraient interagir avec ces derniers. Voici ce qu’ils ont découvert.
Apple analyse les tendances UX pour l’ère des agents IA
Dans l’étude intitulée Répertoriage de l’espace de conception de l’expérience utilisateur pour les agents informatiques, une équipe de quatre chercheurs d’Apple souligne que si le marché investit massivement dans le développement et l’évaluation des agents IA, certains aspects de l’expérience utilisateur restent négligés : la façon dont les utilisateurs souhaitent interagir avec eux et l’apparence de ces interfaces.
Pour explorer ce sujet, ils ont divisé l’étude en deux phases. Dans un premier temps, ils ont identifié les principaux modèles et considérations de conception UX que les laboratoires d’IA intègrent dans les agents IA existants. Ensuite, ils ont testé et affiné ces idées grâce à des études pratiques auprès des utilisateurs, en utilisant une méthode intéressante appelée Wizard of Oz.
Phase 1 : La taxonomie
Les chercheurs ont examiné neuf agents disponibles sur desktop, mobile et web, parmi lesquels :
- Claude Computer Use Tool
- Adept
- OpenAI Operator
- AIlice
- Magentic-UI
- UI-TARS
- Project Mariner
- TaxyAI
- AutoGLM
Ils ont ensuite consulté huit praticiens, designers, ingénieurs ou chercheurs œuvrant dans les domaines de l’UX ou de l’IA au sein de grandes entreprises technologiques. Cette collaboration leur a permis de cartographier une taxonomie exhaustive comprenant quatre catégories, 21 sous-catégories et 55 exemples de fonctionnalités abordant les considérations clés liées à l’UX des agents IA.
Les quatre principales catégories incluaient :
- Requête de l’utilisateur : comment les utilisateurs saisissent des commandes
- Explicabilité des activités de l’agent : quelles informations présenter à l’utilisateur sur les actions de l’agent
- Contrôle de l’utilisateur : comment les utilisateurs peuvent intervenir
- Modèle mental et attentes : comment aider les utilisateurs à comprendre les capacités de l’agent
En gros, ce cadre couvrait tout, des aspects de l’interface permettant aux agents de présenter leurs plans aux utilisateurs, jusqu’à la manière dont ils communiquent leurs capacités ou signalent des erreurs.
Phase 2 : L’étude Wizard-of-Oz
Pour la seconde phase, les chercheurs ont recruté 20 utilisateurs ayant déjà une expérience avec des agents IA, leur demandant d’interagir avec un agent via une interface de chat pour effectuer soit une tâche de location de vacances, soit une tâche d’achat en ligne.
Les participants ont été invités à utiliser une interface de chat fictive pour interagir avec un « agent » incarné par le chercheur. Ce dernier contrôlait également l’interface de l’agent et exécutait les instructions des utilisateurs en temps réel. Lorsque la tâche était terminée, un message signalant “tâche accomplie” était affiché dans le chat.
Pour chaque tâche, les participants devaient effectuer six fonctions avec l’aide de l’agent, dont certaines ont été délibérément conçues pour échouer, comme rester bloqué dans une boucle de navigation.
Résultats clés
A l’issue de l’étude, les chercheurs ont conclu que les utilisateurs souhaitent avoir de la visibilité sur les actions des agents IA, sans pour autant vouloir micromanager chaque étape, ce qui annulerait leur intérêt.
Ils ont également noté que les attentes des utilisateurs évoluent selon qu’ils explorent des options ou exécutent une tâche familière. En matière de transparence, plus les utilisateurs sont novices avec l’interface, plus ils désirent des explications et des pauses de confirmation, même dans des scénarios à faible risque.
Enfin, il est apparu que les utilisateurs souhaitent davantage de contrôle lorsque les actions entraînent de réelles conséquences, comme des changements dans les informations de compte ou de paiement. Ils s’éloignent rapidement de l’agent lorsqu’il fait des suppositions silencieuses ou commet des erreurs, surtout en cas de choix ambigus.
Cette étude offre des perspectives intéressantes pour les développeurs d’applications cherchant à intégrer des capacités d’agents dans leurs créations.