
Apple a partagé des détails concernant sa participation à la conférence IEEE/CVF sur la vision par ordinateur et la reconnaissance de formes (CVPR) de cette année. Voici les informations essentielles.
LA RECHERCHE D’APPLE À L’HONNEUR AU CVPR
Dans une annonce récente, Apple a révélé le programme de sa participation au CVPR, événement qu’elle sponsorise également.
Cette année, le CVPR se déroulera du 3 au 7 juin au Colorado Convention Center à Denver. La firme à la pomme y sera présente à travers des présentations par affiche, des discours oraux, une présentation invitée, ainsi qu’un discours d’ouverture et des événements affinitaires.
Les études présentées par Apple
Voici un aperçu des recherches qu’Apple exposera, dont certaines ont déjà été couvertes par le passé :
- AMUSE : Cadre de référence audio-visuel pour la compréhension multi-locuteur agentique
- AToken : Un tokenizer unifié pour la vision
- Annotation de la langue des signes par des modèles de langue des signes
- DSO : Optimisation directe pour l’atténuation des biais
- Du lieu aux fonctions : Évaluation de l’intelligence spatial-fonctionnelle pour les LLM multimodaux
- Apprentissage d’empreintes de mouvement à long terme pour une génération cinématique efficace
- Pico-Banana-400K : Un ensemble de données à grande échelle pour l’édition d’images guidée par texte
- SO-Bench : Évaluation de la sortie structurelle des LLM multimodaux
- STARFlow-V : Modélisation générative vidéo de bout en bout avec des flux normalisants
- TrajTok : Apprentissage de tokens de trajectoire pour une meilleure compréhension vidéo
- UniGen-1.5 : Amélioration de la génération et de l’édition d’images par unification des récompenses en apprentissage par renforcement
- Velox : Apprentissage de représentations de géométrie et d’apparence 4D
- VSAS-Bench : Évaluation en temps réel des modèles d’assistants visuels en streaming
- Ce qui compte dans la compression d’images apprise en pratique
Discours et événements
Colin Lea, chercheur chez Apple, donnera également un discours d’ouverture lors de l’atelier Generative AI for Sign Language (GenSign), suivi de trois autres interventions invitées par des ingénieurs d’Apple, qui se tiendront entre le 3 et le 4 juin.
Apple a également confirmé que les chercheuses Hsin-Ping (Cindy) Huang et Maggie Xiao représenteront la société lors du dîner de mentorat Women in Computer Vision (WiCV).
Pour consulter le programme complet de la participation d’Apple à cette édition du CVPR, suivez ce lien.