
Une action collective proposée accuse Apple d’avoir utilisé un ensemble de données contenant des millions de vidéos YouTube pour entraîner un modèle d’IA, comme l’indique une étude publiée fin 2024.
Ce recours, intenté par Ted Entertainment, Matt Fisher et Golfholics, affirme qu’Apple a contourné les protections anti-scraping de YouTube pour télécharger ces vidéos. Selon le document, une équipe de chercheurs d’Apple a publié une étude intitulée STIV: Scalable Text and Image Conditioned Video Generation, où ils précisent avoir utilisé un ensemble de données dénommé Panda-70M pour former le modèle de génération vidéo décrit dans leur article.
Extrait du recours :
Le dataset Panda 70M fonctionne comme une carte ou un fichier d’index identifiant des vidéos et extraits YouTube spécifiques par URL, identifiant vidéo et timestamp. Une seule vidéo YouTube peut être divisée en de nombreux extraits, chacun considéré comme un échantillon d’entraînement séparé. L’extraction de chaque extrait nécessite d’accéder indépendamment à la vidéo source sur YouTube et d’isoler le segment désigné, un processus qui constitue un acte de contournement distinct pour chaque extrait récupéré.
Les plaignants affirment que leur contenu apparaît plus de 500 fois dans l’ensemble de données et cherchent à représenter « tous les autres dans la même situation » dans le cadre de cette action collective. Ils soutiennent qu’en dépit du fait que l’ensemble de données ne fournit que des liens vers les vidéos, Apple aurait contourné les protections anti-scraping de YouTube pour télécharger et utiliser le contenu sous-jacent afin de former ses modèles d’IA.
Pour cette raison, ils demandent un jury pour toutes les revendications et sollicitent :
- la certification de cette action en tant qu’action collective et la nomination des plaignants et de leurs avocats pour représenter la classe ;
- la déclaration que le défendeur a délibérément contourné les systèmes de protection du copyright de YouTube destinés à protéger le contenu audiovisuel des plaignants et des membres de la classe ;
- des dommages-intérêts statutaires (jusqu’au maximum autorisé par la loi par violation), des mesures injonctives, ainsi que des frais d’avocat en vertu de 17 U.S.C. §1203 ;
- des réparations équitables sous Titre 17, Titre 28, et/ou l’autorité inhérente du tribunal, nécessaires pour prévenir ou restreindre l’infraction des droits d’auteur protégés des plaignants et des membres de la classe ;
- la rémunération des intérêts préalables et post-jugement, dans toute la mesure du disponible, sur toute compensation monétaire rendue dans le jugement contre le défendeur ;
- toute autre compensation que le tribunal pourrait juger juste et appropriée.
En plus d’Apple, les plaignants ont également déposé des actions collectives contre Amazon et OpenAI, affirmant que ces deux entreprises ont également utilisé l’ensemble de données Panda-70M dans leurs propres processus de formation de modèles IA.