
Une nouvelle action collective a été déposée aujourd’hui devant le tribunal fédéral du Nord de la Californie, accusant Apple d’avoir utilisé illégalement des œuvres littéraires pour entraîner ses modèles d’IA. Voici les détails.
Les auteurs Grady Hendrix et Jennifer Robertson s’appuient sur des documents fournis par Apple pour étayer leurs accusations. Selon Reuters, ils affirment qu’Apple a utilisé un ensemble de données piraté, nommé Books3, qui inclut leurs œuvres. Le procès indique :
“Apple construit une partie de cette nouvelle entreprise en utilisant Books3, un ensemble de données de livres protégés par le droit d’auteur qui comprend les œuvres publiées des plaignants et de la classe. Apple a utilisé Books3 pour entraîner ses modèles de langage OpenELM. Apple a également probablement formé ses modèles de langue de base en utilisant ce même ensemble de données piraté.”
Les accusations reposent sur des détails fournis par Apple dans son document sur OpenELM, un modèle open-source rendu disponible sur Hugging Face l’année dernière. Ce document mentionne RedPajama comme l’un des ensembles de données utilisés dans le modèle. RedPajama, à son tour, utilise un ensemble de données appelé Books3, qui, comme le précise le procès, est “un corpus connu de livres piratés.”
Les auteurs demandent au tribunal d’autoriser le procès à se poursuivre en tant qu’action collective contre Apple et réclament les réparations suivantes après un procès par jury :
- Autoriser cette action à se poursuivre en tant qu’action collective, avec les plaignants comme représentants de la classe, et avec les avocats des plaignants comme avocats de la classe ;
- Accorder aux plaignants et à la classe des dommages-intérêts statutaires, des dommages-intérêts compensatoires, une restitution, un dédommagement et toute autre réparation qui pourrait être permise par la loi ou l’équité ;
- Interdire définitivement au défendeur de mener les actes illégaux, injustes et portant atteinte aux droits tels que décrits ici ;
- Ordonner la destruction, conformément à 17 U.S.C. § 503(b), de tous les modèles Apple Intelligence ou autres modèles LLM et ensembles d’entraînement incorporant les œuvres des plaignants et des membres de la classe ;
- Un remboursement des coûts, frais et honoraires d’avocats comme permis par la loi ;
- Et toute autre réparation que le tribunal pourrait juger appropriée, juste et équitable.
Cette action fait suite à des résultats mitigés dans des affaires similaires. Récemment, Anthropic a conclu un accord record de 1,5 milliard de dollars dans une affaire comparable. De manière intéressante, Meta a également été confrontée à un procès similaire, mais a remporté la bataille, le juge ayant décidé que son utilisation de livres protégés par le droit d’auteur pour entraîner ses modèles d’IA relevait de l’utilisation équitable.
Ce sentiment a été récemment repris par le président Trump, qui a affirmé :
“On ne peut pas s’attendre à avoir un programme IA réussi lorsque chaque article, livre ou autre chose que vous avez lu ou étudié doit être payé. (…) Ce n’est pas réalisable.”
Pensez-vous que les auteurs devraient être compensés pour l’utilisation de leurs livres dans l’entraînement des modèles d’IA ? Faites-le nous savoir dans les commentaires.
Un commentaire
Tout simplement non.
Si les plaignants ont besoin de financements… qu’ils trouvent d’autres sources, d’autres ‘’vaches à lait’’ .