Close Menu
App4PhoneApp4Phone
    Facebook X (Twitter)
    • Bons plans
    • Fonds d’écran
    • Rumeurs
    • À propos
    • Publicité sur App4Phone
    Facebook X (Twitter)
    App4PhoneApp4Phone
    • Accueil
    • Actualité
    • Astuces
    • Boutique
      • Coques
        • iPhone 16
        • iPhone 15
        • iPhone 14
        • iPhone 13
        • iPhone 12
        • iPhone 11
        • iPhone XR
        • iPhone X(S)
        • iPhone SE
        • iPhone 8
      • Verres trempés
        • iPhone 16
        • iPhone 15
        • iPhone 14
        • iPhone 13
        • iPhone 12
        • iPhone 11
        • iPhone XR
        • iPhone X(S)
        • iPhone SE
        • iPhone 8
      • Accessoires
    • Contact
    • Bons plans
    • Fonds d’écran
    • Rumeurs
    • À propos
    • Publicité sur App4Phone
    App4PhoneApp4Phone
    Home»Actualité»Apple dévoile un immense jeu de données pour l’entraînement des modèles d’édition d’images IA
    Actualité

    Apple dévoile un immense jeu de données pour l’entraînement des modèles d’édition d’images IA

    Thomas MorelBy Thomas Moreloctobre 29, 2025Aucun commentaire3 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email

    Apple a rendu public Pico-Banana-400K, un jeu de données de recherche comprenant 400 000 images, construit en utilisant les modèles Gemini-2.5 de Google. Voici les détails.

    L’équipe de recherche d’Apple a publié une étude intitulée « Pico-Banana-400K : un jeu de données à grande échelle pour l’édition d’images guidée par texte ». En plus de cette étude, ils ont également mis à disposition la totalité du jeu de données de 400 000 images, sous licence de recherche non commerciale. Cela signifie que quiconque peut l’utiliser et l’explorer, à condition que cela soit dans un cadre académique ou pour des travaux de recherche en IA. En d’autres termes, une utilisation commerciale n’est pas autorisée.

    QU’EST-CE QUE C’EST VRAIMENT ?

    Il y a quelques mois, Google a lancé le modèle Gemini-2.5-Flash-Image, également connu sous le nom de Nanon-Banana, qui est considéré comme l’un des meilleurs modèles d’édition d’images. D’autres modèles ont également montré des améliorations significatives, mais, comme l’indiquent les chercheurs d’Apple :

    « Malgré ces avancées, la recherche ouverte reste limitée par le manque de jeux de données d’édition à grande échelle, de haute qualité et entièrement partageables. Les jeux de données existants s’appuient souvent sur des générations synthétiques provenant de modèles propriétaires ou de sous-ensembles limités sélectionnés par des humains. De plus, ces jeux de données présentent souvent des décalages de domaine, des distributions de types de modifications déséquilibrées et un contrôle de la qualité incohérent, ce qui entrave le développement de modèles d’édition robustes. »

    Ainsi, Apple a décidé d’agir.

    CONSTRUCTION DU PICO-BANANA-400K

    La première étape pour Apple a été de récupérer un nombre non précisé de photographies réelles à partir du jeu de données OpenImages, « sélectionnées pour garantir la couverture d’humains, d’objets et de scènes textuelles ». Ils ont ensuite élaboré une liste de 35 types différents de modifications qu’un utilisateur pourrait demander au modèle de réaliser, regroupés en huit catégories. Par exemple :

    • Pixel & Photométrique : Ajouter du grain de film ou un filtre vintage
    • Centrique sur l’humain : Figure de toy Funko-Pop du personnage
    • Composition de scène & Multisujet : Changer les conditions météo (ensoleillé/pluvieux/neigeux)
    • Sémantique au niveau de l’objet : Déplacer un objet (changer sa position/relation spatiale)
    • Échelle : Zoomer

    Ensuite, les chercheurs téléchargeaient une image sur Nano-Banana, accompagnée d’une de ces instructions. Une fois que Nano-Banana avait généré l’image modifiée, les chercheurs faisaient ensuite analyser le résultat par Gemini-2.5-Pro, en l’approuvant ou en le rejetant, en fonction du respect des instructions et de la qualité visuelle.

    Le résultat est devenu Pico-Banana-400K, qui comprend des images produites par le biais d’éditions à tour unique (une seule instruction), de séquences d’éditions à plusieurs tours (plusieurs instructions itératives) et des paires de préférences comparant des résultats réussis et échoués (pour que les modèles puissent également apprendre à reconnaître des issues indésirables).

    Bien que les chercheurs reconnaissent les limites de Nano-Banana en matière d’édition spatiale fine, d’extrapolation de mise en page et de typographie, ils espèrent que Pico-Banana-400K servira de « base solide pour former et évaluer la prochaine génération de modèles d’édition d’images guidés par texte ». Vous pouvez consulter l’étude sur arXiv, et le jeu de données est disponible gratuitement sur GitHub.

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleL’AMA d’Apple Music avec Adam Silver : découvrez les nouvelles fonctionnalités
    Next Article Une nouvelle loi pourrait interdire l’accès des ados aux chatbots d’IA : des implications pour Siri
    Thomas Morel

    Passionné par la tech et le digital, Thomas Morel est un rédacteur spécialisé dans l’univers Apple, iPhone et iOS. Avec plusieurs années d’expérience dans le blogging et le SEO, il décrypte l’actualité high-tech et propose des analyses claires et précises.

    Related Posts

    Actualité

    Apple met en avant les histoires de sauvetage grâce à l’Apple Watch dans une nouvelle campagne

    avril 30, 2026
    Actualité

    Apple développe un cadre d’IA capable d’explorer plusieurs idées avant de répondre

    avril 30, 2026
    Actualité

    Améliorations récentes d’Apple Home : trois nouvelles fonctionnalités à découvrir

    avril 29, 2026
    Leave A Reply Cancel Reply

    la coque iphone la plus fine du monde
    Top 5

    iPhone 18 Pro : date de sortie et nouveautés à venir

    avril 17, 2026

    iPhone 18 et iPhone Air 2 : fuites sur le design et la date de sortie

    avril 6, 2026

    Nouvelles fuites sur l’iPhone 18 Pro : détails de conception et dimensions révélés

    mars 11, 2026

    L’iPhone 18 Pro promet des avancées majeures en matière de photographie

    avril 29, 2026

    iOS 26.5 : date de sortie de la première bêta à venir ?

    mars 27, 2026
    Suivez-nous
    • Facebook 4.3K
    • Twitter 2.5K
    Facebook X (Twitter)
    • À propos
    • Contact
    • Publicité sur App4Phone

    Nos sites : ShopSystem • AppSystem • Worldissmall

    Copyright © 2026 App4Phone. Publié depuis 2011.

    bannière appstore

    Apple, le logo Apple, iPod, iTunes et Mac sont des marques d’Apple Inc., déposées aux États-Unis et dans d’autres pays. iPhone et MacBook Air sont des marques déposées d’Apple Inc. MobileMe est une marque de service d’Apple Inc. App4Phone.fr et son App ne sont pas liés à Apple et les marques citées sont la propriété de leurs détenteurs respectifs.

    Type above and press Enter to search. Press Esc to cancel.