X

Gemini : l’édition d’images s’améliore pour des créations plus réalistes

Google vient d’annoncer l’intégration d’un nouveau modèle d’édition d’images développé par DeepMind, la fameuse entité dédiée à l’IA, au sein de son application Gemini, promettant des transformations à la fois créatives et fidèles à l’original.

Un contrôle accru sur la créativité tout en préservant l’authenticité

L’un des défis majeurs de la génération d’images par IA réside dans la capacité à maintenir la cohérence et la ressemblance d’une personne ou d’un animal d’une image à l’autre. Google s’attaque à ce problème avec cette nouvelle version, qui met un accent particulier sur la préservation des traits des sujets. L’objectif est simple : que vous ajoutiez une perruque des années 60 à un ami ou un tutu à votre chihuahua, le résultat doit rester indéniablement fidèle à l’original. Cette technologie, déjà présentée comme le modèle d’édition d’images le mieux noté au monde lors de présentations privées, est désormais accessible à tous. Voici un petit test que j’ai réalisé sur la base d’une image de ma dernière vidéo résumé de la conférence Made By Google 2025 où j’ai demandé de basculer au Moyen Âge (studio YouTube de l’époque) :

Concrètement, plusieurs nouvelles possibilités s’offrent à nous. Il est désormais possible de changer de costume, de lieu ou même d’époque tout en conservant son apparence.

L’outil permet également de fusionner plusieurs clichés, par exemple pour créer un portrait de vous et de votre animal de compagnie sur un terrain de basket. Une autre fonctionnalité notable est l’édition « multi-tour », qui vous autorise à modifier une image par étapes successives : peindre les murs d’une pièce, puis y ajouter une bibliothèque, puis des meubles, l’IA conservant le contexte à chaque modification, ce qui pourrait accélérer vos achats chez Ikea.

L’outil pousse la créativité encore plus loin en permettant d’appliquer le style d’une image à un objet dans une autre. Vous pourriez par exemple transférer la texture et la couleur des pétales d’une fleur sur une paire de bottes de pluie, ou encore concevoir une robe en utilisant le motif des ailes d’un papillon.

Pour assurer la transparence, Google précise que toutes les images créées ou modifiées via l’application Gemini comporteront un filigrane visible, ainsi qu’un filigrane numérique invisible (SynthID), indiquant clairement qu’elles ont été générées par une intelligence artificielle. Cette nouvelle fonctionnalité est disponible dans l’application Gemini dès aujourd’hui en France.

Categories: Gemini Slider

View Comments (1)