Voici comment essayer le nouvel éditeur d'images AI d'Apple


Il existe un nouvel éditeur d'images Apple, si vous savez où chercher. Les rois de l'iPhone se sont associés à des chercheurs de l'Université de Californie à Santa Barbara pour créer un outil qui vous permet de modifier des photos et des images avec des instructions textuelles. Il n'a pas de version officielle, mais les chercheurs proposent une démo que vous pouvez essayer par vous-même, repérée pour la première fois par Technologie extrême.

Le projet s’appelle Multimodal Large Language Model Guided Image Editing (MGIE). Il existe actuellement de nombreux éditeurs d’images IA sur le marché. Photoshop est désormais livré avec des outils d'IA intégrés, et d'autres, tels que DALL-E d'OpenAI, vous permettent de modifier des images en plus de les générer à partir de rien. Si vous avez déjà essayé de les utiliser, vous savez que cela peut être un peu frustrant. Dans de nombreux cas, l’IA a du mal à comprendre exactement ce que vous recherchez.

L’innovation avec MGIE ajoute une autre couche d’interprétation de l’IA. Lorsque vous indiquez à l'IA ce que vous voulez voir, MGIE utilise d'abord une IA basée sur du texte pour rendre vos instructions plus explicites et descriptives. « Les résultats expérimentaux démontrent que les instructions expressives sont cruciales pour l'édition d'images basée sur des instructions », ont déclaré les chercheurs dans un communiqué. papier publié sur arXiv. « Notre MGIE peut conduire à une amélioration notable. »

Apple a publié une version open source du logiciel sur GitHub. Si vous êtes averti, vous pouvez faire fonctionner vous-même une version de MGIE, mais les chercheurs ont configuré l'outil sur Visage câlin. Cela fonctionne un peu lent quand beaucoup de gens l'utilisent, mais c'est une expérience amusante.

De gigantesques entreprises technologiques comme Apple dépensent des milliards de dollars dans des projets que personne n'a jamais pu voir. Il est donc tout à fait possible que cet outil dit MGIE ne soit jamais publié officiellement. Apple n'a pas immédiatement répondu à une demande de commentaire.

Nous l'avons essayé nous-mêmes ici au bureau de Gizmodo. J'ai téléchargé une photo de mon collègue et conseiller le plus proche Kyle Barr portant une étrange paire de lunettes de soleil qu'il a achetées sur Netflix à le Consumer Electronics Show de cette année. J'ai dit à l'IA « l'homme se tient dans le désert ». Avant de générer l'image, l'outil MGIE a extrapolé :

« L'homme porte un casque en métal et se tient dans un décor désertique. L'environnement autour de lui est aride et stérile, avec des dunes de sable s'étendant à perte de vue. »

Après avoir joué avec l'outil pendant bien plus longtemps que nous n'aurions dû, il est clairement soumis aux mêmes limitations que tout autre générateur d'images IA. La plupart du temps, les résultats sont bizarres et ne correspondent en rien à ce que vous avez demandé. Mais dans certains cas, elle a fait un travail impressionnant, et pour défendre le programme, l’IA fait mieux avec des sujets familiers. « Familier » n'est pas quelque chose que l'on appellerait les lunettes de soleil de Kyle.



Vous pouvez lire l’article original (en Angais) sur le {site|blog}gizmodo.com