OpenAI est de retour avec une autre mise à niveau des capacités d'image de ChatGPT, et celle-ci ressemble moins à un gadget qu'à une étape sérieuse pour rendre les visuels d'IA réellement utiles. OpenAI a officiellement lancé ChatGPT Images 2.0, un nouveau système de génération d'images qui s'appuie fortement sur le raisonnement et la précision. ChatGPT Images 2.0 se concentre sur la compréhension, pas seulement sur la génération
Au lieu de transformer aveuglément les invites en visuels, le modèle adopte maintenant une approche plus délibérée, essentiellement en « réfléchissant » à ce que vous demandez avant de générer l'image. OpenAI
Ce changement se manifeste de plusieurs manières clés. Le modèle est bien meilleur pour gérer des invites complexes, peut maintenir la cohérence entre plusieurs sorties et est nettement plus fiable lorsqu'il s'agit de placer du texte à l'intérieur d'images, ce qui est quelque chose avec lequel les outils d'IA antérieurs ont eu du mal. OpenAI
En outre, il peut également générer de multiples variations à partir d'une seule invite tout en conservant l'idée de base intacte, ce qui le rend beaucoup plus utile pour le travail itératif. Le résultat est un système qui ressemble moins à un générateur d'art IA qu'à un outil qui comprend réellement ce que vous essayez de créer. C'est là que les images IA commencent à devenir pratiques
Ce qui rend cette mise à jour intéressante, c'est la direction prise par OpenAI. Il ne s'agit plus de poursuivre l'art viral de l'IA, mais aussi de rendre la génération d'images utilisable dans des scénarios réels. Avec un rendu de texte amélioré, une meilleure structure et des résultats plus prévisibles, ChatGPT Images 2.0 commence à avoir un sens pour des choses comme les présentations, les créations sur les réseaux sociaux ou les maquettes de conception rapide. Ce n'est toujours pas un remplacement complet des outils professionnels, mais il se rapproche suffisamment pour gérer une quantité surprenante de travail créatif quotidien. Vidéos recommandées
Cela dit, ce n'est pas parfait. Il y a encore des incohérences occasionnelles, en particulier avec des mises en page plus complexes ou du texte non anglais. Mais par rapport à ce qui se passait il y a encore un an, les progrès sont difficiles à ignorer. Et si cette tendance se poursuit, la ligne entre les visuels « générés par l'IA » et « réellement utilisables » s'amincira très rapidement. ChatGPT Images 2.0 est disponible dès aujourd'hui pour tous les utilisateurs de ChatGPT et du Codex, avec des sorties avancées utilisant Thinking disponibles pour les utilisateurs Plus, Pro, Business et Enterprise. Le modèle sous-jacent, gpt-image-2, est également disponible dans l'API.