C’est sur le réseau social X (ex‑Twitter) que Sam Altman, PDG d’OpenAI, a annoncé la bonne nouvelle. Le nouvel outil de génération d’images intégré à ChatGPT, basé sur GPT-4o, est disponible pour tous les utilisateurs gratuits. Rappelons que cette fonctionnalité était jusqu’ici réservée aux souscripteurs à un abonnement payant. OpenAI ne se renie donc pas et continue de rendre l'accès à ses technologies les plus pointues accessibles au plus grand nombre, comme il l'a (presque) toujours fait jusqu'ici. Toutefois, cette démocratisation s'accompagne de certaines restrictions. Les utilisateurs non-payants se voient ainsi limités à trois générations d'images par jour, tandis que les abonnés conservent un accès illimité à cette fonctionnalité. Publicité, votre contenu continue ci-dessous Performances et couacs Ce générateur d’images basé sur GPT-4o n’est disponible que depuis quelques jours, mais nous avons pu constater durant ce court laps de temps qu’il surpasse allègrement DALL-E, le modèle précédemment utilisé par ChatGPT. Les images produites présentent une qualité visuelle nettement supérieure. De plus, le générateur comprend impeccablement les requêtes et est capable de retranscrire presque parfaitement du texte. Il est aussi très doué pour se servir d’images de référence afin d’en créer de nouvelles. Cependant, nous avons constaté que le processus de génération peut se montrer assez lent avec un compte gratuit, nécessitant parfois jusqu’à 20 s par image. Des problèmes occasionnels de connexion ont également été rapportés — nous en avons d’ailleurs aussi fait l’expérience. Néanmoins, ces problèmes techniques sont certainement dus au succès du service et devraient être rapidement résolus. Publicité, votre contenu continue ci-dessous Des exemples de générations d'image par ChatGPT-4o. © OpenAI Une popularité colossale, mais qui interroge Souvenez-vous que le lancement public de cette fonctionnalité avait provoqué un tel afflux d’utilisateurs que Sam Altman en avait plaisanté sur X il y a quelques jours, déclarant que “les serveurs sont en train de fondre”. Cet engouement s’explique notamment par la capacité impressionnante de l’outil à reproduire des styles artistiques reconnaissables. Parmi les tendances que vous n’avez sans doute pas ratées dans vos fils d’actualité, la plus visible concerne la génération d’images imitant le style des films du célèbre studio d’animation japonais Studio Ghibli. Une fidélité qui a soulevé des questions concernant les droits d’auteur et la nature des données d’entraînement utilisées par OpenAI. Au-delà de ces questions artistiques et éthiques, l’outil a également (et sans surprise) fait l’objet d’utilisations problématiques. On voit ainsi fleurir de fausses factures de restaurant. Face à ces dérives, un représentant d’OpenAI a précisé que toutes les images générées contiennent des métadonnées les identifiant comme créées par ChatGPT, et que l’entreprise “prend des mesures” lorsqu'elles enfreignent ses politiques d’utilisation. © OpenAI, des exemples de contenus générés par GPT-4o Quelques limitations supplémentaires Outre la limite quotidienne de trois générations d'images évoquée plus haut, les utilisateurs non-payants semblent aussi subir des restrictions concernant le téléchargement d'images sources, d'après plusieurs témoignages sur les réseaux et Reddit. Ainsi, après avoir fourni deux images à modifier, ChatGPT peut refuser d'accepter de nouveaux fichiers sources. Publicité, votre contenu continue ci-dessous Aucune explication n'a été donnée à date, mais ces limitations sont certainement à mettre sur le compte de la volonté d'OpenAI de gérer la charge sur ses serveurs, tout en incitant les utilisateurs les plus intensifs à souscrire un abonnement payant. Enfin, aux Numériques, nous avons constaté une autre “bizarrerie” : ChatGPT a catégoriquement refusé de générer une “photo ultra-réaliste d'un renard qui dessine un mouton à côté du Petit Prince de Saint-Exupéry”. Raison invoquée, une telle image “ne respecte pas nos politiques de contenu”. Après plusieurs échanges, que vous pouvez retrouver intégralement ici, la seule chose que nous avons été en mesure de tirer de lui pour cette demande précise est l'image ci-dessous. L'image générée depuis un compte gratuit de ChatGPT. © Image générée par IA Elle est certes très réussie et on observe bien un renard dessiner un mouton, mais on est loin du style photoréaliste demandé initialement. Notez tout de même que la version payante refuse tout autant de générer cette image. Ceci étant, le plus surprenant reste qu'en passant par sora.com, qui utilise le même générateur GPT-4o, l'image ci-dessous a été produite sans autre forme de procès, bien que l'on puisse douter du respect de la consigne pour le style réaliste. L'accès à cette plateforme est toutefois réservé aux utilisateurs payants. Le même prompt depuis sora.com © Image générée par IA Publicité, votre contenu continue ci-dessous