Résumé : Recraft a lancé sa nouvelle version V3 de modèle de génération d'images, qui se distingue par sa capacité à générer du texte précis dans les images, à maintenir une haute qualité visuelle. Avec le meilleur score du benchmark Hugging Face, Recraft V3 surpasse ses concurrents en termes de rendu textuel et de compréhension des invites, proposant une interface web gratuite, un abonnement abordable et une API pour les développeurs, tandis que l'industrie de l'IA attend avec impatience les prochaines mises à jour de Midjourney et OpenAI.
Recraft affirme que son dernier modèle v3 excelle pour générer du texte dans les images, maintenir une précision anatomique, comprendre les invites et produire des visuels de haute qualité. L'une des principales avancées est la capacité à restituer correctement de longs textes dans une seule génération, alors que d'autres modèles ont généralement du mal avec des textes dépassant plusieurs mots.
Le modèle occupe la première place dans le test de comparaison texte-image de Hugging Face avec un score ELO de 1172, surclassant ses récents concurrents Flux et Ideogram. Ici, les utilisateurs comparent des paires d'images provenant de différents modèles lors de tests à l'aveugle en utilisant un système d'évaluation ELO de type jeu d'échecs.
Contrôler l'incontrolable
Recraft v3 introduit des fonctionnalités de contrôle précis destinées aux designers professionnels. Les utilisateurs peuvent spécifier le placement exact du texte et ses dimensions au sein des images, ainsi qu'utiliser plusieurs images de référence pour maintenir une cohérence stylistique de marque. Selon Recraft, ces ajustements ne nécessitent pas de réentraînement des modèles.
Le modèle génère également des graphiques vectoriels allant de simples icônes à des illustrations complexes. Les fonctions supplémentaires comprennent des outils d'édition d'images basés sur l'IA, tels que la gomme AI, la modification de la zone, la peinture intérieure, la peinture extérieure, le simulateur AI, le convertisseur créatif et de clarté, le réglage fin AI et le suppresseur d'arrière-plan.
L'interface web offre 50 crédits gratuits par jour, avec un abonnement de base de 1 000 crédits pour 10 euros par mois. Recraft propose également une API pour les développeurs et les entreprises.
Midjourney et OpenAI pourraient bientôt mettre à jour leurs modèles
Midjourney, le leader de l'IA en matière d'images, s 'apprête à sortir son modèle v7. Bien que la version actuelle v6.1 de Midjourney produise des résultats esthétiques très appréciés, elle accuse un retard en matière de suivi des invites et de capacités de rendu de texte par rapport aux modèles plus récents. La société a récemment ajouté un éditeur d'images robuste qui fonctionne avec les images uploadées.
Le PDG d'OpenAI, Sam Altman, a annoncé une prochaine mise à jour de DALL-E 3 ou un nouvel outil de traitement des images lors d'un récent événement organisé par OpenAI à Londres. Le nouveau GPT-4o multimodal de la société peut déjà générer des images de haute qualité avec un suivi précis des invitations et montre des capacités au-delà de DALL-E 3, nous le savons grâce à des démos, bien que ces fonctionnalités n'aient pas encore été lancées. OpenAI attend peut-être que sa génération d'images n'interfère pas avec les élections américaines, ou ne dispose tout simplement pas de la puissance de calcul nécessaire pour mettre cette fonctionnalité sur le marché.
source :
https://the-decoder.com/new-ai-image-model-recraft-v3-takes-top-spot-in-benchmarks/