Souvent, les grands modèles linguistiques comme ChatGPT, Gemini ou Grok sont sous les feux de la rampe lorsqu’il s’agit de comparer leurs performances. Mais qu’en est-il des modèles texte-image ? Ces plateformes restent souvent dans l’ombre, alors que leurs résultats peuvent être tout aussi spectaculaires. Curious Refuge a relevé ce défi et le résultat est vraiment impressionnant. Ce test montre directement les différents styles de modèles de texte à image comme Midjourney, Image FX de Google, Flux 1.1 et Frames de Runway.
Le test de Curious Refuge
Les modèles pris en compte dans ce test sont Midjourney, Image FX de Google, Flux 1.1 et Frames de Runway. Ces modèles ont été testés sur la base de prompts identiques afin de déterminer lequel produisait les meilleures images.
2. A cinematic still of a 19th-century aristocratic woman in an ornate ballroom, gazing out of a rain-streaked window as candlelight flickers behind her, medium shot, soft golden lighting, rich filmic texture, shot on an Arri Alexa 65, 8K. pic.twitter.com/aVlofQeEOG
— Curious Refuge (@CuriousRefuge) February 26, 2025
Midjourney
Midjourney est connu pour ses compositions d’images artistiques et souvent surréalistes. Il se prête parfaitement aux projets créatifs où l’expression artistique est primordiale. Les images de Midjourney se distinguent par leur précision des détails et leur capacité à représenter des scènes complexes.
4. A cinematic still of a lone gunslinger standing in the middle of a dusty frontier town, the sun casting long shadows as he reaches for his revolver, wide shot, warm golden hour lighting, vintage anamorphic lens look, shot on Kodak 35mm film. pic.twitter.com/2G4AJwaoKn
— Curious Refuge (@CuriousRefuge) February 26, 2025
Image FX de Google
Image FX de Google exploite les dernières avancées en matière de technologie de traitement d’image et est particulièrement doué pour créer des images réalistes. Il est idéal pour les applications qui exigent précision et réalisme, comme la publicité ou la conception de produits.
Flux 1.1
Flux 1.1 est un autre modèle puissant, connu pour sa polyvalence. Il peut créer des images réalistes ou abstraites et offre un large éventail d’options de style. Cela en fait un choix populaire pour les designers qui apprécient la flexibilité.
Cadres de Runway
Frames de Runway est un modèle qui se distingue par sa facilité d’utilisation et sa capacité à fournir rapidement des résultats de haute qualité. Il est particulièrement apprécié des débutants qui souhaitent créer rapidement des images impressionnantes sans avoir à se plonger profondément dans les détails techniques.
Our verdict? Midjourney and Image FX are the clear winners for realism and cinematic quality. Midjourney shines with stylized shots, while Image FX (seriously underrated!) delivers movie-quality results with incredible prompt accuracy.
— Curious Refuge (@CuriousRefuge) February 26, 2025
Frames by Runway takes third place – great…
Conclusion
Quel est le meilleur modèle ? Voici la réponse de Curious Refuge :
Notre verdict ? Midjourney et Image FX sont les grands gagnants en termes de réalisme et de qualité cinématographique. Midjourney brille par ses prises de vue stylisées, tandis qu’Image FX (très sous-estimé !) offre des résultats de qualité cinématographique avec une précision incroyable des invites. Frames by Runway prend la troisième place – un grand réalisme, mais il a fallu plus d’itérations pour que les invites soient parfaites. Flux s’est bien débrouillé, mais n’a pas réussi à capturer l’ambiance cinématographique.
Ce qui est particulièrement impressionnant, c’est que Midjourney V6.1 est déjà disponible depuis le 31 juillet 2024 et qu’elle s’est maintenue comme jalon dans l’actualité pendant plus de six mois. Cela montre la longévité et l’influence de ce modèle dans le monde en rapide évolution de la technologie de l’IA.
Source