La génération d'images à partir de texte s'est cristallisée autour de trois modèles de pointe en 2026 : Flux Kontext Pro (Black Forest Labs), Nano Banana (Google) et 4o Image (OpenAI). Chacun représente un compromis distinct entre vitesse, fidélité et prix.
Voici à quoi ressemblent nos propres générations lorsque nous avons utilisé le même prompt sur les trois modèles.
Le prompt
"Un renard roux assis dans la neige fraîche à l'heure dorée, faible profondeur de champ, photoréaliste"
Vitesse et prix (nos tarifs actuels via la passerelle)
- Nano Banana — 6 secondes, $0.056 par image
- Flux Kontext Pro — 9 secondes, $0.084 par image
- 4o Image — 12 secondes, $0.14 par image
Observations sur la qualité
- Flux Kontext Pro : meilleure fidélité globale aux prompts complexes. Gère de manière convaincante le texte dans les images (menus, panneaux). Légère brillance plastique sur la peau parfois.
- Nano Banana : le plus rapide, réalisme le plus propre pour la nature, les produits, les portraits. Plus faible sur le texte intégré et les scènes complexes à plusieurs sujets.
- 4o Image : le plus fort pour l'illustration et l'art conceptuel. Réalisme légèrement en retrait par rapport à Flux. Idéal pour les rendus stylisés.
Choisir selon votre cas d'utilisation
- Photographie e-commerce et marketing : Nano Banana en priorité. Le moins cher + le plus rapide + suffisamment réaliste pour 90 % des photos de produits/scènes de vie.
- Scènes éditoriales complexes avec texte : Flux Kontext Pro. Le seul modèle qui orthographie correctement de manière fiable.
- Illustration stylisée, art conceptuel, éditorial : 4o Image. Les instincts artistiques d'OpenAI sont difficiles à surpasser.
- Génération en masse (>1000 images/jour) : Nano Banana. Les $0.03 économisés par image par rapport à Flux s'accumulent rapidement.
Modèle d'utilisation : choisir par prompt, pas par produit
La plupart des produits riches en images que nous observons via notre API ne sont pas fidèles à un seul modèle. Ils routent : "si le prompt contient du texte" → Flux, "si catégorie == illustration" → 4o Image, par défaut → Nano Banana. Cette règle simple permet d'économiser 30 % des coûts sans sacrifier la qualité des résultats sur les prompts complexes.
Appeler les trois via une seule API
// Routage dans votre code applicatif :
const model = prompt.includes('text') || prompt.includes('sign')
? 'black-forest-labs/flux-kontext-pro'
: style === 'illustration'
? 'openai/4o-image'
: 'google/nano-banana';
await fetch('https://aimarcus.eu/aigenerate/api/v1/jobs/createTask', {
method: 'POST',
headers: {
'Authorization': 'Bearer sk-aig-...',
'Content-Type': 'application/json',
},
body: JSON.stringify({ model, input: { prompt, output_format: 'png', image_size: '1:1' } }),
});
Un seul token Bearer, trois fournisseurs à la pointe de la technologie, un routage intelligent dans le code applicatif. C'est tout l'avantage d'une API agrégatrice.