La génération d'images à partir de texte s'est cristallisée autour de trois modèles de pointe en 2026 : Flux Kontext Pro (Black Forest Labs), Nano Banana (Google) et 4o Image (OpenAI). Chacun représente un compromis distinct entre vitesse, fidélité et prix.

Voici à quoi ressemblent nos propres générations lorsque nous avons utilisé le même prompt sur les trois modèles.

Le prompt

"Un renard roux assis dans la neige fraîche à l'heure dorée, faible profondeur de champ, photoréaliste"

Vitesse et prix (nos tarifs actuels via la passerelle)

  • Nano Banana — 6 secondes, $0.056 par image
  • Flux Kontext Pro — 9 secondes, $0.084 par image
  • 4o Image — 12 secondes, $0.14 par image

Observations sur la qualité

  • Flux Kontext Pro : meilleure fidélité globale aux prompts complexes. Gère de manière convaincante le texte dans les images (menus, panneaux). Légère brillance plastique sur la peau parfois.
  • Nano Banana : le plus rapide, réalisme le plus propre pour la nature, les produits, les portraits. Plus faible sur le texte intégré et les scènes complexes à plusieurs sujets.
  • 4o Image : le plus fort pour l'illustration et l'art conceptuel. Réalisme légèrement en retrait par rapport à Flux. Idéal pour les rendus stylisés.

Choisir selon votre cas d'utilisation

  • Photographie e-commerce et marketing : Nano Banana en priorité. Le moins cher + le plus rapide + suffisamment réaliste pour 90 % des photos de produits/scènes de vie.
  • Scènes éditoriales complexes avec texte : Flux Kontext Pro. Le seul modèle qui orthographie correctement de manière fiable.
  • Illustration stylisée, art conceptuel, éditorial : 4o Image. Les instincts artistiques d'OpenAI sont difficiles à surpasser.
  • Génération en masse (>1000 images/jour) : Nano Banana. Les $0.03 économisés par image par rapport à Flux s'accumulent rapidement.

Modèle d'utilisation : choisir par prompt, pas par produit

La plupart des produits riches en images que nous observons via notre API ne sont pas fidèles à un seul modèle. Ils routent : "si le prompt contient du texte" → Flux, "si catégorie == illustration" → 4o Image, par défaut → Nano Banana. Cette règle simple permet d'économiser 30 % des coûts sans sacrifier la qualité des résultats sur les prompts complexes.

Appeler les trois via une seule API

// Routage dans votre code applicatif :
const model = prompt.includes('text') || prompt.includes('sign')
  ? 'black-forest-labs/flux-kontext-pro'
  : style === 'illustration'
    ? 'openai/4o-image'
    : 'google/nano-banana';

await fetch('https://aimarcus.eu/aigenerate/api/v1/jobs/createTask', {
  method: 'POST',
  headers: {
    'Authorization': 'Bearer sk-aig-...',
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({ model, input: { prompt, output_format: 'png', image_size: '1:1' } }),
});

Un seul token Bearer, trois fournisseurs à la pointe de la technologie, un routage intelligent dans le code applicatif. C'est tout l'avantage d'une API agrégatrice.