Texto-para-imagem se consolidou em torno de três modelos de ponta em 2026: Flux Kontext Pro (Black Forest Labs), Nano Banana (Google) e 4o Image (OpenAI). Cada um representa um equilíbrio distinto entre velocidade, fidelidade e preço.

Aqui está o resultado das nossas gerações ao rodarmos o mesmo prompt em todos os três.

O prompt

"Uma raposa vermelha sentada na neve fresca ao pôr do sol, com profundidade de campo rasa, foto-realista"

Velocidade e preço (nossas taxas atuais de gateway)

  • Nano Banana — 6 segundos, $0.056 por imagem
  • Flux Kontext Pro — 9 segundos, $0.084 por imagem
  • 4o Image — 12 segundos, $0.14 por imagem

Observações sobre qualidade

  • Flux Kontext Pro: melhor aderência geral a prompts complexos. Lida bem com texto em imagens (menus, placas). Ocasionalmente apresenta um leve brilho plástico na pele.
  • Nano Banana: mais rápido, realismo mais limpo para natureza, produtos e retratos. Mais fraco em texto embutido e cenas complexas com múltiplos sujeitos.
  • 4o Image: melhor para ilustração e arte conceitual. Realismo um pouco atrás do Flux. Ideal para saídas estilizadas.

Escolhendo para seu caso de uso

  • Fotografia para e-commerce e marketing: Nano Banana primeiro. Mais barato + mais rápido + realista o suficiente para 90% das fotos de produtos/estilo de vida.
  • Cenas editoriais complexas com texto: Flux Kontext Pro. Único modelo que soletra corretamente de forma consistente.
  • Ilustração estilizada, arte conceitual, editorial: 4o Image. Os instintos de direção artística da OpenAI são difíceis de superar.
  • Geração em lote (>1000 imagens/dia): Nano Banana. A economia de $0.03 por imagem em relação ao Flux se acumula em valores significativos.

Padrão de uso: escolha por prompt, não por produto

A maioria dos produtos com uso intensivo de imagens que vemos em nossa API não é fiel a um único modelo. Eles roteiam: "se o prompt contém texto" → Flux, "se a categoria == ilustração" → 4o Image, padrão → Nano Banana. Essa regra simples gera uma economia de 30% nos custos sem sacrificar a qualidade de saída em prompts difíceis.

Chamando os três por meio de uma única API

// Roteamento no código do seu app:
const model = prompt.includes('text') || prompt.includes('sign')
  ? 'black-forest-labs/flux-kontext-pro'
  : style === 'illustration'
    ? 'openai/4o-image'
    : 'google/nano-banana';

await fetch('https://aimarcus.eu/aigenerate/api/v1/jobs/createTask', {
  method: 'POST',
  headers: {
    'Authorization': 'Bearer sk-aig-...',
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({ model, input: { prompt, output_format: 'png', image_size: '1:1' } }),
});

Um único token Bearer, três provedores de ponta, roteamento inteligente no código do aplicativo. Essa é toda a vantagem de uma API agregadora.