Texto-para-imagem se consolidou em torno de três modelos de ponta em 2026: Flux Kontext Pro (Black Forest Labs), Nano Banana (Google) e 4o Image (OpenAI). Cada um representa um equilíbrio distinto entre velocidade, fidelidade e preço.
Aqui está o resultado das nossas gerações ao rodarmos o mesmo prompt em todos os três.
O prompt
"Uma raposa vermelha sentada na neve fresca ao pôr do sol, com profundidade de campo rasa, foto-realista"
Velocidade e preço (nossas taxas atuais de gateway)
- Nano Banana — 6 segundos, $0.056 por imagem
- Flux Kontext Pro — 9 segundos, $0.084 por imagem
- 4o Image — 12 segundos, $0.14 por imagem
Observações sobre qualidade
- Flux Kontext Pro: melhor aderência geral a prompts complexos. Lida bem com texto em imagens (menus, placas). Ocasionalmente apresenta um leve brilho plástico na pele.
- Nano Banana: mais rápido, realismo mais limpo para natureza, produtos e retratos. Mais fraco em texto embutido e cenas complexas com múltiplos sujeitos.
- 4o Image: melhor para ilustração e arte conceitual. Realismo um pouco atrás do Flux. Ideal para saídas estilizadas.
Escolhendo para seu caso de uso
- Fotografia para e-commerce e marketing: Nano Banana primeiro. Mais barato + mais rápido + realista o suficiente para 90% das fotos de produtos/estilo de vida.
- Cenas editoriais complexas com texto: Flux Kontext Pro. Único modelo que soletra corretamente de forma consistente.
- Ilustração estilizada, arte conceitual, editorial: 4o Image. Os instintos de direção artística da OpenAI são difíceis de superar.
- Geração em lote (>1000 imagens/dia): Nano Banana. A economia de $0.03 por imagem em relação ao Flux se acumula em valores significativos.
Padrão de uso: escolha por prompt, não por produto
A maioria dos produtos com uso intensivo de imagens que vemos em nossa API não é fiel a um único modelo. Eles roteiam: "se o prompt contém texto" → Flux, "se a categoria == ilustração" → 4o Image, padrão → Nano Banana. Essa regra simples gera uma economia de 30% nos custos sem sacrificar a qualidade de saída em prompts difíceis.
Chamando os três por meio de uma única API
// Roteamento no código do seu app:
const model = prompt.includes('text') || prompt.includes('sign')
? 'black-forest-labs/flux-kontext-pro'
: style === 'illustration'
? 'openai/4o-image'
: 'google/nano-banana';
await fetch('https://aimarcus.eu/aigenerate/api/v1/jobs/createTask', {
method: 'POST',
headers: {
'Authorization': 'Bearer sk-aig-...',
'Content-Type': 'application/json',
},
body: JSON.stringify({ model, input: { prompt, output_format: 'png', image_size: '1:1' } }),
});
Um único token Bearer, três provedores de ponta, roteamento inteligente no código do aplicativo. Essa é toda a vantagem de uma API agregadora.