Si vous devez choisir un modèle vidéo IA en 2026, deux noms dominent la conversation : Google Veo 3.1 et Runway Aleph. Les deux produisent des clips inimaginables il y a encore un an. Les deux sont coûteux comparés à la génération d'images. Et les deux ont des points forts clairs qui font de l'un ou de l'autre le bon choix selon ce que vous développez.

Ce billet rassemble ce que nous avons appris en exécutant des milliers de tâches via notre passerelle API, afin que vous puissiez choisir sans gaspiller de crédits en exploration.

Résumé

  • Veo 3.1 Fast — meilleur rapport qualité-prix pour des clips courts générés à partir de texte. ~30-60s de génération. Excellents mouvements de caméra et éclairage réaliste.
  • Runway Aleph — meilleur pour les actions dynamiques, la cohérence stylistique entre les plans et la direction créative. Génération légèrement plus longue et coût par seconde plus élevé.
  • Les deux acceptent l'entrée image-vers-vidéo. Les deux sont limités à ~10 secondes par clip dans la génération actuelle.

Comparaison des prix (par seconde, 720p)

En passant par AI Generate avec une majoration par défaut de 40 % :

  • Veo 3.1 Fast (texte-vers-vidéo) : $0.42 par seconde
  • Runway Aleph : $0.77 par seconde

Pour un clip de 5 secondes, cela représente $2.10 contre $3.85 respectivement. Sur 100 clips, l'écart est de $175 — un montant significatif. Les paliers de volume réduisent la majoration en dessous de 20 % une fois que vous dépensez $200+/mois.

Quand choisir Veo 3.1

  • Vous avez besoin de scènes naturelles réalistes : personnes, nature, architecture, prises de produits
  • Vous faites attention aux coûts et souhaitez itérer sur de nombreuses variations
  • L'action est simple ou statique — un chien qui court, un panoramique de caméra, un zoom
  • Vous n'avez pas besoin d'un style artistique spécifique intégré

Quand choisir Runway Aleph

  • Vous avez besoin d'actions complexes — danseurs, sports, interactions entre plusieurs agents
  • Vous enchaînez des clips et souhaitez une cohérence stylistique entre eux
  • Le clip fait partie d'une création de marque où le style compte plus que le réalisme littéral
  • Vous connaissez déjà les conventions de prompts de Runway issues des travaux Gen-3

Comment appeler les deux via une seule API

Le but d'une passerelle est de ne pas avoir à gérer deux ensembles de credentials. Voici les commandes curl exactes pour chacun — même token Bearer, nom de modèle différent :

curl https://aimarcus.eu/aigenerate/api/v1/jobs/createTask \
  -H "Authorization: Bearer sk-aig-..." \
  -d '{
    "model": "google/veo-3-1-fast",
    "input": {
      "prompt": "Golden retriever running through autumn leaves, cinematic, 5s",
      "aspect_ratio": "16:9"
    }
  }'
curl https://aimarcus.eu/aigenerate/api/v1/jobs/createTask \
  -H "Authorization: Bearer sk-aig-..." \
  -d '{
    "model": "runway/aleph",
    "input": {
      "prompt": "A dancer in motion, studio lighting, cinematic",
      "duration": 5
    }
  }'

Les deux renvoient un taskId. Interrogez /api/v1/jobs/recordInfo?taskId=... toutes les 3 secondes jusqu'à ce que state="success", ou configurez une URL de webhook dans vos paramètres de compte pour recevoir une notification push.

Qui gagne ?

Pour 80 % des charges de travail en production où vous générez des séquences courtes de B-roll, des clips produits ou du contenu social — Veo 3.1 Fast. La différence de prix s'accumule, et le réalisme est suffisant pour la plupart des scènes non dynamiques.

Pour des projets créatifs où le style est le produit — clips musicaux, bandes-annonces de marque, teasers de jeux — Runway Aleph. Les 80 % de coût supplémentaires vous offrent un résultat que Veo peine encore à atteindre.

Le moyen le plus simple de décider : testez le même prompt sur les deux via le playground. Pour $1 par test, vous aurez votre réponse en dix minutes.