Si estás eligiendo un modelo de video AI en 2026, dos nombres dominan la conversación: Google Veo 3.1 y Runway Aleph. Ambos producen clips que eran impensables hace un año. Ambos son costosos en comparación con la generación de imágenes. Y ambos tienen fortalezas claras que hacen que uno u otro sea la elección correcta dependiendo de lo que estés desarrollando.

Este artículo reúne lo que hemos aprendido ejecutando miles de trabajos a través de cada uno mediante nuestra puerta de enlace API, para que puedas decidir sin gastar créditos en exploración.

Resumen

  • Veo 3.1 Fast: mejor relación precio-fidelidad para clips cortos de texto a video. Generación en ~30-60s. Fuerte movimiento de cámara e iluminación realista.
  • Runway Aleph: mejor en acción dinámica, consistencia de estilo entre tomas y dirección creativa. Generación ligeramente más lenta y mayor costo por segundo.
  • Ambos aceptan imagen a video. Ambos tienen un límite de ~10 segundos por clip en la generación actual.

Comparación de precios (por segundo, 720p)

Ejecutando a través de AI Generate con un margen predeterminado del 40%:

  • Veo 3.1 Fast (texto a video): $0.42 por segundo
  • Runway Aleph: $0.77 por segundo

Para un clip de 5 segundos, eso es $2.10 frente a $3.85, respectivamente. En 100 clips, la diferencia es de $175, lo cual es significativo. Los niveles de volumen reducen ambos por debajo del 20% de margen una vez que gastas $200+/mes.

Cuándo elegir Veo 3.1

  • Necesitas escenas naturales realistas: personas, naturaleza, arquitectura, tomas de productos
  • Te importa el costo y quieres iterar en muchas variaciones
  • La acción es simple o estática: un perro corriendo, un paneo de cámara, un zoom
  • No necesitas un estilo artístico específico integrado

Cuándo elegir Runway Aleph

  • Necesitas acción compleja: bailarines, deportes, múltiples agentes interactuando
  • Estás encadenando clips y necesitas consistencia de estilo entre ellos
  • El clip es parte de un proyecto creativo donde el estilo importa más que el realismo literal
  • Ya conoces las convenciones de prompts de Runway por trabajos con Gen-3

Cómo usar ambos desde una API

El objetivo de una puerta de enlace es que no necesites dos conjuntos de credenciales. Aquí está el curl exacto para cada uno: mismo token Bearer, diferente nombre de modelo:

curl https://aimarcus.eu/aigenerate/api/v1/jobs/createTask \
  -H "Authorization: Bearer sk-aig-..." \
  -d '{
    "model": "google/veo-3-1-fast",
    "input": {
      "prompt": "Golden retriever running through autumn leaves, cinematic, 5s",
      "aspect_ratio": "16:9"
    }
  }'
curl https://aimarcus.eu/aigenerate/api/v1/jobs/createTask \
  -H "Authorization: Bearer sk-aig-..." \
  -d '{
    "model": "runway/aleph",
    "input": {
      "prompt": "A dancer in motion, studio lighting, cinematic",
      "duration": 5
    }
  }'

Ambos devuelven un taskId. Consulta /api/v1/jobs/recordInfo?taskId=... cada 3 segundos hasta que state="success", o configura una URL de webhook en la configuración de tu cuenta para recibir una notificación push.

¿Cuál gana?

Para el 80% de las cargas de trabajo de producción donde estás generando clips cortos de B-roll, productos o contenido social: Veo 3.1 Fast. La diferencia de precio se acumula, y el realismo es comparable para la mayoría de las escenas no dinámicas.

Para proyectos creativos donde el estilo es el producto: videos musicales, tráilers de marca, teasers de juegos: Runway Aleph. El costo adicional del 80% te da el tipo de resultado con el que Veo aún lucha.

La forma más fácil de decidir: ejecuta el mismo prompt en ambos a través del playground. Por $1 por prueba, tendrás tu respuesta en diez minutos.