Si estás eligiendo un modelo de video AI en 2026, dos nombres dominan la conversación: Google Veo 3.1 y Runway Aleph. Ambos producen clips que eran impensables hace un año. Ambos son costosos en comparación con la generación de imágenes. Y ambos tienen fortalezas claras que hacen que uno u otro sea la elección correcta dependiendo de lo que estés desarrollando.
Este artículo reúne lo que hemos aprendido ejecutando miles de trabajos a través de cada uno mediante nuestra puerta de enlace API, para que puedas decidir sin gastar créditos en exploración.
Resumen
- Veo 3.1 Fast: mejor relación precio-fidelidad para clips cortos de texto a video. Generación en ~30-60s. Fuerte movimiento de cámara e iluminación realista.
- Runway Aleph: mejor en acción dinámica, consistencia de estilo entre tomas y dirección creativa. Generación ligeramente más lenta y mayor costo por segundo.
- Ambos aceptan imagen a video. Ambos tienen un límite de ~10 segundos por clip en la generación actual.
Comparación de precios (por segundo, 720p)
Ejecutando a través de AI Generate con un margen predeterminado del 40%:
- Veo 3.1 Fast (texto a video):
$0.42 por segundo - Runway Aleph:
$0.77 por segundo
Para un clip de 5 segundos, eso es $2.10 frente a $3.85, respectivamente. En 100 clips, la diferencia es de $175, lo cual es significativo. Los niveles de volumen reducen ambos por debajo del 20% de margen una vez que gastas $200+/mes.
Cuándo elegir Veo 3.1
- Necesitas escenas naturales realistas: personas, naturaleza, arquitectura, tomas de productos
- Te importa el costo y quieres iterar en muchas variaciones
- La acción es simple o estática: un perro corriendo, un paneo de cámara, un zoom
- No necesitas un estilo artístico específico integrado
Cuándo elegir Runway Aleph
- Necesitas acción compleja: bailarines, deportes, múltiples agentes interactuando
- Estás encadenando clips y necesitas consistencia de estilo entre ellos
- El clip es parte de un proyecto creativo donde el estilo importa más que el realismo literal
- Ya conoces las convenciones de prompts de Runway por trabajos con Gen-3
Cómo usar ambos desde una API
El objetivo de una puerta de enlace es que no necesites dos conjuntos de credenciales. Aquí está el curl exacto para cada uno: mismo token Bearer, diferente nombre de modelo:
curl https://aimarcus.eu/aigenerate/api/v1/jobs/createTask \
-H "Authorization: Bearer sk-aig-..." \
-d '{
"model": "google/veo-3-1-fast",
"input": {
"prompt": "Golden retriever running through autumn leaves, cinematic, 5s",
"aspect_ratio": "16:9"
}
}'
curl https://aimarcus.eu/aigenerate/api/v1/jobs/createTask \
-H "Authorization: Bearer sk-aig-..." \
-d '{
"model": "runway/aleph",
"input": {
"prompt": "A dancer in motion, studio lighting, cinematic",
"duration": 5
}
}'
Ambos devuelven un taskId. Consulta /api/v1/jobs/recordInfo?taskId=... cada 3 segundos hasta que state="success", o configura una URL de webhook en la configuración de tu cuenta para recibir una notificación push.
¿Cuál gana?
Para el 80% de las cargas de trabajo de producción donde estás generando clips cortos de B-roll, productos o contenido social: Veo 3.1 Fast. La diferencia de precio se acumula, y el realismo es comparable para la mayoría de las escenas no dinámicas.
Para proyectos creativos donde el estilo es el producto: videos musicales, tráilers de marca, teasers de juegos: Runway Aleph. El costo adicional del 80% te da el tipo de resultado con el que Veo aún lucha.
La forma más fácil de decidir: ejecuta el mismo prompt en ambos a través del playground. Por $1 por prueba, tendrás tu respuesta en diez minutos.