Wenn Sie 2026 ein KI-Videomodell auswählen, dominieren zwei Namen die Diskussion: Google Veo 3.1 und Runway Aleph. Beide erzeugen Clips, die vor einem Jahr noch undenkbar waren. Beide sind im Vergleich zur Bildgenerierung teuer. Und beide haben klare Stärken, die je nach Anwendungsfall das eine oder andere Modell zur richtigen Wahl machen.
Dieser Beitrag fasst zusammen, was wir aus Tausenden von Jobs über unsere API-Gateway gelernt haben, damit Sie sich ohne unnötigen Kreditverbrauch entscheiden können.
TL;DR
- Veo 3.1 Fast — bestes Preis-Leistungs-Verhältnis für kurze Text-zu-Video-Clips. ~30-60 Sekunden Generierungszeit. Starke Kamerabewegungen und realistische Beleuchtung.
- Runway Aleph — besser bei dynamischen Aktionen, Stil-Konsistenz über mehrere Aufnahmen hinweg und kreativer Regie. Etwas längere Generierungszeit und höhere Kosten pro Sekunde.
- Beide unterstützen Bild-zu-Video. Beide begrenzen die Clip-Länge in der aktuellen Generation auf ~10 Sekunden.
Preisvergleich (pro Sekunde, 720p)
Über AI Generate mit einem Standardaufschlag von 40%:
- Veo 3.1 Fast (Text-zu-Video):
$0.42 pro Sekunde - Runway Aleph:
$0.77 pro Sekunde
Für einen 5-Sekunden-Clip sind das $2.10 gegenüber $3.85. Bei 100 Clips beträgt die Differenz $175 — genug, um ins Gewicht zu fallen. Volumenrabatte reduzieren beide auf unter 20% Aufschlag, sobald Sie $200+/Monat ausgeben.
Wann Veo 3.1 wählen
- Sie benötigen realistische natürliche Szenen: Menschen, Natur, Architektur, Produktaufnahmen
- Sie achten auf die Kosten und möchten viele Variationen testen
- Die Aktion ist einfach oder statisch — ein Hund, der läuft, eine Kamerafahrt, ein Zoom
- Sie brauchen keinen spezifischen künstlerischen Stil
Wann Runway Aleph wählen
- Sie benötigen komplexe Aktionen — Tänzer, Sport, mehrere interagierende Akteure
- Sie verketten Clips und möchten Stil-Konsistenz zwischen ihnen
- Der Clip ist Teil eines gebrandeten Kreativprojekts, bei dem Stil wichtiger ist als realistische Darstellung
- Sie kennen bereits die Prompt-Konventionen von Runway aus Gen-3-Projekten
Wie beide über eine API aufrufen
Der Vorteil eines Gateways ist, dass Sie nicht zwei verschiedene Zugangsdaten verwalten müssen. Hier sind die genauen curl-Befehle für beide — derselbe Bearer-Token, unterschiedlicher Modellname:
curl https://aimarcus.eu/aigenerate/api/v1/jobs/createTask \
-H "Authorization: Bearer sk-aig-..." \
-d '{
"model": "google/veo-3-1-fast",
"input": {
"prompt": "Golden retriever running through autumn leaves, cinematic, 5s",
"aspect_ratio": "16:9"
}
}'
curl https://aimarcus.eu/aigenerate/api/v1/jobs/createTask \
-H "Authorization: Bearer sk-aig-..." \
-d '{
"model": "runway/aleph",
"input": {
"prompt": "A dancer in motion, studio lighting, cinematic",
"duration": 5
}
}'
Beide geben eine taskId zurück. Polling Sie /api/v1/jobs/recordInfo?taskId=... alle 3 Sekunden, bis state="success", oder richten Sie eine Webhook-URL in Ihren Kontoeinstellungen ein, um eine Push-Benachrichtigung zu erhalten.
Welches Modell gewinnt?
Für 80% der Produktions-Workloads, bei denen kurze B-Roll-Clips, Produktvideos oder Social-Media-Inhalte generiert werden — Veo 3.1 Fast. Der Preisunterschied summiert sich, und die Realismusqualität reicht für die meisten nicht-aktionsbasierten Szenen aus.
Für kreative Projekte, bei denen der Stil das Produkt ist — Musikvideos, gebrandete Trailer, Game-Teaser — Runway Aleph. Die zusätzlichen 80% Kosten liefern die Art von Output, mit der Veo noch Schwierigkeiten hat.
Der einfachste Weg zur Entscheidung: Testen Sie denselben Prompt in beiden Modellen über den Playground. Für $1 pro Test haben Sie Ihre Antwort in zehn Minuten.