2026年にAI動画モデルを選ぶ際、議論の中心となるのはGoogle Veo 3.1とRunway Alephの2つです。どちらも1年前には考えられなかったようなクリップを生成できます。どちらも画像生成に比べて高価です。そして、どちらも用途に応じて適切な選択となる明確な強みを持っています。
この投稿では、当社のAPIゲートウェイを通じて数千件のジョブを実行した経験を基に、クレジットを無駄にせずに選択できるよう情報をまとめました。
要約
- Veo 3.1 Fast — 短いテキストから動画へのクリップにおいて、価格対品質比が最良。生成時間は約30〜60秒。カメラの動きやリアルな照明が得意。
- Runway Aleph — 動的なアクション、ショット間のスタイルの一貫性、クリエイティブな演出が得意。生成時間はやや長く、1秒あたりのコストも高め。
- どちらも画像から動画への入力を受け付けます。現行世代ではどちらも1クリップあたり約10秒が上限です。
価格比較(1秒あたり、720p)
AI Generateを通じた場合、デフォルトの40%マークアップを含みます:
- Veo 3.1 Fast(テキストから動画):
$0.42 per second - Runway Aleph:
$0.77 per second
5秒のクリップでは、それぞれ$2.10と$3.85です。100クリップでは差額は$175となり、無視できない金額です。月額$200以上を費やす場合、ボリュームティアによりどちらも20%以下のマークアップに抑えられます。
Veo 3.1を選ぶべき場合
- リアルな自然シーン(人、自然、建築物、製品ショット)が必要な場合
- コストを重視し、多くのバリエーションを試したい場合
- アクションが単純または静的(犬が走る、カメラのパンやズーム)な場合
- 特定のアートスタイルを必要としない場合
Runway Alephを選ぶべき場合
- 複雑なアクション(ダンサー、スポーツ、複数のエージェントの相互作用)が必要な場合
- クリップを連結し、スタイルの一貫性を保ちたい場合
- クリップがブランドクリエイティブの一部で、スタイルがリアリズムより重要な場合
- Runwayのプロンプト規則(Gen-3など)に既に習熟している場合
1つのAPIで両方を呼び出す方法
ゲートウェイの利点は、2つの認証情報を保持する必要がないことです。以下はそれぞれの正確なcurlコマンドです。同じBearerトークンを使用し、異なるモデル名を指定します:
curl https://aimarcus.eu/aigenerate/api/v1/jobs/createTask \
-H "Authorization: Bearer sk-aig-..." \
-d '{
"model": "google/veo-3-1-fast",
"input": {
"prompt": "Golden retriever running through autumn leaves, cinematic, 5s",
"aspect_ratio": "16:9"
}
}'
curl https://aimarcus.eu/aigenerate/api/v1/jobs/createTask \
-H "Authorization: Bearer sk-aig-..." \
-d '{
"model": "runway/aleph",
"input": {
"prompt": "A dancer in motion, studio lighting, cinematic",
"duration": 5
}
}'
どちらもtaskIdを返します。/api/v1/jobs/recordInfo?taskId=...を3秒ごとにポーリングし、state="success"になるまで確認するか、アカウント設定でWebhook URLを設定してプッシュ通知を受け取ります。
どちらが勝者か?
短いBロール、製品クリップ、ソーシャルコンテンツを生成する80%のプロダクションワークロードでは、Veo 3.1 Fastが最適です。価格差が積み重なり、ほとんどの非アクションシーンでリアリズムは同等です。
音楽ビデオ、ブランドトレーラー、ゲームティーザーなど、スタイルが製品そのものであるクリエイティブプロジェクトでは、Runway Alephが最適です。追加コスト80%は、Veoではまだ難しい出力を実現します。
最も簡単な判断方法:プレイグラウンドで同じプロンプトを両方に実行します。テスト1回あたり$1で、10分以内に答えが出ます。