
Google macht KI-Video mit nativer Audio-Ausgabe deutlich günstiger – API-Preise sinken um bis zu 60 Prozent
Google öffnet sein jüngstes KI-Videomodell Veo 3 breiter für Entwickler und senkt gleichzeitig die Hürde für den produktiven Einsatz: Das Modell ist seit dem 17. Juli 2025 offiziell über die Gemini-API verfügbar – zusätzlich zu Vertex AI und Googles eigenen Kreativwerkzeugen – und erzeugt nicht nur realistische Bewegtbilder, sondern auch eine native Tonspur mit Musik und Geräuschen, die direkt zum Bildinhalt passt. Parallel dazu hat Google die API-Preise spürbar reduziert: Je nach Variante liegen die Kosten nun bis zu 60 Prozent unter den bisherigen Tarifen, was die Kalkulation für Agenturen, Studios und Solo-Creator grundlegend verändert.
Was Veo 3 technisch auszeichnet – und warum die Audio-Fähigkeit so wichtig ist
Veo 3 generiert 8-Sekunden-Clips in 720p oder 1080p und beherrscht dabei ein breites Spektrum an Stilen von „cinematisch“ bis „surreal“. Der Clou ist die native Audioausgabe: Die Modelle erzeugen zu den Szenen passende Geräusche, Musik und Soundeffekte, die mit der Bildbewegung synchronisiert werden. Unterstützt werden die gängigen Seitenverhältnisse 16:9 und 9:16 für YouTube, Reels, Shorts & Co., die Bildrate liegt modellseitig bei 24 fps. In der stabilen „Generate“-Variante ist Bild-zu-Video derzeit nicht vorgesehen; die Schnellvariante „Veo 3 Fast“ konzentriert sich ebenso auf Text-zu-Video plus Ton.
Für die Praxis entscheidend: Alle von Veo generierten Videos tragen eine robuste, maschinenlesbare SynthID-Wasserkennung. Das schafft Transparenz in Workflows, die von Pitch-Decks und Social-Clips bis zu Werbespots reichen, und erleichtert Compliance-Prozesse bei Publishern und Marken.
Verfügbarkeit: Gemini-API, Vertex AI – und Zugang über Googles Kreativ-Apps
Google hat Veo 3 zuerst in seinen eigenen Ökosystemen ausgerollt – etwa in der Gemini-App und im Story-Editor „Flow“ – und dann für Entwickler über die Gemini-API sowie für Unternehmenskunden via Vertex AI zugänglich gemacht. Für Cloud-Teams steht Veo 3 inzwischen als Public Preview in Vertex AI bereit; Creator erhalten über die Google-AI-Tarife (Pro bzw. Ultra) komfortablen Endnutzer-Zugang, während Entwickler mit der Gemini-API den vollen Programmierzugriff bekommen.
Die neuen Preise im Überblick – und was sie in der Praxis bedeuten
Mit der aktuellen Preissenkung hat Google die Kostenstruktur für Veo 3 grundlegend verschlankt. Offiziell kostet die Generierung „Video + Audio“ über die Gemini-API nun 0,40 US-Dollar pro Sekunde; die schnellere „Veo 3 Fast“-Variante liegt bei 0,15 US-Dollar pro Sekunde. Auf Vertex AI sind darüber hinaus auch „Video only“-Tarife ausgewiesen. Gegenüber den zuvor kommunizierten Sätzen entsprechen die neuen Tarife Einsparungen von bis zu 60 Prozent.
Modell | Funktion | Alter Preis (API) | Neuer Preis (API) | Reduktion | Beispiel: 8 s Clip |
---|---|---|---|---|---|
Veo 3 | Video + Audio | 0,75 $/s | 0,40 $/s | ≈ 46,7 % | 6,00 $ → 3,20 $ |
Veo 3 | Video only | 0,50 $/s | 0,20 $/s | 60 % | 4,00 $ → 1,60 $ |
Veo 3 Fast | Video + Audio | 0,40 $/s | 0,15 $/s | ≈ 62,5 % | 3,20 $ → 1,20 $ |
Veo 3 Fast | Video only | 0,25 $/s | 0,10 $/s | 60 % | 2,00 $ → 0,80 $ |
Altpreise nach Branchenberichten; neue Preise gemäß offizieller Gemini- bzw. Vertex-Preislisten.
Budget-Realität: Was kostet eine Minute Video?
Veo generiert 8-Sekunden-Clips. Für rund eine Minute Material (≈ 8 Clips, anschließend zusammengeschnitten) ergeben sich Richtwerte: Veo 3 Fast mit Audio liegt bei etwa 9,60 US-Dollar pro Minute (8 × 1,20 $), Veo 3 mit Audio bei etwa 25,60 $, Video-only entsprechend bei ca. 6,40 $ (Fast) bzw. 12,80 $ (Standard). Postproduktion, Upscaling, Musikrechte oder Sprecherkosten sind darin nicht enthalten, können aber teilweise entfallen, wenn die generierte Tonspur bereits dicht genug ist. Für Social-Formate, Storyboards, Mood-Films oder Previz spart das signifikant Budget – und macht schnelle Iterationen realistisch.
API-Praxis: So arbeitest du mit Veo 3 über die Gemini-API
Der Einstieg führt über Google AI Studio (Paid Tier) oder direkt über die Gemini-API. Entwickler wählen in der API das passende Modell – etwa veo-3.0-generate-001 (Standard) oder veo-3.0-fast-generate-001 (Fast) – und senden eine Textbeschreibung samt optionalen Steuerhinweisen für Kamera, Bewegung, Stil und Ton. Die API liefert nach Abschluss der Long-Running-Operation eine Videodatei. Wichtig sind die Modellgrenzen: Länge aktuell 8 Sekunden, Auflösungen 720p/1080p, 24 fps, Quer- oder Hochformat. Die stabile Generate-Variante unterstützt derzeit kein Image-to-Video; die Fast-Variante ist ebenfalls auf Text-zu-Video ausgelegt.
// Beispiel: Pseudocode-Aufruf (vereinfacht) model = "veo-3.0-fast-generate-001" prompt = "Aerial tracking shot over a neon-lit city at night; rain on asphalt; synthwave ambience; footsteps and distant traffic; slow push-in; 24fps; 1080p; 9:16" job = gemini.video.generate(model, {text: prompt}) video = await job.waitForResult() save(video, "veo3_sample.mp4")
Für Prototypen stellt Google einen Quickstart mit UI und Beispielcode bereit; in AI Studio gibt es zusätzlich ein „Starter App“-Template zum Remixen. So lassen sich Workflows zügig vom Prompt bis zum Download aufsetzen.
Creator-Zugang ohne eigenen Code – und temporäre Promo-Fenster
Wer nicht sofort in die API einsteigen möchte, kann Veo 3 über Googles Endnutzer-Produkte ausprobieren. Im Rahmen von Aktionen hat Google in den vergangenen Wochen wiederholt kurzzeitig kostenlosen Zugriff in der Gemini-App gewährt; regulär bieten die Google-AI-Abos (Pro/Ultra) limitierte Veo-Kontingente sowie höhere Limits im Editor „Flow“. Für schnelle Social-Experimente oder Previz-Clips ist das oft die einfachste Abkürzung.
Qualität, Sicherheit, Compliance: Was Teams jetzt beachten sollten
Auch wenn Veo 3 im Alltag bereits beeindruckende Resultate liefert, bleibt das System in einigen Bereichen eine „bewegliche Zielscheibe“: Bild-zu-Video ist in der stabilen Generate-Linie nicht verfügbar; die Promptsteuerung für komplexe Kamerafahrten oder feingranulare Handlungskontrolle erfordert Iteration und geeignete Referenzprompts. Für den professionellen Einsatz sprechen jedoch klare Vorteile: ein offizieller Lizenz- und Abrechnungspfad (Gemini-API/Vertex AI), die SynthID-Wasserzeichen für Herkunftsnachweise und die native Tonspur, die häufig Musik-/SFX-Workflows verkürzt. Gerade Publisher und Marken, die strenge Herkunftsnachweise verlangen, profitieren hier von der Google-Architektur.
Strategische Einordnung: Wo Veo 3 im Markt steht
Im Wettbewerbsumfeld positioniert sich Veo 3 als End-to-End-Generator für kurze Sequenzen mit Bild und Ton. Der native Audiofokus ist derzeit ein Differenzierungsmerkmal, weil er nahtlos Single-Asset-Workflows (ein Prompt, ein Clip mit Ton) ermöglicht – ein Vorteil für Social-Teams, Newsrooms und Werbekunden, die zügig Variationen testen. Gleichzeitig bleibt der 8-Sekunden-Taktus eine natürliche Grenze: Längere Stücke entstehen durch „Stitching“, was in die Postproduktion verlagert wird. Dass Google die API-Preise massiv reduziert, signalisiert allerdings klaren Skalierungswillen: Die Schwelle für produktive Nutzung, A/B-Testing und datengetriebene Kreativ-Pipelines sinkt spürbar.
Letzte Aktualisierung am 1.09.2025 / Affiliate Links / Bilder von der Amazon Product Advertising API. Alle hier angezeigten Preise und Verfügbarkeiten gelten zum angegebenen Zeitpunkt der Einbindung und können sich jederzeit ändern. Der Preis und die Verfügbarkeit, die zum Kaufzeitpunkt auf Amazon.de angezeigt werden, sind maßgeblich. Als Amazon-Partner verdienen wir an qualifizierten Verkäufen.
Quellen & weiterführende Links
- Google Developers Blog: „Build with Veo 3, now available in the Gemini API“ (17.07.2025)
- Gemini-API Doku: „Generate videos with Veo 3“ – Fähigkeiten, 8 s, 720p/1080p, Audio
- Vertex AI Modellseite: „Veo 3 (veo-3.0-generate-001)“ – Modell-ID, Limits, Audio
- Vertex AI Modellseite: „Veo 3 Fast (veo-3.0-fast-generate-001)“ – 24 fps, 8 s, Auflösungen
- Gemini-API Preisübersicht – Veo 3 & Veo 3 Fast (Video + Audio)
- Vertex AI Preisübersicht – Veo-Preise inkl. „Video only“
- The Decoder: „Google cuts API prices for Veo 3 by up to 60 percent“
- Google Cloud Blog: „What Google Cloud announced in AI this month“ – Verfügbarkeit & Updates
- Google I/O Überblick: „Fuel your creativity with new generative media models“ – Veo 3 mit Audio
- Google AI-Pläne: „Get Google AI Pro benefits“ – Zugänge und Kontingente
- Veo 3 Quickstart (GitHub) – Beispielcode & UI
- Google One: „Manage your AI credits“ – Gratis-Credits & Promo-Fenster (Flow/Veo)
- DeepMind: „SynthID“ – Wasserzeichen für KI-Inhalte