🔥 HOT NEWS
Google baut Video-Generator per Chatbefehl
Google legt nach. Mit Gemini Omni kommt ein multimodales Modell, das aus Text, Bildern und Audio direkt Videos baut — per Konversation.
Google legt nach. Mit Gemini Omni kommt ein multimodales Modell, das aus Text, Bildern und Audio direkt Videos baut — per Konversation.
Was Omni kann
Das Modell denkt über vier Modalitäten gleichzeitig: Text, Bild, Audio, Video. User tippen einen Befehl, Omni liefert den Clip. Bearbeitung läuft im Chat — kein Timeline-Gefrickel mehr.
- Modell:** Gemini Omni (Familie)
- Erstes Release:** Omni Flash
- Input:** Text + Bild + Audio
- Output:** Video, editierbar via Prompt
- Anbieter:** Google DeepMind
⚖️ Gemini Omni vs. OpenAI Sora
- Steuerung:** Omni per Chat, Sora per Prompt-Feld
- Multimodal-Input:** Omni nimmt Audio, Sora nicht
- Editing:** Omni iterativ im Dialog, Sora regeneriert komplett
- Verfügbarkeit:** Omni Flash startet jetzt, Sora 2 noch eingeschränkt
💡 Was das bedeutet
Video-Editing wird zur Konversation. Wer bisher Premiere oder DaVinci aufgemacht hat, redet künftig mit dem Modell. Für Marketing-Teams, YouTube-Creator und Agenturen ist das der Moment, an dem KI-Video vom Spielzeug zum Werkzeug wird.
🤖 NERDMAN-URTEIL
Google hat aus dem Sora-Schock gelernt — und liefert mit Omni das, was OpenAI im Februar versprochen, aber nie eingelöst hat.
Quelle: TechCrunch AI
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.