Google legt nach. Mit Gemini Omni kommt ein multimodales Modell, das aus Text, Bildern und Audio direkt Videos baut — per Konversation.