Google hat sein neues Gemini-Modell für künstliche Intelligenz angekündigt, ein KI-System, welches eine Vielzahl von Produkten des Unternehmens antreiben wird – vom Google Bard Chatbot bis hin zu den neuen Pixel-Smartphones.
Und Google scheint vollends zuversichtlich, dass man hier eine Top-Lösung vorliegen hat, weswegen man mit Lobgesängen à la “das fähigste und allgemeinste Modell, dass wir je gebaut haben” nicht gerade geizt. Zeitgleich soll die neue KI die Nutzerfahrung noch viel hilfreicher als ohnehin schon gestalten. Und wirft man mal einen Blick auf die erste atemberaubende Video-Demo, scheint das nicht allzu weit hergeholt.
Gemini wird es übrigens in gleich drei “Größen” geben: Ultra, Pro und Nano, wobei jede Größe für einen anderen Zweck gedacht ist. Alle werden allerdings multimodal sein, d. h. sie können eine Vielzahl von Eingaben verarbeiten. Der Hersteller meint sogar, dass Gemini Text, Code, Audio, Bilder und Videos als Eingabeaufforderungen verarbeiten kann.
Gemini Ultra ist hierbei jedoch noch einmal für extrem anspruchsvolle Anwendungsfälle vorbehalten, während Gemini Nano perfekt auf Smartphones zugeschnitten scheint und Android-Smartphones so weitere Kaufargumente liefert.
Bei all den neuen Leistungen besteht Google allerdings auch darauf, dass man schon im Vorfeld eine Reihe “strenger Tests” durchführte, um schädliche Ergebnisse bei der Gemini-Nutzung zu erkennen wie auch zu vermeiden. Das scheint zugegebenermaßen eine große Herausforderung gewesen zu sein, wo doch die multimodale Natur von Gemini darauf schließen lässt, dass zwei scheinbar harmlose Eingaben (z. B. ein Text und ein Bild) so kombiniert werden können, dass etwas Beleidigendes oder Gefährliches entsteht.
Google reagiert mit Gemini aber voraussichtlich auch noch einmal auf den anhaltenden Druck, den man durch die Konkurrenz in Form von OpenAIs ChatGPT verspüren dürfte und versucht demnach einmal mehr gleichzuziehen. Erst vor ein paar Tagen kursierte jedoch die Nachricht, dass Google die Ankündigung von Gemini auf das nächste Jahr verschoben hat, weil es in einer Reihe von Sprachen schlecht funktioniert.
Vielleicht also doch lieber nichts überstürzen?
Wer weiß … inzwischen gibt es jedenfalls schon Gegenstimmen zu eben jener Aussage, wobei Gemini ungeachtet dessen vorerst trotzdem nur in Englisch funktionieren wird.
Doch was haben wir jetzt eigentlich so richtig vom neuen KI-Helfer? Wer beispielsweise ein Pixel 8 Pro sein Eigen nennt, der darf sich laut Suchmaschinengiganten mit Gemini Nano auf allerlei handliche Ki-Features freuen, die zunächst von Smart Reply bis hin zu Summarize (im Recorder) reichen. Erstgenanntes dient namensgebend zur Antwort auf Nachrichten, während die Summarize-Funktion die wichtigsten Inhalte eines Recordings niederschreibt.
Der Google Bard Chatbot wurde obendrein ebenfalls aktualisiert und läuft jetzt mit Gemini, was laut Google “das größte Upgrade für Bard seit seiner Einführung” sein dürfte. Außerdem sagt Google, dass “Gemini in den kommenden Monaten in weiteren unserer Produkte und Dienste wie in der Suche, Anzeigen, Google Chrome sowie Duet AI verfügbar sein wird”.
Im Rahmen der Ankündigung hat Google auch eine Reihe von Gemini-Demonstrationen gezeigt. Diese zeigen, wie die KI errät, was ein Nutzer gezeichnet hat, wie sie Musik passend zu einer Zeichnung abspielt und vieles mehr.
Es ist kein Geheimnis, dass ChatGPT schon seit Monaten das dominierende KI-Tool ist, und Google will das mit Gemini nun einmal mehr anfechten. Pluspunkt: Das Unternehmen hat einige ziemlich kühne Behauptungen über seine Fähigkeiten aufgestellt.
Google sagt zum Beispiel, dass die Leistung von Gemini Ultra den aktuellen Stand der Technik in “30 der 32 weit verbreiteten akademischen Benchmarks” übertrifft, die in der Forschung und Entwicklung von großen Sprachmodellen (LLM) verwendet werden. Mit anderen Worten: Google ist der Meinung, dass Gemini Ultra den GPT-4 in fast jeder Hinsicht in den Schatten stellt.
Verglichen mit dem GPT-4 LLM, das ChatGPT antreibt, hat Gemini laut Google in sieben von acht textbasierten Benchmarks die Nase vorn. Bei den multimodalen Tests gewann Gemini laut Googles Vergleich sogar in allen 10 Benchmarks.
Bedeutet das, dass es einen neuen KI-Champion gibt? Das bleibt natürlich noch abzuwarten. Entsprechend gilt es auch erst einmal zu sehen, was denn unabhängige Nutzer vom neuen KI-Helfer halten dürften. Klar ist jedoch, dass Google nach wie vor den KI-Kampf äußerst ernst nimmt. Und nun ist es einmal mehr an OpenAI (sowie Microsoft) sich zu wappnen und entsprechende Gegenargumente zu finden, solange die Zeit dafür zur Verfügung steht …