Neues Sprachmodell von Google: Welche Möglichkeiten bietet Gemini?

Im Dezember des vergangenen Jahres 2023 hat Google die künstliche Intelligenz namens Gemini vorgestellt. Gemini wurde als multimodales Modell entwickelt, es kann also verschiedene Modi von Informationen verarbeiten und anwenden. So ist es möglich, Eingaben in Form von Bildern, Videos, Audios, Code und geschriebenem Text, auch in Kombination, zu tätigen. Überdies soll Gemini dazu in der Lage sein, für jeweilige Forschungsvorhaben relevante Passagen in wissenschaftlichen Artikeln zu erkennen und einzuholen.

Das neue KI-System bildet neuerdings die Basis des Google-eigenen Chatbots Bard und soll im Laufe der Entwicklung fortwährend in weitere Google-Produkte integriert werden. Diese Informationen beziehen sich jedoch vorerst nicht auf die EU. Ein genaues Datum für den Start von Google Bard auf Basis von Gemini in der EU wurde bisher noch nicht bekannt gegeben.


Gemini wird in drei Versionen veröffentlicht – von diesen drei Versionen sind zunächst nur zwei Versionen zugänglich. Gemini Nano und Gemini Pro sind außerhalb der EU schon verfügbar.
Gemini Pro soll die leistungsfähigere Basis von Bard bilden, während Gemini Nano für die Nutzung auf Android Geräten angepasst werden soll. Momentan läuft Gemini Nano allerdings lediglich auf dem Google Pixel 8 Pro. Gemini Ultra wurde als die leistungsfähigste der drei Versionen angekündigt, sie ist aber noch nicht für die Öffentlichkeit zugänglich. Ultra soll die Basis für eine optimierte Version des Chatbots Bard namens Bard Advanced bilden. Ähnlich wie GPT4, welches u.a. als LLM in Microsofts Copilot verwendet wird, soll Gemini (Pro) als Modell in verschiedene Anwendungen integriert erscheinen und nicht als eigene Anwendung.


Google stellt die Funktionen des KI-Modells sehr ambitioniert in einem Werbevideo dar. Die vielfältige Nutzbarkeit des KI-Systems scheint flexibel und flüssig vonstattenzugehen. Tatsächlich wurde das Video an vielen Stellen jedoch bearbeitet. Die Bearbeitung und Nachproduktion des Werbevideos wird mit folgendem Satz kommentiert (Übersetzung1): „Für die Zwecke dieser Demo wurde die Latenzzeit reduziert und die Ausgaben in Gemini wurden der Einfachheit halber gekürzt.“ An diesem Vorgehen seitens Google wurde an verschiedenen Stellen Kritik geäußert. Die an die KI gerichteten Eingaben z.B., wurden erst im Anschluss an die Aufnahmen vertont. Die verkürzte Darstellung der Kontextsettings für die jeweilige Aufgabe und auch deren Bewältigung durch die KI gaben Anlass zur Kritik an der Darstellung durch Google. Zusätzlich wird aus dem Kontext des Videos und der Videobeschreibung nicht klar, um welche Version vom Gemini es sich bei der Präsentation handelt.


Insgesamt stellt das KI-System sicherlich eine interessante Neuentwicklung im Bereich generativer künstlicher Intelligenz dar. Welche Weiterentwicklungen Gemini gegenüber der Konkurrenz bieten wird und welche Chancen und Herausforderungen sich daraus für Betriebe und deren Interessenvertretung ergeben, bleibt insbesondere mit der Einführung von Gemini Ultra noch abzuwarten.


Weitere Informationen zu Gemini finden Sie unter:


Nils Bremhorst
Technologieberatungsstelle beim DGB NRW e. V.
nils.bremhorst@tbs-nrw.de


  1. „For the purposes of this demo, latency has been reduced and Gemini outputs have been shortened for brevity.“ ↩︎

Zurück

Das Projekt Zukunftszentrum KI NRW wird im Rahmen des Programms Zukunftszentren durch das Bundesministerium für Arbeit und Soziales und vom Ministerium für Arbeit, Gesundheit und Soziales NRW sowie durch die Europäische Union über den Europäischen Sozialfonds Plus (ESF Plus) gefördert.