Google DeepMind enthüllt Gemini 3: Ein neuer Maßstab für KI-Reasoning und autonome Agenten

Google DeepMind hat heute mit Gemini 3 die nächste Generation seiner KI-Modelle vorgestellt. Laut CEO Demis Hassabis markiert dieses Release einen weiteren Schritt in Richtung der allgemeinen künstlichen Intelligenz (AGI). Der Fokus liegt dabei auf drastisch verbesserter logischer Schlussfolgerung, Multimodalität und vor allem auf der Fähigkeit, als autonomer Agent zu agieren.

Die Veröffentlichung teilt sich in zwei Hauptstränge: Das ab sofort verfügbare Gemini 3 Pro und das noch leistungsfähigere, auf tiefgehende Analysen spezialisierte Gemini 3 Deep Think, das zunächst Sicherheitstests durchläuft.

KI Assistant

PhD-Niveau und neue Benchmarks

Technisch gesehen positioniert Google Gemini 3 Pro als das derzeit führende Modell im Bereich des multimodalen Verständnisses. In der Ankündigung werden signifikante Leistungssteigerungen gegenüber dem Vorgänger (2.5 Pro) hervorgehoben. Das Modell führt das LMArena-Ranking mit 1.501 Punkten an und zeigt laut Google komplexe Schlussfolgerungen auf PhD-Niveau.

Besonders bemerkenswert sind die Ergebnisse in standardisierten Tests:

  • GPQA Diamond: 91,9 % (Fachwissen auf Expertenniveau).
  • Humanity’s Last Exam: 37,5 % (ohne Tools).
  • MathArena Apex: 23,4 % (ein neuer Bestwert für mathematische Modelle).
  • SimpleQA Verified: 72,1 % (ein Indikator für hohe faktische Genauigkeit und weniger „Halluzinationen“).

Google betont zudem eine Änderung im Interaktionsstil: Gemini 3 soll weniger zu Schmeicheleien oder Klischees neigen und stattdessen präzisere, direktere und nuancierte Antworten liefern.

Deep Think: Der Modus für komplexe Logik

Zusätzlich zum Pro-Modell wurde der „Deep Think“-Modus angekündigt. Dieser Modus ist darauf ausgelegt, die Grenzen des logischen Denkens („Reasoning“) weiter zu verschieben. In internen Tests übertrifft er die Pro-Version deutlich, etwa beim Humanity’s Last Exam mit 41,0 % und beim ARC-AGI Benchmark (45,1 % mit Code-Nutzung). Dieser Modus soll in den kommenden Wochen für Abonnenten von Google AI Ultra verfügbar gemacht werden, nachdem externe Sicherheitsbewertungen abgeschlossen sind.

Multimodales Lernen und Kontextverständnis

Ein Kernmerkmal von Gemini 3 bleibt das riesige Kontextfenster von einer Million Tokens, gepaart mit der Fähigkeit, Text, Bild, Audio, Video und Code nahtlos zu verarbeiten. Dies ermöglicht neue Anwendungsfälle im Bereich Lernen und Analyse.

In der Praxis bedeutet das: Nutzer können dem Modell wissenschaftliche Arbeiten oder lange Videovorträge übergeben, woraus Gemini 3 interaktive Lernmaterialien oder Code für Visualisierungen erstellt. Auch im sportlichen Bereich demonstriert Google die Fähigkeiten: Das Modell kann beispielsweise Videos eines Pickleball-Spiels analysieren und basierend auf der visuellen Auswertung konkrete Trainingspläne zur Technikverbesserung erstellen.

Die Ära des „Agentic Coding“ und Google Antigravity

Vielleicht die größte Neuerung betrifft Entwickler. Google beschreibt Gemini 3 als das bisher leistungsfähigste Modell für „Vibe Coding“ und „Agentic Coding“ – also das Programmieren durch KI-Agenten.

Mit einem Elo-Wert von 1487 führt es die WebDev Arena an und zeigt im Terminal-Bench 2.0 (54,2 %), dass es Computer über Terminals bedienen kann. Um diese Fähigkeiten zu nutzen, führt Google eine neue Plattform namens Google Antigravity ein.

Antigravity verändert die Rolle der KI vom bloßen Assistenten zum aktiven Partner. In dieser neuen Entwicklungsumgebung (IDE) agieren KI-Agenten autonomer:

  • Sie haben direkten Zugriff auf Editor, Terminal und Browser.
  • Sie können Aufgaben planen, ausführen und ihren eigenen Code validieren.
  • Unterstützt werden sie dabei vom „Gemini 2.5 Computer Use“-Modell (Browsersteuerung) und einem neuen Bildmodell namens „Nano Banana“ (Gemini 2.5 Image).

Gemini 3 ist zudem bereits in gängige Entwickler-Tools wie Cursor, GitHub, JetBrains und Replit integriert.

Langfristige Planung und Alltagshilfe

Über das Programmieren hinaus zielt Gemini 3 darauf ab, als zuverlässigerer persönlicher Agent im Alltag zu fungieren. Im Vending-Bench 2, einem Test für langfristige Planung in simulierten Umgebungen, belegt das Modell den ersten Platz.

Das Ziel ist, dass die KI komplexe, mehrstufige Workflows übernimmt – wie etwa das Buchen lokaler Dienstleistungen oder die vollständige Organisation des E-Mail-Posteingangs. Diese „Agentic“-Funktionen werden zunächst in den USA unter dem Namen Gemini Agent für Ultra-Abonnenten ausgerollt.

Sicherheit und Verfügbarkeit

Google unterstreicht, dass Gemini 3 trotz gestiegener Autonomie das bisher sicherste Modell sei. Es wurde umfangreich gegen „Prompt Injections“ und Cyberangriffe gehärtet und zeigt eine geringere Tendenz, Nutzern blind zuzustimmen („Ja-Sagerei“). Unabhängige Bewertungen erfolgten unter anderem durch das UK AI Security Institute.

Verfügbarkeit:

  • Gemini 3 Pro ist ab sofort in der Gemini App, in Google AI Studio sowie für Unternehmen via Vertex AI verfügbar.
  • In der Google Suche unterstützt es nun den KI-Modus für Abonnenten.
  • Der Deep Think-Modus folgt in Kürze für Ultra-Abonnenten.

Quelle: Gemini 3: Eine neue KI-Ära beginnt

Werbung & Infos:

Aktuelles Bitdefender Angebot


Verwandte Themen: