ModelleToolsForschung

Gemini 3.5 Flash erhält natives Computer-Use für Agenten

Google hat Computer-Use direkt in Gemini 3.5 Flash integriert, sodass das Modell Bildschirme sehen, verstehen und selbstständig bedienen kann.

Im Detail

  • Das Modell kann jetzt Browser, Mobile-Geräte und Desktop-Umgebungen eigenständig steuern – vorher war dies nur über ein separates Gemini-2.5-Modell möglich.
  • Auf dem OSWorld-Benchmark erreicht Gemini 3.5 Flash 78,4 Punkte und schlägt damit GPT-5.4 mini (72,1), liegt aber hinter Anthropic Opus 4.8 (83,4).
  • Google nutzt adversariales Training und optionale Enterprise-Safeguards gegen Prompt-Injection-Attacken; Sandboxing und menschliche Überwachung werden empfohlen.

Warum es zählt

Für Unternehmen, die Automatisierung von Büroprozessen, Software-Tests oder Datenverarbeitung planen, wird die direkte Bildschirmsteuerung durch AI-Agenten ein Schlüsselfaktor – das spart Entwicklungszeit und eröffnet neue Anwendungsfälle.

Für dich Erkunde, wie du Gemini 3.5 Flash mit Computer-Use für Automatisierung von wiederkehrenden Aufgaben in deinen Systemen einsetzen könntest – besonders für RPA-ähnliche Szenarien.

← Alle News

Zusammenfassungen werden automatisch erstellt und verlinken auf die Originalquelle.