Gemini 3.5 Flash erhält natives Computer-Use für Agenten

Im Detail

Das Modell kann jetzt Browser, Mobile-Geräte und Desktop-Umgebungen eigenständig steuern – vorher war dies nur über ein separates Gemini-2.5-Modell möglich.
Auf dem OSWorld-Benchmark erreicht Gemini 3.5 Flash 78,4 Punkte und schlägt damit GPT-5.4 mini (72,1), liegt aber hinter Anthropic Opus 4.8 (83,4).
Google nutzt adversariales Training und optionale Enterprise-Safeguards gegen Prompt-Injection-Attacken; Sandboxing und menschliche Überwachung werden empfohlen.

Warum es zählt

Für Unternehmen, die Automatisierung von Büroprozessen, Software-Tests oder Datenverarbeitung planen, wird die direkte Bildschirmsteuerung durch AI-Agenten ein Schlüsselfaktor – das spart Entwicklungszeit und eröffnet neue Anwendungsfälle.

Für dich Erkunde, wie du Gemini 3.5 Flash mit Computer-Use für Automatisierung von wiederkehrenden Aufgaben in deinen Systemen einsetzen könntest – besonders für RPA-ähnliche Szenarien.

Quellen

The Decoder

Zusammenfassungen werden automatisch erstellt und verlinken auf die Originalquelle.