
OpenAI hat am 17. Juli 2025 offiziell den neuen „ChatGPT Agent“ vorgestellt – eine Erweiterung, die ChatGPT ermöglicht, nicht nur zu beraten, sondern selbständig komplexe Aufgaben im Web und auf einer virtuellen Computerumgebung auszuführen. Damit schlägt OpenAI die Brücke zwischen Forschung und praktischer Anwendung und gibt Nutzern die Möglichkeit, Arbeitsabläufe von der Informationssuche bis zur Dokumentenerstellung vollständig zu automatisieren
Einheitliches agentisches System
Im Kern integriert der ChatGPT Agent verschiedene früher separat entwickelte Systeme („Operator“, „Deep Research“ etc.) in eine einheitliche Agenten‑Architektur. Diese vereint:
- einen visuellen Browser für grafische Oberflächen,
- einen textbasierten Browser für vereinfachte Web‑Abfragen,
- ein Terminal für Kommandozeilen‑Aktionen,
- direkten API‑Zugriff und
- Konnektoren zu Diensten wie Gmail oder GitHub.
Der Agent wählt proaktiv das jeweils optimale Werkzeug und behält den Kontext über alle Schritte hinweg bei, während der Nutzer jederzeit eingreifen oder weitere Informationen liefern kann
Neue Bestleistungen in Benchmarks
OpenAI gibt an, mit dem Agenten in mehreren renommierten Benchmarks neue Höchstwerte (State‑of‑the‑Art) erreicht zu haben:
- Humanity’s Last Exam (HLE): 41,6 Punkte auf Expertenniveau,
- FrontierMath: 27,4 % Genauigkeit in anspruchsvollen Mathematikfragen,
- DSBench: Übertrifft menschliche Performance in realistischer Data‑Science‑Aufgabe,
- SpreadsheetBench: 45,5 % Trefferquote bei Tabellenaufgaben (Copilot in Excel: 20 %),
- BrowseComp: 68,9 % Web‑Navigations‑Erfolg
Verfügbarkeit & Preise
Der ChatGPT Agent wird für Abonnenten der Pro‑, Plus‑ und Team‑Pläne bereits ausgerollt; Enterprise‑ und Education‑Kunden folgen in den kommenden Wochen. Pro‑Nutzer können bis zu 400 agentische Nachrichten pro Monat senden, Plus und Team jeweils 40. Weitere Kontingente sollen künftig erwerbbar sein, was einen neuen Preismodell‑Zweig andeutet :contentReference[oaicite:3]{index=3}.
Sicherheits‑ und Risikomanagement
Mit der Fähigkeit, Aktionen im Web und in Dritt‑App‑Konnektoren auszuführen, steigt das Gesamtrisiko. OpenAI hat dazu ein „Preparedness Framework“ eingeführt, das:
- kritische Aktionen nur nach expliziter Nutzerfreigabe erlaubt („Watch Mode“),
- prompt‑injection‑Angriffe durch spezielles Training erkennt,
- hochriskante Aufgaben wie Banküberweisungen ganz verwehrt,
- mehrschichtige Überwachung durch Klassifizierer und externe Red‑Teaming‑Expertise sicherstellt,
- und ein Bug‑Bounty‑Programm für praktische Sicherheitsfunde ins Leben gerufen hat.
Bedeutung und Ausblick
Der Start des ChatGPT Agent markiert einen entscheidenden Schritt hin zu autonomen KI‑Assistenten, die nicht mehr nur Ratschläge geben, sondern Handlungen für den Nutzer übernehmen. Während erste Praxistests noch Feinschliff in Formatierung und Zuverlässigkeit erfordern, legt OpenAI mit dieser Funktionalität den Grundstein für zukünftige Anwendungen in Wirtschaft, Forschung und Alltag.
Quellen: