Zum Inhalt springen
EN DE

ChatGPT Agent Mode: AI im Web

L4 Lektion 3 von 5 — AI als Coworker
1
2
3
4
5

Claude Cowork arbeitet auf deinem Computer — mit deinen lokalen Dateien. ChatGPT Agent Mode OpenAIs agentic Feature in ChatGPT, das einen visuellen Browser, Code-Ausführung, Dateibearbeitung und App-Integrationen kombiniert. Der Agent arbeitet in der Cloud und kann eigenständig mehrstufige Aufgaben im Web ausführen. arbeitet in der Cloud — mit einem eigenen virtuellen Browser, der Websites navigieren, Formulare ausfüllen und Online-Aufgaben erledigen kann.

Beide lösen dasselbe Problem: AI, die nicht nur antwortet, sondern handelt. Aber die Stärken liegen an unterschiedlichen Stellen.

Agent Mode vereint drei Fähigkeiten, die OpenAI ursprünglich separat entwickelt hat:

KomponenteWas sie tutUrsprünglich
Visueller BrowserNavigiert Websites, klickt, scrollt, füllt FormulareOperator (Jan 2025)
Deep ResearchDurchsucht das Web 5–30 Minuten, analysiert Hunderte QuellenDeep Research (Feb 2025)
ChatGPT-KernKonversation, Code-Ausführung, DateibearbeitungChatGPT
ToolFunktion
Visueller BrowserInteragiert mit Websites über GUI (klicken, scrollen, tippen)
Text-BrowserEinfachere, reasoning-basierte Web-Abfragen
TerminalCode-Ausführung (Python), Datenanalyse
DateisystemSpreadsheets, Präsentationen, Dokumente erstellen
AppsGmail, Google Calendar, Drive, GitHub, Slack, Notion, HubSpot u.a.
  • “Schau in meinen Kalender und briefe mich über anstehende Meetings basierend auf aktuellen News der Teilnehmer.”
  • “Recherchiere die drei grössten Wettbewerber in unserem Markt und erstelle ein Vergleichs-Slide-Deck.”
  • “Finde die günstigsten Flüge nach Berlin nächste Woche und erstelle eine Vergleichstabelle.”

Deep Research verdient besondere Erwähnung, weil es eine Aufgabe löst, die Knowledge Worker täglich haben: Umfassende Recherche mit Quellen.

  • Durchsucht eigenständig das Web für 5–30 Minuten
  • Analysiert Hunderte Quellen
  • Erstellt strukturierte Reports mit Zitaten
  • Kann den Scope auf bestimmte Websites einschränken
  • Kann mit hochgeladenen Dateien arbeiten
PlanDeep Research Queries/Monat
Free5
Plus ($20)25
Pro ($200)250

Einschränkung: Gelegentliche Halluzinationen. Quellen immer stichprobenartig prüfen.

ChatGPT kann wiederkehrende Aufgaben planen:

  • Einmalig, täglich, wöchentlich, monatlich oder jährlich
  • Maximum: 10 aktive Tasks gleichzeitig
  • Funktioniert auf Web, Desktop und Mobile

Beispiele:

  • “Jeden Freitag: Wochenendplan basierend auf Wetter und Standort”
  • “Jeden Montag: Zusammenfassung meiner GitHub-Aktivitäten”
  • “Täglich um 7 Uhr: News-Briefing zu meiner Branche”
PlanPreisAgent ModeDeep Research
Free$0Nein5/Monat
Plus$20/MonatJa (40 Msg/Monat)25/Monat
Pro$200/MonatJa (400 Msg/Monat)250/Monat
Team$25–30/User/MonatJa25/Monat

Wichtig: Nur initiale Anfragen zählen zum Kontingent. Nachfragen und Klärungen innerhalb eines Tasks nicht.

  • Web-Automation — der grösste Unterschied zu Cowork: Agent Mode kann Websites navigieren, Formulare ausfüllen, Online-Recherche mit Interaktion
  • Plattformübergreifend — Web, Desktop (Mac + Windows), iOS, Android
  • Deep Research — eine der besten verfügbaren Lösungen für umfassende Web-Recherche
  • App-Integrationen — Gmail, Calendar, Drive, Slack, Notion, GitHub u.v.m.
  • Kein lokaler Dateizugriff — alles läuft in der Cloud. Du kannst Dateien hochladen, aber Agent Mode kann nicht auf deine lokalen Ordner zugreifen
  • Anti-Bot-Blockaden — viele Websites (Amazon, LinkedIn, Social Media) blockieren den visuellen Browser
  • CAPTCHAs — braucht deine Hilfe bei “Ich bin kein Roboter”
  • Geschwindigkeit — Multi-Step-Tasks dauern 1–10 Minuten, weil jede Seite einzeln verarbeitet wird
  • Komplexe Authentifizierung — MFA, SSO-Redirects und OAuth sind problematisch
  • Audit-Problem — Agent-Aktionen sind in Logs nicht von User-Aktionen unterscheidbar
AspektClaude CoworkChatGPT Agent Mode
FokusDesktop und lokale DateienWeb und Cloud
Lokaler DateizugriffJa (Ordner-Sandbox)Nein
Web-BrowsingChrome-ExtensionEigener visueller Browser
PlattformenmacOS + Windows DesktopWeb, Desktop, iOS, Android
Sub-AgentsJa (parallel)Nein
Deep ResearchWebsuche mit Zusammenfassung5–30 Min autonome Recherche
Scheduled TasksJa (braucht offene App)Ja (bis 10 aktive)
Einstiegspreis$20/Monat$20/Monat
Beste fürDokumentenerstellung, DateiarbeitWeb-Automation, Recherche

Cowork, wenn du:

  • Mit lokalen Dateien arbeitest (PDFs organisieren, Excel-Analysen, Präsentationen)
  • Cross-App-Workflows brauchst (Excel → PowerPoint)
  • Primär am Desktop arbeitest

Agent Mode, wenn du:

  • Web-basierte Aufgaben hast (Recherche, Buchungen, Formulare)
  • Deep Research für umfassende Analysen brauchst
  • Mobil oder plattformübergreifend arbeiten willst

Beide, wenn du verschiedene Aufgabentypen hast — was für die meisten Knowledge Worker der Fall ist.

Aktiviere Agent Mode in ChatGPT (Tools-Dropdown oder /agent). Stelle eine mehrstufige Web-Aufgabe: “Finde die 3 meistzitierten Studien zum Thema [dein Arbeitsbereich] aus 2025 und fasse jede in 3 Sätzen zusammen.”

Starte eine Deep Research-Anfrage zu einem Thema, das du ohnehin recherchieren musst. Vergleiche den Output mit dem, was du in 30 Minuten selbst gefunden hättest.

Nimm eine Aufgabe und erledige sie mit Cowork und mit Agent Mode. Dokumentiere: Was war schneller? Was hatte höhere Qualität? Was war komfortabler?

Claude Cowork und ChatGPT Agent Mode repräsentieren zwei Philosophien: Desktop-first vs. Cloud-first. Beide werden besser, beide werden sich annähern. Für dich als Knowledge Worker ist die wichtigste Fähigkeit nicht, ein Tool perfekt zu beherrschen — sondern zu wissen, wann welches die richtige Wahl ist.

In der nächsten Lektion geht es um die vielleicht wichtigste Fähigkeit im Umgang mit AI-Agents: Trust Calibration — wann du vertrauen kannst, wann du prüfen musst und wie du das Verhältnis über Zeit kalibrierst.

Part of AI Learning — free courses from prompt to production. Jan on LinkedIn