Zum Inhalt springen
EN DE

Wann AI

Dein Stakeholder will einen “AI-powered” Workflow. Dein Engineering-Team kann das bauen. Die Frage, die niemand stellt: Braucht dieses Problem überhaupt AI?

Als PM ist Deine wichtigste Faehigkeit nicht, AI einzusetzen — sondern zu erkennen, wann Du es nicht tun solltest. Denn die teuersten AI-Projekte sind nicht die, die scheitern. Es sind die, die ein Problem loesen, das keins war.

Nicht jedes Problem ist ein AI-Problem. Die entscheidende Frage: Ist das Problem deterministisch oder probabilistisch?

DeterministischProbabilistisch
LogikKlar, stabil, dokumentierbarMehrdeutig, kontextabhaengig
RegelnEndliche If-Then-KettenZu viele Ausnahmen für Regeln
ErgebnisEin “richtiges” ErgebnisKein einzelnes “richtiges” Ergebnis
BeispielSteuerberechnung, ValidierungSentiment-Analyse, Empfehlungen

Wann Rule-Based reicht: Logik klar und stabil, Entscheidungen müssen auditierbar sein, Prozesse sind wiederholbar.

Wann AI/ML Sinn macht: Kein einzelnes “richtiges” Ergebnis, System verbessert sich mit mehr Daten, Regeln haben zu viele Ausnahmen.

Die Realität: Die meisten Enterprise-Probleme sind Hybride. Dein Login-Flow ist deterministisch. Deine Fraud Detection ist probabilistisch. Beides im selben Produkt.

Die Zahlen sind ernuechternd:

  • 64% der User würden Features deaktivieren oder Produkte verlassen, wenn AI-Features aufgezwungen werden (ZDNET/Aberdeen)
  • Nur 5-30% der AI-Implementierungen liefern messbaren P&L-Impact — je nach Studie und Definition (MIT Sloan Management Review 2025, McKinsey Global AI Survey 2024)
  • Nur 1 von 4 AI-Projekten liefert den versprochenen ROI, nur 16% skalieren unternehmensweit (IBM, 2025)

Das Problem ist selten die Technologie. Das Problem ist, dass kein klares User-Problem existierte, bevor jemand “AI” auf die Roadmap geschrieben hat.

  • Humane AI Pin & Rabbit R1: “A solution looking for a problem” (Logitech CEO). Hardware-Produkte ohne klaren Use Case.
  • McDonald’s AI Drive-Thru (IBM): Nach 3 Jahren gestoppt. Virales TikTok-Video: 260 McNuggets bestellt, weil das System Hintergrundgeraeusche als Bestellungen interpretierte.
  • United Healthcare: 90% Fehlerrate bei einem spezifischen Algorithmus (nH Predict) für Post-Acute-Care-Ablehnungen (STAT News Investigation).
  • Google AI Overviews: “Put glue on pizza”-Empfehlungen. Deployment ohne ausreichende Error Tolerance Definition.

5 Check-Fragen bevor Du AI auf die Roadmap setzt:

#FrageNein = Warnsignal
1Ist das Problem probabilistisch?Rule-Based Engine reicht vermutlich
2Verbessert sich das System mit mehr Daten?Statische Lösung ist effizienter
3Gibt es genug qualitative Trainingsdaten?Cold-Start-Problem, hohe Anfangsinvestition
4Ist die Fehlertoleranz akzeptabel?High-Stakes-Domain ohne Human Review = Risiko
5Uebersteigt der erwartete Wert die AI-spezifischen Kosten?Variable LLM-Kosten in Fixed Subscriptions = Unit-Economics-Problem

Alle 5 mit Ja? AI ist ein valider Ansatz. Eine oder mehr mit Nein? Pruefe Alternativen, bevor Du AI commitest.

Du bist PM bei einem B2B-SaaS für Rechnungsverarbeitung. Der VP Product will “AI-powered Invoice Processing” auf der Roadmap. Aktuell nutzt Ihr Template-basierte OCR mit festen Regeln.

Die Situation:

  • 120.000 Rechnungen/Monat, 85% folgen 4 Standardformaten
  • Aktuelle Rule-Based Accuracy: 94% für Standardformate, 45% für Sonderformate
  • AI-Modell im Eval: 96% für Standard, 82% für Sonderformate
  • AI-Kosten: $0.03 pro Rechnung (LLM-basiert) vs. $0.001 pro Rechnung (Rule-Based)
  • 15% der Rechnungen (Sonderformate) verursachen 60% des manuellen Aufwands

Optionen:

  1. Alles auf AI umstellen: 96%/82% Accuracy, $3.600/Monat
  2. Alles Rule-Based lassen: 94%/45% Accuracy, $120/Monat
  3. Hybrid: Rule-Based für Standardformate, AI nur für Sonderformate
Wie wuerdest Du entscheiden?

Die beste Entscheidung: Option 3 — Hybrid.

Warum:

  • Standardformate: Rule-Based liefert 94% bei 30x niedrigeren Kosten. Die 2% Verbesserung durch AI rechtfertigt nicht den 30-fachen Preisanstieg
  • Sonderformate: AI verbessert von 45% auf 82% — das ist der echte Hebel. Diese 15% der Rechnungen verursachen 60% des manuellen Aufwands
  • Hybrid-Kosten: ~$660/Monat (Rule-Based für 102k Standard + AI für 18k Sonder) statt $3.600

Die PM-Fehler in diesem Szenario:

  • “Bolt-On AI”: AI draufschrauben ohne den Workflow neu zu denken. Rule-Based funktioniert für 85% der Faelle — warum ersetzen?
  • Modelle als Strategie: Das Modell ist austauschbar. Dein Wettbewerbsvorteil liegt in der Daten-Pipeline und den Validierungsregeln.
  • Unit Economics ignorieren: $0.03 pro Rechnung klingt billig — bis Du 120k Rechnungen/Monat durchrechnest.
  • AI ist eine Lösung, kein Feature. Starte beim Problem, nicht bei der Technologie. Wenn Du nicht erklären kannst welches User-Problem AI loest, hast Du keins.
  • Die meisten Probleme sind Hybride. Deterministisch wo möglich, probabilistisch wo noetig. Das spart Kosten und reduziert Fehler.
  • Fehlertoleranz vor Deployment definieren. McDonald’s, United Healthcare und Google haben gezeigt, was passiert, wenn man das nicht tut.
  • Unit Economics durchrechnen. Variable LLM-Kosten in Fixed-Price-Subscriptions sind ein Geschaeftsmodell-Risiko, kein technisches Detail.

Quellen: ZDNET/Aberdeen Consumer AI Survey (2024), MIT Sloan “AI Implementation Strategies” (2025), IBM Global AI Adoption Index (2025), Logitech CEO Bracken Darrell on Humane/Rabbit (2024), McDonald’s/IBM Drive-Thru Pilot Post-Mortem (2024)

Part of AI Learning — free courses from prompt to production. Jan on LinkedIn