3 Min. Lesezeit

Sollten wir KI-Vorhersagen mehr vertrauen als uns selbst? Meine Erfahrungen vom FMP Prediction Tournament

#KI#Forecasting#ChatGPT#Zukunft

Sollten wir KI-Vorhersagen mehr vertrauen als uns selbst?

Ich bin gerade Zweiter beim FMP Prediction Tournament geworden.

Über 60 Leute, 12 Vorhersagen aus Politik, Wirtschaft, Sicherheit und Popkultur. Um ehrlich zu sein: Selten war ich auf einen 2. Platz so stolz.

Aber ich muss eine unbequeme Frage stellen.

Ich habe ChatGPT (damals noch das O3-Modell im Thinking-Modus) genutzt. Für jede einzelne Frage.

Das Modell hat mir Wahrscheinlichkeiten ausgespuckt, Szenarien durchgespielt, Datenlagen zusammengefasst. Und es war verdammt hilfreich. Doch dann kam ein Moment, der mich aufhorchen ließ.

Die Taylor-Swift-Verlobung

Bei der Frage nach einer möglichen Taylor-Swift-Verlobung bis Ende 2025 hat mir die KI eine Wahrscheinlichkeit von 50 % ausgegeben.

Ich dachte: Das ist Quatsch. Mein Bauchgefühl sagt ganz klar „Nein“.

Dank meiner Frau kannte ich zu diesem Zeitpunkt nicht nur 36 Songtexte auswendig, sondern auch 471 Fakten über „Tay Tay“ 😅.

Und trotzdem: Es fiel mir superschwer, mich gegen ChatGPT zu entscheiden.

Und das ist das Learning, das mich tatsächlich am meisten mitnimmt und beschäftigt.

Die KI als ernstzunehmender Forecaster

KI wird jeden Tag besser im Forecasting. Aktuelle Modelle kommen fast auf das Niveau der besten menschlichen Prognostiker – der sogenannten Superforecaster.

Philipp Tetlocks berühmte Forschungen zu Superforecastern haben gezeigt, dass bestimmte Menschen durch strukturierte Denkweisen, kontinuierliche Aktualisierung ihrer Annahmen und den Vermeidung kognitiver Verzerrungen erstaunlich präzise Vorhersagen treffen können. Bisher waren diese Experten ungeschlagen.

Doch die Lage ändert sich gerade massiv. Ende 2025 und Anfang 2026 durchgeführte Analysen zeigen, dass fortgeschrittene Large Language Models (LLMs) die Lücke zu menschlichen Superforecastern extrem schnell schließen. Zwar liegen die weltbesten menschlichen Vorhersager derzeit (mit einem Brier-Score von etwa 0.081 gegenüber 0.101 bei Top-KI-Modellen) noch rund 20 % vorne, doch der durchschnittliche „Otto-Normal-Vorhersager“ wurde von der KI längst überholt. Experten gehen davon aus, dass KI-Modelle spätestens zwischen 2026 und 2028 endgültig mit den menschlichen Superforecastern gleichziehen werden.

Die Magie der Kombination

Die wahre Stärke liegt jedoch, wie so oft, nicht in der Entscheidung „Mensch ODER Maschine“, sondern in der Kombination von beiden. Wenn Menschen und KI zusammenarbeiten, verbessert sich die Vorhersagegenauigkeit um fast 30 %. Die KI ist exzellent darin, in Sekundenschnelle gewaltige Datenmengen, historische Vergleichsfälle und Wahrscheinlichkeiten zu verarbeiten, während der Mensch – und das ist der entscheidende Punkt – Kontextwissen und Bauchgefühl mitbringen kann. Ein Bauchgefühl, das aus Erfahrungen gespeist wird, die nicht in den Trainingsdaten der KI liegen. (Oder eben aus intensivem Swiftie-Wissen).

Fazit: Vertrauen ja, aber nicht blind

Wir stehen an der Schwelle zu einer Zeit, in der KI-Vorhersagen extrem präzise und für jedermann verfügbar werden. Forecasting wird günstiger, schneller und zugänglicher.

Die wichtigste Fähigkeit für uns wird es sein, diese Vorhersagen richtig einzuordnen. Wir dürfen der Maschine nicht blind vertrauen, wenn unser Kontext-Wissen etwas anderes sagt – auch wenn es schwerfällt. Gleichzeitig sollten wir aber die demutsvolle Erkenntnis zulassen, dass die KI oft objektiver und analytischer an Probleme herangeht als wir selbst.

Vertrauen wir also auf unsere eigenen Instinkte, lernen wir aber, die starken quantitativen und rationalen Einordnungen der KI als perfektes Gegenüber zu nutzen.

Wie nutzen Sie KI für strategische Entscheidungen? Vertrauen Sie eher dem Algorithmus oder Ihrem Bauchgefühl? Lassen Sie uns das gerne diskutieren!


Ausgewählte Quellen & Weiterführende Informationen

  • Studien von Philip Tetlock, u.a. über das “Good Judgment Project” und Superforecasting.
  • Aktuelle Metriken zur Prognosegüte (Brier-Scores) von LLMs im Vergleich zu menschlichen Experten.
BB

Benedikt Backhaus

Experte für KI, Automatisierung und die Zukunft der Arbeit. Ich helfe Unternehmen und Einzelpersonen dabei, die Potenziale neuer Technologien zu nutzen.

Mehr über mich →