“Ergebnisverzerrung ist ein systematischer Fehler bei der Bewertung der Qualität einer Entscheidung auf der Grundlage ihres Endergebnisses, wobei der Entscheidungsprozess und die Rolle des Zufalls ignoriert werden”

cognitive-biasesL12026-02-09T00:00:00.000Z

🔬

Analysis

Behauptung: Der Ergebnisverzerrung (Outcome Bias) ist ein systematischer Fehler bei der Bewertung der Qualität einer Entscheidung auf der Grundlage ihres Endergebnisses, wobei der Entscheidungsprozess und die Rolle des Zufalls ignoriert werden
Urteil: WAHR
Evidenzniveau: L1 — mehrere systematische Übersichtsarbeiten und empirische Studien bestätigen die Existenz des Phänomens
Schlüsselanomalie: Entscheidungen mit erfolgreichen Ergebnissen werden 2,2- bis 4,7-mal günstiger bewertet als identische Entscheidungen mit erfolglosen Ergebnissen, unabhängig von der Qualität des Entscheidungsprozesses
30-Sekunden-Überprüfung: Fragen Sie sich: Würden Sie einen Chirurgen, dessen Patient an einer unvorhergesehenen Komplikation starb, genauso streng bewerten wie einen Chirurgen, dessen Patient nach demselben Eingriff mit denselben Risiken überlebte? Wenn nicht, unterliegen Sie der Ergebnisverzerrung

Steelman — was Befürworter des Konzepts behaupten

Die Ergebnisverzerrung (Outcome Bias) stellt einen fundamentalen kognitiven Fehler bei der Bewertung der Qualität von Entscheidungen dar. Gemäß der klassischen Definition ist es die Tendenz, die Qualität einer Entscheidung auf der Grundlage ihres Endergebnisses zu beurteilen, anstatt auf der Grundlage der Qualität des Entscheidungsprozesses selbst (S011). Das Phänomen wurde systematisch in der klassischen Arbeit von Baron und Hershey (1988) dokumentiert, die zeigte, dass Entscheidungen, die zu erfolgreichen Ergebnissen führten, signifikant günstiger bewertet wurden als dieselben Entscheidungen, die zu Misserfolgen führten (S005).

Der wesentliche Unterschied zwischen Ergebnisverzerrung und Rückschaufehler (Hindsight Bias) liegt im Fokus: Der Rückschaufehler bezieht sich auf die Verzerrung des Gedächtnisses zugunsten des Handelnden, während die Ergebnisverzerrung sich ausschließlich darauf konzentriert, dem Ergebnis ein größeres Gewicht als anderen Informationsfragmenten bei der Bewertung einer vergangenen Entscheidung zu verleihen (S018). Dies bedeutet, dass selbst bei vollständigen Informationen über den Entscheidungsprozess, den Kontext und die Wahrscheinlichkeiten Beobachter systematisch die Bedeutung des Endergebnisses überbewerten.

Forscher argumentieren, dass die Ergebnisverzerrung drei bisher unerforschte Aspekte hat: (1) die Antizipation und Manipulation der Ergebnisverzerrung durch Agenten, (2) die Ergebnisverzerrung unter Dritten, und (3) die Aktualisierung von Überzeugungen unter dem Einfluss der Ergebnisverzerrung (S006). Empirische Daten zeigen, dass Agenten Prinzipale strategisch manipulieren, indem sie das Wissen über die Ergebnisverzerrung nutzen, obwohl Prinzipale keine Verpflichtungsmechanismen verwenden, um dem entgegenzuwirken.

Was die Evidenz tatsächlich zeigt

Die empirische Grundlage für die Existenz der Ergebnisverzerrung ist außerordentlich robust. Eine systematische Übersichtsarbeit der empirischen Evidenz zeigte, dass statistisch signifikante Ergebnisse eine 2,2- bis 4,7-mal höhere Wahrscheinlichkeit hatten, vollständig dargestellt zu werden, im Vergleich zu nicht signifikanten Ergebnissen (S002, S003). Dieses Verhältnis bleibt über verschiedene Kontexte und Disziplinen hinweg stabil.

Im Kontext systematischer Übersichtsarbeiten gewinnt das Problem besondere Schärfe. Eine Querschnittsanalyse von Cochrane-Übersichtsarbeiten ergab, dass 43% (150 von 350) der Übersichtsarbeiten Diskrepanzen in der Berichterstattung von Ergebnissen zwischen Protokoll und veröffentlichter Übersichtsarbeit enthielten, wobei 23% (35 von 150) als hohes Risiko für Ergebnisverzerrung klassifiziert wurden (S004). Kritischerweise berichteten nur 6% der Übersichtsarbeiten mit Diskrepanzen die Gründe für die Änderungen, und null Übersichtsarbeiten mit potenziell verzerrten Diskrepanzen erkannten diese Änderungen an (S004).

Die Analyse aufeinanderfolgender Ausgaben der Cochrane-Bibliothek zeigte, dass 22% (64 von 288) der Übersichtsarbeiten Diskrepanzen in den Ergebnissen aufwiesen, wobei 75% dieser Diskrepanzen primäre Ergebnisse betrafen (S005). Ergebnisse, die von sekundär zu primär hochgestuft wurden, waren 1,66-mal wahrscheinlicher statistisch signifikant (relatives Risiko 1,66, 95%-Konfidenzintervall 1,10-2,49) (S005). Dies liefert direkte quantitative Evidenz dafür, dass das Wissen über Ergebnisse die Entscheidungen darüber beeinflusst, welche Ergebnisse hervorgehoben werden.

Eine aktuelle Studie von 2023 führte eine vorregistrierte Replikation des klassischen Experiments von Baron und Hershey mit einer Online-Stichprobe durch und bestätigte die Robustheit des Phänomens der Ergebnisverzerrung unter zeitgenössischen Bedingungen (S005, S019). Dies zeigt, dass der Effekt kein Artefakt historischer Methodologien oder spezifischer Populationen ist.

Im Bereich der medizinischen Forschung zeigte eine systematische Übersichtsarbeit, dass Ergebnisverzerrung ein Problem in neurologischen Fachzeitschriften mit hohem Impact-Faktor ist (S001, S008). In der Überprüfung von 42 Metaanalysen mit statistisch signifikanten Ergebnissen wurden acht (19%) nach Korrektur für Ergebnisverzerrung nicht signifikant, und 11 (26%) überschätzten den Effekt (S001). Dies hat direkte Konsequenzen für die klinische Praxis und Entscheidungsfindung im Gesundheitswesen.

Konflikte und Unsicherheiten

Trotz der robusten empirischen Grundlage gibt es wichtige Nuancen und Einschränkungen im Verständnis der Ergebnisverzerrung. Eine Studie von 2025 untersuchte, ob Leistungsdruck die Ergebnisverzerrung verstärkt, und argumentierte, dass beobachtete Ergebnisse, die nicht den Erwartungen entsprechen, gleichzeitig Leistungsdruck verursachen, was die Ergebnisverzerrung verstärken kann (S002). Dies deutet darauf hin, dass der Effekt durch kontextuelle Faktoren wie Stress und Erwartungen moduliert werden kann.

Eine wichtige Unterscheidung muss zwischen legitimen Änderungen von Ergebnissen und Ergebnisverzerrung getroffen werden. Nicht alle Änderungen in der Spezifikation von Ergebnissen stellen eine Verzerrung dar: Es können begründete Gründe für die Änderung von Ergebnissen existieren, wie neue wissenschaftliche Daten oder Machbarkeitsprobleme (S004). Die Schlüsselfrage liegt in der Transparenz und darin, ob die Änderungen nach Kenntnis der Ergebnisse vorgenommen wurden.

Eine Studie über Lungenentzündung, die subjektive versus objektive Ergebnisse untersuchte, fand keine allgemeinen Beweise für Verzerrung, die durch subjektive Ergebnisse in Nicht-Unterlegenheitsstudien verursacht wurde, obwohl dies je nach Zustand und Kontext variieren kann (S006). Dies deutet darauf hin, dass die Art des gemessenen Ergebnisses auf komplexe Weise mit der Ergebnisverzerrung interagieren kann.

Die Rolle des Sponsorings bleibt unklar. Obwohl Sponsoring-Effekte existieren, wird Ergebnisverzerrung sowohl in industriegesponserten als auch in nicht gesponserten Übersichtsarbeiten gefunden (S006). Die geringe Anzahl nicht gesponserter Studien in einigen Analysen verhindert eine angemessene Bewertung des Sponsorings als einzigem Faktor.

Eine aktuelle Studie von 2025 untersuchte, wie Ergebnisverzerrung die Wahrnehmung individueller Verantwortung im Kontext von Sicherheitsuntersuchungen beeinflusst, und stellte fest, dass "Ermittler auch Menschen sind" und denselben kognitiven Verzerrungen unterliegen (S003). Dies wirft Fragen darauf auf, wie berufliche Ausbildung und institutionelle Strukturen die Ergebnisverzerrung mildern oder verschärfen können.

Interpretationsrisiken

Es gibt mehrere kritische Risiken der Fehlinterpretation der Evidenz über Ergebnisverzerrung:

Risiko 1: Ablehnung aller ergebnisbasierten Bewertungen. Obwohl Ergebnisverzerrung ein reales Phänomen ist, liefern Ergebnisse tatsächlich wertvolle Informationen über die Qualität von Entscheidungen in einigen Kontexten. Der Schlüssel liegt darin, Informationen über Ergebnisse mit Informationen über den Prozess auszubalancieren, anstatt Ergebnisse vollständig zu ignorieren (S012, S013).

Risiko 2: Annahme, dass alle Diskrepanzen in Ergebnissen Verzerrung sind. Wie oben erwähnt, existieren legitime Gründe für die Änderung von Ergebnisspezifikationen. Das Kriterium für Verzerrung ist, ob die Änderungen nach Kenntnis der Ergebnisse und ohne transparente Berichterstattung vorgenommen wurden (S004, S005).

Risiko 3: Überschätzung der Fähigkeit von Menschen, Ergebnisverzerrung zu vermeiden. Die Evidenz zeigt, dass selbst Experten und Fachleute anfällig für diese Verzerrung sind. Eine Studie über Sicherheitsermittler fand, dass Ergebnisverzerrung die Wahrnehmung individueller Verantwortung selbst unter ausgebildeten Fachleuten beeinflusst (S003). Dies deutet darauf hin, dass das Bewusstsein für die Verzerrung allein möglicherweise nicht ausreicht, um sie zu verhindern.

Risiko 4: Verwechslung von Ergebnisverzerrung mit Rückschaufehler. Obwohl verwandt, sind dies unterschiedliche Phänomene. Der Rückschaufehler beinhaltet den Glauben, dass man es "die ganze Zeit wusste", während die Ergebnisverzerrung die Beurteilung der Entscheidungsqualität auf der Grundlage des Ergebnisses beinhaltet (S018). Diese Unterscheidung ist wichtig für die Gestaltung angemessener Interventionen.

Risiko 5: Ignorieren der Rolle kontextueller Faktoren. Die Forschung deutet darauf hin, dass Faktoren wie Leistungsdruck, die Art des Ergebnisses (subjektiv vs. objektiv) und der berufliche Kontext die Stärke der Ergebnisverzerrung modulieren können (S002, S006). Interventionen müssen diese kontextuellen Faktoren berücksichtigen.

Die überzeugendste Evidenz für Ergebnisverzerrung stammt aus Studien, die zeigen, dass identische Entscheidungen dramatisch unterschiedlich bewertet werden, ausschließlich auf der Grundlage des Ergebnisses. Im Kontext der medizinischen Forschung hat dies dazu geführt, dass Behandlungen als mehr oder weniger wirksam angesehen werden, nicht auf der Grundlage der Qualität der Evidenz, sondern darauf, ob die berichteten Ergebnisse statistisch signifikant waren (S001, S008). Dies hat tiefgreifende Implikationen für evidenzbasierte Medizin und öffentliche Gesundheitspolitik.

Das Phänomen ist besonders problematisch in Hochrisikokontexten wie Luftfahrt, Medizin und Finanzen, wo Entscheidungen unter Unsicherheit getroffen werden müssen und wo Ergebnisse durch Faktoren außerhalb der Kontrolle des Entscheidungsträgers beeinflusst werden können. Die Forschung zeigt, dass selbst wenn Bewerter vollständigen Zugang zu Informationen über den Entscheidungsprozess haben, das Wissen über das Ergebnis ihr Urteil kontaminiert (S005, S019).

Die Implikationen für die Praxis sind erheblich. In der medizinischen Forschung bedeutet dies, dass Metaanalysen und systematische Übersichtsarbeiten möglicherweise die Wirksamkeit von Behandlungen über- oder unterschätzen, basierend darauf, welche Ergebnisse berichtet wurden (S001, S008). In Sicherheitsuntersuchungen bedeutet dies, dass Individuen möglicherweise unfair für Ergebnisse verantwortlich gemacht werden, die außerhalb ihrer Kontrolle lagen (S003). In der Finanzwelt bedeutet dies, dass Investitionsentscheidungen möglicherweise auf der Grundlage von Glück statt Können bewertet werden.

💡

Examples

Bewertung einer Operation nach Ergebnis

Ein Chirurg traf die Entscheidung zu operieren, basierend auf allen verfügbaren Daten und Standardprotokollen, aber der Patient starb aufgrund einer unvorhergesehenen Reaktion auf die Anästhesie. Die Krankenhausverwaltung kritisiert die Entscheidung des Chirurgen ausschließlich aufgrund des negativen Ergebnisses und ignoriert die Korrektheit des Entscheidungsprozesses. Zur Überprüfung müssen medizinische Unterlagen und Protokolle untersucht werden, um zu bewerten, ob die Handlungen des Chirurgen zum Zeitpunkt der Entscheidung gerechtfertigt waren. Es ist wichtig, die statistische Wahrscheinlichkeit von Komplikationen und die Rolle zufälliger Faktoren außerhalb der Kontrolle des Arztes zu berücksichtigen.

Investitionsentscheidung und Marktcrash

Ein Finanzanalyst empfahl ein diversifiziertes Aktienportfolio basierend auf gründlicher Analyse und angemessener Risikobewertung. Einen Monat später ereignete sich eine unvorhersehbare geopolitische Krise, und der Markt brach zusammen, was den Anlegern Verluste brachte. Kunden beschuldigen den Analysten der Inkompetenz und bewerten nur das Endergebnis. Für eine objektive Bewertung muss die Qualität der Forschung zum Zeitpunkt der Empfehlung analysiert, mit Marktstandards verglichen und die Unmöglichkeit der Vorhersage zufälliger Ereignisse berücksichtigt werden.

Entscheidung des Piloten im Notfall

Ein Pilot stand vor einem Triebwerksausfall und entschied sich für eine Notlandung auf einer Autobahn, wobei er alle Anweisungen und Sicherheitsprotokolle befolgte. Leider traf das Flugzeug bei der Landung einen Lastwagen, was zu Opfern unter den Passagieren führte. Die Untersuchung konzentrierte sich zunächst auf das negative Ergebnis und beschuldigte den Piloten falscher Handlungen. Eine objektive Überprüfung erfordert die Analyse der Handlungen des Piloten im Kontext verfügbarer Informationen, zeitlicher Einschränkungen und alternativer Optionen, die zu noch schlimmeren Folgen hätten führen können.

🚩

Red Flags

•Die Entscheidungsbewertung ändert sich basierend auf dem bekannten Ergebnis statt auf der Qualität des Entscheidungsprozesses
•Ergebnisse mit statistischer Signifikanz haben eine 2,2-4,7-fach höhere Wahrscheinlichkeit, vollständig berichtet zu werden
•40-62% der Studien haben mindestens ein primäres Ergebnis, das beim Vergleich von Protokoll und Publikation geändert, eingeführt oder weggelassen wurde
•22-43% der systematischen Reviews enthalten Diskrepanzen in der Ergebnisberichterstattung zwischen Protokoll und veröffentlichtem Review
•Nur 4-6% der Reviews mit Ergebnisdiskrepanzen beschreiben die Gründe für Änderungen im veröffentlichten Review
•Von sekundär zu primär hochgestufte Ergebnisse sind 1,66-mal wahrscheinlicher statistisch signifikant (95% KI: 1,10-2,49)
•75% der Diskrepanzen in Cochrane-Reviews sind auf Änderungen bei primären Endpunkten zurückzuführen

🛡️

Countermeasures

✓
Alle primären und sekundären Endpunkte im Protokoll vor Studienbeginn klar spezifizieren und Protokoll in öffentlicher Datenbank registrieren (z.B. PROSPERO)
✓
Ergebnisse in eingeschlossenen Studien systematisch mit ihren Protokollen vergleichen und alle Diskrepanzen mit Begründung dokumentieren
✓
Risiko für Ergebnisverzerrung für jede Studie mit standardisierten Instrumenten bewerten (z.B. COSMIN-Checkliste für PROMs)
✓
Sensitivitätsanalysen durchführen unter Ausschluss von Studien mit hohem Risiko für Ergebnisverzerrung und statistische Methoden zur Anpassung selektiver Berichterstattung anwenden
✓
Autoren zur Bereitstellung von Links zu registrierten Protokollen verpflichten und Konsistenz zwischen Protokoll und veröffentlichtem Review überprüfen
✓
Entscheidungsqualität auf Basis der zum Entscheidungszeitpunkt verfügbaren Informationen bewerten, nicht auf Basis des bekannten Ergebnisses
✓
Verpflichtende transparente Berichterstattung aller Ergebnisänderungen mit expliziter Begründung und Angabe, ob Änderungen nach Kenntnis der Ergebnisse vorgenommen wurden

📚

Sources

Level: L1

Category: cognitive-biases

Author: AI-CORE LAPLACE

#outcome-bias#cognitive-bias#research-methodology#systematic-reviews#evidence-based-medicine#publication-bias#decision-making