Fast jeder HR-Fachmann ist dem Myers-Briggs Type Indicator (MBTI) begegnet. Er ist die weltweit kommerziell erfolgreichste Persönlichkeitsbewertung — allein im unternehmerischen Kontext nehmen ihn jährlich schätzungsweise 2,5 Millionen Menschen in Anspruch. Dennoch hat die wissenschaftliche Gemeinschaft jahrzehntelang auf seine Schwächen hingewiesen. Währenddessen hat das Big Five — auch als OCEAN bekannt — mehr als fünfzig Jahre peer-begutachteter, transkultureller Validierung angesammelt und bleibt das dominierende Rahmenwerk in der akademischen Persönlichkeitsforschung.
Welches sollte Ihr Team also tatsächlich verwenden? Die Antwort lautet nicht einfach „das, das intuitiver wirkt". Es hängt davon ab, was Sie messen möchten, wie präzise die Ergebnisse sein müssen und ob Sie bereit sind, die Bewertungen alle paar Monate zu wiederholen, wenn sich die Typen der Personen ändern.
Wie der MBTI funktioniert — und warum sein Typsystem wissenschaftlich problematisch ist
Der Myers-Briggs Type Indicator wurde von Isabel Briggs Myers und ihrer Mutter Katharine Cook Briggs in den 1940er Jahren entwickelt, basierend auf Carl Jungs Theorie der psychologischen Typen. Die Teilnehmer beantworten eine Reihe von Zwangsantwort-Fragen und werden einem von 16 diskreten Typen zugeordnet, die jeweils durch vier binäre Dimensionen definiert sind:
- E/I — Extraversion vs. Introversion
- S/N — Sensorik vs. Intuition
- T/F — Denken vs. Fühlen
- J/P — Urteilen vs. Wahrnehmen
Der Reiz liegt auf der Hand: 16 einprägsame Bezeichnungen (INTJ, ENFP usw.) lassen sich in einem Workshop viel leichter diskutieren als eine Reihe kontinuierlicher Punkteverteilungen. Der Test ist narrativ befriedigend — er erzählt eine Geschichte darüber, wer man ist. Er ist in die Populärkultur als eine Art säkulares Horoskop eingegangen. Der Vergleich mit anderen populären, aber weniger validen Rahmenwerken ist aufschlussreich: 16Personalities vs Big Five untersucht eine ähnliche Dynamik mit einem anderen viralen Instrument.
Das Test-Retest-Problem des MBTI: 50 % der Nutzer erhalten einen anderen Typ
Hier liegt das zentrale empirische Problem des MBTI: Wenn Personen ihn einige Wochen später erneut durchführen, erhalten ein großer Anteil von ihnen einen anderen Vier-Buchstaben-Typ. Eine viel zitierte Übersicht stellte fest, dass etwa 50 % der Teilnehmer beim Wiederholungstest nach nur fünf Wochen einen anderen MBTI-Typ erhalten. Dies liegt daran, dass das Instrument kontinuierliche Eigenschaften in binäre Kategorien zwingt: Jemand, der genau an der E/I-Grenze liegt, wird je nach seinem Befinden in dieser Woche auf die eine oder andere Seite kippen.
„Bis zu drei Viertel der Testteilnehmer erhalten beim Wiederholen des MBTI nach nur fünf Wochen einen anderen Persönlichkeitstyp." — in mehreren unabhängigen Meta-Analysen zitiert, die MBTI-Stabilitätsdaten überprüfen.
Eine Messung, die ihre eigenen Ergebnisse nicht reproduzieren kann, misst kein stabiles zugrundeliegendes Konstrukt — was per Definition das ist, was Persönlichkeit sein soll. Das ist keine geringfügige technische Kritik. Es bedeutet, dass Teams, die Entscheidungen über Rollen, Coaching oder Kommunikationsstile auf der Grundlage von MBTI-Typen treffen, möglicherweise auf der Basis von Daten handeln, die im nächsten Quartal anders aussehen werden. Die Geschichte des Big Five zeigt, wie die empirische Alternative entwickelt wurde — durch lexikalische Analyse und Faktorreplikation statt allein auf Theorie basierend.
Sagt der MBTI die Arbeitsleistung vorher? Was die Forschung zeigt
Selbst wenn man die Zuverlässigkeit außer Acht lässt, ist ein Test für Teams nur dann nützlich, wenn seine Scores Ergebnisse vorhersagen, die von Bedeutung sind: Arbeitsleistung, Qualität der Zusammenarbeit, Bindungsrate. Die unabhängige Forschung zur prädiktiven Validität des MBTI für die Arbeitsleistung ist durchweg schwach. Keine bedeutende peer-begutachtete Meta-Analyse hat festgestellt, dass der MBTI-Typ die Arbeitsleistung auf einem Niveau vorhersagt, das seinen weitverbreiteten Einsatz bei der Einstellung oder Teamzuordnung rechtfertigt.
Der Kontrast mit dem Big Five ist stark. Die wegweisende Meta-Analyse von Barrick und Mount aus dem Jahr 1991 — und Dutzende von Replikationen seitdem — zeigte, dass Gewissenhaftigkeit (Disziplin in der Dimensionsbenennung von Cèrcol) ein robuster Prädiktor der Arbeitsleistung in praktisch allen Berufsgruppen ist. Emotionale Stabilität (das Gegenteil von Neurotizismus / Tiefe) sagt die Leistung in stressintensiven Rollen vorher. Diese Zusammenhänge gelten über Kulturen, Sprachen und Branchen hinweg. Für eine ausführliche Analyse, warum das wichtig ist, siehe Was ist Gewissenhaftigkeit: der beständigste Prädiktor der Arbeitsleistung.
Warum das Big Five den MBTI bei jeder Validitätsmetrik übertrifft
Das Big Five ist kein einzelner Test — es ist ein wissenschaftliches Modell der Persönlichkeitsstruktur, das aus faktoranalytischen Studien natürlicher Sprache und Selbstberichtsdaten über Jahrzehnte und Kulturen hinweg entstanden ist. Seine fünf Dimensionen sind:
- Offenheit für Erfahrungen (Vision) — Neugier, Kreativität, Toleranz für Mehrdeutigkeit
- Gewissenhaftigkeit (Disziplin) — Selbstregulation, Organisation, Zielorientierung
- Extraversion (Präsenz) — Geselligkeit, positiver Affekt, Durchsetzungsvermögen
- Verträglichkeit (Verbundenheit) — Kooperation, Empathie, Vertrauen
- Neurotizismus (Tiefe) — emotionale Reaktivität, Angst, Stressvulnerabilität
Im Gegensatz zum MBTI behandelt das Big Five jede Dimension als kontinuierliches Spektrum. Eine Person ist nicht einfach ein „Extravertierter" oder ein „Introvertierter" — sie fällt irgendwo auf einer Verteilung, und diese Nuance ist enorm wichtig für die Vorhersage, wie sie sich in einem bestimmten Kontext verhalten wird. Personen mit hohen und Personen mit niedrigen Scores auf einer bestimmten Dimension können beide gute Leistungen erbringen; was sich unterscheidet, ist die Art von Umgebung und Aufgaben, die zu ihnen passen.
Eine Übersicht von 2003 von Gosling et al. (DOI: 10.1016/S0092-6566(03)00046-1) bestätigte, dass sogar sehr kurze Big Five-Messungen zuverlässig bedeutsame Varianz in Persönlichkeitsergebnissen erfassen, was die Robustheit des Modells über verschiedene Messformate hinweg zeigt. Die fünf Faktoren replizieren sich in Sprachen vom Englischen und Spanischen bis zum Chinesischen und Yoruba, was darauf hindeutet, dass sie echte transkulturelle menschliche Variation widerspiegeln und keine kulturellen Artefakte sind — ein Befund, der ausführlich in Big Five personality across cultures dokumentiert ist.
Der IPIP-Vorteil: Kostenlos, offen und wissenschaftlich überprüfbar
Die meisten kommerziellen Implementierungen des Big Five (NEO-PI-R, BFI) sind mit Lizenzgebühren verbunden und schränken den Zugang ein. Der International Personality Item Pool (IPIP) ist ein gemeinfrei zugängliches Repository von Persönlichkeitselementen, das unabhängig gegen die wichtigsten kommerziellen Instrumente validiert wurde. IPIP-basierte Bewertungen liefern Big Five-Messqualität zum Nulltarif, mit voller wissenschaftlicher Transparenz — Forscher und Entwickler können jeden Eintrag, jeden Bewertungsalgorithmus und jede Norm einsehen.
Cèrcol basiert auf dem IPIP. Unsere Wissenschaftsseite dokumentiert die spezifischen Elementpools und Validierungsstudien, die jeder Dimension zugrunde liegen. Siehe auch unsere Erklärung zu Was der IPIP ist. Es lohnt sich auch, den MBTI mit anderen teamorientierten Rahmenwerken zu vergleichen: DISC vs Big Five und Big Five vs DISC vs Belbin untersuchen die breitere Landschaft der Alternativen.
MBTI vs Big Five: Direkter Vergleich
| Merkmal | MBTI | Big Five (IPIP) |
|---|---|---|
| Test-Retest-Zuverlässigkeit (5 Wochen) | ~50 % erhalten einen anderen Typ | Hoch (r ≈ 0,75–0,85 in allen Studien) |
| Prädiktive Validität für Arbeitsleistung | Schwach / nicht etabliert | Stark (besonders Gewissenhaftigkeit) |
| Wissenschaftliche Grundlage | Jungianische Theorie (nicht empirisch abgeleitet) | Faktoranalytisch, transkulturelle Replikation |
| Kosten | Proprietär; offizielle Version kostenpflichtig | IPIP ist gemeinfrei / kostenlos |
| Ausgabeformat | 16 diskrete Typen | 5 kontinuierliche Dimensionen |
| Unabhängige Replikation | Begrenzt | Umfangreich (50+ Jahre Peer-Review) |
Welches sollte Ihr Team verwenden? Eine praktische Empfehlung
Wenn Ihr Ziel ein einprägsames Workshop-Eisbrecher ist und Sie die Ergebnisse nicht für Entscheidungen verwenden werden, die die Rollen oder Karrieren von Personen betreffen, ist der MBTI weitgehend harmlos — viele Menschen finden ihn ansprechend. Aber wenn Sie Daten möchten, die in sechs Monaten noch Bedeutung haben, die über Teams hinweg verglichen werden können und die die Forschung mit tatsächlichen Leistungsergebnissen verknüpft, ist das Big Five die einzige vertretbare Wahl.
Für Teams insbesondere ist die Kombination aus Selbstbewertungsdaten und Peer-Perspektivdaten aufschlussreicher als jede der beiden für sich allein. Cèrcols Full Moon-Bewertung kombiniert IPIP-basiertes Selbstbericht mit strukturiertem Zeuge/Zeugin-Feedback, das Ihnen sowohl gibt, wie Personen sich selbst sehen, als auch wie ihre engsten Mitarbeiter sie erleben — alles auf demselben wissenschaftlich validierten Rahmenwerk aufgebaut.
Die Wahl zwischen MBTI und Big Five ist letztlich eine Wahl zwischen Vertrautheit und Validität. Ihr Team verdient sowohl Strenge als auch Zugänglichkeit. Das Big Five liefert Ersteres; eine gut gestaltete Plattform kann Letzteres liefern.
Probieren Sie die validierte Alternative — kostenlos
Wenn Sie den MBTI verwendet haben und sehen möchten, wie eine wissenschaftlich rigorose Alternative tatsächlich aussieht, ist der einfachste Schritt, eine durchzuführen. Cèrcols kostenlose Bewertung basiert auf dem IPIP Big Five, dauert etwa fünfzehn Minuten und liefert Ergebnisse, die bei Wiederholungen standhalten — im Gegensatz zum Typ, den Sie letzten Monat erhalten haben, der sich mysteriöserweise geändert hat. Sie sehen Ihre Scores in Disziplin, Verbundenheit, Präsenz, Tiefe und Vision als kontinuierliche Dimensionen, nicht als binäre Kästchen. Keine Bezahlschranke, kein erzwungener E-Mail-Trichter für die Ergebnisse. Testen Sie es kostenlos auf cercol.team.
Quellen: Myers-Briggs Type Indicator — Wikipedia · Big Five personality traits — Wikipedia · Gosling, S. D., Rentfrow, P. J., & Swann, W. B. (2003). A very brief measure of the Big-Five personality domains. Journal of Research in Personality, 37(6), 504–528. DOI: 10.1016/S0092-6566(03)00046-1
Weiterführende Lektüre
- 16Personalities vs Big Five: der virale Test, der zur Hälfte richtig liegt
- DISC vs Big Five: warum vier Stile nicht ausreichen
- Big Five vs DISC vs Belbin: ein wissenschaftlicher Vergleich
- Was sind Reliabilität und Validität in Persönlichkeitstests?
- Zwangsantwort-Persönlichkeitsbewertung: ehrlichere Daten erhalten
- Die Geschichte des Big Five: von Allport bis Goldberg