Wenn Sie jemals einen Persönlichkeitstest als Teil einer Bewerbung gemacht haben, haben Sie sich wahrscheinlich gefragt: Wonach suchen sie wirklich? Und wenn Sie wüssten, wonach sie suchen, könnten Sie einfach entsprechend antworten?
Die ehrliche Antwort auf die erste Frage lautet: Ja, es gibt Muster, die Arbeitgeber tendenziell bevorzugen — höheres Conscientiousness, moderate bis hohe Extraversion für viele Rollen, niedrigeren Neurotizismus. Die ehrliche Antwort auf die zweite ist komplizierter.
Dieser Artikel überprüft, was die wissenschaftliche Literatur tatsächlich über das Fälschen von Persönlichkeitstests sagt, wie oft es vorkommt, ob es für die Vorhersagevalidität wichtig ist, und was es uns über den angemessenen Einsatz von Persönlichkeitsbewertungen sagt.
Kann man Persönlichkeitstests fälschen? Ja — wenn man dazu aufgefordert wird
Die Forschung zur Fälschbarkeit ist in einem Punkt eindeutig: Wenn Menschen explizit aufgefordert werden, sich als ideale Kandidaten zu präsentieren, können sie ihre Scores erheblich verschieben und tun dies auch. Studien mit „fake good"-Instruktionen — wo Teilnehmer gebeten werden, sich vorzustellen, sie bewerben sich auf eine begehrte Stelle und antworten entsprechend — zeigen konsistent, dass die Durchschnittswerte bei Conscientiousness, Emotionaler Stabilität (niedriger Neurotizismus) und Extraversion um etwa eine halbe Standardabweichung oder mehr steigen.
Das ist nicht überraschend. Der soziale Erwünschtheitsbias — die Tendenz, Fragen auf eine Weise zu beantworten, die ein günstiges soziales Bild präsentiert — ist eines der am besten dokumentierten Phänomene der Umfrageforschung. Persönlichkeitstests sind nicht dagegen immun. Für eine breitere Behandlung, wie der Bewertungskontext Scores beeinflusst, siehe Anonymität in der Persönlichkeitsbewertung: warum es wichtig ist.
„Motiviertes Fälschen bei Persönlichkeitsinventaren kann zu mittleren Score-Erhöhungen von ungefähr einer halben bis einer Standardabweichung auf den meisten Big Five-Skalen führen."
— Viswesvaran & Ones (1999), Human Performance
Wie viel Fälschen passiert tatsächlich in realen Einstellungskontexten
Hier wird das Bild nuancierter. Die Laborbelege für Fälschen unter Anweisung sind robust. Die Belege für spontanes, uninstruiertes Fälschen in tatsächlichen Einstellungskontexten sind schwächer.
Mehrere Studien haben Persönlichkeitsscores verglichen, die in Bewerberkontexten (wo Menschen Gründe haben zu fälschen) mit Scores erhoben wurden, die in Forschungskontexten erhoben wurden (wo sie das nicht haben). Die Unterschiede sind real, aber kleiner als die instruierten Fälschungsstudien nahelegen — typischerweise ungefähr ein Viertel bis ein Drittel einer Standardabweichung auf den am stärksten fälschbaren Skalen.
Einige Forscher argumentieren, dass diese verbleibende Lücke hauptsächlich auf Selbsttäuschung statt auf bewusste Verzerrung zurückzuführen ist: Bewerber glauben genuinement, die Merkmale zu besitzen, die sie behaupten, weil motiviertes Denken sie dazu bringt, ihre Selbstbewertungen in positive Richtungen zu übertreiben. Das ist ein anderes Phänomen als zynisches Fälschen und hat andere Implikationen dafür, was dagegen zu tun ist. Es verbindet sich auch mit den breiteren Belegen darüber, warum Selbstbewertung allein ein unvollständiges Bild erzeugt — wir sind systematisch unzuverlässige Erzähler unserer eigenen Persönlichkeiten.
Schadet Fälschen wirklich der Vorhersagevalidität?
Das ist die wichtige empirische Frage, und die Antwort ist genuinement umstritten. Es gibt drei Hauptpositionen in der Literatur:
Position 1: Fälschen spielt keine große Rolle. Einige Meta-Analysen haben gefunden, dass Persönlichkeitstests ähnliche Vorhersagevalidität für Arbeitsleistung zeigen, unabhängig davon, ob der Bewertungskontext Bewerber- oder Forschungskontext war. Wenn Fälscher am Ende genauso gut bei der Arbeit abschneiden, hat das Fälschen das Vorhersagesignal nicht korrumpiert.
Position 2: Fälschen reduziert die Validität. Andere Forschung argumentiert, dass wenn hohe Scorer eine Mischung aus genuinen hochmerkmalligen Individuen und geschickten Fälschern sind, die Vorhersagebeziehung zur Leistung abgeschwächt wird. Fälscher blähen die Verteilung auf, ohne das zugrunde liegende Merkmal zu haben.
Position 3: Fälschen selektiert auf Impressionsmanagement. Eine dritte Perspektive weist darauf hin, dass die Fähigkeit, einen Persönlichkeitstest erfolgreich zu fälschen, selbst ein bedeutsames Signal sein kann — spezifisch korreliert es mit sozialer Intelligenz und der Motivation zu beeindrucken. Menschen, die effektiv fälschen, könnten tatsächlich in Rollen gut abschneiden, wo Impressionsmanagement wichtig ist. Das macht Fälschen nicht unproblematisch, aber es verkompliziert die einfache Validitätskorrptions-Geschichte.
Der aktuelle wissenschaftliche Konsens neigt für Verwendungen mit niedrigen Einsätzen und Nicht-Selektions-Verwendungen zur Position 1, und für Hocheinsatz-Selektionskontexte, wo der Anreiz zum Fälschen am höchsten ist, zur Position 2. Für das, was „valide" in der Persönlichkeitsmessung wirklich bedeutet, siehe was ist Reliabilität und Validität in Persönlichkeitstests?.
Forced-Choice-Formate: eine Teillösung für Test-Fälschung
Eine technische Antwort auf Fälschen ist das Forced-Choice-Format, bei dem Befragte zwischen zwei oder mehr gleich sozial erwünschten Optionen wählen (z.B. „Ich neige dazu, sehr organisiert zu sein" vs. „Ich neige dazu, sehr gesellig zu sein"). Durch das Entfernen der einfachen Option, alle positiven Deskriptoren zu bestätigen, reduzieren Forced-Choice-Formate die Möglichkeit zur Antwortinflation.
Die Belege zu Forced-Choice-Formaten sind generell positiv: sie produzieren weniger Fälschen und in einigen Studien etwas bessere Vorhersagevalidität. Aber sie sind schwieriger zu absolvieren, kognitiv anspruchsvoller und weniger gut in interkulturellen Kontexten validiert. Sie führen auch ipsative Bewertungsprobleme ein (die Scores sind relativ zueinander, nicht absolut), die die Interpretation erschweren. Für eine detaillierte Behandlung der Abwägungen, siehe Forced-Choice-Persönlichkeitsbewertung: ehrlichere Daten.
| Testformat | Fälschbarkeit | Was zu tun ist |
|---|---|---|
| Standard Likert-Skala Big Five | Hoch — einfach, positive Items zu bestätigen | Für Entwicklung verwenden; überwachen wenn für Selektion verwendet |
| Forced-Choice (z.B. Thurstone IRT) | Moderat — schwieriger zu fälschen aber nicht immun | Besser für Selektionskontexte; lokal validieren |
| Situative Urteilstests (SJTs) | Moderat — weniger transparent aber noch fälschbar | Mit Persönlichkeitsdaten für bessere Abdeckung kombinieren |
| Peer/Multi-Rater-Bewertung (z.B. Cèrcol Zeugen) | Niedrig — andere sind schwieriger zu manipulieren | Am resistentesten gegen absichtliches Fälschen |
| Anonymer Selbstbericht (kein Hocheinsatz-Kontext) | Niedrig — reduzierte Motivation zur Verzerrung | Bestes für Entwicklung; der ideale Kontext für ehrliche Daten |
Siehe auch: Sozialer Erwünschtheitsbias in Persönlichkeitstests.
Warum das eigentliche Problem die Verwendung von Persönlichkeitstests für die Selektion ist
Der größte Teil der Fälschungsdebatte ist eigentlich eine Stellvertreterdebatte darüber, ob Persönlichkeitstests überhaupt für Einstellungsselektionen verwendet werden sollten. Wenn Sie Persönlichkeitsdaten für Entwicklung verwenden — um Menschen zu helfen, sich selbst zu verstehen und besser mit anderen zu arbeiten — ist Fälschen größtenteils selbst-sabotierend. Wenn Sie sich durch Fälschen zu einem Entwicklungsbericht vorarbeiten, der nicht widerspiegelt, wie Sie sich tatsächlich verhalten, erhalten Sie einfach Feedback, das für Sie weniger nützlich ist. Die Kosten fallen auf die Person, die gefälscht hat, nicht auf die Organisation.
Wenn Sie Persönlichkeitsdaten als Selektionshürde verwenden — als Tor, das bestimmt, ob Sie in einem Einstellungsprozess weiterkommen — wird der Anreiz zum Fälschen signifikant, und die Konsequenzen des Fälschens fallen auf die Organisation (in Form falsch selektierter Einstellungen) und auf ehrliche Kandidaten, die gegenüber geschickten Fälschern benachteiligt sind. Die ethischen und rechtlichen Dimensionen davon werden in Persönlichkeitstests bei der Einstellung: was legal und was ethisch ist untersucht.
Das ist die wichtigste praktische Erkenntnis aus der Fälschungsliteratur: das Fälschbarkeitsproblem ist nachgelagert zum Missbrauchsproblem. Persönlichkeitsbewertungen wurden für Entwicklung und Selbstverständnis konzipiert. Wenn sie als Selektionsfilter umgewidmet werden, entwickeln sie Fälschbarkeitsschwachstellen, für die sie nie konzipiert wurden zu widerstehen.
Warum anonyme Entwicklungsbewertung Fälschen widersteht
Eine praktische Reaktion auf Fälschungsbedenken ist es, Persönlichkeitsdaten anonym zu erheben — d.h. in Kontexten, wo die Daten nicht von Einstellungsmanagern gesehen werden, und wo die Scores von niemandem mit Beschäftigungsentscheidungen verknüpft sind. Das ist genau der Kontext, in dem Persönlichkeitsbewertungen ihr validestes und nützlichstes Signal erzeugen.
Anonyme Bewertungen eliminieren die primäre Motivation zum Fälschen. Sie produzieren Daten, die genauer und für Entwicklung nützlicher sind. Sie eliminieren auch die rechtlichen und ethischen Risiken, die mit der Verwendung von Persönlichkeitsdaten in der Selektion verbunden sind.
Cèrcol verwendet ein Multi-Rater-Design, bei dem Zeugen eine Außensicht auf das Verhalten einer Person bieten. Das fügt eine Informationsschicht hinzu, die erheblich schwieriger zu fälschen ist als Selbstbericht: Während Sie Ihre eigenen Conscientiousness-Scores aufblasen können, können Sie nicht leicht manipulieren, wie fünf Kollegen, die täglich mit Ihnen arbeiten, Ihr typisches Verhalten beschreiben. Die Wissenschaft hinter dem IPIP — International Personality Item Pool, der das Zeugen-Instrument untermauert, gibt ihm validierte Open-Source-Grundlagen, die kommerziellen Tools häufig fehlen.
Die Fälschungsliteratur lehrt uns letztlich weniger darüber, wie man Persönlichkeitstests manipulationsresistenter macht, und mehr darüber, wo sie genuinement hingehören: in Entwicklung, in Teamdialog, in Selbstverständnis. Das ist, wo sie ihr ehrlichstes und nützlichstes Signal liefern.
Wie Cèrcol Fälschen begegnet
Cèrcols Design reagiert direkt auf das Fälschungsproblem auf jeder Ebene. Die Zeugen-Peer-Bewertung bedeutet, dass Ihr Persönlichkeitsprofil nicht aus Ihrer eigenen Selbstpräsentation aufgebaut wird — es wird aus der Art aufgebaut, wie die Menschen, die mit Ihnen arbeiten, Ihr Verhalten tatsächlich beschreiben. Zeugen antworten anonym auf erzwungene Wahl-Adjektivpaare, was sowohl die Fähigkeit zu fälschen (keine offensichtlich „richtige" Antwort) als auch den Anreiz (keine Einsätze an ihre individuellen Antworten geknüpft) eliminiert. Der Selbstberichtskomponent wird in einem risikoarmen, individuell besessenen Kontext genommen — Sie besitzen Ihre Daten und entscheiden, wer sie sieht — was die Forschung zeigt, das Impressionsmanagement substanziell reduziert. Sie können das vollständige Instrument bei /instruments erkunden und über die zugrunde liegende Wissenschaft bei /science lesen. Die Bewertung ist kostenlos auf cercol.team.
Weiterführende Lektüre
- Sozialer Erwünschtheitsbias in Persönlichkeitstests
- Forced-Choice-Persönlichkeitsbewertung: ehrlichere Daten erhalten
- Warum Selbstbewertung allein nicht ausreicht: der Fall für Peer-Persönlichkeitsfeedback
- Anonymität in der Persönlichkeitsbewertung: warum es wichtig ist
- Persönlichkeitstests bei der Einstellung: was legal und was ethisch ist
- Was ist Reliabilität und Validität in Persönlichkeitstests?