Is Cèrcol based on the Big Five?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP public-domain item pool (Goldberg et al. 2006). The 12 team roles are derived from the AB5C circumplex (Hofstee et al. 1992) and team composition research (Bell 2007; Neuman & Wright 1999).

What makes Cèrcol different from Belbin or DISC?

Cèrcol's roles are grounded in the Big Five (OCEAN) personality model using the IPIP public-domain item pool. The scoring pipeline is fully open source and auditable. Witness Cèrcol uses forced-choice adjective selection — not Likert scales — to eliminate social desirability bias in peer assessment. Unlike Belbin or DISC, all items are public domain and the entire methodology is published and citable.

Is the personality assessment free?

The New Moon Cèrcol (10 items, Big Five snapshot) and First Quarter Cèrcol (60 items, IPIP-NEO-60, 30 facets) are always free — no account required. The Full Moon Cèrcol (120 items, IPIP-NEO-120, Witness peer assessment, cognitive ability measure) requires a one-time payment.

What is Witness Cèrcol?

Witness Cèrcol is a peer personality assessment where someone who knows you well rates you using a forced-choice adjective selection method — picking the best-fit and worst-fit adjective per round from a set covering all five OCEAN dimensions. Forced choice eliminates the social desirability bias that affects standard Likert-scale peer ratings. Dimensions where your self-rating and peer ratings diverge by more than 0.8 standard deviations are flagged as potential blind spots.

How are the 12 team roles derived?

The 12 roles are derived from the AB5C circumplex (Hofstee, De Raad & Goldberg 1992), covering all six intersections of the three team balance dimensions (Presence/Extraversion × Bond/Agreeableness × Vision/Openness) at both poles. The selection of these three dimensions as requiring team-level balance is grounded in Bell (2007) and Neuman & Wright (1999). Discipline (Conscientiousness) and Depth (Neuroticism) modulate role expression but do not define team balance.

No account is required for any instrument. During assessment, no personal data is collected — only anonymous scores are logged. Data is stored on our own servers (Hetzner Online GmbH). No third-party analytics. No data is shared with or sold to third parties.

Is Cèrcol based on the Big Five (OCEAN)?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP — the International Personality Item Pool, a public-domain collection validated in thousands of published studies. The five dimensions are Presence (Extraversion), Bond (Agreeableness), Vision (Openness), Discipline (Conscientiousness), and Depth (Neuroticism). Because the IPIP is public domain there are no licence restrictions: the full item pool and scoring logic are open and citable.

How is Cèrcol different from Belbin, DISC, or StrengthsFinder?

Three things set Cèrcol apart. First, the items come from the Big Five (OCEAN), the most replicated personality model in academic research — not a proprietary framework. Second, the full item pool (IPIP) and scoring pipeline are public domain and auditable; there is no black box. Third, the Witness peer assessment uses forced-choice adjective selection instead of Likert scales, which eliminates the social desirability bias that affects most 360-feedback tools. Belbin and DISC use closed, proprietary methodologies.

What are blind spots in team personality assessment?

A blind spot is a personality dimension where how you see yourself and how others see you diverge significantly — more than 0.8 standard deviations apart. Cèrcol's Witness peer assessment detects blind spots by comparing your self-report with forced-choice adjective ratings from people who know you. Blind spots are neither good nor bad: they show where your self-perception and others' experience of you don't match, which is often more actionable than the score itself.

Kann man einen Persönlichkeitstest fälschen — und spielt es eine Rolle?

Wenn Sie jemals einen Persönlichkeitstest als Teil einer Bewerbung gemacht haben, haben Sie sich wahrscheinlich gefragt: Wonach suchen sie wirklich? Und wenn Sie wüssten, wonach sie suchen, könnten Sie einfach entsprechend antworten?

Die ehrliche Antwort auf die erste Frage lautet: Ja, es gibt Muster, die Arbeitgeber tendenziell bevorzugen — höheres Conscientiousness, moderate bis hohe Extraversion für viele Rollen, niedrigeren Neurotizismus. Die ehrliche Antwort auf die zweite ist komplizierter.

Dieser Artikel überprüft, was die wissenschaftliche Literatur tatsächlich über das Fälschen von Persönlichkeitstests sagt, wie oft es vorkommt, ob es für die Vorhersagevalidität wichtig ist, und was es uns über den angemessenen Einsatz von Persönlichkeitsbewertungen sagt.

Kann man Persönlichkeitstests fälschen? Ja — wenn man dazu aufgefordert wird

Die Forschung zur Fälschbarkeit ist in einem Punkt eindeutig: Wenn Menschen explizit aufgefordert werden, sich als ideale Kandidaten zu präsentieren, können sie ihre Scores erheblich verschieben und tun dies auch. Studien mit „fake good"-Instruktionen — wo Teilnehmer gebeten werden, sich vorzustellen, sie bewerben sich auf eine begehrte Stelle und antworten entsprechend — zeigen konsistent, dass die Durchschnittswerte bei Conscientiousness, Emotionaler Stabilität (niedriger Neurotizismus) und Extraversion um etwa eine halbe Standardabweichung oder mehr steigen.

Das ist nicht überraschend. Der soziale Erwünschtheitsbias — die Tendenz, Fragen auf eine Weise zu beantworten, die ein günstiges soziales Bild präsentiert — ist eines der am besten dokumentierten Phänomene der Umfrageforschung. Persönlichkeitstests sind nicht dagegen immun. Für eine breitere Behandlung, wie der Bewertungskontext Scores beeinflusst, siehe Anonymität in der Persönlichkeitsbewertung: warum es wichtig ist.

„Motiviertes Fälschen bei Persönlichkeitsinventaren kann zu mittleren Score-Erhöhungen von ungefähr einer halben bis einer Standardabweichung auf den meisten Big Five-Skalen führen."
— Viswesvaran & Ones (1999), Human Performance

0,3–0,5 SA

durchschnittliche Score-Inflation wenn Fälschen instruiert wird

r = 0,60

Korrelation zwischen gefälschten und ehrlichen Profilen (Rangordnung erhalten)

Erzwungene Wahl

Format, das Fälschen am effektivsten reduziert

Wie viel Fälschen passiert tatsächlich in realen Einstellungskontexten

Hier wird das Bild nuancierter. Die Laborbelege für Fälschen unter Anweisung sind robust. Die Belege für spontanes, uninstruiertes Fälschen in tatsächlichen Einstellungskontexten sind schwächer.

Mehrere Studien haben Persönlichkeitsscores verglichen, die in Bewerberkontexten (wo Menschen Gründe haben zu fälschen) mit Scores erhoben wurden, die in Forschungskontexten erhoben wurden (wo sie das nicht haben). Die Unterschiede sind real, aber kleiner als die instruierten Fälschungsstudien nahelegen — typischerweise ungefähr ein Viertel bis ein Drittel einer Standardabweichung auf den am stärksten fälschbaren Skalen.

Einige Forscher argumentieren, dass diese verbleibende Lücke hauptsächlich auf Selbsttäuschung statt auf bewusste Verzerrung zurückzuführen ist: Bewerber glauben genuinement, die Merkmale zu besitzen, die sie behaupten, weil motiviertes Denken sie dazu bringt, ihre Selbstbewertungen in positive Richtungen zu übertreiben. Das ist ein anderes Phänomen als zynisches Fälschen und hat andere Implikationen dafür, was dagegen zu tun ist. Es verbindet sich auch mit den breiteren Belegen darüber, warum Selbstbewertung allein ein unvollständiges Bild erzeugt — wir sind systematisch unzuverlässige Erzähler unserer eigenen Persönlichkeiten.

Schadet Fälschen wirklich der Vorhersagevalidität?

Das ist die wichtige empirische Frage, und die Antwort ist genuinement umstritten. Es gibt drei Hauptpositionen in der Literatur:

Position 1: Fälschen spielt keine große Rolle. Einige Meta-Analysen haben gefunden, dass Persönlichkeitstests ähnliche Vorhersagevalidität für Arbeitsleistung zeigen, unabhängig davon, ob der Bewertungskontext Bewerber- oder Forschungskontext war. Wenn Fälscher am Ende genauso gut bei der Arbeit abschneiden, hat das Fälschen das Vorhersagesignal nicht korrumpiert.

Position 2: Fälschen reduziert die Validität. Andere Forschung argumentiert, dass wenn hohe Scorer eine Mischung aus genuinen hochmerkmalligen Individuen und geschickten Fälschern sind, die Vorhersagebeziehung zur Leistung abgeschwächt wird. Fälscher blähen die Verteilung auf, ohne das zugrunde liegende Merkmal zu haben.

Position 3: Fälschen selektiert auf Impressionsmanagement. Eine dritte Perspektive weist darauf hin, dass die Fähigkeit, einen Persönlichkeitstest erfolgreich zu fälschen, selbst ein bedeutsames Signal sein kann — spezifisch korreliert es mit sozialer Intelligenz und der Motivation zu beeindrucken. Menschen, die effektiv fälschen, könnten tatsächlich in Rollen gut abschneiden, wo Impressionsmanagement wichtig ist. Das macht Fälschen nicht unproblematisch, aber es verkompliziert die einfache Validitätskorrptions-Geschichte.

Der aktuelle wissenschaftliche Konsens neigt für Verwendungen mit niedrigen Einsätzen und Nicht-Selektions-Verwendungen zur Position 1, und für Hocheinsatz-Selektionskontexte, wo der Anreiz zum Fälschen am höchsten ist, zur Position 2. Für das, was „valide" in der Persönlichkeitsmessung wirklich bedeutet, siehe was ist Reliabilität und Validität in Persönlichkeitstests?.

Forced-Choice-Formate: eine Teillösung für Test-Fälschung

Eine technische Antwort auf Fälschen ist das Forced-Choice-Format, bei dem Befragte zwischen zwei oder mehr gleich sozial erwünschten Optionen wählen (z.B. „Ich neige dazu, sehr organisiert zu sein" vs. „Ich neige dazu, sehr gesellig zu sein"). Durch das Entfernen der einfachen Option, alle positiven Deskriptoren zu bestätigen, reduzieren Forced-Choice-Formate die Möglichkeit zur Antwortinflation.

Die Belege zu Forced-Choice-Formaten sind generell positiv: sie produzieren weniger Fälschen und in einigen Studien etwas bessere Vorhersagevalidität. Aber sie sind schwieriger zu absolvieren, kognitiv anspruchsvoller und weniger gut in interkulturellen Kontexten validiert. Sie führen auch ipsative Bewertungsprobleme ein (die Scores sind relativ zueinander, nicht absolut), die die Interpretation erschweren. Für eine detaillierte Behandlung der Abwägungen, siehe Forced-Choice-Persönlichkeitsbewertung: ehrlichere Daten.

Testformat	Fälschbarkeit	Was zu tun ist
Standard Likert-Skala Big Five	Hoch — einfach, positive Items zu bestätigen	Für Entwicklung verwenden; überwachen wenn für Selektion verwendet
Forced-Choice (z.B. Thurstone IRT)	Moderat — schwieriger zu fälschen aber nicht immun	Besser für Selektionskontexte; lokal validieren
Situative Urteilstests (SJTs)	Moderat — weniger transparent aber noch fälschbar	Mit Persönlichkeitsdaten für bessere Abdeckung kombinieren
Peer/Multi-Rater-Bewertung (z.B. Cèrcol Zeugen)	Niedrig — andere sind schwieriger zu manipulieren	Am resistentesten gegen absichtliches Fälschen
Anonymer Selbstbericht (kein Hocheinsatz-Kontext)	Niedrig — reduzierte Motivation zur Verzerrung	Bestes für Entwicklung; der ideale Kontext für ehrliche Daten

Siehe auch: Sozialer Erwünschtheitsbias in Persönlichkeitstests.

Warum das eigentliche Problem die Verwendung von Persönlichkeitstests für die Selektion ist

Der größte Teil der Fälschungsdebatte ist eigentlich eine Stellvertreterdebatte darüber, ob Persönlichkeitstests überhaupt für Einstellungsselektionen verwendet werden sollten. Wenn Sie Persönlichkeitsdaten für Entwicklung verwenden — um Menschen zu helfen, sich selbst zu verstehen und besser mit anderen zu arbeiten — ist Fälschen größtenteils selbst-sabotierend. Wenn Sie sich durch Fälschen zu einem Entwicklungsbericht vorarbeiten, der nicht widerspiegelt, wie Sie sich tatsächlich verhalten, erhalten Sie einfach Feedback, das für Sie weniger nützlich ist. Die Kosten fallen auf die Person, die gefälscht hat, nicht auf die Organisation.

Wenn Sie Persönlichkeitsdaten als Selektionshürde verwenden — als Tor, das bestimmt, ob Sie in einem Einstellungsprozess weiterkommen — wird der Anreiz zum Fälschen signifikant, und die Konsequenzen des Fälschens fallen auf die Organisation (in Form falsch selektierter Einstellungen) und auf ehrliche Kandidaten, die gegenüber geschickten Fälschern benachteiligt sind. Die ethischen und rechtlichen Dimensionen davon werden in Persönlichkeitstests bei der Einstellung: was legal und was ethisch ist untersucht.

Das ist die wichtigste praktische Erkenntnis aus der Fälschungsliteratur: das Fälschbarkeitsproblem ist nachgelagert zum Missbrauchsproblem. Persönlichkeitsbewertungen wurden für Entwicklung und Selbstverständnis konzipiert. Wenn sie als Selektionsfilter umgewidmet werden, entwickeln sie Fälschbarkeitsschwachstellen, für die sie nie konzipiert wurden zu widerstehen.

Warum anonyme Entwicklungsbewertung Fälschen widersteht

Eine praktische Reaktion auf Fälschungsbedenken ist es, Persönlichkeitsdaten anonym zu erheben — d.h. in Kontexten, wo die Daten nicht von Einstellungsmanagern gesehen werden, und wo die Scores von niemandem mit Beschäftigungsentscheidungen verknüpft sind. Das ist genau der Kontext, in dem Persönlichkeitsbewertungen ihr validestes und nützlichstes Signal erzeugen.

Anonyme Bewertungen eliminieren die primäre Motivation zum Fälschen. Sie produzieren Daten, die genauer und für Entwicklung nützlicher sind. Sie eliminieren auch die rechtlichen und ethischen Risiken, die mit der Verwendung von Persönlichkeitsdaten in der Selektion verbunden sind.

Cèrcol verwendet ein Multi-Rater-Design, bei dem Zeugen eine Außensicht auf das Verhalten einer Person bieten. Das fügt eine Informationsschicht hinzu, die erheblich schwieriger zu fälschen ist als Selbstbericht: Während Sie Ihre eigenen Conscientiousness-Scores aufblasen können, können Sie nicht leicht manipulieren, wie fünf Kollegen, die täglich mit Ihnen arbeiten, Ihr typisches Verhalten beschreiben. Die Wissenschaft hinter dem IPIP — International Personality Item Pool, der das Zeugen-Instrument untermauert, gibt ihm validierte Open-Source-Grundlagen, die kommerziellen Tools häufig fehlen.

Die Fälschungsliteratur lehrt uns letztlich weniger darüber, wie man Persönlichkeitstests manipulationsresistenter macht, und mehr darüber, wo sie genuinement hingehören: in Entwicklung, in Teamdialog, in Selbstverständnis. Das ist, wo sie ihr ehrlichstes und nützlichstes Signal liefern.

Wie Cèrcol Fälschen begegnet

Cèrcols Design reagiert direkt auf das Fälschungsproblem auf jeder Ebene. Die Zeugen-Peer-Bewertung bedeutet, dass Ihr Persönlichkeitsprofil nicht aus Ihrer eigenen Selbstpräsentation aufgebaut wird — es wird aus der Art aufgebaut, wie die Menschen, die mit Ihnen arbeiten, Ihr Verhalten tatsächlich beschreiben. Zeugen antworten anonym auf erzwungene Wahl-Adjektivpaare, was sowohl die Fähigkeit zu fälschen (keine offensichtlich „richtige" Antwort) als auch den Anreiz (keine Einsätze an ihre individuellen Antworten geknüpft) eliminiert. Der Selbstberichtskomponent wird in einem risikoarmen, individuell besessenen Kontext genommen — Sie besitzen Ihre Daten und entscheiden, wer sie sieht — was die Forschung zeigt, das Impressionsmanagement substanziell reduziert. Sie können das vollständige Instrument bei /instruments erkunden und über die zugrunde liegende Wissenschaft bei /science lesen. Die Bewertung ist kostenlos auf cercol.team.

Kann man einen Persönlichkeitstest fälschen — und spielt es eine Rolle?

Kann man Persönlichkeitstests fälschen? Ja — wenn man dazu aufgefordert wird

Wie viel Fälschen passiert tatsächlich in realen Einstellungskontexten

Schadet Fälschen wirklich der Vorhersagevalidität?

Forced-Choice-Formate: eine Teillösung für Test-Fälschung

Warum das eigentliche Problem die Verwendung von Persönlichkeitstests für die Selektion ist

Warum anonyme Entwicklungsbewertung Fälschen widersteht

Wie Cèrcol Fälschen begegnet

Weiterführende Lektüre

Verwandte Artikel

Anonymität in der Persönlichkeitsbewertung: warum es mehr zählt als Sie denken

Was Reliabilität und Validität bei Persönlichkeitstests bedeuten — klar erklärt

Persönlichkeitstests bei der Einstellung: Was ist legal, was ist ethisch?