Is Cèrcol based on the Big Five?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP public-domain item pool (Goldberg et al. 2006). The 12 team roles are derived from the AB5C circumplex (Hofstee et al. 1992) and team composition research (Bell 2007; Neuman & Wright 1999).

What makes Cèrcol different from Belbin or DISC?

Cèrcol's roles are grounded in the Big Five (OCEAN) personality model using the IPIP public-domain item pool. The scoring pipeline is fully open source and auditable. Witness Cèrcol uses forced-choice adjective selection — not Likert scales — to eliminate social desirability bias in peer assessment. Unlike Belbin or DISC, all items are public domain and the entire methodology is published and citable.

Is the personality assessment free?

The New Moon Cèrcol (10 items, Big Five snapshot) and First Quarter Cèrcol (60 items, IPIP-NEO-60, 30 facets) are always free — no account required. The Full Moon Cèrcol (120 items, IPIP-NEO-120, Witness peer assessment, cognitive ability measure) requires a one-time payment.

What is Witness Cèrcol?

Witness Cèrcol is a peer personality assessment where someone who knows you well rates you using a forced-choice adjective selection method — picking the best-fit and worst-fit adjective per round from a set covering all five OCEAN dimensions. Forced choice eliminates the social desirability bias that affects standard Likert-scale peer ratings. Dimensions where your self-rating and peer ratings diverge by more than 0.8 standard deviations are flagged as potential blind spots.

How are the 12 team roles derived?

The 12 roles are derived from the AB5C circumplex (Hofstee, De Raad & Goldberg 1992), covering all six intersections of the three team balance dimensions (Presence/Extraversion × Bond/Agreeableness × Vision/Openness) at both poles. The selection of these three dimensions as requiring team-level balance is grounded in Bell (2007) and Neuman & Wright (1999). Discipline (Conscientiousness) and Depth (Neuroticism) modulate role expression but do not define team balance.

No account is required for any instrument. During assessment, no personal data is collected — only anonymous scores are logged. Data is stored on our own servers (Hetzner Online GmbH). No third-party analytics. No data is shared with or sold to third parties.

Is Cèrcol based on the Big Five (OCEAN)?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP — the International Personality Item Pool, a public-domain collection validated in thousands of published studies. The five dimensions are Presence (Extraversion), Bond (Agreeableness), Vision (Openness), Discipline (Conscientiousness), and Depth (Neuroticism). Because the IPIP is public domain there are no licence restrictions: the full item pool and scoring logic are open and citable.

How is Cèrcol different from Belbin, DISC, or StrengthsFinder?

Three things set Cèrcol apart. First, the items come from the Big Five (OCEAN), the most replicated personality model in academic research — not a proprietary framework. Second, the full item pool (IPIP) and scoring pipeline are public domain and auditable; there is no black box. Third, the Witness peer assessment uses forced-choice adjective selection instead of Likert scales, which eliminates the social desirability bias that affects most 360-feedback tools. Belbin and DISC use closed, proprietary methodologies.

What are blind spots in team personality assessment?

A blind spot is a personality dimension where how you see yourself and how others see you diverge significantly — more than 0.8 standard deviations apart. Cèrcol's Witness peer assessment detects blind spots by comparing your self-report with forced-choice adjective ratings from people who know you. Blind spots are neither good nor bad: they show where your self-perception and others' experience of you don't match, which is often more actionable than the score itself.

Persönlichkeitstests bei der Einstellung: Was ist legal, was ist ethisch?

Persönlichkeitsbewertung hat einen dauerhaften Platz in der Unternehmensrekrutierung gefunden. Umfragen zeigen konsistent, dass eine Mehrheit der Fortune 500-Unternehmen irgendeine Form von Vorbeschäftigungstests verwendet, und Persönlichkeitsinstrumente machen einen erheblichen Anteil dieser Aktivität aus. Der Reiz liegt auf der Hand: Wenn Sie vorhersagen können, wie sich ein Kandidat verhalten wird, bevor er Ihr Gebäude betritt, können Sie bessere Einstellungsentscheidungen zu geringeren Kosten treffen.

Die Realität ist erheblich komplizierter. Die Rechtslage in den Vereinigten Staaten schafft echte Einschränkungen, wie Persönlichkeitsdaten bei der Auswahl verwendet werden können. Die ethische Literatur wirft Fragen auf, die der rechtliche Rahmen nicht vollständig beantwortet. Und die Validitätsnachweis, obwohl real, ist schwächer als die meisten Anbieter zugeben.

Dieser Artikel behandelt die wichtigsten rechtlichen und ethischen Überlegungen, stützt sich auf die peer-reviewed Forschung und bietet ein Framework, um darüber nachzudenken, wo Persönlichkeitsbewertung wirklich hilft und wo sie inakzeptable Risiken einführt.

Der rechtliche Rahmen: Title VII, ADA und Persönlichkeitstests bei der Einstellung

Rechtliche rote Linien: In den meisten Rechtssystemen ist die Verwendung von Persönlichkeitstest-Ergebnissen als alleinige Grundlage für eine Ablehnung ein illegales Diskriminierungsrisiko, wenn der Test nachteilige Auswirkungen auf geschützte Gruppen hat. Beste Praxis: Persönlichkeit als einen von mehreren Inputs verwenden, sicherstellen, dass der Test arbeitsrelevant ist, den Validierungsprozess dokumentieren.

Zwei Rechtsbereiche sind am direktesten relevant: der Americans with Disabilities Act (ADA) von 1990 und die Doktrin des disparaten Impacts, die nach Title VII des Civil Rights Act von 1964 etabliert wurde, wie sie von der Equal Employment Opportunity Commission (EEOC) durchgesetzt wird.

Die ADA und medizinische Untersuchungen. Die ADA verbietet Arbeitgebern, medizinische Untersuchungen durchzuführen, bevor ein bedingtes Stellenangebot gemacht wurde. Die EEOC hat lange vertreten, dass psychologische Tests, die darauf ausgelegt sind, psychische Störungen oder Beeinträchtigungen zu erkennen, als medizinische Untersuchungen im Sinne dieser Definition gelten können. Ein Persönlichkeitstest ist nicht automatisch eine medizinische Untersuchung — Tests, die typische Persönlichkeitsmerkmale messen (wie Big Five-Instrumente), gelten im Allgemeinen nicht als medizinische Untersuchungen. Aber Tests, die behaupten, klinische Zustände zu screenen, Psychopathologie zu identifizieren oder Zustände wie Depressionen oder PTSD zu erkennen, sind es fast sicher. Arbeitgeber, die Instrumente verwenden, die vor einem bedingten Angebot in klinisches Terrain abdriften, gehen erhebliche rechtliche Risiken ein.

Disparater Impact unter Title VII. Selbst ein Test, der nichts mit Behinderung zu tun hat, kann gegen das Gesetz verstoßen, wenn er nachteilige Auswirkungen erzeugt — das heißt, wenn er Mitglieder einer geschützten Klasse zu einer substantiell höheren Rate ausschließt als andere, und dieses Differenzial nicht durch geschäftliche Notwendigkeit gerechtfertigt werden kann. Die einheitlichen Richtlinien der EEOC über Mitarbeitauswahlverfahren (1978) legen die Vier-Fünftel-Regel als grobe Referenz fest: Wenn die Auswahlrate für eine geschützte Gruppe weniger als vier Fünftel der Rate für die am höchsten punktende Gruppe beträgt, wird ein nachteiliger Impact vermutet.

Persönlichkeitstests variieren erheblich in dem Maße, in dem sie Gruppenunterschiede erzeugen. Die meta-analytische Literatur zu Untergruppendifferenzen bei der Persönlichkeit (von Hough und Kollegen überprüft) legt nahe, dass die Big Five-Dimensionen relativ kleine Mittelwertunterschiede zwischen Schwarzen und Weißen im Vergleich zu kognitiven Fähigkeitstests zeigen, die typischerweise Unterschiede von etwa einer Standardabweichung zeigen. Allerdings können kleine durchschnittliche Unterschiede je nach Grenzwert und Auswahlquote zu bedeutsamen nachteiligen Auswirkungen akkumulieren. Openness to Experience und einige Facetten der Extraversion zeigen etwas größere Gruppenunterschiede als Conscientiousness oder Agreeableness, obwohl keine Big Five-Dimension völlig frei von dieser Bedenken ist.

Für Hinweise darauf, wie HR-Fachleute Beschäftigungstests angehen sollten, bietet die Society for Human Resource Management (SHRM) praktische Frameworks, die sowohl rechtlichen Anforderungen als auch evidenzbasierten Praktiken entsprechen.

Das Validitätsproblem: Was Persönlichkeitstests bei der Einstellung tatsächlich vorhersagen

Rechtliche Compliance ist notwendig, aber nicht ausreichend. Die tiefere Frage ist, ob Persönlichkeitstests tatsächlich die Ergebnisse vorhersagen, die Arbeitgeber interessieren.

Der meta-analytische Befund ist gut etabliert und weitgehend konsistent. Barrick und Mounts wegweisende Meta-Analyse von 1991 — immer noch eine der meistzitierten Studien in der Industrie- und Organisationspsychologie — stellte fest, dass Conscientiousness Arbeitsleistung in allen Berufsgruppen mit einem korrigierten Validitätskoeffizient von etwa .22 vorhersagte (https://doi.org/10.1111/j.1744-6570.1991.tb00688.x). Andere Big Five-Dimensionen zeigten je nach Jobtyp eine variablere Validität. Die vollständige Evidenzbasis, warum Conscientiousness ein so konsistenter Prädiktor ist, wird in What is Conscientiousness? The most consistent predictor of job performance untersucht.

„Conscientiousness zeigte konsistente Beziehungen zu allen Arbeitsleistungskriterien für alle untersuchten Berufsgruppen… Die Ergebnisse unterstützen die Konstruktvalidität dieser Persönlichkeitsdimension."
— Barrick & Mount (1991), Personnel Psychology

Ein Validitätskoeffizient von .22 ist statistisch bedeutsam, aber praktisch bescheiden. Das bedeutet, dass Persönlichkeit etwa 4–5 Prozent der Varianz in der Arbeitsleistung erklärt. Kognitive Fähigkeitstests zeigen dagegen typischerweise Validitätskoeffizienten im .40–.50-Bereich für viele Jobs. Strukturierte Interviews zeigen eine Validität von etwa .50. Arbeitsproben können .54 erreichen.

Das bedeutet nicht, dass Persönlichkeitsdaten wertlos sind. Selbst kleine Prädiktionseffekte kumulieren über Tausende von Einstellungen. Aber es bedeutet, dass Persönlichkeitstests als primäres oder definitives Auswahlhindernis zu verwenden — Kandidaten ausschließlich aufgrund der Persönlichkeit zu bestehen oder zu versagen — wissenschaftlich nicht zu rechtfertigen ist. Das Signal ist real, aber schwach.

Der breitere wissenschaftliche Kontext, wie Persönlichkeitsinstrumente konzipiert und validiert werden, wird in Personality science and evidence-based HR: why it matters behandelt.

Nachteiliger Impact: Welche Big Five-Dimensionen tragen das größte rechtliche Risiko

Aus der Perspektive des disparaten Impacts tragen nicht alle Big Five-Dimensionen das gleiche Risiko. Die Forschung zu Untergruppendifferenzen legt nahe:

Persönlichkeitsdimension (Cèrcol-Name)	Typische Größenordnung der Gruppenunterschiede	Risiko nachteiliger Auswirkungen
Disziplin (Conscientiousness)	Klein	Geringer
Verbindung (Agreeableness)	Klein	Geringer
Präsenz (Extraversion)	Klein bis moderat	Moderat
Vision (Openness)	Klein bis moderat	Moderat
Tiefe (Neuroticism)	Klein	Geringer, aber ethische Bedenken wegen Stigmatisierung

Die geringeren Gruppenunterschiede für Conscientiousness sind einer der Gründe, warum sie tendenziell die Dimension ist, die Arbeitgeber am legitimsten für Vorhersagen einsetzen. Aber selbst hier schafft die Verwendung eines Grenzwerts für die Auswahl anstelle einer kontinuierlichen Bewertung für die Entwicklung Risiken.

Warum der Anwendungsfall bestimmt, ob Persönlichkeitstests vertretbar sind

Ein Großteil der rechtlichen und ethischen Debatte löst sich auf, wenn man erkennt, dass der Anwendungsfall genauso wichtig ist wie das Instrument. Dasselbe Persönlichkeitsprofil, das Haftung erzeugt, wenn es verwendet wird, um Kandidaten auszuschließen, erzeugt praktisch kein rechtliches Risiko, wenn es zur Unterstützung von Onboarding, Coaching oder Teamentwicklung verwendet wird.

Anwendungsfall	Rechtlich sicher	Vorsicht geboten
Entwicklungscoaching für aktuelle Mitarbeiter	Ja	Keine
Teamzusammensetzungsanalyse	Ja	Minimal
Onboarding und Manager-Briefings	Ja	Minimal
Strukturierte Entwicklungsgespräche	Ja	Keine
Ergänzender Input bei Einstellungen (kombiniert mit anderen Daten)	Mit Einschränkungen	Berufsrelevanz dokumentieren; nachteilige Auswirkungen überwachen
Primäres Auswahlhindernis (bestanden/nicht bestanden aufgrund Persönlichkeit)	Nein	Hoch — Validität zu schwach; Risiko nachteiliger Auswirkungen
Vorabbewerbungs-Screening ohne Jobanalyse	Nein	Sehr hoch

Siehe auch: Does personality composition predict team performance? und The science behind Cèrcol.

Für eine fundierte Perspektive darauf, wie Persönlichkeits-Job-Passung tatsächlich funktioniert und wann es angemessen ist, sie in Einstellungskontexten zu besprechen, siehe Personality and job fit: how to think about person-environment fit.

Beurteilung vs. Screening: Die entscheidende Unterscheidung bei persönlichkeitsbasierten Einstellungen

Die wichtigste praktische Unterscheidung ist die zwischen Beurteilung und Screening. Screening ist ein binäres Tor: man besteht oder besteht nicht. Beurteilung ist ein Profil: So tendiert diese Person zu verhalten, welche Umgebungen ihr geeignet sind, wo sie möglicherweise Unterstützung benötigt. Dieselben Persönlichkeitsdaten erhalten eine völlig andere rechtliche und ethische Bedeutung, je nachdem welches dieser Frameworks angewendet wird.

Wenn Persönlichkeitsdaten für das Screening verwendet werden, trägt der Arbeitgeber die Beweislast, Berufsrelevanz (Inhaltsvalidität) nachzuweisen und auf nachteilige Auswirkungen zu überwachen. Die einheitlichen Richtlinien der EEOC verlangen dies. Die meisten Arbeitgeber führen diese Arbeit nicht rigorös durch, was sowohl rechtliche Exposition als auch das Risiko schafft, systematisch qualifizierte Kandidaten auszuschließen.

Wenn Persönlichkeitsdaten für die Beurteilung verwendet werden — für die Entwicklung, für das Onboarding, für den Teamdialog — muss das Instrument zuverlässig und wissenschaftlich fundiert sein, aber die rechtliche Last ist weit geringer und die ethische Rechtfertigung ist klarer. Sie helfen Menschen, sich selbst und einander zu verstehen, nicht den Zugang zu wirtschaftlichen Möglichkeiten auf der Grundlage eines Tests zu rationieren.

Zwei weitere Fragen betreffen den ethischen Einsatz jedes Persönlichkeitsinstruments in einem beruflichen Kontext: in welchem Ausmaß Kandidaten die Ergebnisse manipulieren können, und die Rolle der sozialen Erwünschtheit. Dies wird in Can you fake a personality test? und Social desirability bias in personality tests untersucht.

Wie Cèrcol Persönlichkeitsbewertung ohne Screening-Risiko angeht

Cèrcol basiert auf dem Big Five / IPIP-Framework und verwendet Peer-Bewertung („Zeuginnen") neben der Selbstauskunft. Dieses Dual-Source-Design hat sowohl wissenschaftliche als auch ethische Vorteile: Multi-Rater-Daten sind zuverlässiger als Selbstauskunft allein, und die Entwicklungsorientierung bedeutet, dass Daten in Richtung Verständnis statt Auswahl fließen.

Für Organisationen, die Cèrcol verwenden, ist der angemessene Standardwert, Persönlichkeitsprofile vollständig aus Einstellungsprozessen herauszuhalten und sie ausschließlich für die Entwicklung zu verwenden. Wenn eine Organisation sich entscheidet, Persönlichkeitsdaten für Einstellungsverantwortliche verfügbar zu machen, sollte sie die Berufsrelevanz dokumentieren, Grenzwerte vermeiden und die Daten als ein schwaches Signal unter vielen behandeln, nicht als endgültige Antwort.

Die Literatur zu Beschäftigungstests dokumentiert eine lange Geschichte gut gemeinter Werkzeuge, die falsch angewendet wurden und echten Schaden anrichteten. Persönlichkeitsbewertung ist von dieser Geschichte nicht ausgenommen. Sorgfältig eingesetzt, mit angemessenem Umfang, fügt sie echten Wert hinzu. Leichtfertig als Auswahltor eingesetzt, führt sie rechtliche Risiken und ethische Schäden ein, die die bescheidene Validitätsnachweise nicht rechtfertigen.

Die ehrliche Antwort auf „Sollten wir Persönlichkeitstests bei der Einstellung verwenden?" ist: nicht als Filter, und nicht allein. Die ehrliche Antwort auf „Können uns Persönlichkeitsdaten helfen, bessere Teams aufzubauen?" ist: ja, mit dem richtigen Rahmen.

Persönlichkeitsdaten richtig verwenden

Die rechtliche und ethische Rechtfertigung für Persönlichkeitsbewertung bei Einstellungen hängt vollständig davon ab, wie sie eingesetzt wird. Cèrcol ist von Grund auf für den vertretbaren Anwendungsfall konzipiert: Teamentwicklung, Onboarding und Coaching — nicht Kandidatenscreening. Die Peer-Bewertungsmethodik Zeugin fügt eine zweite Datenquelle hinzu, die Selbstauskunftsinstrumente allein nicht liefern können, während alle Daten in einem entwicklungsorientierten Rahmen gehalten werden.

Wenn Ihre Organisation darüber nachdenkt, wie Persönlichkeitsdaten verantwortungsvoll eingesetzt werden können — und die rechtliche Exposition zu vermeiden, die mit Missbrauch einhergeht — ist die Überprüfung der Cèrcol-Methodik der richtige Ausgangspunkt. Für Teams, die bereits Persönlichkeitswerkzeuge verwenden, bieten die 12 Teamrollen ein praktisches Framework, um Big Five-Daten in umsetzbare Teamgespräche zu übersetzen.

Persönlichkeitstests bei der Einstellung: Was ist legal, was ist ethisch?

Der rechtliche Rahmen: Title VII, ADA und Persönlichkeitstests bei der Einstellung

Das Validitätsproblem: Was Persönlichkeitstests bei der Einstellung tatsächlich vorhersagen

Nachteiliger Impact: Welche Big Five-Dimensionen tragen das größte rechtliche Risiko

Warum der Anwendungsfall bestimmt, ob Persönlichkeitstests vertretbar sind

Beurteilung vs. Screening: Die entscheidende Unterscheidung bei persönlichkeitsbasierten Einstellungen

Wie Cèrcol Persönlichkeitsbewertung ohne Screening-Risiko angeht

Persönlichkeitsdaten richtig verwenden

Weiterführende Literatur

Verwandte Artikel

Warum Persönlichkeitswissenschaft zum Kern evidenzbasierter HR gehört

Wie man Persönlichkeitsdaten nutzt, ohne Menschen zu etikettieren

Persönlichkeit und Jobpassung: Wie man über Person-Umwelt-Passung nachdenkt