Is Cèrcol based on the Big Five?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP public-domain item pool (Goldberg et al. 2006). The 12 team roles are derived from the AB5C circumplex (Hofstee et al. 1992) and team composition research (Bell 2007; Neuman & Wright 1999).

What makes Cèrcol different from Belbin or DISC?

Cèrcol's roles are grounded in the Big Five (OCEAN) personality model using the IPIP public-domain item pool. The scoring pipeline is fully open source and auditable. Witness Cèrcol uses forced-choice adjective selection — not Likert scales — to eliminate social desirability bias in peer assessment. Unlike Belbin or DISC, all items are public domain and the entire methodology is published and citable.

Is the personality assessment free?

The New Moon Cèrcol (10 items, Big Five snapshot) and First Quarter Cèrcol (60 items, IPIP-NEO-60, 30 facets) are always free — no account required. The Full Moon Cèrcol (120 items, IPIP-NEO-120, Witness peer assessment, cognitive ability measure) requires a one-time payment.

What is Witness Cèrcol?

Witness Cèrcol is a peer personality assessment where someone who knows you well rates you using a forced-choice adjective selection method — picking the best-fit and worst-fit adjective per round from a set covering all five OCEAN dimensions. Forced choice eliminates the social desirability bias that affects standard Likert-scale peer ratings. Dimensions where your self-rating and peer ratings diverge by more than 0.8 standard deviations are flagged as potential blind spots.

How are the 12 team roles derived?

The 12 roles are derived from the AB5C circumplex (Hofstee, De Raad & Goldberg 1992), covering all six intersections of the three team balance dimensions (Presence/Extraversion × Bond/Agreeableness × Vision/Openness) at both poles. The selection of these three dimensions as requiring team-level balance is grounded in Bell (2007) and Neuman & Wright (1999). Discipline (Conscientiousness) and Depth (Neuroticism) modulate role expression but do not define team balance.

No account is required for any instrument. During assessment, no personal data is collected — only anonymous scores are logged. Data is stored on our own servers (Hetzner Online GmbH). No third-party analytics. No data is shared with or sold to third parties.

Is Cèrcol based on the Big Five (OCEAN)?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP — the International Personality Item Pool, a public-domain collection validated in thousands of published studies. The five dimensions are Presence (Extraversion), Bond (Agreeableness), Vision (Openness), Discipline (Conscientiousness), and Depth (Neuroticism). Because the IPIP is public domain there are no licence restrictions: the full item pool and scoring logic are open and citable.

How is Cèrcol different from Belbin, DISC, or StrengthsFinder?

Three things set Cèrcol apart. First, the items come from the Big Five (OCEAN), the most replicated personality model in academic research — not a proprietary framework. Second, the full item pool (IPIP) and scoring pipeline are public domain and auditable; there is no black box. Third, the Witness peer assessment uses forced-choice adjective selection instead of Likert scales, which eliminates the social desirability bias that affects most 360-feedback tools. Belbin and DISC use closed, proprietary methodologies.

What are blind spots in team personality assessment?

A blind spot is a personality dimension where how you see yourself and how others see you diverge significantly — more than 0.8 standard deviations apart. Cèrcol's Witness peer assessment detects blind spots by comparing your self-report with forced-choice adjective ratings from people who know you. Blind spots are neither good nor bad: they show where your self-perception and others' experience of you don't match, which is often more actionable than the score itself.

Ce que signifient la fiabilité et la validité dans les tests de personnalité

Parcourez n'importe quelle page marketing d'un test de personnalité et vous y trouverez deux mots utilisés comme réassurances : fiable et valide. Les fournisseurs les emploient librement, avec peu d'explications, comme signaux que leur instrument est scientifiquement crédible. Les termes ne sont presque jamais définis pour le lecteur.

Cela importe parce que la fiabilité et la validité ne sont pas interchangeables, ne sont pas la même chose et ne sont pas simples à évaluer en pratique. Un instrument peut être très fiable sans être valide. Un test peut afficher une validité apparente — il semble mesurer ce qu'il prétend — tout en échouant à tous les critères statistiques rigoureux de validité. Et le MBTI, l'instrument de personnalité le plus populaire commercialement dans le monde, illustre exactement comment un instrument peut mal performer sur les critères mêmes que ses éditeurs invoquent.

Cet article explique chaque concept clairement, décrit comment reconnaître des preuves fortes et faibles pour chacun, et fournit un cadre d'évaluation pratique pour tout instrument de personnalité.

α > 0.80 bon alpha de Cronbach (fiabilité)

r > 0.30 coefficient de validité minimum pour usage pratique

0.27 stabilité test-retest du Big Five sur 6 ans

Fiabilité vs validité : Un test fiable donne des résultats cohérents à chaque fois — mais un test valide mesure ce qu'il prétend mesurer. Les deux sont nécessaires ; ni l'un ni l'autre ne suffit seul.

Fiabilité dans les tests de personnalité : Ce que cela signifie et quels scores exiger

La fiabilité se réfère à la cohérence d'une mesure. Un test est fiable s'il produit les mêmes résultats — ou des résultats très similaires — dans des conditions où le trait sous-jacent n'a pas changé. Il y a deux types principaux.

Fiabilité test-retest

La fiabilité test-retest demande : si la même personne passe le même test deux fois, à quelques semaines d'intervalle, à quel point les résultats sont-ils similaires ? Les scores peuvent différer entre les administrations pour deux raisons : un changement réel du trait sous-jacent, ou une erreur de mesure. Un test fiable minimise l'erreur de mesure, de sorte que les changements de score entre les administrations reflètent principalement un changement réel plutôt que du bruit.

Le seuil standard pour une fiabilité test-retest acceptable est une corrélation d'environ 0.70 ou plus sur un intervalle de deux à quatre semaines. Les instruments Big Five bien validés atteignent généralement 0.80 ou plus pour les scores au niveau du domaine. La fiabilité test-retest du MBTI est plus faible — des études ont révélé qu'environ 50% des répondants reçoivent une classification différente à quatre lettres lorsqu'ils sont retestés cinq semaines plus tard, ce qui est la signature statistique d'une erreur de mesure élevée. Voir MBTI vs Big Five pour la comparaison complète.

Cohérence interne

La fiabilité de cohérence interne demande si les items d'une échelle mesurent le même construit sous-jacent. Si une échelle de Conscienciosité contient des items sur l'organisation, la diligence et la fiabilité, ces items devraient se corréler entre eux — parce qu'ils captent tous la même disposition sous-jacente. La statistique standard est l'alpha de Cronbach, où les valeurs supérieures à 0.70 sont généralement considérées comme acceptables et supérieures à 0.80 comme bonnes.

Une faible cohérence interne signifie que les items d'une échelle mesurent des choses différentes — ce qui rend difficile l'interprétation du score total de l'échelle. Un score de Conscienciosité dérivé d'items qui se corrèlent à peine entre eux n'est pas une mesure cohérente. Pour une explication de la façon dont la longueur de l'échelle interagit avec la cohérence interne, voir pourquoi 120 items valent mieux que 10.

Validité dans les tests de personnalité : Quatre types que tout acheteur devrait comprendre

La validité aborde une question différente : le test mesure-t-il réellement ce qu'il prétend mesurer ? Un test peut être parfaitement cohérent (fiable) tout en mesurant quelque chose d'entièrement erroné. Les principales formes de preuve de validité abordent chacune un aspect différent de cette question.

Validité convergente

La validité convergente demande si le test se corrèle avec d'autres mesures établies du même construit. Une nouvelle échelle d'Extraversion devrait se corréler positivement avec des mesures d'Extraversion validées existantes — parce que si les deux mesurent l'Extraversion, elles devraient s'accorder sur qui en a plus ou moins.

Cela semble évident mais est étonnamment souvent négligé. Beaucoup d'instruments propriétaires ne rapportent pas de données de validité convergente, ce qui rend impossible d'évaluer s'ils mesurent les mêmes construits que la littérature académique. La banque d'items IPIP a été construite précisément pour permettre ce type de comparaison publique.

Validité de critère

La validité de critère — la forme la plus importante en pratique — demande si le test prédit les résultats que le trait devrait théoriquement prédire. Si une mesure de Conscienciosité est valide, elle devrait prédire la performance au travail, la réussite académique et l'atteinte des objectifs, parce que la Conscienciosité est le trait le plus constamment lié à ces résultats dans la littérature. Si un test prétend mesurer la Conscienciosité mais ne montre aucune corrélation avec la performance au travail, il y a quelque chose qui ne va pas dans cette prétention.

La validité prédictive est un sous-type spécifique : le test prédit-il des résultats futurs ? La validité concurrente demande si le test se corrèle avec des résultats évalués au même moment. Les deux importent, mais la validité prédictive est l'étalon-or pour les instruments utilisés dans la sélection du personnel. Pour les implications sur le recrutement spécifiquement, voir les tests de personnalité dans le recrutement : ce qui est légal et ce qui est éthique.

Validité discriminante

La validité discriminante demande si le test se corrèle trop fortement avec des mesures de construits différents. Si une échelle prétendant mesurer l'Agréabilité se corrèle aussi fortement avec la Conscienciosité qu'avec d'autres mesures d'Agréabilité, il se peut qu'elle ne mesure pas l'Agréabilité de manière distincte. Comprendre ce que chaque facette du Big Five mesure de manière unique aide ici — voir qu'est-ce qu'une facette en psychologie de la personnalité.

Validité apparente vs validité statistique

La validité apparente est l'apparence de mesurer ce qu'un test prétend. Un item qui indique « Je suis une personne organisée » a une haute validité apparente pour la Conscienciosité — il semble mesurer l'organisation. Mais la validité apparente n'est pas la même chose que la validité statistique, et les confondre est l'une des erreurs les plus courantes dans l'évaluation des tests de personnalité.

Beaucoup d'instruments populaires ont une haute validité apparente et une validité statistique modeste à médiocre. Le contenu semble pertinent ; les prédictions sont faibles. Pour une analyse des tests populaires qui tombent dans ce piège, voir les meilleurs tests de personnalité gratuits pour les équipes en 2026.

Concept psychométrique	Ce qu'il mesure	Bon seuil	Instruments Big Five	MBTI
Fiabilité test-retest	Cohérence des scores dans le temps	r ≥ 0.70 sur 4 semaines	Typiquement 0.80–0.90	~0.50 (50% de changement de type au retest)
Cohérence interne (alpha de Cronbach)	Cohérence des items d'une échelle	α ≥ 0.70	Typiquement 0.80–0.90	Modérée ; varie selon l'échelle
Validité convergente	Accord avec d'autres mesures du même trait	r ≥ 0.50 avec mesure établie	Bien documentée en revue par les pairs	Données limitées publiées entre instruments
Validité de critère	Prédiction de résultats réels	Varie ; d ≥ 0.20 considéré significatif	La Conscienciosité prédit robustement la performance au travail	Faible prédiction de la performance au travail
Validité discriminante	Indépendance des mesures de traits différents	r faible avec des échelles conceptuellement distinctes	Généralement soutenue	Les dimensions ne sont pas clairement indépendantes les unes des autres

Cinq questions pour évaluer toute affirmation de validité d'un test de personnalité

Quand un fournisseur ou un chercheur affirme qu'un instrument de personnalité est « valide et fiable », les questions suivantes produisent une évaluation rapide de la qualité.

Question 1 : La preuve de validité est-elle publiée dans des revues à comité de lecture ? Les rapports techniques propriétaires, les livres blancs et les textes de sites web ne comptent pas. L'examen par les pairs soumet les affirmations de validité à un examen indépendant. Si la seule preuve de validité est la documentation propre de l'éditeur, c'est un signal d'alarme. Les implications plus larges de la façon dont la science de la personnalité gère la réplication sont abordées dans la crise de réplication en science de la personnalité.

Question 2 : Quelle est la fiabilité test-retest sur un intervalle cliniquement significatif ? Quatre à six semaines est le standard. Si ce chiffre n'est pas rapporté ou est inférieur à 0.70, la mesure est bruyante.

Question 3 : Quels résultats l'instrument prédit-il ? La preuve de validité de critère devrait inclure des résultats réels, pas seulement des corrélations avec d'autres mesures auto-rapportées. Pour les instruments pertinents pour le travail, la performance au travail est le critère clé.

Question 4 : Des groupes de recherche indépendants ont-ils répliqué les résultats de validité ? Une seule étude par les propres développeurs de l'instrument est insuffisante. La réplication par des chercheurs sans intérêt commercial dans le résultat est la norme significative.

Question 5 : La notation est-elle transparente ? Si l'algorithme de notation est propriétaire, les affirmations de validité ne peuvent pas être vérifiées indépendamment. Les instruments de science ouverte — y compris l'IPIP sur lequel est construit Cèrcol — permettent à quiconque de vérifier les affirmations par rapport aux données. Voir tests de personnalité : open source vs commercial pour la comparaison complète.

Pourquoi l'évaluation par les pairs ajoute une validité que l'auto-rapport ne peut fournir

Une source de validité sous-estimée dans l'évaluation de la personnalité est l'utilisation des évaluations des observateurs aux côtés de l'auto-rapport. La personnalité mesurée par des personnes qui connaissent le sujet — collègues, managers, subordonnés directs — montre généralement une validité de critère plus élevée que l'auto-rapport seul, particulièrement pour prédire la performance au travail.

C'est parce que l'auto-rapport est sujet à la gestion des impressions (se noter de manière plus favorable, consciemment ou inconsciemment) et à une connaissance limitée de soi (les gens ne savent souvent pas comment ils apparaissent aux autres). Les évaluations des observateurs ne sont pas exemptes de biais, mais elles sont affectées par des biais différents — ce qui signifie que la combinaison de données sur soi et d'observateurs produit des estimations de personnalité plus précises que l'une ou l'autre seule. Pour l'argument complet, voir pourquoi l'auto-évaluation seule ne suffit pas : le feedback de personnalité entre pairs.

Le modèle Témoin (Witness) de Cèrcol est conçu autour de ce principe. L'histoire du Big Five et la page science fournissent plus de contexte sur la preuve de validité qui sous-tend les choix de conception de Cèrcol.

« La fiabilité et la validité ne sont pas des affirmations marketing. Ce sont des propriétés statistiques spécifiques avec des seuils établis, mesurables par des méthodes standard et vérifiables par des données publiées. Un instrument qui ne peut pas fournir de preuves revues par les pairs pour les deux devrait être évalué avec un scepticisme proportionné. »

Comment Cèrcol satisfait le niveau de fiabilité et de validité

L'instrument de Cèrcol est construit sur la banque d'items IPIP — les mêmes items du domaine public dont les propriétés psychométriques ont été documentées de manière indépendante par Goldberg et ses collègues au fil des décennies de recherche publiée. La fiabilité test-retest au niveau du domaine pour les échelles Big Five basées sur IPIP se situe généralement au-dessus de r = 0.80 sur des intervalles de quatre semaines. La cohérence interne (alpha de Cronbach) pour les échelles de 20 items par dimension que Cèrcol utilise est systématiquement supérieure à 0.87.

La validité de critère est héritée de la littérature Big Five plus large : la Conscienciosité (Discipline) prédit la performance au travail dans toutes les principales catégories professionnelles (Barrick & Mount, 1991, doi : 10.1111/j.1744-6570.1991.tb00688.x). Le Névrosisme (Profondeur) prédit la réponse au stress et les résultats de bien-être. L'Ouverture (Vision) prédit la performance créative.

L'évaluation par les pairs Témoin ajoute des scores évalués par des observateurs sur les mêmes cinq dimensions en utilisant un format à choix forcé qui réduit le biais de désirabilité sociale — voir biais de désirabilité sociale dans les tests de personnalité pour la méthodologie complète. Passez l'évaluation gratuite sur cercol.team et consultez la documentation de validité complète sur cercol.team/science.

Lecture complémentaire : L'histoire du Big Five : d'Allport à Goldberg · La science derrière Cèrcol

Ce que signifient la fiabilité et la validité dans les tests de personnalité — expliqué clairement

Fiabilité dans les tests de personnalité : Ce que cela signifie et quels scores exiger

Fiabilité test-retest

Cohérence interne

Validité dans les tests de personnalité : Quatre types que tout acheteur devrait comprendre

Validité convergente

Validité de critère

Validité discriminante

Validité apparente vs validité statistique

Cinq questions pour évaluer toute affirmation de validité d'un test de personnalité

Pourquoi l'évaluation par les pairs ajoute une validité que l'auto-rapport ne peut fournir

Comment Cèrcol satisfait le niveau de fiabilité et de validité

Lecture complémentaire

Articles liés

La science de la personnalité et la crise de réplication : qu'est-ce qui a résisté ?

Qu'est-ce qu'une facette en psychologie de la personnalité — et pourquoi est-ce important ?

L'histoire du Big Five : d'Allport à Goldberg