Is Cèrcol based on the Big Five?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP public-domain item pool (Goldberg et al. 2006). The 12 team roles are derived from the AB5C circumplex (Hofstee et al. 1992) and team composition research (Bell 2007; Neuman & Wright 1999).

What makes Cèrcol different from Belbin or DISC?

Cèrcol's roles are grounded in the Big Five (OCEAN) personality model using the IPIP public-domain item pool. The scoring pipeline is fully open source and auditable. Witness Cèrcol uses forced-choice adjective selection — not Likert scales — to eliminate social desirability bias in peer assessment. Unlike Belbin or DISC, all items are public domain and the entire methodology is published and citable.

Is the personality assessment free?

The New Moon Cèrcol (10 items, Big Five snapshot) and First Quarter Cèrcol (60 items, IPIP-NEO-60, 30 facets) are always free — no account required. The Full Moon Cèrcol (120 items, IPIP-NEO-120, Witness peer assessment, cognitive ability measure) requires a one-time payment.

What is Witness Cèrcol?

Witness Cèrcol is a peer personality assessment where someone who knows you well rates you using a forced-choice adjective selection method — picking the best-fit and worst-fit adjective per round from a set covering all five OCEAN dimensions. Forced choice eliminates the social desirability bias that affects standard Likert-scale peer ratings. Dimensions where your self-rating and peer ratings diverge by more than 0.8 standard deviations are flagged as potential blind spots.

How are the 12 team roles derived?

The 12 roles are derived from the AB5C circumplex (Hofstee, De Raad & Goldberg 1992), covering all six intersections of the three team balance dimensions (Presence/Extraversion × Bond/Agreeableness × Vision/Openness) at both poles. The selection of these three dimensions as requiring team-level balance is grounded in Bell (2007) and Neuman & Wright (1999). Discipline (Conscientiousness) and Depth (Neuroticism) modulate role expression but do not define team balance.

No account is required for any instrument. During assessment, no personal data is collected — only anonymous scores are logged. Data is stored on our own servers (Hetzner Online GmbH). No third-party analytics. No data is shared with or sold to third parties.

Is Cèrcol based on the Big Five (OCEAN)?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP — the International Personality Item Pool, a public-domain collection validated in thousands of published studies. The five dimensions are Presence (Extraversion), Bond (Agreeableness), Vision (Openness), Discipline (Conscientiousness), and Depth (Neuroticism). Because the IPIP is public domain there are no licence restrictions: the full item pool and scoring logic are open and citable.

How is Cèrcol different from Belbin, DISC, or StrengthsFinder?

Three things set Cèrcol apart. First, the items come from the Big Five (OCEAN), the most replicated personality model in academic research — not a proprietary framework. Second, the full item pool (IPIP) and scoring pipeline are public domain and auditable; there is no black box. Third, the Witness peer assessment uses forced-choice adjective selection instead of Likert scales, which eliminates the social desirability bias that affects most 360-feedback tools. Belbin and DISC use closed, proprietary methodologies.

What are blind spots in team personality assessment?

A blind spot is a personality dimension where how you see yourself and how others see you diverge significantly — more than 0.8 standard deviations apart. Cèrcol's Witness peer assessment detects blind spots by comparing your self-report with forced-choice adjective ratings from people who know you. Blind spots are neither good nor bad: they show where your self-perception and others' experience of you don't match, which is often more actionable than the score itself.

Què signifiquen la fiabilitat i la validesa en els tests de personalitat

Fiabilitat en els tests de personalitat: què significa i quines puntuacions exigir

La fiabilitat fa referència a la constància d'una mesura. Un test és fiable si produeix els mateixos resultats, o molt similars, en condicions on el tret subjacent no ha canviat. N'hi ha dos tipus principals.

Fiabilitat test-retest

La fiabilitat test-retest pregunta: si la mateixa persona fa el mateix test dues vegades, amb unes poques setmanes de diferència, com de similars són els resultats? Les puntuacions poden diferir entre administracions per dues raons: un canvi genuí en el tret subjacent, o un error de mesura. Un test fiable minimitza l'error de mesura, de manera que els canvis de puntuació entre administracions reflecteixin principalment un canvi real més que no soroll.

El llindar estàndard per a una fiabilitat test-retest acceptable és una correlació d'aproximadament 0,70 o superior en un interval de dues a quatre setmanes. Els instruments del Big Five ben validats generalment aconsegueixen 0,80 o superior per a puntuacions a escala de domini. La fiabilitat test-retest del MBTI és menor: els estudis han trobat que aproximadament el 50% de les persones enquestades reben una classificació diferent de quatre lletres quan es tornen a avaluar cinc setmanes després, que és la signatura estadística d'un error de mesura elevat. Consulta MBTI enfront de Big Five per a la comparació completa.

Consistència interna

La fiabilitat de consistència interna pregunta si els ítems dins d'una escala mesuren el mateix constructe subjacent. Si una escala de Conscientiousness conté ítems sobre organització, diligència i fiabilitat, aquests ítems s'haurien de correlacionar entre si, perquè tots capten la mateixa disposició subjacent. L'estadística estàndard és l'alfa de Cronbach, on els valors per sobre de 0,70 es consideren generalment acceptables i per sobre de 0,80 són bons.

Una consistència interna baixa significa que els ítems dins d'una escala mesuren coses diferents, fet que dificulta la interpretació de la puntuació total de l'escala. Una puntuació de Conscientiousness derivada d'ítems que gairebé no es correlacionen entre si no és una mesura coherent. Per a una explicació de com la longitud de l'escala interactua amb la consistència interna, consulta per què 120 ítems és millor que 10.

Validesa en els tests de personalitat: quatre tipus que tot comprador hauria d'entendre

La validesa aborda una pregunta diferent: el test mesura realment el que pretén mesurar? Un test pot ser perfectament constant (fiable) mentre mesura quelcom completament equivocat. Les principals formes d'evidència de validesa aborden cadascuna un aspecte diferent d'aquesta pregunta.

Validesa convergent

La validesa convergent pregunta si el test es correlaciona amb altres mesures establertes del mateix constructe. Una nova escala d'Extraversion s'hauria de correlacionar positivament amb mesures d'Extraversion validades existents, perquè si totes dues mesuren l'Extraversion, haurien d'estar d'acord sobre qui en té més i qui menys.

Això sembla obvi, però és sorprenentment freqüent que es descuidi. Molts instruments propietaris no informen de dades de validesa convergent, cosa que fa impossible avaluar si mesuren els mateixos constructes que la literatura acadèmica. El banc d'ítems IPIP es va construir precisament per a permetre aquest tipus de comparació pública.

Validesa de criteri

La validesa de criteri, la forma més important a la pràctica, pregunta si el test prediu els resultats que el tret hauria de predir teòricament. Si una mesura de Conscientiousness és vàlida, hauria de predir el rendiment laboral, el rendiment acadèmic i l'assoliment d'objectius, perquè la Conscientiousness és el tret que s'associa de manera més constant a aquests resultats a la literatura. Si un test afirma mesurar la Conscientiousness però no mostra cap correlació amb el rendiment laboral, hi ha quelcom que no funciona en l'afirmació.

La validesa predictiva és un subtipus específic: el test prediu resultats futurs? La validesa concurrent pregunta si el test es correlaciona amb resultats avaluats al mateix temps. Tots dos importen, però la validesa predictiva és l'estàndard d'or per als instruments utilitzats en la selecció de personal. Per a les implicacions específiques per a la contractació, consulta els tests de personalitat en la contractació: què és legal i què és ètic.

Validesa discriminant

La validesa discriminant pregunta si el test es correlaciona massa amb mesures de constructes diferents. Si una escala que pretén mesurar l'Agreeableness es correlaciona tan fortament amb la Conscientiousness com ho fa amb altres mesures d'Agreeableness, pot ser que no mesuri l'Agreeableness de manera diferenciada — les dues escales poden estar mesurant gairebé el mateix, cosa que vol dir que la informació és parcialment redundant. Entendre el que mesura de manera única cada faceta del Big Five ajuda aquí; consulta què és una faceta en psicologia de la personalitat.

Validesa aparent enfront de validesa estadística

La validesa aparent és l'aparença de mesurar el que un test afirma. Un ítem que diu «Soc una persona organitzada» té una validesa aparent alta per a la Conscientiousness: sembla que mesura l'organització. Però la validesa aparent no és el mateix que la validesa estadística, i confondre-les és un dels errors més comuns en l'avaluació de tests de personalitat.

Molts instruments populars tenen una validesa aparent alta i una validesa estadística modesta o deficient. El contingut sembla rellevant; les prediccions són febles. Per a un desglossament de quins tests populars cauen en aquesta trampa, consulta els millors tests de personalitat gratuïts per a equips el 2026.

Concepte psicomètric	Què mesura	Bon llindar	Instruments del Big Five	MBTI
Fiabilitat test-retest	Constància de les puntuacions al llarg del temps	r ≥ 0,70 durant 4 setmanes	Típicament 0,80–0,90	~0,50 (50% de canvi de tipus en el retest)
Consistència interna (alfa de Cronbach)	Coherència dels ítems dins d'una escala	α ≥ 0,70	Típicament 0,80–0,90	Moderada; varia segons l'escala
Validesa convergent	Acord amb altres mesures del mateix tret	r ≥ 0,50 amb una mesura establerta	Ben documentada en la revisió per parells	Dades limitades publicades entre instruments
Validesa de criteri	Predicció de resultats del món real	Varia; d ≥ 0,20 es considera significatiu	La Conscientiousness prediu el rendiment laboral de manera robusta	Predicció feble del rendiment laboral
Validesa discriminant	Independència de mesures de trets diferents	r baixa amb escales conceptualment diferents	Generalment avalada	Les dimensions no són clarament independents entre si

Cinc preguntes per avaluar qualsevol afirmació de validesa d'un test de personalitat

Quan un venedor o un investigador afirma que un instrument de personalitat és «vàlid i fiable», les preguntes següents produeixen una valoració ràpida de qualitat.

Pregunta 1: l'evidència de validesa està publicada en revistes revisades per parells? Els informes tècnics propietaris, els llibres blancs i els textos de llocs web no compten. La revisió per parells sotmet les afirmacions de validesa a un escrutini independent. Si l'única evidència de validesa és la documentació pròpia de l'editor, es tracta d'un senyal d'alarma. Les implicacions més àmplies de com la ciència de la personalitat gestiona la replicació s'aborden a la crisi de replicació en ciència de la personalitat.

Pregunta 2: quina és la fiabilitat test-retest en un interval clínicament significatiu? De quatre a sis setmanes és l'estàndard. Si aquest nombre no s'informa o és inferior a 0,70, la mesura és sorollosa.

Pregunta 3: quins resultats prediu l'instrument? L'evidència de validesa de criteri hauria d'incloure resultats del món real, no només correlacions amb altres mesures d'autoinforme. Per als instruments rellevants per al treball, el rendiment laboral és el criteri clau.

Pregunta 4: grups de recerca independents han replicat els resultats de validesa? Un únic estudi dels mateixos desenvolupadors de l'instrument és insuficient. La replicació per part d'investigadors sense interès comercial en el resultat és l'estàndard significatiu.

Pregunta 5: la puntuació és transparent? Si l'algorisme de puntuació és propietari, les afirmacions de validesa no es poden verificar de manera independent. Els instruments de ciència oberta, inclòs l'IPIP en el qual es basa Cèrcol, permeten que qualsevol comprovi les afirmacions amb les dades. Consulta tests de personalitat: codi obert enfront de comercial per a la comparació completa.

Per què l'avaluació per parells afegeix una validesa que l'autoinforme no pot proporcionar

Una font de validesa poc valorada en l'avaluació de la personalitat és l'ús de valoracions d'avaluadors externs juntament amb l'autoinforme. La personalitat mesurada per persones que coneixen el subjecte —col·legues, gestors, subordinats directes— mostra típicament una validesa de criteri superior a l'autoinforme sol, especialment per predir el rendiment laboral.

Això es deu al fet que l'autoinforme està subjecte a la gestió d'impressions (puntuar-se de manera més favorable, conscientment o inconscientment) i al coneixement limitat d'un mateix (les persones sovint no saben com apareixen davant dels altres). Les valoracions dels avaluadors externs no estan lliures de biaixos, però estan afectades per biaixos diferents, cosa que significa que combinar dades pròpies i d'avaluadors externs produeix estimacions de personalitat més precises que qualsevol de les dues per separat. Per a l'argument complet, consulta per què l'autoavaluació sola no és suficient: el retorn de personalitat entre parells.

El model Testimoni de Cèrcol està dissenyat al voltant d'aquest principi. La història del Big Five i la pàgina de ciència proporcionen més context sobre l'evidència de validesa que sosté les decisions de disseny de Cèrcol.

«La fiabilitat i la validesa no són afirmacions de màrqueting. Són propietats estadístiques específiques amb llindars establerts, mesurables a través de mètodes estàndard i verificables a través de dades publicades. Un instrument que no pot proporcionar evidència revisada per parells per a totes dues hauria d'avaluar-se amb un escepticisme proporcional.»

Com Cèrcol compleix el nivell de fiabilitat i validesa

L'instrument de Cèrcol es basa en el banc d'ítems IPIP, els mateixos ítems de domini públic les propietats psicomètriques dels quals han estat documentades de manera independent per Goldberg i col·legues al llarg de dècades d'investigació publicada. La fiabilitat test-retest a escala de domini per a les escales del Big Five basades en l'IPIP generalment se situa per sobre de r = 0,80 en intervals de quatre setmanes. La consistència interna (alfa de Cronbach) per a les escales de 20 ítems per dimensió que utilitza Cèrcol és, de manera constant, per sobre de 0,87.

La validesa de criteri s'hereta de la literatura del Big Five més àmplia: la Conscientiousness (Disciplina) prediu el rendiment laboral en totes les principals categories ocupacionals (Barrick & Mount, 1991, doi: 10.1111/j.1744-6570.1991.tb00688.x). El Neuroticism (Profunditat) prediu la resposta a l'estrès i els resultats de benestar. L'Openness (Visió) prediu el rendiment creatiu.

L'avaluació de parells Testimoni afegeix puntuacions valorades per avaluadors externs en les mateixes cinc dimensions utilitzant un format d'elecció forçada que redueix el biaix de desitjabilitat social; consulta biaix de desitjabilitat social en tests de personalitat per a la metodologia completa. Fes l'avaluació gratuïta a cercol.team i revisa la documentació de validesa completa a cercol.team/science.

Lectura addicional: La història del Big Five: d'Allport a Goldberg · La ciència darrere de Cèrcol

Què signifiquen la fiabilitat i la validesa en els tests de personalitat — explicat clarament

Fiabilitat en els tests de personalitat: què significa i quines puntuacions exigir

Fiabilitat test-retest

Consistència interna

Validesa en els tests de personalitat: quatre tipus que tot comprador hauria d'entendre

Validesa convergent

Validesa de criteri

Validesa discriminant

Validesa aparent enfront de validesa estadística

Cinc preguntes per avaluar qualsevol afirmació de validesa d'un test de personalitat

Per què l'avaluació per parells afegeix una validesa que l'autoinforme no pot proporcionar

Com Cèrcol compleix el nivell de fiabilitat i validesa

Lectura addicional

Articles relacionats

La ciència de la personalitat i la crisi de replicació: què ha resistit?

Per què 120 ítems és millor que 10: el compromís en la llargada dels tests de personalitat

La història del Big Five: d'Allport a Goldberg