Is Cèrcol based on the Big Five?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP public-domain item pool (Goldberg et al. 2006). The 12 team roles are derived from the AB5C circumplex (Hofstee et al. 1992) and team composition research (Bell 2007; Neuman & Wright 1999).

What makes Cèrcol different from Belbin or DISC?

Cèrcol's roles are grounded in the Big Five (OCEAN) personality model using the IPIP public-domain item pool. The scoring pipeline is fully open source and auditable. Witness Cèrcol uses forced-choice adjective selection — not Likert scales — to eliminate social desirability bias in peer assessment. Unlike Belbin or DISC, all items are public domain and the entire methodology is published and citable.

Is the personality assessment free?

The New Moon Cèrcol (10 items, Big Five snapshot) and First Quarter Cèrcol (60 items, IPIP-NEO-60, 30 facets) are always free — no account required. The Full Moon Cèrcol (120 items, IPIP-NEO-120, Witness peer assessment, cognitive ability measure) requires a one-time payment.

What is Witness Cèrcol?

Witness Cèrcol is a peer personality assessment where someone who knows you well rates you using a forced-choice adjective selection method — picking the best-fit and worst-fit adjective per round from a set covering all five OCEAN dimensions. Forced choice eliminates the social desirability bias that affects standard Likert-scale peer ratings. Dimensions where your self-rating and peer ratings diverge by more than 0.8 standard deviations are flagged as potential blind spots.

How are the 12 team roles derived?

The 12 roles are derived from the AB5C circumplex (Hofstee, De Raad & Goldberg 1992), covering all six intersections of the three team balance dimensions (Presence/Extraversion × Bond/Agreeableness × Vision/Openness) at both poles. The selection of these three dimensions as requiring team-level balance is grounded in Bell (2007) and Neuman & Wright (1999). Discipline (Conscientiousness) and Depth (Neuroticism) modulate role expression but do not define team balance.

No account is required for any instrument. During assessment, no personal data is collected — only anonymous scores are logged. Data is stored on our own servers (Hetzner Online GmbH). No third-party analytics. No data is shared with or sold to third parties.

Is Cèrcol based on the Big Five (OCEAN)?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP — the International Personality Item Pool, a public-domain collection validated in thousands of published studies. The five dimensions are Presence (Extraversion), Bond (Agreeableness), Vision (Openness), Discipline (Conscientiousness), and Depth (Neuroticism). Because the IPIP is public domain there are no licence restrictions: the full item pool and scoring logic are open and citable.

How is Cèrcol different from Belbin, DISC, or StrengthsFinder?

Three things set Cèrcol apart. First, the items come from the Big Five (OCEAN), the most replicated personality model in academic research — not a proprietary framework. Second, the full item pool (IPIP) and scoring pipeline are public domain and auditable; there is no black box. Third, the Witness peer assessment uses forced-choice adjective selection instead of Likert scales, which eliminates the social desirability bias that affects most 360-feedback tools. Belbin and DISC use closed, proprietary methodologies.

What are blind spots in team personality assessment?

A blind spot is a personality dimension where how you see yourself and how others see you diverge significantly — more than 0.8 standard deviations apart. Cèrcol's Witness peer assessment detects blind spots by comparing your self-report with forced-choice adjective ratings from people who know you. Blind spots are neither good nor bad: they show where your self-perception and others' experience of you don't match, which is often more actionable than the score itself.

Per què 120 ítems és millor que 10: el compromís en la llargada dels tests de personalitat

La fórmula de Spearman-Brown: per què la longitud del test prediu la fiabilitat del Big Five

La relació matemàtica entre la longitud del test i la fiabilitat la van formalitzar fa més d'un segle Charles Spearman i William Brown, que treballaven de manera independent. La fórmula de profecia de Spearman-Brown prediu com canvia la fiabilitat quan canvies el nombre d'ítems d'un test, suposant que els ítems nous són de qualitat similar als originals.

La fórmula té una implicació específica: els guanys de fiabilitat per afegir ítems segueixen una corba de rendiments decreixents. Passar de 2 ítems a 10 ítems produeix un gran guany de fiabilitat. Passar de 80 ítems a 120 ítems en produeix un de molt més petit. Els primers ítems fan la major part de la feina; cada ítem addicional aporta menys que l'anterior.

Per això, l'elecció de la longitud del test és una veritable decisió d'enginyeria, i no una simple conclusió que «com més, millor». En algun punt, la càrrega sobre les persones participants supera el guany de fiabilitat. La pregunta pràctica és on es troba aquest punt per al cas d'ús en qüestió. Per a un tractament complet de com es defineix i es mesura la fiabilitat, consulta què són la fiabilitat i la validesa en les proves de personalitat.

«La fórmula de Spearman-Brown fa precisa la relació fiabilitat-longitud: per a duplicar la fiabilitat d'un test, n'has de quadruplicar aproximadament la longitud.»

Què perden els tests del Big Five de 10 ítems que els instruments més llargs capten

Els dos ítems per dimensió del TIPI no poden, per construcció, captar la variació en el pla de les facetes dins de cada dimensió del Big Five. Com es descriu a què és una faceta en la psicologia de la personalitat, cada dimensió del Big Five conté sis facetes: subtrets estrets que poden apuntar en direccions diferents en persones amb la mateixa puntuació global de dimensió.

Una escala de Conscienciositat de dos ítems pot classificar amb èxit si una persona és en general alta o baixa en la dimensió. Però no pot distingir entre algú la Conscienciositat de qui ve impulsada per l'Ordre i el Sentit del Deure i algú el perfil de qui està dominat per l'Afany d'Assoliment i l'Autodisciplina, que és precisament la distinció més rellevant per a l'adequació de rol i el desenvolupament.

La mateixa limitació s'aplica a totes les dimensions. Una escala d'Obertura de dos ítems no pot separar la curiositat intel·lectual de la sensibilitat estètica. Una escala de Neuroticisme de dos ítems no pot distingir la reactivitat impulsada per l'ansietat de la reactivitat impulsada per la ira.

Els tests curts també mostren una fiabilitat reduïda per a les persones que se situen a prop del centre de la distribució, el rang on puntua la majoria de gent en la majoria de dimensions. Per a les persones amb puntuacions clarament extremes (molt altes o molt baixes), dos ítems poden ser suficients per a classificar-les raonablement. Per a la majoria, que puntua en el rang moderat, l'error de mesura d'una escala de dos ítems és prou gran per a produir classificacions diferents en la reavaluació. Per a l'explicació estadística de per què això importa, consulta com es calculen les puntuacions dels tests de personalitat.

TIPI vs. IPIP-NEO-120: compromisos de fiabilitat un al costat de l'altre

L'IPIP-NEO-120 és un instrument de 120 ítems, disponible lliurement, que mesura les cinc dimensions del Big Five i les trenta facetes. Es va desenvolupar específicament com una alternativa d'accés obert al NEO PI-R propietari, i les seves propietats de validesa s'han documentat en recerca revisada per experts.

La comparació amb el TIPI il·lustra directament el compromís fiabilitat-longitud:

Longitud del test	Instrument d'exemple	Ítems per dimensió	Mesura de facetes	Estimació de fiabilitat (α)	Cas d'ús adequat
10 ítems	TIPI	2	Cap	~0.45–0.65 per dimensió	Recerca de població a gran escala; cribratge quan la brevetat és essencial; autoexploració de baix risc
44 ítems	BFI (Big Five Inventory)	~8–9	Cap	~0.75–0.85 per dimensió	Recerca acadèmica que requereix equilibri entre brevetat i fiabilitat; estudis en l'àmbit del grup
60 ítems	IPIP-NEO-60	12	Parcial	~0.80–0.87 per dimensió	Recerca aplicada; contextos de desenvolupament de risc moderat
100–120 ítems	Cèrcol / IPIP-NEO-120	20–24	Completa (30 facetes)	~0.87–0.93 per dimensió	Desenvolupament individual; perfils d'equip; coaching; avaluació d'alt risc
240 ítems	NEO PI-R (complet)	48	Completa (30 facetes)	~0.90–0.95 per dimensió	Avaluació clínica; recerca que requereix màxima precisió; selecció d'alt risc

Quan un test de personalitat curt és realment adequat

L'argument a favor dels tests de personalitat curts és real i no s'ha de desestimar. En certs contextos, un instrument de 10 ítems és l'elecció correcta.

La recerca de població a gran escala requereix la participació de milers de persones. Un temps de finalització de 10 minuts crea un abandó significativament més gran que un de 2 minuts, cosa que produeix mostres esbiaixades. Quan la pregunta de recerca fa referència a tendències en l'àmbit de la població en lloc de perfils individuals, la fiabilitat més feble del TIPI és acceptable perquè es promitja en mostres grans.

Els contextos de cribratge —on l'objectiu és identificar qui podria beneficiar-se d'una avaluació més exhaustiva— poden fer servir adequadament instruments curts. Si un cribratge de 10 ítems identifica persones candidates en el quartil superior o inferior d'una dimensió per a una avaluació posterior, la brevetat és un compromís raonable.

La mesura repetida presenta un problema diferent. Si vols fer un seguiment del canvi de personalitat al llarg del temps —o a través de diverses intervencions de desenvolupament—, administrar un instrument de 120 ítems cada trimestre és feixuc. Un formulari curt validat fet servir amb constància al llarg del temps pot produir dades longitudinals sobre les quals es pot actuar millor que una administració de format llarg poc freqüent.

L'autoexploració de baix risc —on la persona usuària simplement té curiositat per la seva personalitat en lloc de fer servir les dades per a una decisió de conseqüències— pot fer servir adequadament instruments més curts. El cost de l'error de mesura és menor quan el que hi ha en joc és menor. Per a una comparació de quines avaluacions gratuïtes són adequades per a quins nivells de risc, consulta els millors tests de personalitat gratuïts per a equips el 2026.

Quan la longitud del test importa: desenvolupament individual i perfils d'equip

L'argument a favor dels instruments més llargs es reforça a mesura que augmenten el que hi ha en joc i els requisits d'especificitat del cas d'ús.

El desenvolupament individual requereix dades en el pla de les facetes. Un instrument de 10 ítems no pot dir a un coach o un directiu per què la puntuació de Conscienciositat d'algú és la que és —quines facetes la impulsen i quines intervencions de desenvolupament és més probable que siguin efectives—. Un instrument de 120 ítems amb puntuació en el pla de les facetes proporciona l'especificitat que requereixen les converses de desenvolupament.

Els perfils d'equip requereixen puntuacions individuals fiables com a entrades per a l'anàlisi en l'àmbit de l'equip. Si les puntuacions individuals tenen un error de mesura alt, el perfil de l'equip hereta aquest error. Un mapa d'equip construït sobre puntuacions del TIPI mostrarà una variació aleatòria més gran entre perfils que un de construït sobre instruments més llargs, cosa que redueix la utilitat del mapa per al disseny deliberat d'equips. Consulta els 12 rols d'equip de Cèrcol per a veure com els perfils en el pla de les facetes es tradueixen en coneixement del rol d'equip.

L'avaluació entre iguals reforça l'argument. El model Testimoni de Cèrcol demana als avaluadors externs que avaluïn la personalitat d'una altra persona a través de múltiples dimensions i facetes. Un instrument curt col·lapsaria el senyal de les avaluacions del Testimoni fins al punt que les discrepàncies entre avaluador extern i autoinforme —les dades més informatives de l'informe— es tornarien poc fiables. La metodologia Testimoni s'explica en detall a el que mesura l'instrument Testimoni de Cèrcol.

Les decisions d'alt risc —avaluació del rendiment, redisseny de rols, selecció per a programes de lideratge— requereixen que les dades siguin prou fiables per a actuar-hi. Una mesura amb α = 0.55 (TIPI típic) significa que el 45% de la variància de les puntuacions és soroll aleatori. Una mesura amb α = 0.90 significa que només el 10% és soroll. La diferència entre actuar sobre un 55% de senyal i sobre un 90% de senyal és la diferència entre dades útils i decisions aleatòries.

Per què Cèrcol fa servir 120 ítems per a equilibrar fiabilitat i temps de finalització

L'instrument de Cèrcol fa servir 120 ítems —24 per cada dimensió del Big Five—, i proporciona mesura en el pla de les facetes alhora que es manté substancialment més curt que el NEO PI-R complet de 240 ítems. El disseny reflecteix un compromís deliberat: conservar la resolució de facetes i una fiabilitat per sobre de 0,87 per dimensió mantenint el temps de finalització en aproximadament 15 minuts.

Aquesta longitud té el suport de l'evidència de fiabilitat i validesa per als instruments basats en l'IPIP amb aquest nombre d'ítems, i de la realitat pràctica que els perfils d'equip i el desenvolupament individual requereixen dades en el pla de les facetes que els instruments més curts no poden proporcionar estructuralment. Per a la ciència que hi ha darrere de per què això importa, consulta proves de personalitat: codi obert vs. comercial i el biaix de desitjabilitat social en les proves de personalitat: els instruments més llargs també ofereixen més oportunitats d'incloure ítems de codificació inversa que protegeixen contra l'aquiescència i la inflació de la desitjabilitat social.

La longitud adequada d'un instrument de personalitat no la determina la convenció ni el que sembla còmode. La determinen el cas d'ús, la fiabilitat requerida i el nivell d'especificitat que les dades necessiten proporcionar. Per al desenvolupament individual i d'equip, l'evidència dona suport de manera constant als instruments del rang de 100–120 ítems com a òptim pràctic.

Per què Cèrcol fa servir 120 ítems en lloc de 10

Un test de personalitat de 10 ítems és millor que cap test, però per a les finalitats que la majoria d'equips valoren (adequació de rol, planificació del desenvolupament, predicció de conflictes, coaching), 10 ítems per dimensió no n'hi ha prou. Dos ítems no poden distingir entre facetes, no poden classificar de manera fiable les persones que se situen a la meitat de la distribució i produeixen un error de mesura prou gran per a canviar les conclusions en la reavaluació.

Cèrcol fa servir 120 ítems perquè és la longitud d'instrument més curta que ofereix una resolució completa de facetes i una fiabilitat test-retest per sobre de 0,87 en les cinc dimensions del Big Five. Els ítems s'extreuen del banc d'ítems IPIP de domini obert, la mateixa font científica utilitzada en centenars d'estudis revisats per experts. Completar-lo dura aproximadament 15 minuts.

Si vols veure com són realment les dades del Big Five en el pla de les facetes per al teu equip, l'avaluació és gratuïta a cercol.team. L'avaluació entre iguals Testimoni afegeix perfils valorats per avaluadors externs per a cada persona: una segona perspectiva que cap instrument d'autoinforme, per llarg que sigui, no pot substituir. Llegeix la justificació completa de la mesura a cercol.team/science.

Lectures addicionals: Què signifiquen la fiabilitat i la validesa en les proves de personalitat · La ciència que hi ha darrere de Cèrcol

Per què 120 ítems és millor que 10: el compromís en la llargada dels tests de personalitat

La fórmula de Spearman-Brown: per què la longitud del test prediu la fiabilitat del Big Five

Què perden els tests del Big Five de 10 ítems que els instruments més llargs capten

TIPI vs. IPIP-NEO-120: compromisos de fiabilitat un al costat de l'altre

Quan un test de personalitat curt és realment adequat

Quan la longitud del test importa: desenvolupament individual i perfils d'equip

Per què Cèrcol fa servir 120 ítems per a equilibrar fiabilitat i temps de finalització

Per què Cèrcol fa servir 120 ítems en lloc de 10

Lectures addicionals

Articles relacionats

Què signifiquen la fiabilitat i la validesa en els tests de personalitat — explicat clarament

Què és una faceta? Les 30 facetes del Big Five

Com es calculen les puntuacions dels tests de personalitat: dels ítems a les dimensions