Is Cèrcol based on the Big Five?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP public-domain item pool (Goldberg et al. 2006). The 12 team roles are derived from the AB5C circumplex (Hofstee et al. 1992) and team composition research (Bell 2007; Neuman & Wright 1999).

What makes Cèrcol different from Belbin or DISC?

Cèrcol's roles are grounded in the Big Five (OCEAN) personality model using the IPIP public-domain item pool. The scoring pipeline is fully open source and auditable. Witness Cèrcol uses forced-choice adjective selection — not Likert scales — to eliminate social desirability bias in peer assessment. Unlike Belbin or DISC, all items are public domain and the entire methodology is published and citable.

Is the personality assessment free?

The New Moon Cèrcol (10 items, Big Five snapshot) and First Quarter Cèrcol (60 items, IPIP-NEO-60, 30 facets) are always free — no account required. The Full Moon Cèrcol (120 items, IPIP-NEO-120, Witness peer assessment, cognitive ability measure) requires a one-time payment.

What is Witness Cèrcol?

Witness Cèrcol is a peer personality assessment where someone who knows you well rates you using a forced-choice adjective selection method — picking the best-fit and worst-fit adjective per round from a set covering all five OCEAN dimensions. Forced choice eliminates the social desirability bias that affects standard Likert-scale peer ratings. Dimensions where your self-rating and peer ratings diverge by more than 0.8 standard deviations are flagged as potential blind spots.

How are the 12 team roles derived?

The 12 roles are derived from the AB5C circumplex (Hofstee, De Raad & Goldberg 1992), covering all six intersections of the three team balance dimensions (Presence/Extraversion × Bond/Agreeableness × Vision/Openness) at both poles. The selection of these three dimensions as requiring team-level balance is grounded in Bell (2007) and Neuman & Wright (1999). Discipline (Conscientiousness) and Depth (Neuroticism) modulate role expression but do not define team balance.

No account is required for any instrument. During assessment, no personal data is collected — only anonymous scores are logged. Data is stored on our own servers (Hetzner Online GmbH). No third-party analytics. No data is shared with or sold to third parties.

Is Cèrcol based on the Big Five (OCEAN)?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP — the International Personality Item Pool, a public-domain collection validated in thousands of published studies. The five dimensions are Presence (Extraversion), Bond (Agreeableness), Vision (Openness), Discipline (Conscientiousness), and Depth (Neuroticism). Because the IPIP is public domain there are no licence restrictions: the full item pool and scoring logic are open and citable.

How is Cèrcol different from Belbin, DISC, or StrengthsFinder?

Three things set Cèrcol apart. First, the items come from the Big Five (OCEAN), the most replicated personality model in academic research — not a proprietary framework. Second, the full item pool (IPIP) and scoring pipeline are public domain and auditable; there is no black box. Third, the Witness peer assessment uses forced-choice adjective selection instead of Likert scales, which eliminates the social desirability bias that affects most 360-feedback tools. Belbin and DISC use closed, proprietary methodologies.

What are blind spots in team personality assessment?

A blind spot is a personality dimension where how you see yourself and how others see you diverge significantly — more than 0.8 standard deviations apart. Cèrcol's Witness peer assessment detects blind spots by comparing your self-report with forced-choice adjective ratings from people who know you. Blind spots are neither good nor bad: they show where your self-perception and others' experience of you don't match, which is often more actionable than the score itself.

Sesgo de deseabilidad social en los tests de personalidad: cómo distorsiona los resultados y qué se puede hacer

El sesgo de deseabilidad social es la tendencia a dar respuestas que probablemente serán vistas favorablemente por los demás —o por uno mismo— en lugar de respuestas que reflejen con precisión la realidad.

En el contexto de la evaluación de la personalidad, opera en dos niveles. El primero es la gestión de la impresión: ajustar conscientemente las respuestas para presentar una mejor imagen. Un candidato a un empleo que quiere parecer consciencioso se puntúa alto en organización y fiabilidad, aunque esto sobreestime sus tendencias reales. El segundo es la mejora autoenañadora: creer genuinamente una versión más positiva de uno mismo, sin conciencia de la distorsión. Esta segunda forma es más insidiosa porque no puede eliminarse simplemente diciéndoles a los participantes que sean honestos.

Ambas formas se han estudiado extensamente desde los años cincuenta. El trabajo fundacional de Edwards (1957) estableció que la deseabilidad social de un enunciado es uno de los predictores más fuertes de la tasa de aprobación: las personas aceptan enunciados socialmente deseables no sólo porque sean ciertos, sino porque son deseables. Décadas posteriores de investigación han confirmado este hallazgo en culturas, contextos e instrumentos de evaluación diversos.

Sesgo de aquiescencia: por qué la gente acepta todo en los tests de personalidad

El sesgo de deseabilidad social tiene un pariente cercano que amplía sus efectos en las evaluaciones con escala de Likert: el sesgo de aquiescencia. La aquiescencia es la tendencia a aceptar los enunciados independientemente del contenido —a decir "sí" más a menudo que "no", a marcar "de acuerdo" o "muy de acuerdo" más de lo que el contenido justifica.

En los cuestionarios de personalidad que utilizan escalas de Likert (totalmente en desacuerdo → totalmente de acuerdo), la aquiescencia infla sistemáticamente todas las puntuaciones. Si tiendes a aceptar los enunciados, puntuarás más alto en todas las dimensiones que se evalúen. Esto hace que los perfiles parezcan más extremos en la dirección positiva de lo que realmente son, e infla las similitudes aparentes entre personas que en realidad pueden diferir sustancialmente.

La aquiescencia y la deseabilidad social interactúan: ambas empujan las respuestas hacia el extremo superior de la escala en los ítems formulados positivamente, amplificando la distorsión. Para una explicación de las protecciones a nivel de puntuación —codificación inversa, ítems negativos— que mitigan parcialmente esto, véase cómo se calculan las puntuaciones de los tests de personalidad.

"La deseabilidad social no es simplemente una variable molesta: explica una porción sustancial y sistemática de la varianza en las medidas de personalidad de autoinforme, especialmente para las dimensiones percibidas como socialmente valoradas."
— Paulhus, D. L. (1991). Measurement and control of response bias. In J. P. Robinson et al. (Eds.), Measures of personality and social psychological attitudes.

La cuestión de cuánto distorsiona el sesgo de deseabilidad social las puntuaciones de personalidad se ha estudiado correlacionando las puntuaciones en escalas de deseabilidad social (instrumentos diseñados para medir la tendencia a responder de manera socialmente deseable) con las puntuaciones en medidas de personalidad estándar.

Los resultados son sustanciales. Las correlaciones entre deseabilidad social y Amabilidad suelen oscilar entre ,30 y ,50, lo que significa que una porción significativa de la varianza en las puntuaciones de Amabilidad refleja el deseo de parecer amable, no la amabilidad real. La Responsabilidad muestra efectos similares, con correlaciones de ,25 a ,45. El Neuroticismo (Profundidad) se ve afectado inversamente: las personas subestiman sistemáticamente su inestabilidad emocional porque admitirla es socialmente indeseable, produciendo correlaciones negativas de magnitud similar.

No se trata de efectos triviales. Significan que en una evaluación de personalidad estándar con escala de Likert, las puntuaciones que se ven son una mezcla del rasgo que se intenta medir y la tendencia general de la persona a la autopresentación. Separarlas es difícil —y en contextos de alto riesgo (contratación, selección, programas de desarrollo de alta visibilidad), la motivación para presentarse bien es máxima y la distorsión es más severa. Para el contexto específico de la contratación, véase los tests de personalidad en la contratación: qué es legal y qué es ético.

No todas las dimensiones son igualmente vulnerables. El patrón es consistente entre estudios:

Bond (Amabilidad) y Discipline (Responsabilidad) son las más infladas por la deseabilidad social. Ambas implican rasgos ampliamente valorados: ser amable, cooperativo, fiable, organizado. Las personas se puntúan más alto en estas dimensiones no necesariamente porque lo sean, sino porque las puntuaciones conllevan implicaciones sociales que quieren avalar.

Depth (Neuroticismo) es la que más se deflaciona: las personas se puntúan sistemáticamente como menos ansiosas, menos irritables y menos reactivas emocionalmente de lo que justifica su experiencia real, porque admitir la inestabilidad emocional es socialmente costoso.

Presence (Extraversión) muestra efectos moderados. La extraversión se valora en muchos contextos profesionales, lo que produce una inflación leve, pero la naturaleza observable de la dimensión hace que una distorsión grave sea difícil de mantener.

Vision (Apertura) también muestra efectos moderados, especialmente para las facetas de curiosidad intelectual: a la gente le gusta verse como curiosa y de mente abierta.

Magnitud relativa del sesgo en las dimensiones del Big Five. El Neuroticismo se oculta activamente (la gente lo esconde); la Amabilidad y la Responsabilidad se inflan (la gente las proyecta). La Extraversión y la Apertura muestran una distorsión comparativamente modesta.

Este patrón tiene implicaciones directas para la manera de interpretar DISC, 16Personalities y otras evaluaciones con escala de Likert que los equipos utilizan habitualmente. Véase DISC vs Big Five: por qué cuatro estilos no son suficientes y 16Personalities vs Big Five: el test viral que lo acierta a medias para las distorsiones específicas de cada marco.

Escala de Likert vs. elección forzada: comparación de la vulnerabilidad al sesgo

Característica	Escala de Likert	Elección forzada
Formato de respuesta	Puntuar cada ítem del 1–5 o 1–7	Elegir uno de cada pareja
Sesgo de aquiescencia	Alto — se puede aceptar todo	Ninguno — la elección es obligada
Deseabilidad social	Alta — fácil seleccionar opciones de alta valencia	Reducida — parejas emparejadas por valencia
Tipo de puntuación	Normativo — nivel absoluto por rasgo	Ipsativo — prioridades relativas entre rasgos
Facilidad de falsificación	Alta en ítems transparentes	Menor — la paridad de valencia hace que la "respuesta correcta" no sea clara
Demanda cognitiva	Baja	Moderada — se requiere una elección genuina
Mejor uso	Investigación, desarrollo de bajo riesgo	Selección, evaluación de alto riesgo, valoraciones de compañeros

La respuesta metodológica más eficaz al sesgo de deseabilidad social en la evaluación de la personalidad es el diseño de elección forzada. En lugar de puntuar cada ítem de manera independiente en una escala, a los participantes se les presentan parejas (o tríos) de ítems y se les pide que elijan cuál les describe mejor.

La elección forzada funciona porque hace que la deseabilidad social sea más difícil de actuar. Si ambos ítems de una pareja son positivos —"cálido y empático" versus "preciso y meticuloso"— no hay una respuesta evidentemente deseable socialmente. Se te obliga a revelar cuál de los dos rasgos valorados te describe con más precisión. La elección revela las prioridades relativas entre dimensiones, en lugar de los niveles absolutos en cada dimensión por separado.

La literatura psicométrica sobre los métodos de elección forzada, revisada por Stark et al. (2005) y más recientemente por Brown y Maydeu-Olivares (2011), confirma que las evaluaciones de elección forzada reducen sustancialmente la inflación de deseabilidad social. Para la explicación técnica completa de cómo funciona esto en el instrumento Testigo de Cèrcol, véase evaluación de la personalidad por elección forzada: por qué produce datos más honestos.

El instrumento Testigo de Cèrcol utiliza un formato de elección forzada diseñado específicamente para reducir el sesgo de deseabilidad social en las valoraciones de compañeros. A los Testigos (evaluadores entre iguales) se les presentan parejas de adjetivos de personalidad —extraídos del circunflexo AB5C, que mapea los adjetivos en las intersecciones del Big Five— y se les pide que elijan qué palabra describe mejor a la persona que están evaluando.

Dado que el Testigo evalúa a otra persona, los motivos de autopresentación operan de manera menos directa que en el autoinforme. Pero los Testigos todavía tienen incentivos sociales para puntuar favorablemente al sujeto objetivo (amistad, compañerismo, deseo de proporcionar feedback positivo). El formato de elección forzada reduce esta tendencia haciendo que la maximización de la favorabilidad sea genuinamente difícil: si ambas opciones son positivas, no puedes simplemente elegir la respuesta "más agradable" sin revelar qué rasgo percibes realmente en ellas.

El resultado es una dada del Testigo que refleja con más precisión la personalidad percibida real en lugar de una impresión positiva generalizada. Para el caso completo de por qué los datos de compañeros son un complemento necesario al autoinforme, véase por qué la autoevaluación sola no es suficiente: feedback de personalidad entre iguales. El anonimato en las valoraciones de compañeros también importa: véase anonimato en la evaluación de la personalidad: por qué importa para la evidencia.

Advertencias honestas: qué no puede corregir completamente el diseño de elección forzada

El diseño de elección forzada no es una solución completa. La limitación principal es que los datos de elección forzada son ipsativos: las puntuaciones reflejan las prioridades relativas entre dimensiones, no los niveles absolutos. Esto hace que ciertos tipos de comparación —por ejemplo, comparar la puntuación absoluta de Amabilidad de una persona con la de otra— sean metodológicamente complejos. La investigación sobre cómo manejar adecuadamente los datos ipsativos es continua, y el marco de interpretación de Cèrcol lo tiene en cuenta.

Además, el diseño de elección forzada no elimina la distorsión motivada por participantes muy determinados. Alguien que quiere fuertemente presentarse como consciencioso todavía puede elegir sistemáticamente adjetivos relacionados con Discipline por encima de las alternativas. Para la investigación completa sobre cómo se manifiesta la falsificación en la práctica, véase ¿se puede falsificar un test de personalidad?. La elección forzada aumenta el coste cognitivo de las respuestas estratégicas, pero no las hace imposibles.

La postura honesta es que ningún diseño de evaluación elimina completamente los sesgos de respuesta. Lo que hace la elección forzada es reducir los sesgos más comunes y con más impacto —la aquiescencia y la deseabilidad social— a un nivel en el que la relación señal-ruido de los datos resultantes es sustancialmente mejor que con los enfoques estándar de escala de Likert.

El sesgo de deseabilidad social infla sistemáticamente las puntuaciones en rasgos valorados (Bond, Discipline) y deflaciona las puntuaciones en rasgos estigmatizados (Depth) en las evaluaciones de personalidad estándar con escala de Likert. El sesgo de aquiescencia lo agrava empujando todas las puntuaciones hacia la aceptación. No se trata de cuestiones técnicas menores: reducen sustancialmente la validez de los datos de personalidad de autoinforme, especialmente en contextos de alto riesgo.

El diseño de elección forzada, tal como se utiliza en el instrumento Testigo de Cèrcol, aborda estos sesgos haciendo que sea estructuralmente difícil maximizar simultáneamente la deseabilidad social en todas las dimensiones. El resultado es un dato de personalidad más honesto, más diferenciado y más útil. Para una comparación clasificada de qué herramientas de evaluación gratuitas gestionan mejor el sesgo, véase los mejores tests de personalidad gratuitos para equipos en 2026.

El sesgo de deseabilidad social no es una inconveniencia menor: infla sistemáticamente las puntuaciones de Bond y Discipline y deflaciona las puntuaciones de Depth en cada evaluación estándar con escala de Likert. Ninguna cantidad de instrucciones del tipo "por favor, sé honesto" cambia los incentivos estructurales.

Cèrcol aborda esto a nivel del instrumento, no a nivel de las instrucciones. La evaluación de compañeros Testigo utiliza un formato de elección forzada en el que las parejas de adjetivos se emparejan por valor de deseabilidad social, lo que hace que sea estructuralmente difícil presentar una imagen idealizada sin tomar decisiones genuinas de personalidad. El diseño de elección forzada se inspira en el circunflexo AB5C (Hofstee, de Raad & Goldberg, 1992) y se ha calibrado con el banco de ítems IPIP.

La evaluación del Big Five de autoinforme utiliza escalas de Likert —con ítems de codificación inversa y protecciones a nivel de escala— y es gratuita en cercol.team. Añadir valoraciones de los Testigos de compañeros produce la imagen multiperspectiva que revela dónde es probable que la deseabilidad social distorsione el autoinforme. Lee el diseño científico completo para ver exactamente cómo ambos instrumentos gestionan el sesgo.

Referencias
Edwards, A. L. (1957). The social desirability variable in personality assessment and research. Dryden Press.
Paulhus, D. L. (1991). Measurement and control of response bias. In J. P. Robinson et al. (Eds.), Measures of personality and social psychological attitudes (pp. 17–59). Academic Press.

Sesgo de deseabilidad social en los tests de personalidad: cómo distorsiona los resultados y qué se puede hacer

Sesgo de aquiescencia: por qué la gente acepta todo en los tests de personalidad

Escala de Likert vs. elección forzada: comparación de la vulnerabilidad al sesgo

Advertencias honestas: qué no puede corregir completamente el diseño de elección forzada

Lectura adicional

Artículos relacionados

El anonimato en la evaluación de la personalidad: por qué importa más de lo que piensas

Qué significan la fiabilidad y la validez en los tests de personalidad — explicado con claridad

Cómo se calculan las puntuaciones de los tests de personalidad: de los ítems a las dimensiones

Qué es el sesgo de deseabilidad social y cómo distorsiona las puntuaciones del Big Five

Sesgo de aquiescencia: por qué la gente acepta todo en los tests de personalidad

¿Cuánto distorsiona realmente el sesgo de deseabilidad social las puntuaciones del Big Five?

Qué dimensiones del Big Five se distorsionan más por la deseabilidad social

Escala de Likert vs. elección forzada: comparación de la vulnerabilidad al sesgo

Cómo el diseño de elección forzada reduce el sesgo de deseabilidad social

Cómo el instrumento Testigo de Cèrcol minimiza la deseabilidad social en las valoraciones de compañeros

Advertencias honestas: qué no puede corregir completamente el diseño de elección forzada

Sesgo de deseabilidad social: conclusiones clave para los usuarios de tests de personalidad

Cómo Cèrcol gestiona el sesgo de deseabilidad social

Lectura adicional

Artículos relacionados

El anonimato en la evaluación de la personalidad: por qué importa más de lo que piensas

Qué significan la fiabilidad y la validez en los tests de personalidad — explicado con claridad

Cómo se calculan las puntuaciones de los tests de personalidad: de los ítems a las dimensiones