Is Cèrcol based on the Big Five?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP public-domain item pool (Goldberg et al. 2006). The 12 team roles are derived from the AB5C circumplex (Hofstee et al. 1992) and team composition research (Bell 2007; Neuman & Wright 1999).

What makes Cèrcol different from Belbin or DISC?

Cèrcol's roles are grounded in the Big Five (OCEAN) personality model using the IPIP public-domain item pool. The scoring pipeline is fully open source and auditable. Witness Cèrcol uses forced-choice adjective selection — not Likert scales — to eliminate social desirability bias in peer assessment. Unlike Belbin or DISC, all items are public domain and the entire methodology is published and citable.

Is the personality assessment free?

The New Moon Cèrcol (10 items, Big Five snapshot) and First Quarter Cèrcol (60 items, IPIP-NEO-60, 30 facets) are always free — no account required. The Full Moon Cèrcol (120 items, IPIP-NEO-120, Witness peer assessment, cognitive ability measure) requires a one-time payment.

What is Witness Cèrcol?

Witness Cèrcol is a peer personality assessment where someone who knows you well rates you using a forced-choice adjective selection method — picking the best-fit and worst-fit adjective per round from a set covering all five OCEAN dimensions. Forced choice eliminates the social desirability bias that affects standard Likert-scale peer ratings. Dimensions where your self-rating and peer ratings diverge by more than 0.8 standard deviations are flagged as potential blind spots.

How are the 12 team roles derived?

The 12 roles are derived from the AB5C circumplex (Hofstee, De Raad & Goldberg 1992), covering all six intersections of the three team balance dimensions (Presence/Extraversion × Bond/Agreeableness × Vision/Openness) at both poles. The selection of these three dimensions as requiring team-level balance is grounded in Bell (2007) and Neuman & Wright (1999). Discipline (Conscientiousness) and Depth (Neuroticism) modulate role expression but do not define team balance.

No account is required for any instrument. During assessment, no personal data is collected — only anonymous scores are logged. Data is stored on our own servers (Hetzner Online GmbH). No third-party analytics. No data is shared with or sold to third parties.

Is Cèrcol based on the Big Five (OCEAN)?

Yes. Cèrcol measures personality using the OCEAN model (Big Five) via the IPIP — the International Personality Item Pool, a public-domain collection validated in thousands of published studies. The five dimensions are Presence (Extraversion), Bond (Agreeableness), Vision (Openness), Discipline (Conscientiousness), and Depth (Neuroticism). Because the IPIP is public domain there are no licence restrictions: the full item pool and scoring logic are open and citable.

How is Cèrcol different from Belbin, DISC, or StrengthsFinder?

Three things set Cèrcol apart. First, the items come from the Big Five (OCEAN), the most replicated personality model in academic research — not a proprietary framework. Second, the full item pool (IPIP) and scoring pipeline are public domain and auditable; there is no black box. Third, the Witness peer assessment uses forced-choice adjective selection instead of Likert scales, which eliminates the social desirability bias that affects most 360-feedback tools. Belbin and DISC use closed, proprietary methodologies.

What are blind spots in team personality assessment?

A blind spot is a personality dimension where how you see yourself and how others see you diverge significantly — more than 0.8 standard deviations apart. Cèrcol's Witness peer assessment detects blind spots by comparing your self-report with forced-choice adjective ratings from people who know you. Blind spots are neither good nor bad: they show where your self-perception and others' experience of you don't match, which is often more actionable than the score itself.

Evaluación de personalidad de elección forzada: por qué produce datos más honestos

Por qué los tests de personalidad tradicionales con escala de Likert tienen un problema de sesgo

Los tests de personalidad con escala de Likert dominan tanto la investigación como la evaluación aplicada. El Inventario del Big Five, el NEO-PI-R, las escalas IPIP y cientos de instrumentos propietarios utilizan variaciones del mismo formato: autoevaluación en un conjunto de afirmaciones de «en desacuerdo» a «de acuerdo».

Los puntos fuertes de este formato son reales. Es intuitivo para los encuestados, fácil de puntuar y produce datos normativos — lo que significa que las puntuaciones pueden compararse entre individuos en una escala absoluta. Una puntuación de 4,2 en Conscienciosidad es directamente comparable entre diferentes personas que han realizado el mismo test.

Pero las escalas de Likert tienen dos debilidades estructurales que no pueden abordarse completamente mediante una redacción cuidadosa de los ítems o instrucciones para «responder honestamente».

La primera es el sesgo de aquiescencia: la tendencia a estar de acuerdo en lugar de no estarlo, independientemente del contenido. En todas las culturas y poblaciones, las personas tienden a avalar afirmaciones a tasas más altas que el azar — decir «de acuerdo» es el camino de menor resistencia. Esto infla uniformemente todas las puntuaciones de rasgos.

La segunda es el sesgo de deseabilidad social: la tendencia a avalar afirmaciones que presentan una autoimagen favorable. Cuando la respuesta socialmente valorada es obvia (y en la mayoría de los ítems de personalidad lo es), quienes se presentan de manera motivada pueden maximizar sus puntuaciones en dimensiones valoradas sin ninguna restricción. Para una explicación completa de cómo esto distorsiona los perfiles del Big Five, consulta el sesgo de deseabilidad social en los tests de personalidad.

Estos dos sesgos se combinan para producir puntuaciones que son una mezcla de niveles de rasgos genuinos y estilo de respuesta — y esa mezcla es difícil de desenredar a posteriori. Para los equipos que se preguntan si sus puntuaciones de DISC o 16Personalities están infladas por este efecto, la respuesta es casi con certeza que sí. Consulta DISC vs Big Five: por qué cuatro estilos no son suficientes para una discusión más amplia de lo que se pierde cuando el diseño de la medida no aborda el sesgo.

Qué es realmente la evaluación de personalidad de elección forzada

La evaluación de personalidad de elección forzada — consulta Elección forzada — presenta los ítems de manera diferente. En lugar de valorar cada afirmación de manera independiente, a los encuestados se les presentan pares (o tripletas) de afirmaciones o adjetivos y se les pide que elijan cuál describe mejor.

Por ejemplo, en lugar de valorar por separado «Soy comunicativo» y «Soy meticuloso», un ítem de elección forzada podría presentar ambos juntos y preguntar: «¿Cuál de estas palabras te describe mejor?» El encuestado debe elegir una. No puede avalar las dos a un nivel alto simultáneamente.

Este simple cambio estructural tiene consecuencias importantes:

La aquiescencia se vuelve imposible: no puedes estar de acuerdo con las dos opciones. Cada elección revela una preferencia entre dos rasgos.
La deseabilidad social se reduce: cuando las dos opciones tienen una valoración positiva (como en los instrumentos de elección forzada bien diseñados), no hay una respuesta obviamente «buena». Elegir «cálido» sobre «preciso» no te hace parecer mejor o peor — simplemente revela prioridades relativas.

«Los formatos de elección forzada eliminan las respuestas de aquiescencia y reducen sustancialmente la inflación de deseabilidad social al requerir que los encuestados asignen cantidades fijas de aprobación entre descripciones de rasgos en competencia.»
— Adaptado de Stark, S., Chernyshenko, O. S., & Drasgow, F. (2005). An IRT approach to constructing and scoring pairwise preference items. Applied Psychological Measurement, 29(3), 184–201. Consulta también doi:10.1037/0022-3514.63.1.146

Por qué funciona la elección forzada: Las escalas de Likert estándar permiten a los encuestados valorarse «altamente» en todos los rasgos. Los formatos de elección forzada requieren compromisos entre opciones igualmente deseables — forzando a los encuestados a revelar prioridades relativas en lugar de ideales absolutos. La investigación muestra que la elección forzada reduce el sesgo de deseabilidad social entre un 40–60% en comparación con las escalas de Likert.

Puntuación ipsativa: Qué significa para la interpretación de las puntuaciones del Big Five

Los instrumentos de elección forzada producen lo que se denomina datos ipsativos. Una puntuación ipsativa representa la posición de una persona en un rasgo en relación con sus otros rasgos propios — no en relación con una norma de población. Si tu perfil muestra alta Presencia y baja Profundidad, esto significa que eres más extravertido que neurótico en términos relativos. No necesariamente te dice si eres más extravertido que la persona promedio.

Esta es una limitación real. Los datos ipsativos no se pueden utilizar para los mismos propósitos que los datos normativos. En particular, comparar directamente los perfiles de dos personas (la puntuación de Presencia de la persona A vs la de la persona B) es metodológicamente complicado con datos ipsativos, porque ambos perfiles están referenciados internamente. Para un tratamiento completo de la puntuación normativa vs ipsativa, consulta cómo se calculan las puntuaciones de los tests de personalidad. La investigación sobre cómo gestionar adecuadamente los datos ipsativos, y sobre enfoques que producen estimaciones más normativas a partir de diseños de elección forzada (como la puntuación basada en TRI), está en curso.

El enfoque de Cèrcol reconoce esta limitación. El instrumento Testigo está diseñado principalmente para revelar prioridades relativas y puntos ciegos — ¿dónde se percibe que esta persona es más fuerte o débil en relación con su propio perfil general, y cómo se compara con su autopercepción? Esto es un uso válido y valioso de los datos ipsativos, incluso si las comparaciones cruzadas absolutas entre personas requieren un cuidado metodológico adicional.

El circunflejo AB5C: Cómo los adjetivos se mapean en las intersecciones del Big Five

El instrumento Testigo de Cèrcol se fundamenta en el Circunflejo Abreviado del Big Five (AB5C), desarrollado por Hofstee, de Raad y Goldberg (1992). El AB5C es un marco sistemático para mapear los adjetivos de personalidad en las dimensiones del Big Five — no como indicadores puros de un solo factor, sino como combinaciones ponderadas de dos factores.

En el marco AB5C, una palabra como «asertivo» no es simplemente un adjetivo de Extraversión — se carga tanto en Extraversión como en (baja) Amabilidad. Una palabra como «creativo» se carga tanto en Apertura como en (baja) Conscienciosidad. Al mapear los adjetivos en estas intersecciones, el AB5C captura la rica estructura superpuesta del lenguaje de la personalidad de manera más precisa que un enfoque simple factor por factor. Para el contexto más amplio de cómo el lenguaje de la personalidad fue analizado sistemáticamente para producir el Big Five, consulta la historia del Big Five de Allport a Goldberg.

Esto importa para el diseño de elección forzada porque permite construir pares que sean genuinamente informativos psicométricamente — cada elección entre un par de adjetivos proporciona información sobre la posición de un encuestado en las dimensiones relevantes del Big Five. Los pares no son arbitrarios; están fundamentados.

En el instrumento Testigo de Cèrcol, los pares de adjetivos están seleccionados para maximizar la información discriminativa en las cinco dimensiones (Presencia, Vínculo, Visión, Disciplina, Profundidad) mientras se mantienen los valores de deseabilidad social tan igualados como sea posible dentro de cada par. Esto asegura que las elecciones revelen una diferenciación genuina de personalidad en lugar de una diferencial deseabilidad social.

Cómo el Testigo de Cèrcol aplica la elección forzada a la evaluación por pares

El instrumento Testigo es el componente de evaluación por pares de Cèrcol. En lugar de pedir a los Testigos (evaluadores por pares) que valoren a la persona objetivo en afirmaciones de comportamiento, a los Testigos se les presentan pares de adjetivos y se les pide que elijan qué palabra describe mejor a la persona que conocen.

El instrumento se basa en la tradición IPIP — la alternativa de ciencia abierta a los instrumentos de personalidad controlados comercialmente. Todo el desarrollo de los ítems es transparente y documentado. El código fuente, el algoritmo de puntuación y la documentación psicométrica están disponibles bajo una licencia de código abierto en cercol.team/science.

Una sesión típica de Testigo dura entre 8 y 12 minutos. El perfil resultante muestra las puntuaciones de la persona objetivo en cada una de las cinco dimensiones de Cèrcol tal como las percibe ese Testigo, y el agregado de todos los Testigos proporciona el compuesto de pares. Este compuesto se compara entonces con el autoinforme de la persona objetivo para identificar alineación y brechas. Para la justificación completa de por qué esta capa de pares importa, consulta por qué la autoevaluación sola no es suficiente: retroalimentación de personalidad entre pares. La cuestión del anonimato en las valoraciones de los pares se aborda en anonimato en la evaluación de personalidad: por qué importa.

Escala de Likert vs. elección forzada: Comparación metodológica completa

Dimensión	Escala de Likert	Elección forzada (Testigo de Cèrcol)
Sesgo de aquiescencia	Riesgo estructural alto	Eliminado por diseño
Deseabilidad social	Alta, especialmente para rasgos valorados	Sustancialmente reducida (pares de valencia igualada)
Interpretación de las puntuaciones	Normativa (nivel absoluto)	Ipsativa (prioridades relativas)
Comparación entre personas	Sencilla	Requiere cuidado metodológico
Resistencia a la falsificación	Baja para ítems transparentes	Más alta — ambas opciones típicamente positivas
Fundamentación teórica	Factor por factor	Circunflejo AB5C
Demanda cognitiva	Baja	Moderada — se requiere deliberación genuina

Limitaciones honestas de la evaluación de personalidad de elección forzada

La elección forzada no es una panacea. Varias limitaciones merecen un reconocimiento honesto.

En primer lugar, el problema de la puntuación ipsativa descrito anteriormente. Aunque los enfoques basados en TRI (TRI de Thurstone, tal como fue desarrollado por Brown y Maydeu-Olivares) pueden recuperar estimaciones más parecidas a las normativas a partir de datos de elección forzada, estos métodos son exigentes computacionalmente y requieren tamaños de muestra sustanciales para calibrarse con precisión. La puntuación de elección forzada más simple sigue siendo bastante ipsativa.

En segundo lugar, las evaluaciones de elección forzada son cognitivamente más exigentes. Los encuestados deben comparar genuinamente dos opciones y decidir cuál se ajusta mejor, en lugar de simplemente valorar cada ítem de manera independiente. Esto puede ralentizar los tiempos de finalización y puede resultar frustrante para los encuestados que sienten que «ambas se aplican igualmente». La imposibilidad de decir «ambas» es por diseño, pero puede parecer antinatural.

En tercer lugar, la elección forzada no elimina todas las respuestas estratégicas. Un autopresentador determinado que sabe qué adjetivos se mapean en qué dimensiones valoradas aún puede elegir sistemáticamente los adjetivos «correctos». Para la literatura completa sobre lo que la falsificación motivada realmente hace a las puntuaciones de los tests de personalidad, consulta ¿se puede falsificar un test de personalidad?. La elección forzada aumenta el costo cognitivo de las respuestas estratégicas, pero no las hace imposibles — particularmente para los encuestados con exposición previa a la teoría de la personalidad.

A pesar de estas limitaciones, el peso de la evidencia psicométrica es claro: los instrumentos de elección forzada producen datos menos sesgados y más diferenciadores que las escalas de Likert en contextos de evaluación de altos riesgos. Para el caso de uso del Testigo — evaluación por pares donde los incentivos sociales para valorar favorablemente son reales — el diseño de elección forzada es la opción metodológicamente superior. Y si estás evaluando esto en el panorama más amplio de las herramientas disponibles, consulta los mejores tests de personalidad gratuitos para equipos en 2026.

Elección forzada vs. Likert: ¿Cuál produce datos del Big Five más honestos?

La evaluación de personalidad de elección forzada elimina el sesgo de aquiescencia por construcción y reduce sustancialmente el sesgo de deseabilidad social mediante pares de ítems de valencia igualada. El circunflejo AB5C proporciona la fundamentación teórica para la selección fundamentada de pares de adjetivos psicométricamente. El instrumento Testigo de Cèrcol aplica estos principios en una herramienta de evaluación por pares de código abierto, fundamentada en el IPIP, diseñada para producir los datos de personalidad por pares más honestos y diferenciadores disponibles. La limitación — la puntuación ipsativa — es real y reconocida, y la interpretación está diseñada en consecuencia.

Prueba una evaluación del Big Five de elección forzada: el instrumento Testigo de Cèrcol

La mayoría de las evaluaciones de personalidad — DISC, 16Personalities, incluso las herramientas del Big Five con escala de Likert — son vulnerables al mismo problema estructural: cuando la respuesta socialmente deseable es visible, los encuestados motivados (e incluso los honestos que intentan ser precisos) sesgarán sus respuestas hacia ella. El diseño de elección forzada es la solución más respaldada por la evidencia disponible.

La evaluación de pares Testigo de Cèrcol es un instrumento de elección forzada construido sobre el marco del circunflejo AB5C y fundamentado en la tradición de ítems de dominio público IPIP. Los Testigos eligen entre pares de adjetivos igualados por deseabilidad social — haciendo estructuralmente difícil ser uniformemente positivo sobre la persona que están valorando. El resultado son datos de personalidad de pares que reflejan cómo la persona es genuinamente experimentada, no solo hasta qué punto el Testigo les agrada.

La autoevaluación en cercol.team es gratuita. Añadir evaluaciones de Testigos lleva a cada par entre 8 y 12 minutos. Lee la justificación científica completa para entender cómo el diseño de elección forzada y la fundamentación AB5C trabajan juntos para ofrecer datos del Big Five más honestos.

Referencias
Hofstee, W. K. B., de Raad, B., & Goldberg, L. R. (1992). Integration of the Big Five and circumplex approaches to trait structure. Journal of Personality and Social Psychology, 63(1), 146–163. doi:10.1037/0022-3514.63.1.146
Brown, A., & Maydeu-Olivares, A. (2011). Item response modeling of forced-choice questionnaires. Educational and Psychological Measurement, 71(3), 460–502.

Evaluación de personalidad de elección forzada: por qué produce datos más honestos

Por qué los tests de personalidad tradicionales con escala de Likert tienen un problema de sesgo

Qué es realmente la evaluación de personalidad de elección forzada

Puntuación ipsativa: Qué significa para la interpretación de las puntuaciones del Big Five

El circunflejo AB5C: Cómo los adjetivos se mapean en las intersecciones del Big Five

Cómo el Testigo de Cèrcol aplica la elección forzada a la evaluación por pares

Escala de Likert vs. elección forzada: Comparación metodológica completa

Limitaciones honestas de la evaluación de personalidad de elección forzada

Elección forzada vs. Likert: ¿Cuál produce datos del Big Five más honestos?

Prueba una evaluación del Big Five de elección forzada: el instrumento Testigo de Cèrcol

Lectura adicional

Artículos relacionados

El anonimato en la evaluación de la personalidad: por qué importa más de lo que piensas

Qué significan la fiabilidad y la validez en los tests de personalidad — explicado con claridad

Por qué 120 ítems es mejor que 10: el compromiso en la longitud de los tests de personalidad