La gran mayoría de los tests de personalidad utilizan escalas de Likert. Lees una afirmación — «Me gusta ser el centro de atención» — y valoras tu grado de acuerdo del 1 (totalmente en desacuerdo) al 5 (totalmente de acuerdo). Este formato es intuitivo, rápido y ha acumulado décadas de investigación psicométrica detrás.
También tiene un problema bien conocido: es fácil de manipular. Más que eso, incluso las personas que intentan ser genuinamente honestas tienden a responder de maneras sistemáticamente sesgadas. La evaluación de personalidad de elección forzada es un formato alternativo diseñado para abordar estos problemas. Entender qué es, cómo funciona y por qué produce datos más precisos es esencial para evaluar cualquier instrumento de personalidad — incluido el instrumento Testigo de Cèrcol.
Por qué los tests de personalidad tradicionales con escala de Likert tienen un problema de sesgo
Los tests de personalidad con escala de Likert dominan tanto la investigación como la evaluación aplicada. El Inventario del Big Five, el NEO-PI-R, las escalas IPIP y cientos de instrumentos propietarios utilizan variaciones del mismo formato: autoevaluación en un conjunto de afirmaciones de «en desacuerdo» a «de acuerdo».
Los puntos fuertes de este formato son reales. Es intuitivo para los encuestados, fácil de puntuar y produce datos normativos — lo que significa que las puntuaciones pueden compararse entre individuos en una escala absoluta. Una puntuación de 4,2 en Conscienciosidad es directamente comparable entre diferentes personas que han realizado el mismo test.
Pero las escalas de Likert tienen dos debilidades estructurales que no pueden abordarse completamente mediante una redacción cuidadosa de los ítems o instrucciones para «responder honestamente».
La primera es el sesgo de aquiescencia: la tendencia a estar de acuerdo en lugar de no estarlo, independientemente del contenido. En todas las culturas y poblaciones, las personas tienden a avalar afirmaciones a tasas más altas que el azar — decir «de acuerdo» es el camino de menor resistencia. Esto infla uniformemente todas las puntuaciones de rasgos.
La segunda es el sesgo de deseabilidad social: la tendencia a avalar afirmaciones que presentan una autoimagen favorable. Cuando la respuesta socialmente valorada es obvia (y en la mayoría de los ítems de personalidad lo es), quienes se presentan de manera motivada pueden maximizar sus puntuaciones en dimensiones valoradas sin ninguna restricción. Para una explicación completa de cómo esto distorsiona los perfiles del Big Five, consulta el sesgo de deseabilidad social en los tests de personalidad.
Estos dos sesgos se combinan para producir puntuaciones que son una mezcla de niveles de rasgos genuinos y estilo de respuesta — y esa mezcla es difícil de desenredar a posteriori. Para los equipos que se preguntan si sus puntuaciones de DISC o 16Personalities están infladas por este efecto, la respuesta es casi con certeza que sí. Consulta DISC vs Big Five: por qué cuatro estilos no son suficientes para una discusión más amplia de lo que se pierde cuando el diseño de la medida no aborda el sesgo.
Qué es realmente la evaluación de personalidad de elección forzada
La evaluación de personalidad de elección forzada — consulta Elección forzada — presenta los ítems de manera diferente. En lugar de valorar cada afirmación de manera independiente, a los encuestados se les presentan pares (o tripletas) de afirmaciones o adjetivos y se les pide que elijan cuál describe mejor.
Por ejemplo, en lugar de valorar por separado «Soy comunicativo» y «Soy meticuloso», un ítem de elección forzada podría presentar ambos juntos y preguntar: «¿Cuál de estas palabras te describe mejor?» El encuestado debe elegir una. No puede avalar las dos a un nivel alto simultáneamente.
Este simple cambio estructural tiene consecuencias importantes:
- La aquiescencia se vuelve imposible: no puedes estar de acuerdo con las dos opciones. Cada elección revela una preferencia entre dos rasgos.
- La deseabilidad social se reduce: cuando las dos opciones tienen una valoración positiva (como en los instrumentos de elección forzada bien diseñados), no hay una respuesta obviamente «buena». Elegir «cálido» sobre «preciso» no te hace parecer mejor o peor — simplemente revela prioridades relativas.
«Los formatos de elección forzada eliminan las respuestas de aquiescencia y reducen sustancialmente la inflación de deseabilidad social al requerir que los encuestados asignen cantidades fijas de aprobación entre descripciones de rasgos en competencia.»
— Adaptado de Stark, S., Chernyshenko, O. S., & Drasgow, F. (2005). An IRT approach to constructing and scoring pairwise preference items. Applied Psychological Measurement, 29(3), 184–201. Consulta también doi:10.1037/0022-3514.63.1.146
Por qué funciona la elección forzada: Las escalas de Likert estándar permiten a los encuestados valorarse «altamente» en todos los rasgos. Los formatos de elección forzada requieren compromisos entre opciones igualmente deseables — forzando a los encuestados a revelar prioridades relativas en lugar de ideales absolutos. La investigación muestra que la elección forzada reduce el sesgo de deseabilidad social entre un 40–60% en comparación con las escalas de Likert.
Puntuación ipsativa: Qué significa para la interpretación de las puntuaciones del Big Five
Los instrumentos de elección forzada producen lo que se denomina datos ipsativos. Una puntuación ipsativa representa la posición de una persona en un rasgo en relación con sus otros rasgos propios — no en relación con una norma de población. Si tu perfil muestra alta Presencia y baja Profundidad, esto significa que eres más extravertido que neurótico en términos relativos. No necesariamente te dice si eres más extravertido que la persona promedio.
Esta es una limitación real. Los datos ipsativos no se pueden utilizar para los mismos propósitos que los datos normativos. En particular, comparar directamente los perfiles de dos personas (la puntuación de Presencia de la persona A vs la de la persona B) es metodológicamente complicado con datos ipsativos, porque ambos perfiles están referenciados internamente. Para un tratamiento completo de la puntuación normativa vs ipsativa, consulta cómo se calculan las puntuaciones de los tests de personalidad. La investigación sobre cómo gestionar adecuadamente los datos ipsativos, y sobre enfoques que producen estimaciones más normativas a partir de diseños de elección forzada (como la puntuación basada en TRI), está en curso.
El enfoque de Cèrcol reconoce esta limitación. El instrumento Testigo está diseñado principalmente para revelar prioridades relativas y puntos ciegos — ¿dónde se percibe que esta persona es más fuerte o débil en relación con su propio perfil general, y cómo se compara con su autopercepción? Esto es un uso válido y valioso de los datos ipsativos, incluso si las comparaciones cruzadas absolutas entre personas requieren un cuidado metodológico adicional.
El circunflejo AB5C: Cómo los adjetivos se mapean en las intersecciones del Big Five
El instrumento Testigo de Cèrcol se fundamenta en el Circunflejo Abreviado del Big Five (AB5C), desarrollado por Hofstee, de Raad y Goldberg (1992). El AB5C es un marco sistemático para mapear los adjetivos de personalidad en las dimensiones del Big Five — no como indicadores puros de un solo factor, sino como combinaciones ponderadas de dos factores.
En el marco AB5C, una palabra como «asertivo» no es simplemente un adjetivo de Extraversión — se carga tanto en Extraversión como en (baja) Amabilidad. Una palabra como «creativo» se carga tanto en Apertura como en (baja) Conscienciosidad. Al mapear los adjetivos en estas intersecciones, el AB5C captura la rica estructura superpuesta del lenguaje de la personalidad de manera más precisa que un enfoque simple factor por factor. Para el contexto más amplio de cómo el lenguaje de la personalidad fue analizado sistemáticamente para producir el Big Five, consulta la historia del Big Five de Allport a Goldberg.
Esto importa para el diseño de elección forzada porque permite construir pares que sean genuinamente informativos psicométricamente — cada elección entre un par de adjetivos proporciona información sobre la posición de un encuestado en las dimensiones relevantes del Big Five. Los pares no son arbitrarios; están fundamentados.
En el instrumento Testigo de Cèrcol, los pares de adjetivos están seleccionados para maximizar la información discriminativa en las cinco dimensiones (Presencia, Vínculo, Visión, Disciplina, Profundidad) mientras se mantienen los valores de deseabilidad social tan igualados como sea posible dentro de cada par. Esto asegura que las elecciones revelen una diferenciación genuina de personalidad en lugar de una diferencial deseabilidad social.
Cómo el Testigo de Cèrcol aplica la elección forzada a la evaluación por pares
El instrumento Testigo es el componente de evaluación por pares de Cèrcol. En lugar de pedir a los Testigos (evaluadores por pares) que valoren a la persona objetivo en afirmaciones de comportamiento, a los Testigos se les presentan pares de adjetivos y se les pide que elijan qué palabra describe mejor a la persona que conocen.
El instrumento se basa en la tradición IPIP — la alternativa de ciencia abierta a los instrumentos de personalidad controlados comercialmente. Todo el desarrollo de los ítems es transparente y documentado. El código fuente, el algoritmo de puntuación y la documentación psicométrica están disponibles bajo una licencia de código abierto en cercol.team/science.
Una sesión típica de Testigo dura entre 8 y 12 minutos. El perfil resultante muestra las puntuaciones de la persona objetivo en cada una de las cinco dimensiones de Cèrcol tal como las percibe ese Testigo, y el agregado de todos los Testigos proporciona el compuesto de pares. Este compuesto se compara entonces con el autoinforme de la persona objetivo para identificar alineación y brechas. Para la justificación completa de por qué esta capa de pares importa, consulta por qué la autoevaluación sola no es suficiente: retroalimentación de personalidad entre pares. La cuestión del anonimato en las valoraciones de los pares se aborda en anonimato en la evaluación de personalidad: por qué importa.
Escala de Likert vs. elección forzada: Comparación metodológica completa
| Dimensión | Escala de Likert | Elección forzada (Testigo de Cèrcol) |
|---|---|---|
| Sesgo de aquiescencia | Riesgo estructural alto | Eliminado por diseño |
| Deseabilidad social | Alta, especialmente para rasgos valorados | Sustancialmente reducida (pares de valencia igualada) |
| Interpretación de las puntuaciones | Normativa (nivel absoluto) | Ipsativa (prioridades relativas) |
| Comparación entre personas | Sencilla | Requiere cuidado metodológico |
| Resistencia a la falsificación | Baja para ítems transparentes | Más alta — ambas opciones típicamente positivas |
| Fundamentación teórica | Factor por factor | Circunflejo AB5C |
| Demanda cognitiva | Baja | Moderada — se requiere deliberación genuina |
Limitaciones honestas de la evaluación de personalidad de elección forzada
La elección forzada no es una panacea. Varias limitaciones merecen un reconocimiento honesto.
En primer lugar, el problema de la puntuación ipsativa descrito anteriormente. Aunque los enfoques basados en TRI (TRI de Thurstone, tal como fue desarrollado por Brown y Maydeu-Olivares) pueden recuperar estimaciones más parecidas a las normativas a partir de datos de elección forzada, estos métodos son exigentes computacionalmente y requieren tamaños de muestra sustanciales para calibrarse con precisión. La puntuación de elección forzada más simple sigue siendo bastante ipsativa.
En segundo lugar, las evaluaciones de elección forzada son cognitivamente más exigentes. Los encuestados deben comparar genuinamente dos opciones y decidir cuál se ajusta mejor, en lugar de simplemente valorar cada ítem de manera independiente. Esto puede ralentizar los tiempos de finalización y puede resultar frustrante para los encuestados que sienten que «ambas se aplican igualmente». La imposibilidad de decir «ambas» es por diseño, pero puede parecer antinatural.
En tercer lugar, la elección forzada no elimina todas las respuestas estratégicas. Un autopresentador determinado que sabe qué adjetivos se mapean en qué dimensiones valoradas aún puede elegir sistemáticamente los adjetivos «correctos». Para la literatura completa sobre lo que la falsificación motivada realmente hace a las puntuaciones de los tests de personalidad, consulta ¿se puede falsificar un test de personalidad?. La elección forzada aumenta el costo cognitivo de las respuestas estratégicas, pero no las hace imposibles — particularmente para los encuestados con exposición previa a la teoría de la personalidad.
A pesar de estas limitaciones, el peso de la evidencia psicométrica es claro: los instrumentos de elección forzada producen datos menos sesgados y más diferenciadores que las escalas de Likert en contextos de evaluación de altos riesgos. Para el caso de uso del Testigo — evaluación por pares donde los incentivos sociales para valorar favorablemente son reales — el diseño de elección forzada es la opción metodológicamente superior. Y si estás evaluando esto en el panorama más amplio de las herramientas disponibles, consulta los mejores tests de personalidad gratuitos para equipos en 2026.
Elección forzada vs. Likert: ¿Cuál produce datos del Big Five más honestos?
La evaluación de personalidad de elección forzada elimina el sesgo de aquiescencia por construcción y reduce sustancialmente el sesgo de deseabilidad social mediante pares de ítems de valencia igualada. El circunflejo AB5C proporciona la fundamentación teórica para la selección fundamentada de pares de adjetivos psicométricamente. El instrumento Testigo de Cèrcol aplica estos principios en una herramienta de evaluación por pares de código abierto, fundamentada en el IPIP, diseñada para producir los datos de personalidad por pares más honestos y diferenciadores disponibles. La limitación — la puntuación ipsativa — es real y reconocida, y la interpretación está diseñada en consecuencia.
Prueba una evaluación del Big Five de elección forzada: el instrumento Testigo de Cèrcol
La mayoría de las evaluaciones de personalidad — DISC, 16Personalities, incluso las herramientas del Big Five con escala de Likert — son vulnerables al mismo problema estructural: cuando la respuesta socialmente deseable es visible, los encuestados motivados (e incluso los honestos que intentan ser precisos) sesgarán sus respuestas hacia ella. El diseño de elección forzada es la solución más respaldada por la evidencia disponible.
La evaluación de pares Testigo de Cèrcol es un instrumento de elección forzada construido sobre el marco del circunflejo AB5C y fundamentado en la tradición de ítems de dominio público IPIP. Los Testigos eligen entre pares de adjetivos igualados por deseabilidad social — haciendo estructuralmente difícil ser uniformemente positivo sobre la persona que están valorando. El resultado son datos de personalidad de pares que reflejan cómo la persona es genuinamente experimentada, no solo hasta qué punto el Testigo les agrada.
La autoevaluación en cercol.team es gratuita. Añadir evaluaciones de Testigos lleva a cada par entre 8 y 12 minutos. Lee la justificación científica completa para entender cómo el diseño de elección forzada y la fundamentación AB5C trabajan juntos para ofrecer datos del Big Five más honestos.
Referencias
Hofstee, W. K. B., de Raad, B., & Goldberg, L. R. (1992). Integration of the Big Five and circumplex approaches to trait structure. Journal of Personality and Social Psychology, 63(1), 146–163. doi:10.1037/0022-3514.63.1.146
Brown, A., & Maydeu-Olivares, A. (2011). Item response modeling of forced-choice questionnaires. Educational and Psychological Measurement, 71(3), 460–502.
Lectura adicional
- Sesgo de deseabilidad social en los tests de personalidad: ¿cuál es el problema?
- ¿Se puede falsificar un test de personalidad? Lo que muestra realmente la investigación
- Por qué la autoevaluación sola no es suficiente: el caso de la retroalimentación de personalidad entre pares
- ¿Qué es la fiabilidad y la validez en los tests de personalidad?
- Por qué 120 ítems es mejor que 10: el compromiso en la longitud de los tests de personalidad
- Anonimato en la evaluación de personalidad: por qué importa para los datos honestos