Si alguna vez has hecho un test de personalidad y te has preguntado si responder como realmente eres o como te gustaría ser, has experimentado en primera persona el sesgo de deseabilidad social. Esta tendencia —a presentarse de manera favorable al responder cuestionarios— es uno de los problemas mejor documentados en la evaluación de la personalidad, y uno de los más persistentes.
Entender qué es el sesgo de deseabilidad social, en qué medida distorsiona realmente los resultados de los tests de personalidad y qué enfoques metodológicos pueden reducirlo es esencial para cualquier persona que utilice datos de personalidad de manera seria.
Qué es el sesgo de deseabilidad social y cómo distorsiona las puntuaciones del Big Five
El sesgo de deseabilidad social es la tendencia a dar respuestas que probablemente serán vistas favorablemente por los demás —o por uno mismo— en lugar de respuestas que reflejen con precisión la realidad.
En el contexto de la evaluación de la personalidad, opera en dos niveles. El primero es la gestión de la impresión: ajustar conscientemente las respuestas para presentar una mejor imagen. Un candidato a un empleo que quiere parecer consciencioso se puntúa alto en organización y fiabilidad, aunque esto sobreestime sus tendencias reales. El segundo es la mejora autoenañadora: creer genuinamente una versión más positiva de uno mismo, sin conciencia de la distorsión. Esta segunda forma es más insidiosa porque no puede eliminarse simplemente diciéndoles a los participantes que sean honestos.
Ambas formas se han estudiado extensamente desde los años cincuenta. El trabajo fundacional de Edwards (1957) estableció que la deseabilidad social de un enunciado es uno de los predictores más fuertes de la tasa de aprobación: las personas aceptan enunciados socialmente deseables no sólo porque sean ciertos, sino porque son deseables. Décadas posteriores de investigación han confirmado este hallazgo en culturas, contextos e instrumentos de evaluación diversos.
Sesgo de aquiescencia: por qué la gente acepta todo en los tests de personalidad
El sesgo de deseabilidad social tiene un pariente cercano que amplía sus efectos en las evaluaciones con escala de Likert: el sesgo de aquiescencia. La aquiescencia es la tendencia a aceptar los enunciados independientemente del contenido —a decir "sí" más a menudo que "no", a marcar "de acuerdo" o "muy de acuerdo" más de lo que el contenido justifica.
En los cuestionarios de personalidad que utilizan escalas de Likert (totalmente en desacuerdo → totalmente de acuerdo), la aquiescencia infla sistemáticamente todas las puntuaciones. Si tiendes a aceptar los enunciados, puntuarás más alto en todas las dimensiones que se evalúen. Esto hace que los perfiles parezcan más extremos en la dirección positiva de lo que realmente son, e infla las similitudes aparentes entre personas que en realidad pueden diferir sustancialmente.
La aquiescencia y la deseabilidad social interactúan: ambas empujan las respuestas hacia el extremo superior de la escala en los ítems formulados positivamente, amplificando la distorsión. Para una explicación de las protecciones a nivel de puntuación —codificación inversa, ítems negativos— que mitigan parcialmente esto, véase cómo se calculan las puntuaciones de los tests de personalidad.
"La deseabilidad social no es simplemente una variable molesta: explica una porción sustancial y sistemática de la varianza en las medidas de personalidad de autoinforme, especialmente para las dimensiones percibidas como socialmente valoradas."
— Paulhus, D. L. (1991). Measurement and control of response bias. In J. P. Robinson et al. (Eds.), Measures of personality and social psychological attitudes.
¿Cuánto distorsiona realmente el sesgo de deseabilidad social las puntuaciones del Big Five?
La cuestión de cuánto distorsiona el sesgo de deseabilidad social las puntuaciones de personalidad se ha estudiado correlacionando las puntuaciones en escalas de deseabilidad social (instrumentos diseñados para medir la tendencia a responder de manera socialmente deseable) con las puntuaciones en medidas de personalidad estándar.
Los resultados son sustanciales. Las correlaciones entre deseabilidad social y Amabilidad suelen oscilar entre ,30 y ,50, lo que significa que una porción significativa de la varianza en las puntuaciones de Amabilidad refleja el deseo de parecer amable, no la amabilidad real. La Responsabilidad muestra efectos similares, con correlaciones de ,25 a ,45. El Neuroticismo (Profundidad) se ve afectado inversamente: las personas subestiman sistemáticamente su inestabilidad emocional porque admitirla es socialmente indeseable, produciendo correlaciones negativas de magnitud similar.
No se trata de efectos triviales. Significan que en una evaluación de personalidad estándar con escala de Likert, las puntuaciones que se ven son una mezcla del rasgo que se intenta medir y la tendencia general de la persona a la autopresentación. Separarlas es difícil —y en contextos de alto riesgo (contratación, selección, programas de desarrollo de alta visibilidad), la motivación para presentarse bien es máxima y la distorsión es más severa. Para el contexto específico de la contratación, véase los tests de personalidad en la contratación: qué es legal y qué es ético.
Qué dimensiones del Big Five se distorsionan más por la deseabilidad social
No todas las dimensiones son igualmente vulnerables. El patrón es consistente entre estudios:
Bond (Amabilidad) y Discipline (Responsabilidad) son las más infladas por la deseabilidad social. Ambas implican rasgos ampliamente valorados: ser amable, cooperativo, fiable, organizado. Las personas se puntúan más alto en estas dimensiones no necesariamente porque lo sean, sino porque las puntuaciones conllevan implicaciones sociales que quieren avalar.
Depth (Neuroticismo) es la que más se deflaciona: las personas se puntúan sistemáticamente como menos ansiosas, menos irritables y menos reactivas emocionalmente de lo que justifica su experiencia real, porque admitir la inestabilidad emocional es socialmente costoso.
Presence (Extraversión) muestra efectos moderados. La extraversión se valora en muchos contextos profesionales, lo que produce una inflación leve, pero la naturaleza observable de la dimensión hace que una distorsión grave sea difícil de mantener.
Vision (Apertura) también muestra efectos moderados, especialmente para las facetas de curiosidad intelectual: a la gente le gusta verse como curiosa y de mente abierta.
Este patrón tiene implicaciones directas para la manera de interpretar DISC, 16Personalities y otras evaluaciones con escala de Likert que los equipos utilizan habitualmente. Véase DISC vs Big Five: por qué cuatro estilos no son suficientes y 16Personalities vs Big Five: el test viral que lo acierta a medias para las distorsiones específicas de cada marco.
Escala de Likert vs. elección forzada: comparación de la vulnerabilidad al sesgo
| Característica | Escala de Likert | Elección forzada |
|---|---|---|
| Formato de respuesta | Puntuar cada ítem del 1–5 o 1–7 | Elegir uno de cada pareja |
| Sesgo de aquiescencia | Alto — se puede aceptar todo | Ninguno — la elección es obligada |
| Deseabilidad social | Alta — fácil seleccionar opciones de alta valencia | Reducida — parejas emparejadas por valencia |
| Tipo de puntuación | Normativo — nivel absoluto por rasgo | Ipsativo — prioridades relativas entre rasgos |
| Facilidad de falsificación | Alta en ítems transparentes | Menor — la paridad de valencia hace que la "respuesta correcta" no sea clara |
| Demanda cognitiva | Baja | Moderada — se requiere una elección genuina |
| Mejor uso | Investigación, desarrollo de bajo riesgo | Selección, evaluación de alto riesgo, valoraciones de compañeros |
Cómo el diseño de elección forzada reduce el sesgo de deseabilidad social
La respuesta metodológica más eficaz al sesgo de deseabilidad social en la evaluación de la personalidad es el diseño de elección forzada. En lugar de puntuar cada ítem de manera independiente en una escala, a los participantes se les presentan parejas (o tríos) de ítems y se les pide que elijan cuál les describe mejor.
La elección forzada funciona porque hace que la deseabilidad social sea más difícil de actuar. Si ambos ítems de una pareja son positivos —"cálido y empático" versus "preciso y meticuloso"— no hay una respuesta evidentemente deseable socialmente. Se te obliga a revelar cuál de los dos rasgos valorados te describe con más precisión. La elección revela las prioridades relativas entre dimensiones, en lugar de los niveles absolutos en cada dimensión por separado.
La literatura psicométrica sobre los métodos de elección forzada, revisada por Stark et al. (2005) y más recientemente por Brown y Maydeu-Olivares (2011), confirma que las evaluaciones de elección forzada reducen sustancialmente la inflación de deseabilidad social. Para la explicación técnica completa de cómo funciona esto en el instrumento Testigo de Cèrcol, véase evaluación de la personalidad por elección forzada: por qué produce datos más honestos.
Cómo el instrumento Testigo de Cèrcol minimiza la deseabilidad social en las valoraciones de compañeros
El instrumento Testigo de Cèrcol utiliza un formato de elección forzada diseñado específicamente para reducir el sesgo de deseabilidad social en las valoraciones de compañeros. A los Testigos (evaluadores entre iguales) se les presentan parejas de adjetivos de personalidad —extraídos del circunflexo AB5C, que mapea los adjetivos en las intersecciones del Big Five— y se les pide que elijan qué palabra describe mejor a la persona que están evaluando.
Dado que el Testigo evalúa a otra persona, los motivos de autopresentación operan de manera menos directa que en el autoinforme. Pero los Testigos todavía tienen incentivos sociales para puntuar favorablemente al sujeto objetivo (amistad, compañerismo, deseo de proporcionar feedback positivo). El formato de elección forzada reduce esta tendencia haciendo que la maximización de la favorabilidad sea genuinamente difícil: si ambas opciones son positivas, no puedes simplemente elegir la respuesta "más agradable" sin revelar qué rasgo percibes realmente en ellas.
El resultado es una dada del Testigo que refleja con más precisión la personalidad percibida real en lugar de una impresión positiva generalizada. Para el caso completo de por qué los datos de compañeros son un complemento necesario al autoinforme, véase por qué la autoevaluación sola no es suficiente: feedback de personalidad entre iguales. El anonimato en las valoraciones de compañeros también importa: véase anonimato en la evaluación de la personalidad: por qué importa para la evidencia.
Advertencias honestas: qué no puede corregir completamente el diseño de elección forzada
El diseño de elección forzada no es una solución completa. La limitación principal es que los datos de elección forzada son ipsativos: las puntuaciones reflejan las prioridades relativas entre dimensiones, no los niveles absolutos. Esto hace que ciertos tipos de comparación —por ejemplo, comparar la puntuación absoluta de Amabilidad de una persona con la de otra— sean metodológicamente complejos. La investigación sobre cómo manejar adecuadamente los datos ipsativos es continua, y el marco de interpretación de Cèrcol lo tiene en cuenta.
Además, el diseño de elección forzada no elimina la distorsión motivada por participantes muy determinados. Alguien que quiere fuertemente presentarse como consciencioso todavía puede elegir sistemáticamente adjetivos relacionados con Discipline por encima de las alternativas. Para la investigación completa sobre cómo se manifiesta la falsificación en la práctica, véase ¿se puede falsificar un test de personalidad?. La elección forzada aumenta el coste cognitivo de las respuestas estratégicas, pero no las hace imposibles.
La postura honesta es que ningún diseño de evaluación elimina completamente los sesgos de respuesta. Lo que hace la elección forzada es reducir los sesgos más comunes y con más impacto —la aquiescencia y la deseabilidad social— a un nivel en el que la relación señal-ruido de los datos resultantes es sustancialmente mejor que con los enfoques estándar de escala de Likert.
Sesgo de deseabilidad social: conclusiones clave para los usuarios de tests de personalidad
El sesgo de deseabilidad social infla sistemáticamente las puntuaciones en rasgos valorados (Bond, Discipline) y deflaciona las puntuaciones en rasgos estigmatizados (Depth) en las evaluaciones de personalidad estándar con escala de Likert. El sesgo de aquiescencia lo agrava empujando todas las puntuaciones hacia la aceptación. No se trata de cuestiones técnicas menores: reducen sustancialmente la validez de los datos de personalidad de autoinforme, especialmente en contextos de alto riesgo.
El diseño de elección forzada, tal como se utiliza en el instrumento Testigo de Cèrcol, aborda estos sesgos haciendo que sea estructuralmente difícil maximizar simultáneamente la deseabilidad social en todas las dimensiones. El resultado es un dato de personalidad más honesto, más diferenciado y más útil. Para una comparación clasificada de qué herramientas de evaluación gratuitas gestionan mejor el sesgo, véase los mejores tests de personalidad gratuitos para equipos en 2026.
Cómo Cèrcol gestiona el sesgo de deseabilidad social
El sesgo de deseabilidad social no es una inconveniencia menor: infla sistemáticamente las puntuaciones de Bond y Discipline y deflaciona las puntuaciones de Depth en cada evaluación estándar con escala de Likert. Ninguna cantidad de instrucciones del tipo "por favor, sé honesto" cambia los incentivos estructurales.
Cèrcol aborda esto a nivel del instrumento, no a nivel de las instrucciones. La evaluación de compañeros Testigo utiliza un formato de elección forzada en el que las parejas de adjetivos se emparejan por valor de deseabilidad social, lo que hace que sea estructuralmente difícil presentar una imagen idealizada sin tomar decisiones genuinas de personalidad. El diseño de elección forzada se inspira en el circunflexo AB5C (Hofstee, de Raad & Goldberg, 1992) y se ha calibrado con el banco de ítems IPIP.
La evaluación del Big Five de autoinforme utiliza escalas de Likert —con ítems de codificación inversa y protecciones a nivel de escala— y es gratuita en cercol.team. Añadir valoraciones de los Testigos de compañeros produce la imagen multiperspectiva que revela dónde es probable que la deseabilidad social distorsione el autoinforme. Lee el diseño científico completo para ver exactamente cómo ambos instrumentos gestionan el sesgo.
Referencias
Edwards, A. L. (1957). The social desirability variable in personality assessment and research. Dryden Press.
Paulhus, D. L. (1991). Measurement and control of response bias. In J. P. Robinson et al. (Eds.), Measures of personality and social psychological attitudes (pp. 17–59). Academic Press.
Lectura adicional
- ¿Se puede falsificar un test de personalidad? Lo que realmente muestra la investigación
- Evaluación de la personalidad por elección forzada: por qué las restricciones producen datos más honestos
- Anonimato en la evaluación de la personalidad: por qué importa para datos honestos
- Por qué la autoevaluación sola no es suficiente: el caso del feedback de personalidad entre iguales
- ¿Qué es la fiabilidad y la validez en los tests de personalidad?
- Los tests de personalidad en la contratación: ¿qué es legal, qué es ético?