Lanzamiento beta — quedan 500 licencias gratuitas de Full Moon. Ayúdanos a detectar errores.
Reclama tu acceso gratuito

Las mejores pruebas de personalidad gratuitas para equipos en 2026 — clasificadas por validez científica

Existen docenas de pruebas de personalidad gratuitas — solo unas pocas tienen respaldo científico real. Esta clasificación de 2026 muestra qué herramientas Big Five son válidas, y cuáles no.

Miquel Matoses·11 min de lectura

El panorama de las evaluaciones de personalidad ha cambiado considerablemente. Las herramientas psicométricas validadas que antes vivían exclusivamente en entornos académicos o clínicos licenciados ahora son libremente accesibles en línea. Al mismo tiempo, el mercado está inundado de evaluaciones que parecen profesionales pero descansan sobre fundamentos científicos débiles o inexistentes.

Esta clasificación aplica un conjunto coherente de criterios a las pruebas de personalidad para equipos más usadas en 2026, ordenadas por validez científica en lugar de popularidad. El objetivo es dar a los equipos — y a los gestores y profesionales de RRHH que los apoyan — una guía clara y basada en la evidencia sobre qué vale la pena usar y qué tratar con precaución.

PruebaÍtemsValidez¿Gratuita?Mejor para
Cèrcol New Moon120AltaEquipos, perfil profundo
Big Five IPIP-NEO120AltaInvestigación, benchmarks de RRHH
Big Five BFI-1010Baja-MediaCribado rápido únicamente
MBTI93BajaEntretenimiento
DISC28Baja-MediaRompehielos de taller

Cómo Evaluamos las Pruebas de Personalidad Gratuitas: Los Criterios de Validez

r = 0.22 Big Five → rendimiento laboral (metaanalítica)
r = 0.13 MBTI → rendimiento laboral (validez escasa)
Gratuita Cèrcol New Moon — 120 ítems IPIP, máxima validez, sin coste

Cada herramienta de esta clasificación es evaluada en cinco dimensiones:

  1. Validación revisada por pares: ¿Ha sido el instrumento validado de manera independiente en investigación publicada y revisada por pares — no solo por el proveedor?
  2. Dominio público / código abierto: ¿Son los ítems y los algoritmos de puntuación inspeccionables públicamente, o la metodología es propietaria?
  3. Fiabilidad test-retest: ¿Las puntuaciones permanecen estables a lo largo de semanas y meses, tal como predice la teoría de la personalidad?
  4. Validez predictiva: ¿Las puntuaciones predicen resultados que importan — rendimiento laboral, efectividad del equipo, bienestar?
  5. Uso gratuito: ¿Puede un equipo usarla sin costes de licencia por usuario?

Para una introducción sobre lo que significan estadísticamente estos criterios, véase what is reliability and validity in personality testing.


Las Mejores Pruebas de Personalidad Gratuitas para Equipos en 2026, Clasificadas por Ciencia

1. Evaluaciones basadas en IPIP — máxima validez, gratuitas, abiertas

Qué mide: Las cinco dimensiones Big Five (Apertura, Conscienciosidad, Extraversión, Amabilidad, Neuroticismo) como puntuaciones continuas, con transparencia a nivel de ítem.

Base científica: El International Personality Item Pool es una biblioteca de dominio público de ítems de personalidad desarrollada y mantenida por Lewis Goldberg en el Oregon Research Institute. Los ítems IPIP han sido validados contra instrumentos comerciales (NEO-PI-R, Hogan, 16PF) en decenas de estudios independientes. El marco Big Five en sí ha sido replicado en más de cincuenta años de investigación transcultural. Para entender cómo estos ítems se convirtieron en el estándar científico, véase what is the IPIP and why does it matter y history of the Big Five from Allport to Goldberg.

Fiabilidad test-retest: Alta. Las dimensiones Big Five están entre los constructos psicológicos más temporalmente estables medidos en investigación, con correlaciones test-retest típicamente en el rango de r = 0,75–0,85 en meses.

Validez predictiva para el rendimiento laboral: Sólida. "La Conscienciosidad es el predictor de personalidad único más fuerte del rendimiento laboral en categorías ocupacionales" (Barrick & Mount, 1991). La Estabilidad Emocional predice el rendimiento en roles de alta presión.

Uso gratuito: Sí. El IPIP es explícitamente de dominio público. Cualquier equipo o desarrollador puede usar ítems IPIP libremente.

Preparado para equipos: Con presentación e interpretación apropiadas, sí — pero la administración IPIP en bruto requiere algo de configuración.


2. Cèrcol Full Moon — IPIP + evaluación de pares Testigo

Qué mide: Las cinco dimensiones Big Five (como Presencia, Bond, Visión, Disciplina, Profundidad) vía autoinforme, más evaluaciones estructuradas de Testigos de hasta tres pares elegidos por cada participante.

Base científica: Construida directamente sobre ítems IPIP y el marco Big Five. La capa de evaluación de pares Testigo añade una segunda perspectiva que el autoinforme solo no puede capturar — la investigación muestra consistentemente que las valoraciones de otros predicen el rendimiento laboral tan bien como, y a veces mejor que, las autovaloradas. Véase why self-assessment alone isn't enough: peer personality feedback para la base de evidencia.

Fiabilidad test-retest: Hereda la estabilidad de la base IPIP Big Five.

Validez predictiva: La combinación de autoevaluación y perspectiva de pares es el enfoque más rico en información disponible, basado en la misma literatura empírica que las herramientas IPIP-only.

Uso gratuito: La evaluación First Quarter es gratuita para individuos y equipos pequeños. Full Moon añade evaluaciones de pares Testigo.

Preparado para equipos: Sí — diseñado específicamente para uso en equipos. Los resultados incluyen una vista a nivel de equipo que muestra la distribución de rasgos a lo largo del grupo. Véase what the Cèrcol Witness instrument measures para la descripción completa del instrumento.


3. Open Source Psychometrics Project

Qué mide: Múltiples instrumentos validados disponibles gratuitamente, incluidas medidas Big Five, herramientas basadas en IPIP, y varias otras evaluaciones de calidad investigadora.

Base científica: El Open Source Psychometrics Project alberga una gama de instrumentos de personalidad bien documentados con datos normativos publicados recopilados de muestras grandes. El sitio es transparente sobre la metodología.

Fiabilidad test-retest: Varía por instrumento; las medidas basadas en IPIP son altas.

Validez predictiva: Alta para las medidas Big Five alojadas en el sitio.

Uso gratuito: Sí, completamente gratuito.

Preparado para equipos: Los resultados son individuales; agregar en perfiles de equipo requiere trabajo adicional. Adecuado para equipos cómodos con algo de interpretación autogestionada.


Qué mide: Cinco dimensiones vagamente mapeadas del MBTI (E/I, S/N, T/F, J/P, más Asertivo/Turbulento), generando 16 tipos nombrados.

Base científica: Adyacente al MBTI. Tiene una superposición parcial con las dimensiones Big Five (el eje Asertivo/Turbulento mapea hacia Estabilidad Emocional; los cuatro ejes MBTI mapean vagamente hacia los otros cuatro factores Big Five). Sin embargo, "el formato de tipo binario descarta la varianza significativa dentro de la categoría, y los estudios de validación de revisión por pares independientes son limitados." Para un desglose exhaustivo, véase 16Personalities vs Big Five: the viral test that gets it half right.

Fiabilidad test-retest: Moderada a baja para la clasificación de tipo de cuatro letras; las puntuaciones de dimensión individuales son más estables que el tipo combinado.

Validez predictiva: No establecida en investigación independiente a niveles comparables a los instrumentos Big Five.

Uso gratuito: Sí, la prueba básica es gratuita.

Preparado para equipos: Ampliamente usado como rompehielos e inicio de conversación. No debería usarse para decisiones de alto riesgo sobre roles o desarrollo.


5. DISC — propietario, validación limitada

Qué mide: Cuatro estilos de comportamiento (Dominancia, Influencia, Estabilidad, Conscienciosidad), presentados como tipos de cuadrante.

Base científica: Basado en el marco teórico de Marston de 1928, no derivado del análisis factorial empírico. Existen múltiples versiones comerciales competidoras con ítems y normas diferentes. "La validación de revisión por pares independiente para predecir el rendimiento laboral es escasa." Cubre únicamente el espacio Big Five parcial (principalmente Extraversión y Amabilidad; falta Neuroticismo y Apertura casi completamente). Véase DISC vs Big Five: why four styles aren't enough para una comparación científica detallada, y Big Five vs DISC vs Belbin para un cara a cara de tres bandas.

Fiabilidad test-retest: Moderada, varía significativamente por proveedor.

Validez predictiva: No establecida para el rendimiento laboral al nivel documentado para el Big Five.

Uso gratuito: No. Todos los instrumentos DISC principales son propietarios y de pago.

Preparado para equipos: Ampliamente usado en contextos de formación; efectivo como marco de comunicación. No es apropiado para evaluación de alto riesgo.


6. Eneagrama — sin base revisada por pares

Qué mide: Nueve arquetipos de personalidad basados en un modelo con orígenes en tradiciones esotéricas, popularizado en el siglo XX por Claudio Naranjo y otros.

Base científica: Esencialmente ninguna. A pesar de su popularidad en comunidades de coaching y espirituales, el Eneagrama no ha acumulado una literatura de validación revisada por pares comparable a ninguna de las herramientas anteriores. Las asignaciones de tipo son inestables, el instrumento carece de datos normativos establecidos, y ningún metaanálisis mayor ha vinculado los tipos del Eneagrama al rendimiento laboral u otras variables criterio. Para más sobre mitos que rodean las pruebas de personalidad, véase five personality science myths that won't die.

Fiabilidad test-retest: Baja.

Validez predictiva: No establecida.

Uso gratuito: Parcialmente; algunas versiones son gratuitas, existen versiones de pago.

Preparado para equipos: Puede generar reflexión personal y discusión significativas, pero debería usarse como ejercicio reflexivo en lugar de como datos psicométricos.


Pruebas de Personalidad Gratuitas Comparadas: Tabla de Clasificación Completa 2026

RangoHerramientaRevisada por paresDominio abiertoFiabilidad test-retestValidez predictivaGratuita
1Evaluaciones basadas en IPIPAltaAltaAlta
2Cèrcol Full MoonAltaSí (IPIP)AltaAlta + datos de paresFreemium
3Open Source PsychometricsAlta (para herramientas Big Five)AltaAlta
416PersonalitiesBaja–moderadaNoModeradaNo establecida
5DISCBajaNoModeradaNo establecidaNo
6EneagramaNingunaVaríaBajaNingunaParcial

Cómo Elegir la Prueba de Personalidad Gratuita Adecuada para Vuestro Equipo

Para la mayoría de equipos que empiezan desde cero, un enfoque de dos pasos funciona bien:

  1. Comenzad con una autoevaluación IPIP gratuita — ya sea a través de Open Source Psychometrics o del First Quarter de Cèrcol — para establecer una base para el perfil Big Five de cada persona.
  2. Añadid la evaluación de pares (Testigos) para ver dónde difiere la percepción de uno mismo de la experiencia de los demás. Esa brecha es a menudo donde se producen las conversaciones de desarrollo más útiles.

Si vuestro equipo ha estado usando DISC o 16Personalities como vocabulario compartido, no tenéis que abandonar ese vocabulario. Pero incorporar un instrumento Big Five adecuado al lado os dará la validez predictiva y la resolución dimensional que a esas herramientas les falta.

Para una inmersión más profunda en lo que realmente estáis pagando — o no pagando — cuando comparáis opciones de código abierto y comerciales, véase personality testing: open source vs commercial.


Probad la evaluación de personalidad para equipos gratuita de mayor rango

Cèrcol ocupa el primer lugar de esta clasificación porque combina la medida IPIP de dominio abierto con la evaluación de pares en una plataforma única, preparada para equipos. Cada puntuación de dimensión está basada en la misma literatura científica que impulsa las herramientas de investigación usadas en estudios de validez mayores — y el instrumento es gratuito para individuos y equipos pequeños.

La autoevaluación tarda 15 minutos y ofrece perfiles Big Five a nivel de dimensión y faceta. La evaluación de pares Testigo añade valoraciones de observadores en un formato de elección forzada que reduce la inflación de deseabilidad social que afecta a cada herramienta de escala Likert de esta lista. Véase how Cèrcol handles social desirability bias y why 120 items is better than 10 para el razonamiento del diseño de la medida.

Comenzad la evaluación de vuestro equipo en cercol.team. Leed la fundamentación científica para ver exactamente lo que estáis midiendo y por qué.


Fuentes: IPIP — International Personality Item Pool · Open Source Psychometrics Project · Barrick, M. R., & Mount, M. K. (1991). The Big Five personality dimensions and job performance: A meta-analysis. Personnel Psychology, 44(1), 1–26.

Lecturas Adicionales

Artículos relacionados

Cèrcol usa solo cookies funcionales — sin analíticas, sin rastreadores publicitarios. Política de privacidad