En 2015, une collaboration pionnière a publié des résultats qui ont ébranlé la psychologie académique jusqu'à ses fondements. L'Open Science Collaboration a réuni 270 chercheurs dans plus de 100 laboratoires et a tenté de répliquer 100 résultats de revues de psychologie sociale et cognitive à fort impact. Les résultats, publiés dans Science (doi:10.1126/science.aac4716), étaient décevants : seulement 36 à 39 pour cent des résultats ont été répliqués dans un sens statistiquement significatif. Les tailles d'effet étaient systématiquement plus petites dans les réplications que dans les originaux. De nombreux résultats qui avaient été largement cités, enseignés dans les cours de premier cycle et appliqués en pratique n'ont pas résisté à des tests indépendants.
La crise de réplication — dont une vue d'ensemble est disponible sur Wikipedia — a reconfiguré la conversation sur ce que la psychologie sait réellement. Elle a suscité une introspection sur les petites tailles d'échantillons, le biais de publication (la tendance à ne publier que les résultats positifs), les degrés de liberté des chercheurs (les nombreux choix non divulgués qui peuvent gonfler les effets apparents) et une culture qui récompensait la nouveauté au détriment de la reproductibilité.
Où se situe la science de la personnalité dans ce tableau ? La réponse est plus rassurante que le taux de réplication global ne le suggère — mais elle n'est pas uniformément rassurante.
Pourquoi la science du Big Five a mieux survécu à la crise de réplication
Les résultats qui ont le plus dramatiquement échoué à se répliquer dans l'Open Science Collaboration étaient concentrés en psychologie sociale et cognitive — des effets flashy et contre-intuitifs qui faisaient de bons titres et du bon matériel de cours. Les études de priming (l'idée qu'exposer brièvement des personnes à un mot change leur comportement ultérieur), l'épuisement de l'ego (l'idée que la volonté est une ressource qui s'épuise avec l'usage) et plusieurs résultats classiques d'influence sociale ont soit échoué à se répliquer, soit se sont répliqués avec des tailles d'effet représentant une fraction de l'original.
La science de la personnalité n'était pas immune aux problèmes de réplication, mais elle était structurellement mieux positionnée pour y résister. Les raisons sont méthodologiques.
Les tailles d'échantillons tendent à être plus grandes. Les résultats du Big Five qui ancrent le domaine — la relation entre Conscientiousness et performance au travail, entre Neuroticism et bien-être psychologique, entre Openness et créativité — ont été établis dans des centaines d'études et de méta-analyses impliquant des dizaines de milliers de participants. Lorsque les résultats sont basés sur un très grand N et ont été répliqués de nombreuses fois dans différents contextes, la réplication est une question de routine plutôt qu'un espoir.
Les mesures sont plus stables. Les questionnaires de personnalité produisent des scores très fiables — les fiabilités de cohérence interne sont typiquement dans la plage .80-.90. Les paradigmes de priming en session unique, en revanche, mesurent des états à court terme sensibles au contexte avec une fiabilité bien plus faible. Des mesures peu fiables signifient des effets bruités qui fluctuent de manière imprévisible d'une réplication à l'autre.
Les construits sont plus opérationnellement transparents. La « Conscientiousness » a une définition claire et consensuelle qui a été opérationnalisée de manière cohérente à travers les instruments et les études depuis des décennies. De nombreux résultats de psychologie sociale non répliqués dépendaient d'opérationnalisations créatives et théoriquement contestées de construits comme le « pouvoir », l'« attitude implicite » ou la « déplétion autorégulative ». Des construits plus transparents produisent des résultats plus réplicables. Les items du domaine public de l'IPIP rendent cette transparence possible au niveau de la mesure.
Les résultats robustes du Big Five qui se sont répliqués de manière fiable
« Parmi les résultats les plus robustes de la psychologie de la personnalité, on trouve la relation entre Conscientiousness et performance au travail — une connexion documentée dans des centaines d'études, de multiples cultures et une grande variété de domaines professionnels. » — Roberts et al., 2007 (revue méta-analytique)
Les résultats suivants de la science de la personnalité ont survécu à des réplications répétées et à un examen méta-analytique avec des tailles d'effet constamment modérées à importantes.
Conscientiousness et performance au travail. La méta-analyse de Barrick et Mount (1991) — et ses nombreuses réplications et extensions — a établi que la Conscientiousness (Discipline dans le cadre de Cèrcol) est le prédicteur Big Five le plus cohérent de la performance au travail dans tous les types professionnels. L'effet n'est pas important en termes absolus (corrélations corrigées typiquement autour de .20-.28) mais c'est l'un des plus importants dans la littérature sur les relations personnalité-résultats, et il se maintient dans tous les secteurs, cultures et types d'emploi. Ce résultat a été répliqué tant de fois qu'il est traité comme une référence à laquelle les nouveaux prédicteurs sont évalués. Pour un profil complet de cette dimension, voir what is Conscientiousness.
Neuroticism et bien-être. La relation négative entre Neuroticism (Profondeur dans la terminologie de Cèrcol) et le bien-être subjectif, la satisfaction de vie et l'affect positif est l'un des résultats les plus répliqués de la science de la personnalité. Une méta-analyse de Steel, Schmidt et Shultz (2008) a trouvé des corrélations entre Neuroticism et des mesures globales de bien-être autour de -.40 à -.50. La relation se maintient longitudinalement, transculturellement et à travers différentes opérationnalisations du bien-être. Le tableau complet de cette dimension est couvert dans what is Neuroticism.
Stabilité des traits au cours de l'âge adulte. Le résultat selon lequel les traits du Big Five sont modérément stables à travers l'âge adulte — et deviennent plus stables avec l'âge — a été répliqué dans des études longitudinales dans plusieurs pays. Roberts et DelVecchio (2000) ont méta-analysé 152 études longitudinales et ont trouvé des corrélations test-retest augmentant d'environ .54 dans l'enfance à .74 à l'âge adulte. La personnalité n'est pas fixe, mais elle n'est pas aussi malléable que les récits populaires le suggèrent parfois. C'est l'un des résultats les plus importants à comprendre avant de lire five personality science myths that won't die.
Extraversion et affect positif. L'association entre Extraversion (Présence) et l'émotionnalité positive est très réplicable et apparaît dans les études par auto-évaluation et dans celles par évaluation momentanée écologique. L'Extraversion semble refléter, en partie, une sensibilité biologique aux signaux de récompense qui se manifeste comme une tendance à éprouver des émotions positives plus fréquentes et plus intenses dans des contextes sociaux.
Openness et créativité, intelligence et engagement esthétique. Le lien entre Openness to Experience (Vision) et les résultats dans les domaines créatifs — production artistique, pensée divergente, consommation culturelle — est constamment répliqué. Sa relation avec l'intelligence cristallisée est modérée et robuste.
Quels résultats de la science de la personnalité ont un bilan de réplication plus faible
Tous les résultats de la science de la personnalité n'ont pas résisté également bien à la réplication.
Interactions spécifiques trait × résultat. Alors que les effets principaux des traits du Big Five sur des résultats larges sont robustes, les affirmations sur des interactions modératrices spécifiques — que la Conscientiousness prédit la performance seulement dans certaines conditions de leadership, que l'Agreeableness compte davantage pour la performance de l'équipe dans les rôles à forte interdépendance — ont un bilan de réplication plus faible. Ces effets d'interaction sont souvent basés sur des échantillons plus petits, impliquent plus de degrés de liberté des chercheurs dans l'analyse et tendent à se réduire substantiellement dans les réplications indépendantes.
Interventions de changement de personnalité. Les études affirmant que des interventions ciblées peuvent modifier de manière significative les niveaux de traits du Big Five — et que ces changements persistent dans le temps — ont montré des résultats de réplication mitigés. Le résultat de base selon lequel la personnalité peut changer est robuste ; les preuves d'un changement fiable, ciblé et durable via des interventions spécifiques le sont moins. Le domaine a besoin d'essais pré-enregistrés plus importants avant que des affirmations fortes sur le changement de personnalité ne soient justifiées.
Interprétations basées sur des types. Les tentatives de dériver des « types » de personnalité significatifs à partir des scores continus du Big Five — l'affirmation qu'il existe des groupes distincts de personnes ayant des profils significativement différents — ont montré une mauvaise réplication. Un article largement cité de 2018 de Gerlach et al. prétendant identifier quatre types de personnalité robustes a rapidement été suivi d'analyses indépendantes montrant que la structure des types était très sensible aux choix méthodologiques. Les scores continus de traits se répliquent ; les types discrets ne se répliquent pas. C'est l'une des raisons pour lesquelles Cèrcol évite le cadrage basé sur des types.
Ce que les équipes devraient faire confiance — et ce qu'il faut traiter avec prudence
| Résultat | Statut de réplication | Niveau de confiance |
|---|---|---|
| Conscientiousness → performance au travail | Très répliqué | Élevé — utiliser comme référence |
| Neuroticism → moindre bien-être | Très répliqué | Élevé — cohérent entre cultures et instruments |
| Stabilité des traits à l'âge adulte | Très répliqué | Élevé — le changement intra-personnel est réel mais lent |
| Extraversion → affect positif | Très répliqué | Élevé — robuste en échantillonnage d'expérience et en laboratoire |
| Openness → créativité | Bien répliqué | Modéré-élevé — les tailles d'effet varient selon le domaine |
| Interactions spécifiques trait × résultat | Mitigé | Faible — traiter avec prudence ; chercher des preuves N important |
| Interventions de changement de personnalité | Mitigé | Faible-modéré — prometteur mais pas encore établi |
| Types de personnalité du Big Five | Mal répliqué | Faible — éviter les assignations de types binaires |
L'implication pratique pour quiconque utilise des données de personnalité est de les appliquer au niveau des tendances de traits larges, et non de prédictions à grain fin. La recherche sur la Conscientiousness et la performance au travail vous donne des raisons d'espérer que quelqu'un avec des scores de Discipline élevés montrera, en moyenne et au fil du temps, une plus grande fiabilité et un meilleur suivi que quelqu'un avec des scores faibles. Cela ne vous donne pas de raisons de prédire ce qu'ils feront dans une situation spécifique, comment ils réagiront à un manager particulier, ou s'ils réussiront dans un rôle aux exigences inhabituelles. Pour un compte rendu plus complet de ces limites, voir what personality science cannot predict.
Pour Cèrcol, cela signifie construire des cadres d'interprétation au niveau où les preuves sont les plus solides, et être explicite sur l'incertitude là où les preuves sont plus faibles. La page science sur cercol.team/science présente la base de preuves en détail.
Comment la pré-inscription améliore la crédibilité de la science de la personnalité
La crise de réplication a entraîné un changement dans les pratiques de recherche. La pré-inscription — s'engager sur des hypothèses, des mesures et une stratégie d'analyse avant la collecte de données — empêche la flexibilité non divulguée qui gonfle les taux de faux positifs. Les grandes études collaboratives agrègent des données dans de nombreux laboratoires pour produire des estimations de taille d'effet suffisamment robustes pour se généraliser. Les collaborations adversariales opposent des chercheurs aux vues opposées dans des études conjointes conçues pour trancher entre elles.
Ces pratiques améliorent déjà la qualité de la littérature en science de la personnalité. Les résultats qui survivent à la réplication pré-inscrite avec un N important sont substantiellement plus crédibles que ceux qui n'ont été démontrés que dans des études mono-laboratoire. À mesure que le domaine mûrit, le rapport signal/bruit s'améliorera — et avec lui, la confiance que les praticiens peuvent accorder aux données de personnalité. Pour une revue des idées fausses persistantes, voir five personality science myths that won't die.
Testez la science vous-même avec Cèrcol
Les résultats du Big Five qui se sont répliqués de la manière la plus robuste — Conscientiousness et performance, Neuroticism et bien-être, stabilité des traits — sont exactement les résultats sur lesquels les évaluations de personnalité devraient être fondées. C'est la norme que Cèrcol s'impose : seules les dimensions et relations avec de solides bilans de réplication sont utilisées pour générer des insights, et la page science documente les preuves à l'appui de manière transparente.
Si vous voulez voir à quoi ressemble la science de la personnalité répliquée en pratique, Cèrcol est gratuit sur cercol.team. L'évaluation utilise des items du domaine public IPIP, évalue les cinq dimensions dont les preuves de validité ont survécu à la crise de réplication, et vous donne des perspectives à la fois par auto-évaluation et par les pairs — parce que deux signaux indépendants sont plus fiables qu'un seul.
Lecture complémentaire : Critiques of the Big Five: what the critics say · The science behind Cèrcol