Hvis du nogensinde har taget en personlighedstest som del af en jobansøgning, har du sandsynligvis spekuleret: hvad leder de egentlig efter? Og hvis du vidste, hvad de ledte efter, kunne du så bare svare derefter?
Det ærlige svar på det første spørgsmål er: ja, der er mønstre, som arbejdsgivere tenderer til at foretrække — højere Conscientiousness, moderat til høj Ekstraversion for mange roller, lavere Neurotisme. Det ærlige svar på det andet er mere kompliceret.
Denne artikel gennemgår, hvad den videnskabelige litteratur faktisk siger om forfalskning på personlighedstests, hvor meget det sker, om det er vigtigt for forudsigelsesvaliditet, og hvad det fortæller os om passende brug af personlighedsvurdering.
Kan man forfalske personlighedstests? Ja — når man instrueres om det
Forfalskningsforskningen er utvetydig på ét punkt: når folk eksplicit instrueres til at præsentere sig selv som ideelle kandidater, kan de og gør faktisk skifte deres scorer substantielt. Studier med "fake good" instruktioner — hvor deltagerne bedes forestille sig, at de søger et ønskværdigt job og svarer i overensstemmelse hermed — viser konsekvent, at gennemsnitscorer på Conscientiousness, Emotionel Stabilitet (lav Neurotisme) og Ekstraversion stiger med ca. halvt standardafvigelse eller mere.
Det er ikke overraskende. Social ønskvardhedsbias — tendensen til at besvare spørgsmål på måder, der præsenterer et gunstigt socialt billede — er et af de bedst dokumenterede fænomener i undersøgelsesforskning. Personlighedstests er ikke immune over for det. For en bredere behandling af, hvordan vurderingskontekst former scorer, se anonymitet i personlighedsvurdering: hvorfor det er vigtigt.
"Motiveret forfalskning på personlighedsinventarer kan resultere i gennemsnitlige score-stigninger på ca. et halvt til et standardafvigelse på de fleste Big Five skalaer."
— Viswesvaran & Ones (1999), Human Performance
Hvor meget forfalskning sker der faktisk i rigtige ansættelseskontekster
Her bliver billedet mere nuanceret. Laboratorieevidensen for forfalskning under instruktion er robust. Evidensen for spontan, uinstrueret forfalskning i faktiske ansættelseskontekster er svagere.
Flere studier har sammenlignet personlighedsscorer indsamlet i ansøgerkontekster (hvor folk har grund til at forfalske) med scorer indsamlet i forskningskontekster (hvor de ikke har det). Forskellene er reelle, men mindre end de instruerede forfalskningsstudier antyder — typisk ca. en fjerdedel til en tredjedel af et standardafvigelse på de mest forfalskelige skalaer.
Nogle forskere hævder, at dette resterende hul primært tilskrives selvbedrag snarere end bevidst forvrængning: ansøgere tror genuint, de besidder de træk, de hævder, fordi motiveret ræsonnement fører dem til at oppuste deres selvevalueringer i positive retninger. Det er et andet fænomen end kynisk forfalskning og har forskellige implikationer for, hvad man skal gøre ved det. Det forbinder sig også med den bredere evidens om hvorfor selvvurdering alene producerer et ufuldstændigt billede — vi er systematisk upålidelige fortællere om vores egne personligheder.
Skader forfalskning faktisk forudsigelsesvaliditet?
Det er det centrale empiriske spørgsmål, og svaret er genuint omstridt. Der er tre hovedpositioner i litteraturen:
Position 1: Forfalskning er ikke så vigtig. Nogle meta-analyser har fundet, at personlighedstests viser lignende forudsigelsesvaliditet for jobperformance uanset om vurderingskonteksten var ansøger- eller forskningsmæssig. Hvis forfalskere ender med at præstere ligeså godt på jobbet, har forfalskning ikke korrumperet det forudsigende signal.
Position 2: Forfalskning reducerer validitet. Anden forskning hævder, at når høje scorere er en blanding af genuint højtræk-individer og dygtige forfalskere, svækkes den forudsigende relation til performance. Forfalskere oppuster fordelingen uden at have det underliggende træk.
Position 3: Forfalskning selekterer på imponementsstyring. Et tredje perspektiv bemærker, at evnen til at forfalske en personlighedstest med succes i sig selv kan være et meningsfuldt signal — specifikt korrelerer det med social intelligens og motivationen til at imponere. Folk der forfalsker effektivt kan faktisk præstere godt i roller, hvor imponementsstyring er vigtigt. Det gør ikke forfalskning uproblematisk, men komplicerer den simple validitetskorruptions-fortælling.
Den aktuelle videnskabelige konsensus hælder mod Position 1 for lav-indsats og ikke-udvælgelsesanvendelser, og mod Position 2 for høj-indsats udvælgelseskontekster, hvor incitamentet til at forfalske er størst. For hvad "valid" faktisk betyder i personlighedsmåling, se hvad er reliabilitet og validitet i personlighedstest?.
Tvunget-valg formater: en delvis løsning på testforfalskning
Et teknisk svar på forfalskning er tvunget-valg formatet, hvor respondenter vælger mellem to eller flere ligeligt socialt ønskværdige muligheder (f.eks. "Jeg har en tendens til at være meget organiseret" vs. "Jeg har en tendens til at være meget social"). Ved at fjerne den nemme mulighed for at billige alle positive deskriptorer, reducerer tvunget-valg formater muligheden for responsinflation.
Evidensen på tvunget-valg formater er generelt positiv: de producerer mindre forfalskning og i nogle studier lidt bedre forudsigelsesvaliditet. Men de er sværere at tage, mere kognitivt krævende og mindre velvaliderede i tværkulturelle kontekster. De introducerer også ipsative scoringproblemer (scorerne er relative til hinanden, ikke absolutte), der komplicerer fortolkning. For en detaljeret behandling af afvejningerne, se tvunget-valg personlighedsvurdering: mere ærlige data.
| Testformat | Modtagelighed for forfalskning | Hvad man skal gøre |
|---|---|---|
| Standard Likert-skala Big Five | Høj — nem at billige positive items | Brug til udvikling; overvåg hvis brugt i udvælgelse |
| Tvunget valg (f.eks. Thurstone IRT) | Moderat — sværere at forfalske men ikke immun | Bedre til udvælgelseskontekster; valider lokalt |
| Situationelle bedømmelsestests (SJTs) | Moderat — mindre transparent men stadig forfalskelig | Kombiner med personlighedsdata for bedre dækning |
| Peer/multi-vurdering (f.eks. Cèrcol Vidner) | Lav — andre er sværere at manipulere | Mest modstandsdygtig over for bevidst forfalskning |
| Anonym selvrapportering (ingen høj-indsats kontekst) | Lav — reduceret motivation til at forvrænge | Bedst til udvikling; den ideelle kontekst for ærlige data |
Se også: social ønskværdighedsbias i personlighedstests.
Hvorfor det egentlige problem er at bruge personlighedstests til udvælgelse
Det meste af forfalskningsdebatten er egentlig en stedfortræderdebat om, hvorvidt personlighedstests overhovedet bør bruges til ansættelsesudvælgelse. Hvis du bruger personlighedsdata til udvikling — til at hjælpe folk med at forstå sig selv og arbejde bedre med andre — er forfalskning i høj grad selvmodsigende. Hvis du forfalsker dig vej til en udviklingsrapport, der ikke afspejler, hvordan du faktisk opfører dig, vil du blot få feedback, der er mindre nyttig for dig. Omkostningen falder på den person, der forfalskede, ikke på organisationen.
Hvis du bruger personlighedsdata som en udvælgelseshindring — som en port der bestemmer, om du fortsætter i en ansættelsesproces — bliver incitamentet til at forfalske betydeligt, og konsekvenserne af forfalskning falder på organisationen (i form af fejludvalgte ansættelser) og på ærlige kandidater, der er stillet ringere i forhold til dygtige forfalskere. De etiske og juridiske dimensioner af dette undersøges i personlighedstest i ansættelse: hvad er lovligt og hvad er etisk.
Det er den vigtigste praktiske indsigt fra forfalskningslitteraturen: forfalskelsesproblemer er nedstrøms for misbrugsproblemer. Personlighedsvurdering var designet til udvikling og selvforståelse. Når den omgøres som et udvælgelsesfilter, udvikler den forfalskelssårbarheder, den aldrig var designet til at modstå.
Hvorfor anonym udviklingsbaseret vurdering modstår forfalskning
Et praktisk svar på forfalskningsmæssige bekymringer er at indsamle personlighedsdata anonymt — dvs. i kontekster, hvor dataene ikke vil blive set af ansættelsesledere, og hvor ingen individers scorer er knyttet til ansættelsesbeslutninger. Det er præcis den kontekst, hvori personlighedsvurdering genererer sit mest valide og nyttige signal.
Anonyme vurderinger eliminerer den primære motivation for forfalskning. De producerer data, der er mere præcise og mere nyttige til udvikling. De eliminerer også de juridiske og etiske risici forbundet med at bruge personlighedsdata i udvælgelse.
Cèrcol bruger et multi-vurderingsdesign, hvori Vidner giver et eksternt syn på en persons adfærd. Det tilføjer et informationslag, der er substantielt sværere at forfalske end selvrapportering: mens du kan oppuste dine egne Conscientiousness-scorer, kan du ikke let manipulere, hvordan fem kolleger, der arbejder med dig hver dag, beskriver din typiske adfærd. Videnskaben bag IPIP — International Personality Item Pool, der understøtter Vidne-instrumentet, giver det validerede open-source-grundlag, som kommercielle værktøjer hyppigt mangler.
Forfalskningslitteraturen lærer os i sidste ende mindre om, hvordan man gør personlighedstests mere manipulationsresistente, og mere om, hvor de genuint hører hjemme: i udvikling, i teamdialog, i selvforståelse. Det er der, de leverer deres mest ærlige og mest nyttige signal.
Sådan adresserer Cèrcol forfalskning
Cèrcols design reagerer direkte på forfalskningsproblemet på hvert niveau. Vidne peer-vurderingen betyder, at din personlighedsprofil ikke er bygget op fra din egen selvpræsentation — den er bygget fra, hvordan de mennesker, der arbejder med dig, faktisk beskriver din adfærd. Vidner besvarer tvungne valgadjektivpar anonymt, hvilket eliminerer både evnen til at forfalske (intet åbenlyst "rigtigt" svar) og incitamentet (ingen indsatser knyttet til deres individuelle svar). Selvrapporteringskomponenten tages i en lav-indsats, individuelt ejet kontekst — du ejer dine data og beslutter, hvem der ser dem — hvilket forskning viser substantielt reducerer imponementsstyring. Du kan udforske det fulde instrument på /instruments og læse om den underliggende videnskab på /science. Vurderingen er gratis på cercol.team.
Yderligere læsning
- Social ønskværdighedsbias i personlighedstests
- Tvunget-valg personlighedsvurdering: at få mere ærlige data
- Hvorfor selvvurdering alene ikke er nok: sagen for peer personlighedsfeedback
- Anonymitet i personlighedsvurdering: hvorfor det er vigtigt
- Personlighedstest i ansættelse: hvad er lovligt og hvad er etisk?
- Hvad er reliabilitet og validitet i personlighedstest?