Ik heb al eerder aandacht besteed aan het recent verschenen whitepaper van 8vance (zie: Laten we nou eens stoppen met het misbruiken van de term ‘matchen’). Vandaag wil ik stilstaan bij het volgens 8vance rechtmatige karakter van haar dienstverlening. Een opvallende positie die niet wordt gedeeld door de Autoriteit Persoonsgegevens.
Massa = kassa, maar massa = NIET beter
Op pagina 11 van haar whitepaper stelt het bedrijf:
AI-systemen voor talentmanagement zijn ontworpen om de interne en externe arbeidsmarkt te ontsluiten en eerlijker en objectiever te maken. Deze systemen worden getraind op grote hoeveelheden data: hoe meer data, hoe beter om bias te voorkomen.
Er is voor zover mij bekend geen enkele relatie tussen de hoeveelheid data en de mate waarin die data vrij is van bias. Ik nodig 8vance uit deze “meer = schoner” claim te bewijzen met concrete voorbeelden of anders haar marketingmateriaal drastisch aan te passen. Als deze claim wel correct zou zijn dan betekent het per direct dat 8vance behoorlijk smerige data moet hebben, gezien het relatief kleine datavolume (85+ miljoen persoonsprofielen) in vergelijking met collegascrapers zoals Eightfold, hireEZ, HeroHunt en SeekOut, die tussen de 800 miljoen en 1,1 miljard persoonsprofielen zeggen te bezitten. Ik heb voor alle zekerheid ook nog even de volgende vraag aan het LLM Perplexity gesteld: Is er een correlatie tussen de hoeveelheid data en het voorkomen van bias? en dat gaf dit resultaat: