Hoe gaat 8vance haar “AI skills matching engine” instandhouden?

Logo en logotype 8vanceGisteren heb ik een video gekeken op de site AI in Recruitment, een onderdeel van het promotie-imperium waarmee Geert-Jan Waasdorp en Martijn Hemminga allerhande recruitment rommel over recruitment Nederland uitstorten. En in deze video figureerde Laurens Waling, Chief evangelist van 8vance, het bedrijf dat toevalligerwijs ook de sponsor van deze serie podcasts is… 8vance werd door Hemminga aangekondigd als de market leader in recruitment. Waarmee maar meteen duidelijk wordt gemaakt dat we het met het waarheidsgehalte van deze podcast niet nauw moeten nemen. Goed om te weten.

Liefhebbers van inhoudelijke informatie over AI in relatie tot recruitment raad ik aan deze video links te laten liggen, tenzij je een masochistische aandrang hebt. Er was niets nieuws te beluisteren, maar ik wist er in de subtext toch nog wat interessante tidbits uit te halen.

Laat ik even kort de achtergrond schetsen: 8vance scrapet ongevraagd en zonder toestemming persoonsgegevens van sociale netwerken. Volgens de Autoriteit Persoonsgegevens mag dat niet. 8vance gebruikt(e) de gescrapete persoonsgegevens voor twee toepassingen:

  1. Het opbouwen en aanbieden van een personen database aan klanten die gebruik maken van hun zoekfunctie.
  2. Het opbouwen en aanbieden van een database voor het trainen van een op AI gebaseerd algoritme dat vervolgens kan worden gebruikt binnen de bij 1. vermelde zoekfunctie.

8vance claimt met de eerste van bovengenoemde toepassingen te zijn gestopt. Het is op dit moment niet onafhankelijk te verifiëren of dit daadwerkelijk het geval is.

LinkedIn heeft recent de toegang tot haar persoonsgegevens zeer sterk beperkt. Hiermee droogde voor 8vance LinkedIn als bron voor het scrapen van persoonsgegevens op. En daarmee verloor 8vance haar enige mogelijkheid om de personen database te onderhouden. Want hoewel 8vance stelt meerdere bronnen te gebruiken, geeft het bedrijf (in bovenvermelde video) toe dat met LinkedIn een zeer groot deel van haar basis is weggevallen. Maar de video meldt merkwaardigsgewijs ook dat 8vance in gesprek zou zijn met LinkedIn om gegevens op een andere manier te verkrijgen (kopen?). LinkedIn Nederland heeft ontkennend gereageerd op de vraag of er gesprekken met 8vance plaatsvinden.

En minstens zo merkwaardig is deze uitspraak:

There are still lots of places on the Internet where you can find information about resumes from people so it’s not completely gone but it would be ideal if this (LinkedIn) would be open again to keep it up to date.

Hierbij gaat 8vance voorbij aan de wet (AVG) en de nadere uitleg die de AP erbij heeft gegeven: scraping is bijna altijd illegaal. Dat betekent niet dat scraping alleen op LinkedIn illegaal is maar dat het op alle sites met persoonsgegevens illegaal is. Inzichtgevend zijn de twee redenen die Waling geeft waarom het naar zijn mening onterecht is dat 8vance geen persoonsgegevens (meer) mag scrapen:

It doesn’t harm the person: they don’t don’t notice it

We (8vance) have a public purpose for it: we want to make the labor market more transparent

De eerste reden explodeert in zijn eigen gezicht zonder dat hij of de twee interviewers het door hebben: als je persoonsgegevens wil verzamelen dan zal je de toestemming van de eigenaren van deze persoonsgegevens moeten hebben. Boefjes…

De twee reden riekt naar grootheidswaanzin, en is tot op heden op geen enkele manier gebleken. Ik ga er vanuit dat 8vance enige concrete resultaten in dit opzicht de wereld in getoeterd zou hebben. Tot op heden is er niet meer dan een doodse stilte te ‘horen’.

Ook is 8vance van mening dat zij een betere werkwijze hebben dan, pak hem beet, Google:

Google’s just scraping all the internet stores all the the information. Google does not remove the identifiable information so we’re actually doing it in a far better way you could say. You could compare it how a search engine is doing it storing the information that’s being scraped locally but we store anonymously so it’s not data anymore so we do not have to then apply to the gdpr because it’s not profile information anymore.

Ehhh… Ik weet niet wat ik hierop kan zeggen dan: lees de wet en hou je daaraan. Het gaat niet om wat je daarna met de data doet, het gaat er om dat je niet mag scrapen! Overigens, maar puur uit intellectuele nieuwsgierigheid: is er ooit een poging gedaan om op basis van werkervaringen en opleidingen alleen de achterliggende personen te traceren. Oftewel: hoe anoniem is deze informatie?

8vance beschrijft in haar privacybeleid het als volgt:

De op AI gebaseerde matchingtechnologie is gedurende de ontwikkeling daarvan noodzakelijkerwijs getraind. Voor deze training zijn openbaar gepubliceerde profielen van een aantal zakelijke platforms gebruikt (MD: lees gescraped, wat verboden is, en was). Daarvan zijn identificerende gegevens verwijderd, waaronder voor- en achternaam, foto, bedrijfsnamen, referenties naar andere profielen en gevoelige informatie uit vrije tekstvelden om een trainingsdataset mee samen te stellen. Door het weghalen van identificeerbare informatie is het voor ons niet meer mogelijk om in de trainingsdata een specifiek profiel terug te vinden (MD: heeft 8vance dit geprobeerd? Of beter nog, heeft een onafhankelijk instantie dit geprobeerd?). De data zijn alleen nog sets van werkervaring, vaardigheden en opleidingen. Er is dus sprake van geanonimiseerde data. Dat zijn de minimale gegevens die nodig zijn om de matchingtechnologie te trainen voor bruikbare doeleinden.

Ook in dit privacybeleid vergeet 8vance te melden dat scraping niet is toegestaan. Wel maakt 8vance nog een verwijzing naar het document van de AP:

Het gerechtvaardigd belang: Voor het verzamelen en gebruiken van trainingsdata baseert 8vance zich op haar gerechtvaardigde belangen. Ze handelt hierbij conform de ‘handreiking scraping door particuliere en private organisaties’ (mei 2024) van de Autoriteit Persoonsgegevens. De volledige uitwerking van het gerechtvaardigd belang wordt in een separaat document behandelt. Samenvattend is het belang gebaseerd op de noodzaak van een goede werking van de 8vance matchingtechnologie voor economische exploitatie alsmede een maatschappelijk belang. Gebruik van het 8vance platform kan namelijk bijdragen aan een betere doorstroming op de arbeidsmarkt en vermindering van discriminatie, nu naam, afkomst, leeftijd en geslacht niet worden meegenomen in de matching.

8vance stelt dat ze overeenkomstig de notitie van de AP handelt. Maar een onderbouwing van deze mening was niet te vinden. Ten aanzien van het separate document waarover wordt gesproken, verwijs ik dat het over een whitepaper gaat dat door 8vance in samenwerking met Digitaal-Werven is uitgebracht. De titel van het whitepaper is: Het beste van AI voor talent en recruitment in een uitdagende arbeidsmarkt. Ik heb naar aanleiding hiervan een tweetal artikelen geschreven Laten we nou eens stoppen met het misbruiken van de term ‘matchen’ en Blijf van onze data af, 8vance!

Slotopmerkingen
Nu 8vance blijkbaar geen LinkedIn profielen meer mag en daarom niet meer kan scrapen ligt er een koe van een vraag boven de markt (lees: UWV). Namelijk: hoe gaat 8vance haar database op een legale manier onderhouden met informatie vanuit werknemers? Haar entree in het recruitment domein is gebaseerd op het onrechtmatig verzamelen, verwerken en exploiteren van persoonsinformatie. Haar verblijf is jarenlang gebaseerd op het verhullen, verbloemen en verdraaien van de werkelijkheid. Maar wat nu? Handen voor de ogen en gewoon stiekem doen alsof de skills in vacatures hetzelfde zijn als de skills in cv’s? Vast wel. What could possibly go wrong?

Geef een reactie

1 Comment
  • Patrick Boonstra
    says:

    8vance werpt zich op als een soort van hoeder van de Nederlandse Arbeidsmarkt, maar laten we niet vergeten dat ze gewoon commerciele diensten bieden, om bedrijven te helpen hun vacatures te verkopen.

    De beide argumenten van 8vance t.a.v. Gerechtvaardigd belang zijn al lang geleden door AP expliciet onderuit gehaald in https://www.autoriteitpersoonsgegevens.nl/uploads/imported/normuitleg_gerechtvaardigd_belang.pdf
    a) Gerechtvaardigd belang: “Wat ook niet als een gerechtvaardigd belang kwalificeert, is bijvoorbeeld: het enkel dienen van zuiver commerciële belangen, winstmaximalisatie, het zonder gerechtvaardigd belang volgen van het gedrag van werknemers of het (koop)gedrag van (potentiële) klanten, etc.”
    b) Maatschappelijk Belang: “Wat niet als een gerechtvaardigd belang kwalificeert, is een algemeen belang van ‘de samenleving’ of iets dergelijks. Hierbij gaat het namelijk niet om een echt, concreet en rechtstreeks gerechtvaardigd belang van de verwerkingsverantwoordelijke of derde. Het is dan aan de wetgever om daarin te voorzien met concrete wetgeving. ”

    Ook hun ‘prize’ client het UWV mag dit niet: “Let op: overheidsinstellingen/bestuursorganen mogen zich bij het uitoefenen van hun wettelijke taken nooit beroepen op de grondslag van gerechtvaardigd belang. ”

    De ENIGE manier waarop 8vance haar (AI) Engine wel legaal zou krijgen is als ze die zou baseren op TOESTEMMING van de bron-data; ieder andere manier is illegaal verklaard.

    De AP heeft recent een aantal fikse boetes uitgereikt aan (voldoende) vergelijkbare bedrijven (Clearview), met daarin ook de expliciete waarschuwing dat gebruikers van (illegale) AI Tools ook boetes kunnen verwachten.