8vance heeft in de afgelopen dagen een document op haar site gezet met als titel: De verwerkingsgrondslag voor de trainingsdata. Naar dit document werd in de privacyverklaring van 16 augustus verwezen, maar er was geen link aanwezig. Die is er nu dus wel. En het document is de zoveelste poging van 8vance om de rechtmatigheid van haar handelen aan te tonen, waarbij vooral aandacht wordt besteed aan haar gerechtvaardigd belang.
Maar dit alles is eigenlijk volstrekt irrelevant, want 8vance heeft haar AI-zoektoepassing getraind met onrechtmatig verkregen persoonsgegevens. Die verkrijging heeft plaatsgevonden door “publiek toegankelijke profielen afkomstig van diverse professionele netwerkplatforms” massaal te scrapen. Hiermee heeft 8vance 85 miljoen persoonsprofielen verzameld, voornamelijk via LinkedIn. Deze persoonsprofielen zijn overigens waardeloos geworden. 8vance kan ze namelijk niet langer onderhouden omdat LinkedIn de publiek toegankelijke profielen vergaand heeft beperkt. Deze profielen werrden via de zoektoepassing van 8vance voor haar klanten ontsloten. Dat is jarenlang de modus operandi van 8vance geweest en is volgens de AVG verboden. Tegelijkertijd is met een subset van de onrechtmatig verkregen gegevens de AI-zoektoepassing getraind.
Laten we dat scrapen van publieke profielen eens nader onder de loep nemen. De publieke profielen zijn profielen van mensen die zich bij LinkedIn (of een ander social network) hebben geregistreerd en daar een profiel hebben samengesteld. LinkedIn maakt deze profielen publiek zodat via zoekmachines deze profielen gevonden kunnen worden. LinkedIn heeft er geen behoefte aan dat Jan en Alleman (ook: 8vance) deze profielen scrapet en heeft daarom een robot.txt bestand, met onder meer de volgende informatie (de robots van Google, Bing en anderen zijn met name genoemd voor bepaalde domeinen die gescrapet mogen worden):
# Notice: The use of robots or other automated means to access LinkedIn without # the express permission of LinkedIn is strictly prohibited.
User-agent: * Disallow: /
Een nette robot die langskomt en niet met name genoemd wordt, zal niets van LinkedIn scrapen. Maar de robot van 8vance was (en is) niet netjes. Die scrapete dat het een lieve lust was. Alles werd kaalgegraasd en meegenomen.
En dan is er ook nog het publieke profiel van een individu. In de overgrote meerderheid van de gevallen zijn de individuen niet op de hoogte van het feit dat hun profielen publiek vindbaar op Internet staan. Je met namelijk ter zake kundig zijn om die mogelijkheid via LinkedIn dicht te zetten. Dat is niet zo netjes van LinkedIn, maar dat terzijde. En geen van die individuen waarvan het profiel publiek staat, is door 8vance gevraagd of zij de gegevens mochten kopiëren.
Ik moet nu toch even een kleine quote melden uit De verwerkingsgrondslag voor de trainingsdata:
De toepassing van 8vance draagt bij aan de bescherming van mensenrechten, meer specifiek non-discriminatie, door bij te dragen aan een transparante en toegankelijke arbeidsmarkt.
Dat staat wat mij betreft op zeer gespannen voet met de scraping praktijken die 8vance sinds haar oprichting bezigt. Ze scrapet alles waar ze haar robothanden op kan leggen, zonder toestemming van de achterliggende natuurlijke personen, zonder acht te slaan op de richtlijnen van LinkedIn en andere sociale netwerken en heeft vervolgens de godsgruwelijke brutaliteit om over bescherming van mensenrechten te orakelen? Gaat het wel goed, 8vance?
Daarnaast is er het oude liedje van een transparante en toegankelijke arbeidsmarkt. 8vance blijft dit ad nauseam herhalen zonder ook maar één flinter aan bewijs hiervoor aan te voeren.
Verder zegt Han Stoffels (CEO 8vance) nog dit:
For the record: Wij houden ons aan alle wet en regelgeving en meer dan dat wij zijn werkelijk het beste jongetje van klas als gaat om AVG naleving en de AI act.
En dat doet 8vance door ongevraagd persoonsgegevens van publieke LinkedIn profielen te scrapen zonder toestemming of instemming. Vergeet hierbij vooral niet dat privacy een grondrecht is…