Scraping van online persoonsgegevens is sinds 1 mei van dit jaar tot verboden terrein verklaard door de Autoriteit Persoonsgegevens (AP). Kort voor de bekendmaking van AP had LinkedIn haar profielen (in Nederland) al een stuk onaantrekkelijker gemaakt voor scrapers door gegevens over opleidingen en werkervaringen voortaan niet meer publiek te delen. Via zoekmachines zijn LinkedIn profielen nog altijd te vinden, maar voor toepassingen die persoonsprofielen manipuleren op basis van opleidingen en werkervaringen is dit een kiss of death. Maar is het sudden death of palliatieve sedatie?
Die vraag kan worden beantwoord door de mogelijke reacties van een scraper de revue te laten passeren:
- Sudden death: Per direct alle werkervaringen en opleidingen uit de opgeslagen profielen verwijderen.
- Palliatieve sedatie: In de normale update-routine meenemen en op dat moment de niet langer beschikbare gegevens verwijderen.
- Cheating death: Procederen.
- The Walking Death: Doen of je neus bloed en de niet langer beschikbare gegevens ‘gewoon’ in de profielen handhaven.
Als het business model gebaseerd is op het verwerken, verrijken en te gelde maken van opleidingen en werkervaringen dan is het verwijderen van die gegevens (uit alle(!) bestanden) een sudden death situatie. Het business model is opgehouden te bestaan. Optie 2 is de welbekende Kroniek van een aangekondigde dood, tenzij de entrepreneur een list weet te verzinnen. Een zeer hoog denkraam is in dit geval wel een vereiste. Optie 3 is de hoop dat van uitstel misschien wel afstel kan komen; ik zou zeggen, dream on. Optie 4 staat buiten de wet en wordt alleen al om die reden hier niet verder besproken.
Een kleine rondgang langs ter zake kundige connecties (N = 6, dank voor de reacties) leerde mij dat vrijwel iedereen tussen opties 1 en 2 ging zitten. Er is dus enige tolerantie voor die arme, arme scrapers die jarenlang op grove wijze misbruik hebben gemaakt van persoonsgegevens onder de fictie van één of ander onhoudbaar gerechtvaardigd belang, maar daarover in een volgend artikel meer. Er lijkt dus nog tijd voor scrapers om schoon schip te maken.
Laat ik eens atypisch coulant zijn en er vanuit gaan dat met een half jaar alle werkervaringen en opleidingen uit de bestanden zijn verwijderd. Dan is er over een half jaar geen search/match (al dan niet met AI) toepassing meer aanwezig die iets kan doen met opleidingen, functies en skills. Uitgezonderd procederende en frauderende partijen.
Mogelijk dat er dan een modicum van privacy (een grondrecht van iedere burger..) gaat ontstaan, die ten koste gaat van onrechtmatige mensenhandel. Een prima deal als je het aan mij vraagt.
Als achtergrond nog even dit, hieronder is weergegeven welke data Linkedin publiek beschikbaar stelt:
Publiek zichtbare deel van een LinkedIn profiel
Dat is dus nog altijd krankzinnig veel data. Voor wat er allemaal kan worden overgenomen verwijs ik graag naar dit artikel, met de kanttekening dat opleidingen en werkervaringen dus niet langer deel uitmaken van de gescrapete gegevens.
Werkervaringen en opleidingen zijn niet langer bereikbaar voor scraper, vreemd genoeg is de About sectie nog wel beschikbaar. Hiermee kunnen scrapers overigens aardig in de problemen komen als blijkt dat binnen deze sectie ook bijzondere persoonsgegevens aanwezig zijn. Dat zijn gegevens die nooit gescraped mogen worden zonder voorafgaande expliciete toestemmen van de betreffende natuurlijke persoon. Maar er is vast geen scraper die een testmethode heeft ontwikkeld om zeker (hoe zeker is zeker?) te stellen dat hier geen bijzonder persoonsgegevens in aanwezig zijn.
En LinkedIn geeft ook nog altijd naamgenoten (Others named Marc Drees), waarover ik me al eerder heb verbaasd en waarbij ik me afvraag wat een scraper met deze informatie moet? Of met similar profiles?