Een week geleden heb ik aandacht besteed aan de move van LinkedIn om het publiek zichtbare deel van een LinkedIn profiel fors in te perken. En we weten dat LinkedIn’s publieke profielen als firehose wordt gebruikt door 8vance c.s. die zich niet storen aan de ToS van LinkedIn die dit expliciet verbiedt. 8vance is ook doof voor het feit dat de natuurlijke personen achter deze publieke profielen volstrekt onwetend zijn van deze grootschalige kopieslag (meer dan 85 miljoen West-Europese publieke profielen vol persoonsgegevens, waarvan 7 miljoen Nederlandse).
Maar wat betekent de move van Linkedin voor de toekomst 8vance? Niet veel goeds. Of veel goeds, het hangt natuurlijk van je perspectief af. Hoe dan ook, ik wil de impact van de move van LinkedIn inzichtelijk maken op basis van een drietal basisbestanden waarvan we weten dat 8vacen daarover beschikt. Om van daaruit zachtjes te speculeren over de toekomst van 8vance zelf.
Raw bestand
Nadat 8vance een publiek profiel van LinkedIn heeft gespiderd komt de data van zo’n profiel als eerste in een raw bestand (formulering 8vance) terecht. In dit ‘tijdelijke’ bestand zit een ware zeeroversschat aan persoonsgegevens. Volgens 8vance leeft dit bestand niet langer dan vier weken en is het uitsluitend bedoeld als een tijdelijke opslag om van daaruit het search/match bestand en het trainingsbestand aan te maken. Op basis van onderzoek door RecruitmentMatters weten we dat ‘tijdelijk’ in het woordenboek van 8vance een rekbaar begrip is. Dat kan makkelijk oplopen tot 5 maanden of meer.
Search/match bestand
Vanuit het raw bestand wordt een subset aan data per profiel opgeslagen in het search/match bestand. Hoewel oorspronkelijk 8vance probeerde vol te houden dat er geen persoonsgegevens in dit bestand werden opgeslagen, bleek uit onderzoek van RecruitmentMatters dat ook in dit bestand een aanzienlijke hoeveelheid persoonsgegeven per profiel werden opgeslagen.
Het search/match bestand wordt gebruikt door klanten van 8vance om te zoeken naar geschikte kandidaten; het bestand is feitelijk te vergelijken met een cv-bestand, zoals de nodige vacaturesites en vacature-aggregatoren aanbieden. En LinkedIn…
AI trainingsbestand
Vanuit het raw bestand of het search/match bestand wordt vervolgens het AI trainingsbestand aangemaakt, en hierin zitten alleen de werkervaringen van de publieke profielen. De werkervaringen worden volgens verrijkt met skills op basis van genormaliseerde functietitels.
Het AI trainingsbestand wordt vervolgens gebruikt om een AI-model op te bouwen en dit model is onderdeel van de zoekfunctie waarmee in het search/match bestand gezocht kan worden.
En nu…
Volgens 8vance worden de profielen elk half jaar ververst. En herein lies the rub. Want als 8vance profielen ververst gaan worden dan heeft dit verstrekkende gevolgen voor (de inhoud van) bovengenoemde bestanden. Want het publiek zichtbare deel van een LinkedIn profiel laat de werkervaringen (naast enig aanhangend vocht) niet meer zien. En dat betekent automatisch dat het AI trainingsbestand geen inhoud meer heeft, en dat het search/match bestand aanzienlijk minder waarde heeft. Binnen een periode van maximaal 6 maanden is 8vance volledig uitgehold.
En misschien moet dit nog wel veel eerder gebeuren, want 8vance heeft nu data in haar bestanden die afkomstig zijn van publieke profielen van LinkedIn, maar diezelfde publieke profielen op LinkedIn tonen die data nu niet meer. Dus lijkt het me logisch, fatsoenlijk en onvermijdelijk dat 8vance die data per direct gaat verwijderen.