Big data blijft steeds vaker een onderwerp op de agenda van HR. Ondanks mijn sceptische houding over de toegevoegde waarde (zie mijn blog “Big Data en recruitment voorlopig Big Nonsense”) krijg ik steeds vaker vragen over dit onderwerp. Ook hoor ik steeds vaker over experimenten waarbij men met behulp van data probeert voorspellingen te doen. Het voorspellen van loopbaanpaden is één zo’n experiment. Monsterboard probeerde dit een aantal jaar geleden. Bij Ikki hebben we het geprobeerd. Data, niet perse big data werd gebruikt. Maar vaak werd wel op basis van historische data een voorspelling gemaakt.
In dit blog zal ik niet ingaan op aannames, methodes, systemen en technieken die er nodig zijn om voorspellingen te kunnen doen. Ik wil ingaan op de enorme onzekerheid die schuilt in het afhankelijk zijn van cijfers die men niet kan controleren.
Linkedin geeft aan aankomende studenten ook graag advies op basis van hun kennis uit eigen data. Zo kan je op allerlei manieren een universiteit kiezen met hulp van Linkedin. Waar werken mensen die een studie hebben gedaan, waar wonen ze, wat doen ze. Leuk om te bekijken. Linkedin zet desgewenst de universiteiten op een rijtje. Als aankomend student in de VS kan je als je bijvoorbeeld software developer wil worden de beste universiteit kiezen.
Om tot mooie adviezen te komen gaan ze secuur door hun data.
Zo te zien zijn er al heel wat data geanalyseerd om tot mooie adviezen te komen.
Nu is niets op Linkedin door mij te controleren. Linkedin kan mij van alles wijs maken. Mijn eigen statistieken zijn ook nauwelijks te controleren. Het is met data zo, als je het niet kan controleren of verifiëren is het enige dat je kan doen erop vertrouwen dat het klopt. Hoe afhankelijker je van data wordt waarop je conclusies trekt, hoe meer de noodzaak er is om zeker te zijn van de correctheid van de informatie waarop je de conclusies baseert.
Zo deed ik laatst een klein experiment, ik plaatste een update op Linkedin om de nieuwe statistieken te testen. Sinds een aantal weken is de oude statistiek met de aantallen die je updates bekeken verdwenen en plaatst Linkedin bij je profiel soms wat statistische informatie over één update. Sinds dat moment zie ik dat mijn updates niet meer worden bekeken. Vreemd, in plaats dat er tussen de vijftig en honderd mensen keken, kijkt nu niemand of slechts een enkeling. De enkeling die ik niet eens kan controleren. Bij de oude aantallen kon ik tenminste nog iedereen zien. Dus ik plaatste een update en vroeg aan 10 mensen de update te bekijken en op de link te klikken. Niemand van deze mensen deed een like. De volgende dag, nadat iedereen mij had gezegd de link te hebben bekeken, heb ik de update bekeken en dit is wat ik zag.
Vijf likes en één persoon die de update heeft bekeken. Momenteel (drie dagen later) zijn de likes iets gestegen en zijn er drie mensen die de update hebben gezien. Vreemd, zonder te kijken geliked en de mensen van wie ik weet dat ze de update hebben bekeken zijn niet geteld.
Hoe kunnen wij steeds afhankelijker worden van de informatie op basis van data zonder nog enige invloed te hebben op de verificatie op de correctheid van deze data? Door onze data steeds vaker aan partijen te geven als Linkedin zonder er maar iets voor terug te vragen.
Eduard
says:Op zichzelf een prima artikel, Herbert. Helaas is je laatste statement wel vrij ironisch aangezien recruiters hun werk niet meer kunnen doen zonder LinkedIn, waaronder jijzelf neem ik aan.
Herbert Prins
says:Beste Eduard, Dank je wel en ja je hebt gelijk dat statement is ironisch en ik zou op dit moment niet zonder Linkedin kunnen. Echter ik ben gebruiker vanaf het prille begin van sociale netwerken en wat mij is opgevallen dat de afhankelijheid er voor zorgt dat onze gegevens gebruikt worden zonder heldere afspraken. Door uitgebreide voorwaarden die vaak veranderen te laten ondertekenen wordt gedacht gebruikers zonder weerga te gebruiken.Linkedin, Facebook, Twitter etc gebruiken onze data zonder dat we hier nog enige invloed op hebben. Het is ook onmogelijk hier over met deze partijen te communiceren en of afspraken te maken. Zij bepalen (verkopen) wie wel en wie niet jouw data informatie mag gebruiken zien of manipuleren.