CSN conference (#CSN11): Johan Bollen

Johan Bollen De eerste keynote van de dag, en het is van de man die op basis van het sentiment van tweets stelt de koersontwikkeling van de Dow Jones te kunnen voorspellen. Volstrekte onzin natuurlijk, tenzij er een causaal verband zou bestaan tussen tweetsentiment aan de ene kant en primary dealers en high-frequency trading programma’s aan de andere kant. De meerjarige melt-up van de Dow Jones is eerder toe te wijzen aan Bernanke’s geldpers dan iets anders. Maar het leverde Bollen instant fame op, en dat is ook wat waard.

En wie weet is er een brug te verzinnen naar online recruitment. Een hoop negatieve tweets over een bedrijf zal vast het sentiment van de medewerkers van dat bedrijf beinvloeden. Met als gevolg een hoger verloop; in ieder geval aan medewerkers die veel met negatieve gestemde klanten te maken hebben. Alle reden dus om goed te luisteren!

De premisse van Bollen is natuurlijk gebaseerd op de wisdom of the crowds. Waarbij James Surowiecki, schrijver van het boek met dezelfde naam, wel de nodige disclaimers toevoegde. Zoals de omvang van het aantal deelnemers in de crowd (hoe groter, hoe beter). En natuurlijk dat er geen beinvloeding van de deelnemers in die crowd plaatsvindt. Blijkbaar is dit ook al veel eerder door Condorcet bewezen; maar dat is een hele ouwe knakker en die ken ik niet.

Maar wisdom of niet, Twitter is natuurlijk een fucking grote crowd. Die Bollen als een EEG van het global brain ziet.

image

En daar is het; kan het ‘collectieve sentiment’ een voorspellende waarde hebben? Wel volgens Bollen, en hij maakt daarbij gebruik van een zestal mood states:

image 

Oftewel, de woorden in een tweet kunnen het sentiment van de twitteraar verraden. Voorwaarde, volgens Bollen, zijn zeer grote aantallen tweets. En hierbij een voorbeeld:

image

Door alle tweets zodanig te analyseren blijkt dat 8% van alle tweets sentiment indicatoren bevatten. Door belangrijke evenementen te koppelen aan de verschillende gemoedstoestanden is duidelijk. Zoals bij de presidentsverkiezing van 2008:

image

Heel fraai. Maar het is het niet verwonderlijk dat bij bepaalde zeer zichtbare events duidelijke variaties in emotie te vinden zijn. En de mate waarin dat bepaalde tweets elkaar versterken is natuurlijk ook nog een factor om rekening mee te houden. Er is geen onafhankelijke impact van iedere afzonderlijke tweet.

Overigens heeft Bollen ook onderzocht hoe er clustering kan ontstaan op basis van vergelijkbare gemoedstoestanden. Waarbij zijn advies is: zoek vooral het gezelschap op van positief gestemde mensen. Hier kan niemand het natuurlijk mee oneens zijn. Tenzij je graag sombert.

Overigens gaat Bollen proberen zijn resultaten te gelde te maken via een hedgefund; door te gaan speculeren op basis van de voorspellende waarde van het Twitter ecosysteem. Dat doet me denken aan de gruwelijke crash van de hedgefunds die door quants zijn gerund en een lange tijd geleden de financiele markten bijna vernietigden. Daarnaast vraag ik me af hoe de ‘inspanningen’ van alle Twitteraars worden terugbetaald als Bollen’s algoritme wel geld gaat opleveren. Ik heb een donkerbruin vermoeden.

Nou eens hard nadenken over praktische toepassingen voor online recruitment. Hier ga ik een nachtje over slapen.

Geef een reactie

3 Comments