Social Network Analysis in verkiezingstijd

Case: Super Tuesday, de Democratische voorverkiezingen in AmerikaSocial Network Analysis in verkiezingstijd

  • Artikel
  • Data Science
Anika-data-scientist
Anika Batenburg
Data Scientist
8 min
25 May 2020

Dinsdag 3 maart 2020 stond te boek als Super Tuesday, de dag waarop in verschillende Amerikaanse staten tegelijkertijd wordt gestemd voor de Democratische presidentskandidaat. We gebruiken deze dag als case voor de toepassing van Social Network Analysis. Dit voorbeeld gaat over verkiezingen, maar je kunt dezelfde werkwijze ook toepassen op een commerciële case waarbij je de namen van de kandidaten vervangt door bijvoorbeeld verschillende merknamen.

Naar aanloop van verkiezingen worden er veel peilingen gedaan om het stemgedrag te voorspellen. Maar kunnen we data van Twitter (een bijna gratis bron van informatie) ook gebruiken om de populariteit, en daarmee indirect het mogelijke stemgedrag, van kandidaten in kaart te brengen?

Met Social Network Analysis kun je waardevolle inzichten uit Twitterdata halen, in dit geval de publieke opinie over de verkiezingen. Aangezien Twitter tijdens de verkiezingsstrijd ook actief wordt ingezet als middel om campagne te voeren, kun je deze data ook gebruiken om campagnes te evalueren.

Data verzamelen

Vijf dagen vóór Super Tuesday hebben we alle tweets verzameld waarin één of meer van de kandidaten zijn genoemd door middel van een @mention of hashtag (bijvoorbeeld #voteforBiden).

Aangezien er ontzettend veel werd getwitterd over de kandidaten, hebben we er voor gekozen een steekproef te nemen. Deze steekproef bestond uit 16.380 tweets gedeeld door de Twitteraars met de meeste volgers. We kozen voor de Tweets van Twitteraars met de meeste volgers omdat zij waarschijnlijk de meeste invloed hebben op Twitter.

Resultaten

Figuur 1 geeft het netwerk van deze dataset weer:

  • De nodes (alle punten) zijn de Twitteraccounts;
  • De edges (de lijntjes tussen de nodes) weerspiegelen de aandacht. Elke keer dat een Twitteraar één van de kandidaten heeft genoemd, zie je een lijntje tussen deze Twitteraar en de kandidaat).

De aandacht op Twitter wordt gekenmerkt door een @mention verwijzend naar een kandidaat (of een hashtag, bijvoorbeeld #BernieForPresident).

social network analysis
Figuur 1. Hoe groter de node, hoe vaker de Twitteraar door anderen werd genoemd.

Welke kandidaat krijgt de meeste aandacht? Kijk naar de nodes!

Een node in figuur 3 is groter naarmate deze Twitteraar vaker is genoemd. Biden en Sanders kregen duidelijk de meeste aandacht. Zie hieronder per kandidaat hoe vaak zij in onze steekproef werden genoemd.

  • Biden werd genoemd in 5798 tweets;
  • Sanders werd genoemd in 6396 tweets;
  • Buttigieg werd genoemd in 1994 tweets;
  • Bloomberg werd genoemd in 1569 tweets;
  • Warren werd genoemd in 1402 tweets;
  • Steyer werd genoemd in 722 tweets;
  • Klobuchar werd genoemd in 718 tweets;
  • Gabbard werd genoemd in 156 tweets.

Verder valt op dat bijna alle kandidaten een duidelijk eigen groep Twitteraars hebben die aandacht aan hen besteedden, behalve Klobuchar. In figuur 1 zijn dit de clusters aan de randen die enkel verbonden zijn met één kandidaat.

Bovenin het netwerk, waar de groene en roze nodes samenkomen, zie je Twitteraars die zowel Biden als Sanders noemen. Aan de linkerkant, tussen Biden en Bloomberg, zie je dat een groep blauwe Twitteraars zowel over Bloomberg als Biden communiceert (de node is blauw omdat ze Bloomberg vaker benoemen dan Biden). Datzelfde geldt voor andere kandidaten, bijvoorbeeld voor Warren: een groep Twitteraars noemt haar, maar ook Sanders.

Gabbard krijgt veel minder aandacht, en hangt buiten het grote netwerk. Dit impliceert dat er een groepje Twitteraars is dat alleen haar noemt, maar zich verder niet bemoeit met de andere kandidaten.

Klobuchar bevindt zich echter in het midden van het netwerk. Twitteraars die haar benoemen, benoemen ook veel andere kandidaten.

Verandering van aandacht over tijd

In dit geval weten we dat Steyer, Buttigieg en Klobuchar zich in de dagen voor Super Tuesday hebben teruggetrokken uit de race. Daarom hebben we het netwerk ook per dag bekeken. Zie figuur 2 hieronder (je kunt figuur vergroten door er op te klikken). In dit figuur zie je hoe de aandacht voor de kandidaten verandert over tijd. De nodes blijven staan (dit zijn de Twitteraars), de edges komen in beeld zodra iemand één van de kandidaten noemt.

edges
Figuur 2. Verandering van edges (ofwel: aandacht voor de kandidaten) over tijd

Het volgende valt op:

  • Op 29 februari stapt Tom Steyer uit de race (plaatje 3). Op die dag lopen er meer roze lijntjes naar Steyer dan de dagen ervoor en daarna. Nadat hij dit nieuws bekend heeft gemaakt, krijgt hij meer aandacht op Twitter.
  • Op 1 maart stapt Pete Buttigieg uit de race (plaatje 4). Ook dan is te zien dat de bruine lijntjes naar Buttigieg intensiveren ten opzichte van de dagen daarvoor en daarna. Buttigieg vraagt zijn fans om op Biden te stemmen. Daarom zie je vanuit het bruine cluster tussen Biden en Buttigieg meer groene lijntjes naar Biden uitgaan.
  • Op 2 maart stapt Amy Klobuchar uit de race. Zij krijgt al relatief weinig aandacht vergeleken met de andere kandidaten, en de Twitteraars die haar noemen, noemen ook vaak andere kandidaten. We zien weinig extra aandacht voor haar op 2 maart.

Conclusie: Twitterdata lijken een goede graadmeter voor stemgedrag

Als je kijkt naar de polls en de daadwerkelijke uitslagen, lijkt deze Twitterdata een goede graadmeter voor het stemgedrag van de Amerikaanse Democraten. Biden en Sanders stonden aan kop, Bloomberg en Warren gingen redelijk gelijk op, en Gabbard kreeg de minste aandacht op Twitter.

De aandacht voor de kandidaten die zich hebben teruggetrokken vóór Super Tuesday (Steyer, Buttigieg met stemadvies voor Biden, en Klobuchar met stemadvies voor Biden) heeft zich verdeeld over de andere kandidaten.

Vervolgstappen en advies

Je zou dit online proces vanaf de start van de campagnes kunnen monitoren om concurrenten in de gaten te blijven houden.

De laatste dagen (en de dagen na Super Tuesday) hebben veel van de kandidaten zich teruggetrokken. Tom Steyer en Elizabeth Warren trokken zich terug zonder stemadvies, terwijl Mike Bloomberg, Pete Buttigieg, en Amy Klobuchar bij hun terugtreden hun aanhangers hebben gevraagd om op Biden te stemmen.

Aangezien er clusters zijn die overlap laten zien in aandacht voor de kandidaten (bijvoorbeeld in aandacht voor Biden en Bloomberg), zouden de afhakende kandidaten zich wellicht al eerder bij Biden hebben kunnen voegen om zo campagnekosten te besparen en hun krachten te bundelen.

Daarnaast hadden deze inzichten gebruikt kunnen worden om het online campagnevoeren te verbeteren. Kandidaten konden achterhalen wie in dit netwerk al actief waren in het verspreiden van hun naam (de activators), wie het meest centraal stonden (wie hebben de meeste macht in het verspreiden van informatie) en/of wie de meeste volgers hadden. Vervolgens konden ze deze Twitteraars vragen ze te helpen met online campagne voeren om zo hun impact te vergroten.

Ook hadden ze met sentiment analyse in kaart kunnen brengen wie zich juist positief en negatief uitlieten over bepaalde kandidaten. Met deze Twitteraars hadden ze online het gesprek aan kunnen gaan. Pete Buttigieg heeft iets vergelijkbaars gedaan.

Inzicht in wat er speelt op social media over onderwerpen die voor jou relevant zijn?

Sociale media voorzien je van rijke data, en Social Network Analysis helpt je in relatief korte tijd inzichtelijk te maken wat er op grote schaal op sociale media gebeurt.

Deze analyse zou je ook toe kunnen passen op een commerciële case. Je zou bijvoorbeeld in kaart kunnen brengen hoeveel aandacht jouw merk krijgt in vergelijking met concurrerende merken.

Niet alleen zijn deze inzichten op zich zelf al erg informatief, ook geven ze aanknopingspunten voor vervolgstappen: op welke aspecten is vervolgonderzoek nodig? Je zou ook kunnen overwegen andere social listening methodes toe te passen om deze vervolgvragen te beantwoorden.

Wil je ook weten hoe je meer grip krijgt op je social media activiteiten? Onze Data Scientists helpen je graag.

Oud-collega Anika Batenburg was een Data Science Consultant bij Digital Power

Anika heeft een PhD op het gebied van online communities. Ze is een enthousiaste onderzoeker met kennis van statistiek, onderzoeksdesign, online netwerken, en automatische tekstanalyse. Ze is geïnteresseerd in het complete plaatje, en denkt daarom graag op strategisch niveau mee met de organisatie.

Anika Batenburg

Data Scientist

1x per maand data insights, praktijkcases en een kijkje achter de schermen ontvangen?

Meld je aan voor onze maillijst en blijf 'up to data':