Hoe je Social Network Analysis inzet voor inzicht in de publieke opinie

Case: de publieke opinie op Twitter omtrent de Corona-maatregelen

  • Artikel
  • Data Science
Anika-data-scientist
Anika Batenburg
Data Scientist
7 min
15 May 2020

De Corona-maatregelen zijn een veel besproken onderwerp op Twitter. Het crisisteam strijdt niet alleen tegen de effecten van Corona op de volksgezondheid, maar probeert ook de legitimiteit voor de keuze voor bepaalde maatregelen onder het publiek te behouden. Met deze praktijkcase leggen we uit hoe je de publieke opinie op Twitter inzichtelijk maakt met Social Network Analysis.

Weet je nog niet wat Social Network Analysis is? Je leest onze uitleg in dit artikel.

Om de legitimiteit te behouden, volgt het crisisteam de publieke opinie op de voet. Ze maken daarbij gebruik van openbare bronnen als peilingen, de stemming in televisieprogramma’s, en het sentiment op Facebook en op Twitter.

Denk bijvoorbeeld aan het sluiten van de scholen: volgens het RIVM niet nodig, maar wel iets waar het publiek sterk op aandrong.

Laten we als voorbeeld voor het Corona crisisteam kijken wat we inzichtelijk kunnen maken op basis van Twitterdata en netwerkanalyse.

Data verzamelen

We hebben in de periode van 10 tot 25 maart 2020 tweets verzameld die betrekking hadden op de Corona-maatregelen. Dit was de periode waarin de eerste maatregelen werden aangekondigd. We vonden 30.580 tweets in totaal.

Resultaten

Figuur 1 geeft het netwerk van deze dataset weer:

  • De nodes (alle punten) zijn de Twitteraccounts (17.344 accounts in totaal);
  • De edges (de lijntjes tussen de nodes) weerspiegelen de communicatie. Elke keer dat een Twitteraar een andere Twitteraar heeft genoemd, zie je een lijntje tussen deze Twitteraars (40.344 edges in totaal).

De communicatie op Twitter wordt gekenmerkt door een @mention (in een post, een reactie, of door iemand te retweeten).

nodes
Figuur 1. Hoe groter de node, hoe vaker de Twitteraar door anderen werd genoemd.

Wat de groottes van de nodes aangeven

De nodes verschillen in grootte. De grotere nodes weerspiegelen de Twitteraars die het vaakst worden genoemd door anderen: hoe groter de node, hoe vaker deze persoon werd genoemd. De grootte zegt dus iets over de ‘populariteit’ van een Twitteraar: wie kreeg de meeste (positieve/negatieve) aandacht?

In figuur 1 zie je dat het Twitter account van Mark Rutte (@minpres) en het RIVM het vaakst werden genoemd. Logisch, aangezien zij een leidende rol spelen in het communiceren van de maatregelen.

Wat de kleuren zeggen

De kleuren in het netwerk laten verschillende clusters zien. De nodes met dezelfde kleur Twitterden veel meer over of met elkaar dan de nodes buiten deze groep (dit zijn de nodes met een andere kleur). We zoomen er dieper op in:

De roze wolk toont een grote groep Twitteraars die met- en over het RIVM en het Ministerie van Volksgezondheid, Welzijn en Sport tweetten. In dit cluster werden veel updates over het virus gedeeld (wat weten we inmiddels over het virus en hoe staan we ervoor?), maar er werden ook veel vragen gesteld en zorgen en kritiek geuit omtrent de maatregelen.

De blauwe Twitteraars communiceren veel over en met ministers van het huidige kabinet die de maatregelen hebben genomen (o.a. minpres, bruno_bruins, hugodejonge, arieslob, markrutte, ferdgrapperhaus, wkoolmees, wbhoekstra).

In dit cluster werd Mark Rutte heel vaak geretweet. Bijvoorbeeld over zijn bezoek aan het Erasmus MC, waardoor ook het Erasmus ziekenhuis veel is genoemd. Deze wolk bevat ook vragen aan de ministers en kritiek over de maatregelen. Zowel ‘ewindt’ en ‘lbergkamp’ zijn Twitteraars met veel volgers die actief de discussie aangingen omtrent de maatregelen. Zij kregen veel reacties van volgers, en werden daardoor ook vaak genoemd.

In de groene wolk werd vooral aandacht besteed aan rechts-nationalistische Twitteraars (bv. geertwilderspvv, thierybaudet, fvdemocratie, Bos_m, Perculator_hnj, Joostniemoller, leondewinter, vrouwvdvrijheid), en de Telegraaf.

Deze politici, journalisten en columnisten hadden vooral kritiek op de aanpak van het kabinet. Deze berichten kregen veel reacties en werden veel geretweet door hun volgers.

Het lila cluster bestaat uit mensen die op nieuws van NU.nl reageerden of dit retweeten.

Er is een donkergroen cluster met (discussies over het) nieuws van RTL nieuws en het NOS (inclusief een aantal NOS journalisten).

Het paarse cluster wat helemaal linksonder uitsteekt vanaf het woord ‘politie’ betreft een tweet over het doen van aangifte in Coronatijd, wat door veel mensen is gedeeld.

Figuur 2 hieronder laat exact hetzelfde netwerk zien, maar nu weerspiegelen de grotere nodes de Twitteraars die actief andere Twitteraars aanspreken in de discussie, de zogenaamde activators. Zij zorgen dat de discussie levend blijft.

nodes
Figuur 2. Hoe groter de node, hoe meer de Twitteraar anderen heeft genoemd (discussion activator)

Normaal gesproken staan de namen van deze Twitteraars bij de nodes, zodat je direct kunt zien wie deze activators zijn. Dit zijn personen met wie je misschien wilt samenwerken of waarmee je misschien juist in gesprek wilt om ze gerust te stellen of te sussen. In dit netwerk zijn dat vooral ‘onbekende’ Twitteraars (geen publieke figuren).

In verband met de privacy van deze personen, hebben we de namen weggelaten uit dit figuur.

Conclusie

Wat opvalt, is dat het crisisteam vooral communiceert via het RIVM en ministers van het kabinet. Daarnaast hebben rechts-nationalistische politici en aanhangers hun eigen groene cluster. Zij communiceren vooral met elkaar over de maatregelen en delen de kritiek vooral binnen hun eigen netwerk.

Andere (oppositie)partijen zijn ook wel te vinden in de dataset, maar zij zijn minder actief. Ook worden ze minder vaak genoemd dan de rechts-nationalistische partijen. Ter vergelijking:

  • Geert Wilders wordt genoemd in 4261 tweets;
  • Thierry Baudet wordt genoemd in 3607 tweets;
  • GroenLinks wordt genoemd in 52 tweets;
  • PvdA wordt genoemd in 194 tweets;
  • CDA wordt genoemd in 72 tweets;
  • Partij van de Dieren wordt genoemd in 12 tweets.

Daarbij gaan deze partijen op in het blauwe of roze cluster.

Vervolgstappen en advies

Nu je de clusters in kaart hebt gebracht, is het tijd voor de volgende stap. Eerst ga je kijken of in de verschillende clusters dezelfde zorgen worden gedeeld als in andere clusters. Dit kun je bijvoorbeeld doen door middel van Topic Modelling, een methode om thema’s uit teksten te destilleren. In het geval van de corona-maatregelen zou het crisisteam zo kunnen bekijken of ze alle zorgen die er bij het publiek spelen, wel in overweging nemen. Ook kun je overwegen andere social listening methodes toe te passen.

Daarna kan het team stap voor stap proberen haar invloed te vergroten buiten het eigen netwerk. In het voorbeeld zou het groene cluster een goede eerste stap zijn. Om hier binnen te komen, kunnen ze bijvoorbeeld samenwerking met een influencer of activator die in dat cluster actief is.

In dit geval bestaat het groene cluster vooral uit invloedrijke personen die kritisch zijn op het beleid van het crisisteam. Ze zullen dus niet snel overtuigd zijn van de boodschap van het crisisteam. Wél kunnen ze beïnvloed worden met een aangepaste communicatiestrategie waaruit blijkt dat de specifieke zorgen binnen hun cluster onderkend worden. Ook door proactief te reageren op vragen die spelen binnen het groene cluster spelen, kan het crisisteam impact maken.

Oud-collega Anika Batenburg was een Data Science Consultant bij Digital Power

Anika heeft een PhD op het gebied van online communities. Ze is een enthousiaste onderzoeker met kennis van statistiek, onderzoeksdesign, online netwerken, en automatische tekstanalyse. Ze is geïnteresseerd in het complete plaatje, en denkt daarom graag op strategisch niveau mee met de organisatie.

Anika Batenburg

Data Scientist

1x per maand data insights, praktijkcases en een kijkje achter de schermen ontvangen?

Meld je aan voor onze maillijst en blijf 'up to data':