Analytics en DataBlogMarkethings.net informeertMarkethings.net inspireert

Wat brengt data tot leven?

Spoiler Alert: Datavisualisatie! Data is de levensader waar menig bedrijf zijn businessmodellen en operaties op baseert. Bedrijven en organisaties verzamelen meer data dan ooit tevoren, in elk aspect van het bedrijf. Van inkomende gesprekken bij de klantenservice tot het voorspellen van de omzet in het derde kwartaal en van de perfecte indeling van een magazijn tot de resultaten van een SEO-campagne: alles wordt opgeslagen. Het analyseren van deze data is steeds belangrijker en kan een grote bijdrage leveren aan het succes van bedrijven. Maar het analyseren alleen is niet genoeg, je moet het ook kunnen overbrengen. Een van de meest efficiënte manieren is het visualiseren van data. Er zijn meerdere mogelijkheden, zoals infographics, maar in deze blog focus ik me op datavisualisatie. Maar wat is het precies? Hoe doe ik het dan? En welke tools kan ik het beste gebruiken? In deze blog neem ik je mee in de wonderlijke wereld van datavisualisatie. Storytelling met data! Doe je mee?

Wat is datavisualisatie precies en waar moet het aan voldoen?

Datavisualisatie is het communiceren van informatie op een duidelijke en effectieve manier door het gebruik van grafische hulpmiddelen. Hierbij zijn een viertal aspecten van belang:
1. De informatie die je presenteert moet interessant zijn. De gegevens en conclusies zijn nieuw en relevant voor de ontvanger.
2. De informatie die je presenteert is integer. Je presenteert geen onjuiste cijfers, maar slechts accurate gegevens die gebaseerd zijn op de waarheid.
3. De informatie je presenteert is functioneel. De ontvanger kan met jouw datavisualisatie aan de slag weet hoe hij de gegevens kan gebruiken bij zijn dagelijkse werkzaamheden.
4. Je presenteert de informatie in de juiste vorm. Er zit een duidelijke structuur in de presentatie en het is begrijpelijk voor de ontvanger.

De vier aspecten zijn te verdelen over twee assen: informatie en design. In onderstaande figuur zie je een visualisatie van de kern van de ‘eisen ’ van een goede data visualisatie.

Het is dus van groot belang dat je als toekomstig marketeer niet alleen weet hoe je data moet analyseren, maar ook hoe je deze data moet interpreteren en vervolgens kunt visualiseren. Datavisualisatie kan zowel gebruikt worden voor een verkenning van de database als voor een rapportage van de resultaten. Door een duidelijke visualisatie ben je in staat om relevante inzichten om te zetten in een voor de ontvanger relevant verhaal.

Hoe sommige datavisualisaties een verkeerd verhaal vertellen

Er zijn talloze vormen en voorbeelden van datavisualisatie. Graag deel ik een drietal slechte voorbeelden met jullie. Herkennen jullie wat er mis gaat in onderstaande voorbeelden? Aan het eind van de blog leg ik uit waarom de onderstaande figuren voorbeelden zijn van slechte datavisualisaties.

Figuur 1. How Baby Boomers Describe Themselves

Figuur 2. Application Category Percentage

Figuur 3. Export van bananen in de periode 1994-2005

Gelukkig zijn er ook tal van goede voorbeelden. Een goed voorbeeld waarin de data echt ‘tot leven komen’ is een klein college waarin professor Hans Rosling op fenomenale wijze de ontwikkeling van verschillende gebieden en landen op de wereld uitlegt. Twijfel je nou welke grafiek je het beste kan gebruiken voor een visualisatie? Gebruik dan deze website . Op deze website worden er allerlei vormen van visualisaties en hun toepassingen uiteengezet.

Handige tools

Nadat we de definitie van datavisualisatie en enkele vereisten van een goede datavisualisatie hebben behandeld, is het tijd om aan de slag te gaan! Er zijn ontelbaar veel mogelijkheden om je data te visualiseren, maar ik beperk me in deze blog tot een vijftal tools. Uiteraard is het ook mogelijk om data te visualiseren met behulp van Microsoft Excel, maar om iets ingewikkeldere (en mooiere) visualisaties te maken kun je gebruik maken van deze tools (in willekeurige volgorde):

1. Tableau
Het meest gebruikte datavisualisatieprogramma is Tableau. Tableau wordt met name gebruikt voor de visualisatie van grote hoeveelheden data en is hier uitermate voor geschikt. Het programma kan dan ook gelinkt worden aan verschillende big dataprogramma’s zoals Hadoop, SQL en SAP. Via de webiste is een free trial beschikbaar.

2. PowerBI
Deze gratis tool van Microsoft is ontzettend geschikt om dashboards te maken en deze snel te delen met vrienden, studiegenoten of collega’s. Doordat de tool van Microsoft is, kun je in het programma in een simpele ‘Excelweergave’ ook nog data bewerken en verschillende databronnen aan elkaar koppelen.

3. Qlik
Dit programma wordt vooral geroemd om haar werkomgeving welke volledig is aan te passen aan jouw wensen en voorkeuren. Dit programma wordt vaak samen gebruikt met Qliksense, een programma voor dataverkenning en -analyse.

4. Plotly
Plotly is uitermate geschikt voor de meer complexere en geavanceerde visualisaties aangezien het een integratie heeft met programma’s als Python en R. Het is gratis te gebruiken (als je student bent) en werkt onder meer samen met het CRM-programma Salesforce.

5. DataHero
DataHero maakt het gemakkelijk om data van verschillende diensten (o.a. Cloud) en databases te combineren en hiermee grafieken en dashboards te maken. Doordat voor deze tool (bijna) geen technische capaciteiten zijn vereist, is het DataHero erg toegankelijk en makkelijk te begrijpen.

Wanneer je Googelt op de bovenstaande programma’s (i.c.m. dashboard) dan zie je allerlei voorbeelden van goede dashboards welke gecreëerd zijn met deze tools.

Wat was er nou mis met de datavisualisaties in figuur 1, 2 en 3?

Figuur 1 geeft weer hoe babyboomers (mensen geboren tussen 1945 en 1955) zichzelf beschrijven. Ondanks dat de visualisatie er op het eerste gezicht mooi uitziet, kloppen de verhoudingen tussen de uitspraken niet. Zo ziet 78% van de babyboomers zich als ‘people-savvy’ (paars) en 61% als ‘willing to learn’ (rood). Het paarse gedeelte is echter kleiner dan het rode gedeelte, terwijl het percentage wel groter is.

Figuur 2 toont de verschillende productcategorieën binnen een winkel. Naast dat er te veel productcategorieën worden weergegeven, waardoor de visualisatie onoverzichtelijk wordt, hebben sommige productcategorieën ook een waarde van 0%. Deze productcategorieën hadden dus helemaal niet moeten worden opgenomen in dit cirkeldiagram.

Ten slotte Figuur 3. Figuur 3 toont de export van banen voor een aantal landen in de periode 1994-2004. Op het eerste gezicht lijkt het misschien een aantrekkelijke visualisatie met de bananen op de achtergrond, maar dit zorgt voor onduidelijkheid. Daarnaast zijn de staafjes in 3D weergegeven. Als ik één tip heb gekregen tijdens mijn cursus data-analyse, dan was het wel dat 3D-weergaves onnodig zijn en vaak leiden tot onduidelijkheid. Doordat deze grafiek 3D-weergaven bevat is het onmogelijk om de diverse staafjes met elkaar te vergelijken en zo juiste conclusies te trekken.

Hopelijk heb ik je een goed beeld gegeven omtrent het visualiseren van data. En met de tools kun je meten zelf aan de slag. Welk verhaal ga jij vertellen?

Geef een reactie

Het e-mailadres wordt niet gepubliceerd.