Wat is Big Data? | Verschillende definities van Big Data

Wat is Big Data nu eigenlijk precies?

Geschreven door

Data is overal, en de hoeveelheid data neemt in schrikbarend tempo toe. Maar wat is Big Data precies, en wat kun je ermee?

geef je op voor de BI award

Big Data serieus nemen

De term ‘Big Data’ beheerst vrijwel alle artikelen over informatietechnologie en managementinformatie. Maar ook de kandidaten voor de Dutch BI Award van de afgelopen jaren laten zien dat ze Big Data Analytics serieus nemen. Maar wat is Big Data nu eigenlijk precies? Velen, waaronder ikzelf, worstelen met de term. Er heerst grote verwarring over Big Data omdat er geen algemeen geaccepteerde definitie bestaat. We weten allemaal dat het te maken heeft met grote hoeveelheden data, met snelle verwerkingstijd en ettelijke verschillende verschijningsvormen. Dat zegt nog niets, want wat is een grote hoeveelheid? Wat is snel en wat zijn ettelijke verschijningsvormen?

Door Rick F. van der Lans
vakjurylid Dutch BI Award

Verschillende definities in omloop

Voor sommigen is Big Data goed gestructureerde sensordata, of door machines gegenereerde data, anderen bedoelen er ongestructureerde tekstdata mee afkomstig uit social media – weer anderen zeggen dat het semi-gestructureerde data zijn in bijvoorbeeld weblogs.

‘Big’ is een relatief begrip

Het feit dat het woord ‘big’ een relatief begrip is, maakt het er niet makkelijker op. Wat voor een Europese onderneming veel is, kan voor een even groot Amerikaans bedrijf een gemiddelde hoeveelheid zijn. En gaat het eigenlijk wel over de hoeveelheid data? Of gaat het meer over wat we met de data kunnen doen, bijvoorbeeld analyseren – dat heeft op zich weinig met het volume te maken.

De V’s van Big Data

Voor de beschrijving van Big Data worden in de markt meestal de V’s gebruikt (Volume, Velocity, Variety, Variation, Visibility, Value). Ik ben inmiddels de tel een beetje kwijtgeraakt; hoe meer v’s, hoe onduidelijker de definitie. Ik zou willen zeggen: genoeg is genoeg, en dat geldt ook voor de hoeveelheid data.

De uitkomst van een analyse wordt niet per se beter als de hoeveelheid data groter is. De kwaliteit van de data is meestal veel belangrijker dan de kwantiteit. Er zijn inmiddels wel enkele definities gelanceerd, maar ik heb tot nu toe nog geen echt acceptabele gezien. Hoe het ook zij, er heerst grote verwarring over het concept ‘Big Data Analytics’.

Wat is een Big Data-systeem?

Wat is een Big Data-systeem?Ik zal eens proberen naar verschillende Big Data-systemen te kijken vanuit verschillende invalshoeken en zo wat licht in de duisternis rond Big Data te laten schijnen. Het verwerken van grote hoeveelheden data is ongetwijfeld het meest voorkomende kenmerk van Big Data systemen.

Maar er is er nog een, en dat is dat de meeste van dergelijke systemen de karakteristieken van productie- en BI-systemen combineren. In essentie is elk Big Data-systeem een productiesysteem, omdat het nieuwe data verzamelt en opslaat, en tegelijk een BI-systeem omdat de nieuwe data niet bedoeld is voor de ondersteuning van bedrijfsprocessen, maar primair voor analyse.

Business processen ondersteunen

Met ‘nieuwe data’ bedoel ik overigens data die nog niet eerder binnen de organisatie verzameld en opgeslagen is, en in veel gevallen is het ook een nieuw type data. Een voorbeeld: het Big Data-systeem van een retailer verzamelt data uit een camerasysteem, om er achter te komen hoe klanten door hun winkel lopen.

Of een multinational verzamelt ongestructureerde data uit social media om te zien hoe er over ze gedacht en geschreven wordt. Traditioneel wordt nieuwe data ingevoerd in en verwerkt door productiesystemen, zoals een grootboek, cash management, en claim-verwerkende systemen. Deze systemen zijn echter niet ontworpen om analytics, maar om business processen te ondersteunen.

Data entry

Sterker nog: toen ze werden ontworpen dacht niemand nog aan analytics, alleen aan het mogelijk maken van data entry. Dat is de reden waarom het soms zo vreselijk moeilijk is om een BI-systeem te bouwen dat de juiste data onttrekt aan die productiedatabases voor analytische of rapportagedoeleinden: er moeten staging areas worden ingericht, ETL- en replicatieprocessen ontworpen, enzovoort.

Leer hoe je Big Data inzet in jouw organisatie

Big Data systemen zijn hybride systemen

Dat gaat nog steeds op: de ontwikkelaars van nieuwe productiesystemen denken er nog steeds niet aan dat de organisatie de data misschien wel eens ergens anders voor zou willen gebruiken – bijvoorbeeld voor analyse. Met andere woorden: wat Big Data-systemen zo bijzonder maakt, is dat het hybride systemen zijn; het zijn productie- en BI-systemen tegelijk. Dat is naar mijn mening ook wat Big Data-applicaties bijzonder maakt – en de meeste verzamelen gigantische hoeveelheden data speciaal geschikt voor de gevraagde vorm van analytics.

Herdefinitie

Misschien moeten we de term Big Data gewoon herdefiniëren. Laten we beginnen met het woord ‘big’ niet meer te associëren met een bepaalde hoeveelheid, maar er – naar goed IT-gebruik – een acroniem van maken: Business Intelligence Generated Data, daar staat BIG Data voor: data die speciaal gegenereerd en opgeslagen wordt om te analyseren.

Ergo, een BIG Data-systeem is een systeem dat data genereert, verzamelt, opslaat en verwerkt met als primair doel business intelligence te ondersteunen. Daaruit volgt dat BIG Data data zijn die gemanaged worden door een BIG Data systeem. Door het herdefiniëren van de term Big Data wordt het hopelijk duidelijk wat er wordt bedoeld met deze veelbelovende categorie systemen en maakt het een einde aan de verwarring.

Rick F. van der Lans
is onafhankelijk adviseur, auteur en presentator op het gebied van datawarehousing, Business Intelligence, applicatie-integratie en databasetechnologie

  1. Avatar Wat is Big Data nu eigenlijk precies? Gustavo Woltmann schreef:

    Bedankt voor de heldere uitleg! Heb je ook tips over hoe je aan die data kunt geraken? Via sociale media?

Reageer ook op dit artikel van Daan van Beek

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Een selectie van onze klanten

Word nu ook klant

Wil je ook klant bij ons worden? Wij helpen je maar wat graag verder met wat is big data? (verschillende definities van big data) of andere zaken waar je slimmer van wordt.

Daan van Beek, Managing Director

DAAN VAN BEEK MSc

Managing Director & auteur van 'De intelligente organisatie' (6e druk)

neem contact met mij op

Fact sheet

Aantal organisaties geholpen
1543
Aantal trainingen & workshops
1544
Aantal deelnemers opgeleid
1545
Gemiddelde klantervaring
8,9
Aantal consultants & docenten
1546
Aantal kantoren
3
Aantal jaren actief
14