Big data algemeen

DE V’s VAN GARTNER: Volume, Velocity, Variety

We weten dat big data immens groot is en een explosieve groei kent. Dat de eerste V staat voor Volume is dus niet echt verwonderlijk.

1.Volume

Als mens zijn wij dagelijks verantwoordelijk voor ruim 2.5 quintiljoen bytes aan data en dit cijfer wordt alleen maar groter. We leven op smartphones, tablets en laptops. Apps (zoals WhatsApp-berichten met media-inhoud) zorgen voor een exponentiële groei van big data.

Wanneer het volume omhoog gaat, groeit automatisch de behoefte aan nieuwe systemen en werknemers in de wereld van IT. Er wordt verwacht dat over een paar jaar miljoenen IT-banen gefocust op big data erbij komen, alles om die stroom van gigabytes aan data te kunnen behandelen.

2009:  Alle internetdata samen werden toen geschat op 500 exabyte

2018:   Alle internetdata samen werden geschat op 18 zettabyte

2025:   Alle internetdata samen wordt voorspeld op 175 zettabyte

175 zettabytes op DVD’s zou een stapel geven, lang genoeg om 22 keer rond de aarde te cirkelen.

2.Variety

Als tweede V hebben we de Verscheidenheid aan data ofwel Variety. Er zijn heel veel manieren op data op te slaan: van excel tot pdf en van foto’s tot videos.

Omdat data voorkomt in zoveel verschillende bestandsformaten is de data die verzameld wordt niet altijd gestructureerd.

De data is ook niet steeds afkomstig vanuit duidelijke bronnen. Data kan uit beelden, muziek, video, maar ook uit mails of andere teksten gefilterd worden en nadien geanalyseerd worden.

Ongestructureerde data wordt niet in relationele databases opgeslagen. Op ongestructureerde data wordt hier in eerste instantie algoritmen op losgelaten om bruikbare data uit de verschillende bronnen te distilleren om nadien te gebruiken.

3.Velocity (Vluchtigheid)

Het gaat hier om de snelheid waarmee data wordt verkregen en verwerkt.
Door de groei van data en sociale media kijken we nu anders naar data dan vroeger.
Vroeger was het zo dat data van de vorige dag heel belangrijk was – nu hebben kranten nog steeds dit idee – maar nieuwssites en radio’s hebben ervoor gezorgd dat we veel sneller het nieuws krijgen en willen. We zijn gewoon geraakt aan kort, snel en up-to-date. Nu heb je zelfs realtime data en informatieverwerking in fracties van seconden, lang wachten om bepaald nieuws binnen te krijgen hoeft niet meer. Natuurlijk komt dit grotendeels doordat het internet sneller is geworden.

De komst van 1G, het eerste gsm-netwerk in de jaren 80, zorgde ervoor dat we met elkaar konden bellen.

Dankzij 2G, in de jaren 90, konden we sms’en naar elkaar sturen. 

3G zorgde ervoor dat we video’s (in lage kwaliteit) konden bekijken.

En het 4G-netwerk maakte het mogelijk dat we video’s in hoge kwaliteit konden streamen en delen. Anders gezegd:  Facebook LiveFacetimeTik TokNetflix en YouTube hebben op de smartphone pas een boost gekregen met de komst van 4G.

En nu 5G? 5G is veel meer dan zomaar een upgrade van 4G. De naam 5G is eigenlijk slecht gekozen, want er is een groot verschil met 4G. 5G is in theorie 100 tot 200 keer sneller en er zit nauwelijks vertraging meer op het netwerk. Je kan met 5G een film in hoge resolutie in amper een paar seconden downloaden. Met 4G duurt dat nog ongeveer 10 minuten.

De toekomst?

LiFi: Li-Fi is een draadloze datacommunicatie technologie dat Light Emitting Diodes (LEDs) gebruikt voor het verzenden van data via licht.

Meer zicht op data? Bezoek de website ‘Our World in Data’.