DTNL_Big Data_algemeen

DE 3 V’s VAN GARTNER

In 2001 presenteerde Math Lancy (toentertijd bij Meta Group, nu bij Gartner) een onderzoeksrapport over alle mogelijkheden van data.
Hierin staan de 3 V’s centraal die Lancy ziet als de drie manieren waarop big data explosief zal groeien!

We weten dat big data immens groot is en een explosieve groei kent. Dat de eerste V staat voor Volume is dus niet echt verwonderlijk.

Volume

Als mens zijn wij dagelijks verantwoordelijk voor ruim twee triljoen gigabytes aan data en dit cijfer wordt alleen maar groter. We leven op smartphones, Iphones en laptops. Apps (zoals WhatsApp-berichten met media-inhoud) zorgen voor een exponentiële groei van big data. Wanneer het volume omhoog gaat, groeit automatisch de behoefte aan nieuwe systemen en werknemers in de wereld van IT. Er wordt zelfs verwacht dat over een paar jaar miljoenen IT-banen gefocust op big data erbij komen, alles om de stroom van gigabytes aan data te kunnen handelen.

2009:  Alle internetdata samen werden toen geschat op 500 exabyte

2018:   Alle internetdata samen werden geschat op 18 zettabyte

2025:   Alle internetdata samen wordt voorspeld op 175 zettabyte

175 zettabytes op DVD’s zou een stapel geven, lang genoeg om 22 keer rond de aarde te cirkelen.

Amazon Cloud verbruikt evenveel energie als 600.000 huisgezinnen

Verscheidenheid

Als tweede V hebben we de Verscheidenheid aan data ofwel Variety.
Als je denkt aan de mogelijkheden om data op te slaan, zal je zien dat alleen al in je eigen leven je al zeker op honderd manieren komt: van excel tot pdf en van video tot toekomstige manieren die nu nog een mysterie zijn.

Omdat data voorkomt in zoveel verschillende bestandsformaten is de data die verzameld wordt niet altijd gestructureerd. Ze is ook niet steeds afkomstig van duidelijke bronnen. Data wordt uit beelden, muziek, video, maar ook klachtenmails of andere teksten gefilterd, opgeslagen en geanalyseerd.

De data kunnen ongestructureerd zijn en niet in een traditionele database opgeslagen worden. Dan worden hier in eerste instantie algoritmen op losgelaten om bruikbare data uit de verschillende bronnen te distilleren.

Vluchtigheid (Velocity): snelheid van gegevensverzameling

Het gaat hier om de snelheid waarmee data wordt verkregen en verwerkt.
Door de groei van data en sociale media kijken we nu anders naar data dan vroeger.
Vroeger was het zo dat data van de vorige dag heel belangrijk was – nu hebben kranten nog steeds dit idee – maar nieuwssites en radio’s hebben ervoor gezorgd dat we veel sneller het nieuws krijgen en willen. We zijn gewend geraakt aan kort, snel en up-to-date. Nu heb je zelfs real-time data en informatieverwerking in fracties van seconden, lang wachten om bepaald nieuws binnen te krijgen hoeft niet meer. Natuurlijk komt dit grotendeels doordat het internet sneller is geworden. Ook de toestellen die met elkaar moeten kunnen communiceren (IoT) vereisen een snel internet.

De komst van 1G, het eerste gsm-netwerk in de jaren 80, zorgde ervoor dat we met elkaar konden bellen.

Dankzij 2G, in de jaren 90, konden we sms’en naar elkaar sturen. 

3G zorgde ervoor dat we video’s (in lage kwaliteit) konden bekijken.

En het 4G-netwerk maakte het mogelijk dat we video’s in hoge kwaliteit konden streamen en delen. Anders gezegd:  Facebook LiveFacetimeTik TokNetflix en YouTube hebben op de smartphone pas een boost gekregen met de komst van 4G. Jullie zullen het misschien aan de factuur gemerkt hebben?

Wat is 5G? 5G is veel meer dan zomaar een upgrade van 4G. De naam 5G is eigenlijk slecht gekozen, want er is een groot verschil met 4G.

5G is in theorie 100 tot 200 keer sneller en er zit nauwelijks vertraging meer op het netwerk.

Je kan met 5G een film in hoge resolutie in amper een paar seconden downloaden.
Met 4G duurt dat nog ongeveer 10 minuten.

Nog belangrijker is het voor de snelheid waarmee apparaten met elkaar kunnen communiceren.

Zelfrijdende auto’s die onmiddellijk moeten stoppen als de sensoren een fietser detecteren om de hoek, bedrijven die met drones bouw- of wegenwerken in real time opvolgen…

De toekomst?

LiFi: Li-Fi is een draadloze datacommunicatie technologie dat Light Emitting Diodes (LEDs) gebruikt voor het verzenden van data via licht.

Waarde van gegevens

You can have data without information,
but you cannot have information
without data.”

Er wordt zoveel data verzameld dat we soms door de bomen het bos niet meer zien.

Dit werkt zonder twijfel ‘fake news’ en complottheorieën in de hand. Denk maar aan Flat-earthers of andere verkopers van onzin. Door de enorme toegankelijkheid van informatie allerhande kunnen er volledige groepen ontstaan die onbewezen feiten als waarheid aannemen.

Door de hoeveelheid aan data moet er voortdurend een selectie gemaakt worden tussen vitale en minder vitale data.

We mogen niet de vergissing maken de ‘data without information’ te behouden en de informatieve data weg te filteren.

Bovendien, hebben we daarnet gezien, is niet elke bron even betrouwbaar.