DTFR_Big Data_général

LES 3 V’s DE GARTNER

En 2001, Math Lancy (alors chez Meta Group, maintenant chez Gartner) a présenté un rapport de recherche sur toutes les possibilités de ‘Big data’.
Ceci se concentre sur les 3V que Lancy considère comme les trois façons dont le Big Data se développera de manière explosive!

Nous savons que le Big Data est immense et connaît une croissance exponentielle. Que le premier V signifie Volume n’est donc pas vraiment surprenant.

  1. Volume

En tant qu’êtres humains, nous sommes responsables de plus de deux billions de giga-octets de données chaque jour et ce chiffre ne fait qu’augmenter. Nous vivons sur nos smartphones, nos Iphones et nos ordinateurs portables. Les applications (comme les messages WhatsApp avec contenu multimédia) entraînent une croissance exponentielle du Big Data . Lorsque le volume augmente, le besoin de nouveaux systèmes et d’employés dans le monde informatique augmente automatiquement. En fait, des millions d’emplois informatiques axés sur le big data devraient être ajoutés dans quelques années, tous pour gérer le flux de giga-octets de données.

2009:  Toutes les données Internet combinées ont été estimées à 500 exabyte

2018:   Toutes les données Internet combinées ont été estimées à 18 zettabyte

2025:   Toutes les données Internet réunies sont estimées à 175 zettabyte

175 zettabytes sur dvd donnerait une pile, assez haute pour tourner 22 fois autour de la terre.

Amazon Cloud consomme autant d’énergie que 600 000 ménages

  1. Variety

En tant que deuxième V, nous avons la Variété de données ou Variété.
Lorsque vous pensez aux possibilités de stockage de données, vous verrez que dans votre propre vie, vous aurez déjà multiples façons: d’Excel au Pdf et de la vidéo à des méthodes futures qui sont encore un mystère.

Étant donné que les données se présentent dans de nombreux formats de fichiers différents, les données collectées ne sont pas toujours structurées. Il ne provient pas non plus toujours de sources claires. Les données sont filtrées, stockées et analysées à partir d’images, de musique, de vidéos, mais également d’e-mails de réclamation ou d’autres textes.

Les données peuvent être non structurées et ne pas être stockées dans une base de données traditionnelle. Ensuite, des algorithmes sont initialement appliqués pour distiller les données utilisables à partir des différentes sources.

  1. Volatilité ( Velocity): vitesse de collecte des données

Il s’agit de la vitesse à laquelle les données sont obtenues et traitées .
En raison de la croissance des données et des médias sociaux, nous regardons désormais les données différemment qu’auparavant.

Auparavant , les données de la veille étaient très importantes.
Maintenant, les journaux ont encore cette idée – mais les sites d’actualités et les radios ont veillé à ce que nous recevons les nouvelles beaucoup plus rapidement. Nous nous sommes habitués à court terme, rapides et à jour . Désormais, nous disposons d’un traitement des données et des informations en temps réel en quelques fractions de secondes, vous n’avez donc plus à attendre longtemps pour recevoir certaines actualités.

Bien sûr, c’est en grande partie parce que l’internet est devenu plus rapide .
Les appareils qui doivent pouvoir communiquer entre eux (IoT) nécessitent également une connexion Internet rapide.

L’arrivée du 1G , le premier réseau GSM dans les années 80, nous a permis de passer des appels.

Grâce à la 2G, dans les années 1990, nous avons pu envoyer des SMS.

La 3G nous a permis de regarder des vidéos (en basse résolution).

Et le réseau 4G nous a permis de diffuser et de partager des vidéos en haute qualité. En d’autres termes: Facebook Live, Facetime, Tik Tok, Netflix et YouTube ont eûs un coup de pouce avec l’arrivée de la 4G. Vous l’avez peut-être remarqué sur votre facture?

Qu’est-ce que la 5G ? La 5G est bien plus qu’une simple mise à niveau de la 4G. Le nom 5G est en fait mal choisi, car il y a une grande différence avec la 4G.

La 5G est en théorie 100 à 200 fois plus rapide et il n’y a pratiquement pas de retard sur le réseau.

Avec la 5G, vous pouvez télécharger un film en haute résolution en seulement quelques secondes. Avec la 4G, cela prend quand même encore environ 10 minutes.

Important: Cette vitesse est également très importante pour les appareils qui doivent pouvoir communiquer entre eux.

Les voitures autonomes qui doivent s’arrêter immédiatement si les capteurs détectent un cycliste au coin de la rue, les entreprises qui utilisent des drones pour surveiller en temps réel la construction ou les travaux routiers …

L’avenir?

LiFi : Li-Fi est une technologie de communication de données sans fil qui utilise des diodes électroluminescentes (LED) pour transmettre des données via la lumière.

Contradictions et véracité

Tant de données sont collectées que parfois nous ne pouvons plus voir clairement.

Cela facilite sans doute les «fausses nouvelles» et les théories du complot. Pensez simplement aux Flat-Earthers ou à d’autres vendeurs absurdités. L’énorme accessibilité des informations de toutes sortes peut créer des groupes entiers qui acceptent des faits non prouvés comme vérité.

Valeur des données

You can have data without information,
but you cannot have information
without data.”

En raison de la quantité de données, une sélection doit constamment être faite entre les données vitales et moins vitales .

Nous ne devons pas faire l’erreur de conserver les données sans information et de filtrer les données informatives.

De plus, comme nous venons de le voir, toutes les sources ne sont pas aussi fiables.