Qu’est-ce que le Big Data ?
Depuis quelques années, le nombre d’usages numériques grandit grâce à l’utilisation des smartphones et des sites internet disposant de services en ligne. Peu à peu, ils ont convergé avec les points physiques comme les commerces, les infrastructures publiques et privées, la rue, etc. Chaque fois qu’il est possible, chacun d’entre-nous nourrissons des sites de médias avec des posts sur les réseaux sociaux, envoyons des emails, des messages, publions des billets de blogs, enregistrons des vidéos sous des plateformes vidéo, publions des vidéos en direct, les conversations téléphoniques, etc. sur tous les sujets qui nous passent par la tête ou que nous voyons. En plus de ces données voulues, chacun de nos passages est enregistré par des caméras, des capteurs en tout genre (par exemple : même notre smartphone possède un GPS, ou quand on passe à la caisse du supermarché ou votre voiture ou encore le dernier objet « connecté » à la mode que vous avez acheté) ou des traces sur nos recherches sur internet. C’est sans limite. Ces dernières données sont supérieures en volume à nos données publiées volontairement.
Ainsi, l’idée générale est d’enregistrer le maximum de données afin de comprendre les comportements diverses et variés dans l’achat, l’engagement, le goût de chacun d’entre-nous. Par suite, ces données permettent aux entreprises de proposer des produits toujours plus personnalisés. Sans cela, il faudrait passer des heures et des heures pour qu’un commercial comprenne le besoin que vous exprimez.
Tous ces usages engendrent des données massives que l’on appelle donc « les Big Data » pour simplifier. Les Big Data s’affirment tous les jours un peu plus comme le nouvel « or noir »
Pourquoi ? Et bien parce que toutes ces données sont un « vrac » qui partagent une définition commune « de base » que l’on nomme les 3V :
Volume : il est considérable
Vélocité : il s’agit de fréquence de création, de collecte et de partage des données
Variété : ce sont les différents types de sources d’information : structurées, semi-structurées, non-structurée, organisées, open, etc.