Service sécurisé

Service

Retour

Lundi 05 Juin 2023

Big Data et discours numérique : comprendre le langage des données (4/6)


Source de données
Une source de données est l'emplacement principal d'où proviennent les données, par exemple d'une base de données, d'une feuille de calcul ou d'un flux de données.
 
Visualisation des données
La visualisation des données consiste à créer une représentation visuelle des données afin d'en tirer un sens ou de communiquer des informations plus efficacement.
 
Virtualisation des données
La virtualisation des données est le processus qui permet de récupérer et de manipuler différentes sources de données sans avoir à connaître les détails techniques de leur emplacement ou de leur format.
 
Désidentification
La dépersonnalisation des données consiste à supprimer les informations qui lient une personne à un élément d'information particulier.
 
Changements perturbateurs
Les bouleversements sont des changements importants et fondamentaux dans la société et les entreprises, souvent rendus possibles par de nouvelles technologies transformatrices qui créent un contexte entièrement nouveau pour la façon dont nous travaillons, vivons, jouons et créons de la valeur. L'innovation en matière de données est souvent décrite comme une technologie qui permet des changements perturbateurs.
 
Exabyte
Un exaoctet est une énorme unité de stockage de données - un 1 suivi de 18 zéros. Pour situer le contexte, nous créons aujourd'hui un exaoctet de nouvelles informations par jour.
 
Hadoop
Hadoop est un logiciel libre qui a été conçu pour permettre le traitement et le stockage d'énormes quantités de données dans des systèmes de fichiers distribués.
 
L'internet des objets
L'internet des objets décrit un monde où les appareils ordinaires sont rendus beaucoup plus intelligents et connectés à l'internet pour étendre la révolution intelligente de la paume de nos mains au monde qui nous entoure. Comme tout ce qui peut être connecté le sera, certains l'ont décrit avec plus de justesse comme l'internet de tout. Selon une estimation, nous n'avons connecté qu'environ 1 % des choses qui peuvent l'être dans le monde. D'ici 2020, on estime que 50 milliards d'appareils seront connectés à l'internet.
 
Système patrimonial
Un système existant est un ordinateur, une application ou une technologie qui est dépassé ou obsolète, mais qui continue d'être utilisé parce qu'il remplit une fonction nécessaire de manière adéquate.
 
Apprentissage automatique
L'apprentissage automatique est l'utilisation d'algorithmes permettant à un ordinateur d'analyser des données dans le but d'"apprendre" à partir de l'expérience les actions à entreprendre lorsqu'un modèle ou un événement spécifique se produit.
 
Métadonnées
Les métadonnées sont les données relatives aux données. Elles peuvent comprendre des informations sommaires de base sur les données, telles que l'auteur des données, la date de création, la taille du fichier et la date de la dernière modification.
 
Détection des valeurs aberrantes
Une valeur aberrante est une donnée qui s'écarte de manière significative de la moyenne générale au sein d'un ensemble de données plus large. Elle est numériquement éloignée du reste des données et, par conséquent, la valeur aberrante indique qu'il se passe quelque chose et nécessite donc généralement une analyse supplémentaire (voir également Détection des anomalies). (Voir également Détection d'anomalie).

Les commentaires de cette actualité sont fermés

0 Commentaire

Aucun commentaire