Reconnaissance des formes
La reconnaissance des formes est le processus de recherche et d'identification de formes dans les données. Il peut s'agir d'un processus simple, comme l'identification d'un ensemble de séquences répétées dans une séquence d'ADN, ou de la recherche d'un modèle dans la manière dont deux ensembles de données interagissent pour découvrir s'il existe un modèle reliant un événement à un autre, ou encore, avec l'aide de l'apprentissage automatique, de la recherche de modèles plus complexes, comme la recherche de caractères numériques dans une image.
Pétaoctet
Un pétaoctet est une énorme mesure de la capacité de stockage représentée par un 1 suivi de 15 zéros, soit un million de gigaoctets. Un pétaoctet représente environ quatre fois la quantité de données contenues dans la Bibliothèque du Congrès.
Analyse prédictive
L'analyse prédictive consiste à utiliser des algorithmes logiciels sur un ou plusieurs ensembles de données pour prédire des tendances ou des événements futurs. Lorsque les données du présent peuvent être comparées à celles du passé, elles peuvent souvent être utilisées pour prédire l'avenir.
Modélisation prédictive
La modélisation prédictive est le processus d'élaboration d'un modèle qui permettra très probablement de prédire une tendance, un comportement futur ou un résultat - souvent en comparant des événements actuels à des événements passés.
Données en temps réel
Les données en temps réel sont des données qui sont exploitées dès leur création. Elles sont souvent créées, traitées, stockées et analysées en quelques millisecondes. Les données en temps réel peuvent aller des cours de la bourse à la vitesse d'une roue utilisée dans le système de freinage antiblocage d'une voiture.
Moteur de recommandation
Un moteur de recommandation est un algorithme informatique qui fait des recommandations, des suggestions ou qui peut personnaliser quelque chose pour vous sur la base d'une variété de modèles de données souvent dérivés de techniques d'apprentissage automatique.
Analyse de régression
L'analyse de régression est un processus statistique permettant d'utiliser des données pour estimer la relation entre deux ou plusieurs variables.
Analyse des risques
L'analyse des risques est l'utilisation d'outils d'analyse de données logicielles pour identifier les risques probables d'un projet, d'une action ou d'une décision. Les nouveaux outils de données peuvent aider à identifier les risques possibles en amont, à mieux modéliser une série de scénarios pour aider à réduire les risques auxquels les organisations sont confrontées, et à surveiller les systèmes pour identifier les problèmes si les choses commencent à déraper.
Analyse des causes profondes
L'analyse des causes profondes est une méthode de résolution des problèmes qui consiste à examiner la relation entre la cause et l'effet afin d'identifier la cause profonde d'une défaillance ou d'un problème. La cause est une cause première si, une fois retirée d'une séquence d'événements, elle empêche l'événement indésirable de se reproduire.
Données semi-structurées
Les données semi-structurées ne sont pas structurées par un modèle de données formel, comme ceux utilisés dans les bases de données, mais fournissent d'autres moyens de décrire les données et les hiérarchies. Les données semi-structurées utilisent souvent des balises ou d'autres marqueurs de données dans ce que l'on appelle parfois une structure auto-descriptive.
Small data : données en petite quantité
Les petites données consistent à exploiter même de petites quantités de données, comme celles contenues dans une enquête auprès des clients, afin d'obtenir des résultats exploitables. Il s'agit généralement de données dont la taille est suffisamment petite pour qu'un être humain puisse les comprendre et les analyser.