Que l’on soit novice ou un pro de la data, difficile de nier la difficulté que l’on peut rencontrer à maîtriser l’ensemble de ses termes. Comment trouver une bonne définition de la data, des mégadonnées, ou même de l’Intelligence Artificielle ? Pour ceux qui veulent en faire leur métier, il est parfois difficile de naviguer dans le vaste paysage de la data.
Pourtant, il est crucial de s’accorder sur des définitions communes, ne serait-ce que pour se comprendre. Mais aussi pour façonner cette nouvelle Terra Incognita et s’assurer qu’elle se démocratise sans trop d’accrocs.
Ce petit lexique a donc pour but de démystifier les 20 termes les plus fréquemment utilisés dans le monde de la donnée. Ils sont regroupés en quatre grandes catégories : l’ingénierie des données, la business intelligence, la science des données et la prise de décision basée sur les data !
Le lexique de la Data Engineering
L’ingénierie des données est une discipline qui se concentre sur l’identification des sources, la collecte et le stockage des données. C’est le précurseur de toutes les autres disciplines de la data.
En terme de définition, il est important de connaître :
L’algorithme : une procédure, ou un ensemble de règles qui permettent de résoudre un problème particulier.
La gouvernance des données : un ensemble de pratiques qui permettent aux parties prenantes d’une organisation d’identifier et de répondre à leurs besoins en matière d’information.
La Data Warehouse (ou entrepôt de données) : un référentiel commun qui permet d’unifier la manière dont les données sont analysées et utilisées pour prendre des décisions éclairées.
Data Fabric : un ensemble de services de données permettant d’offrir des fonctionnalités cohérentes. Cette architecture unifiée intègre la gestion des données dans le cloud et sur site pour accélérer la transformation digitale d’une organisation. Elle permet ainsi de fluidifier l’accès et le partage des données dans un environnement distribué.
Le cloud computing, qui décrit les ressources informatiques stockées et exécutées sur des serveurs distants. Les ressources, y compris les logiciels et les données, sont accessibles depuis n’importe quel appareil connecté à Internet.
La définition de la data en matière de Business Intelligence
La Business Intelligence est la discipline qui consiste à analyser et transformer des données pour en extraire des informations commerciales pertinentes et permettre une meilleure prise de décision.
Pour en maîtriser le jargon, il faut connaître les définitions de :
Data mining : un processus d’extraction qui permet notamment de mettre en lumière des modèles dans un grand ensemble de données. Le Data mining implique d’utiliser des méthodes à l’intersection entre l’apprentissage automatique, les statistiques, et les systèmes de base de données ;
Reporting MIS (pour Management Information Systems). C’est le processus par lequel une entreprise peut obtenir les informations nécessaires pour exécuter ses activités commerciales quotidiennes. Il sert également à surveiller ses progrès. Ainsi, on peut mettre en place un reporting MIS dans des domaines comme la comptabilité, le management, mais aussi l’inventaire.