data_hierarchy_diagram

Retour aux Bases: Classification des Données – Transactionnelles, Master, Golden, Référence

La Gestion des Données est simplissime … avec les bonnes bases!

Cet article survole la classification des données d’entreprise, décrit les différentes catégories de données (de reporting, transactionnelles, master, de référence et métadonnées) et explique pourquoi les données master et de référence ont une position clé dans cette organisation.

Catégories de Données

La classification suivante des données est acceptée dans le champ de la gestion des données. Elle est apparue par le passé sous la forme d’une pile, d’une pyramide et même d’un diamant, comme représenté ci-dessous; Indépendamment de la forme, la liste d’éléments reste plus ou moins la même.

Jetons un œil à ces différentes catégories de données.

Les Données Transactionnelles

Les données transactionnelles décrivent les évènements métier (ou transactions). Elles représentent le plus grand volume d’information de l’entreprise. Les exemples d’évènements métier incluent:

  • l’achat de produits de fournisseurs,
  • la vente de produits à des clients,
  • l’envoi de biens sur des sites clients,
  • l’embauche, la gestion des vacances ou l’évolution de carrière des employés.

Vous manipulez des données transactionnelles tous les jours ! Elles font tourner votre société.

Les données transactionnelles sont manipulées dans les applications opérationnelles, que nous connaissons sous des acronymes variés du type CRM, ERP, SCM, RH, etc.

Données Master (Master Data)

Les Données Master sont des informations qui sous-tendent les évènements métier.
Les Données Master décrivent les clients, produits, pièces, employés, fournisseurs, site,… impliqués dans les transactions. Elles sont communément classifiées en emplacements (sites, organisations géographiques, etc.), tiers (contacts, clients, fournisseurs, employés, etc.) et choses (produits, pièces, éléments, véhicules, etc.).

Note: Les Données Master sont nommées incorrectement en Français données de référence ou données référentielles. Ceci est source de confusion pour la traduction du concept Anglais de Reference Data décrit plus loin. Plutôt que de complètement franciser le terme en « données maîtres » ou « données maîtresses » (sic!), je préfère me tenir à une demi-traduction. Mes excuses aux puristes.

Les Données Master existent et sont utilisées dans les systèmes opérationnels, avec certains problèmes. Les données master dans ces systèmes sont:

  • D’une qualité relative,
  • Disséminées et dupliquées,
  • Non gérées (gouvernées) systématiquement.

Les données master sont habituellement créées et éditées au cours de processus opérationnels (les business process). Malheureusement, les processus opérationnels font un usage spécifique, opérationnel et applicatif des données master et par conséquent ne parviennent pas à atteindre les besoins globaux de l’entreprise en terme de master data, notamment en termes de qualité et de gouvernance.

Données de Référence (Reference Data)

Ce sont des données référencées et partagées par un certain nombre de systèmes. Elles font référence à des concepts qui impactent directement les processus métiers – par exemple, l’état d’une commande (CRÉÉE | APPROUVÉE | REJETÉE | etc.) – ou qui sont utilisés comme une sémantique standard qui clarifie l’interprétation d’un enregistrement – par exemple, la qualification du poste d’un employé (JUNIOR | SENIOR | EXPERT | etc.).

Certaines données de référence sont universelles et/ou standardisées (par exemple, la liste des pays – ISO 3166-1). D’autres relèvent du consensus au sein l’entreprise (statut du client) ou au sein de son domaine d’activité (classification des produits).

Les données de références sont souvent considérées comme un sous ensemble des données master. Leur nom devrait être Données Master de Référence (Master Reference Data).

Données de Reporting

Ces données sont (pour simplifier) organisées à des fin de reporting et de business intelligence. Les données pour le reporting opérationnel ou le reporting de haut niveau (hautement agrégées) entrent dans cette catégorie.

Les données de reporting sont créées à partir des données transactionnelles, les données master et les données de référence.

Métadonnées

Toutes les catégories de données décrites ci-dessus sont « structurées » ou « semi-structurées ». La description de leur structure et de leur signification compose les métadonnées.

Les « Autres Données »

D’autres appellations incluent le mot « données » et doivent être mentionnées:

  • Données Non Structurées sont des données qui n’ont pas de format prédéfini. Ce type réfère principalement à des documents. Par exemple, un document PDF entre dans cette catégorie. Des domaines comme le Text Mining visent à extraire des informations utiles et structurées de ce type de document.
  • Big Data ne se réfère pas à une catégorie ou une structure de données, mais plutôt à une volumétrie. Comprenez ce concept comme « un volume de donnée si gigantesque que les méthodes de processing classiques ne peuvent plus être utilisées ». Dans cette catégorie, on retrouve les logs de site web, les contenus des pages web à une grande échelle, les flux des réseaux sociaux, les informations de radio-identification (RFID), etc.

Quel est le Problème des Données Master ?

Comme indiqué plus tôt, les Données Master sont créées et modifiées dans les systèmes opérationnels, mais ne sont pas toujours assez précises et complètes pour couvrir tous les besoins.

Par exemple, un processus de commande par téléphone ira au-delà de la simple récupération d’informations sur la commande. Les adresses de facturation et de livraison seront saisies avec la commande. Par contre, l’adresse email, comme elle n’est pas nécessaire pour ce processus, ne sera pas capturée. Un processus d’enregistrement sur le web se focalisera sur la qualité de l’adresse email, mais ne garantira pas la qualité du numéro de téléphone, etc. Les données saisies dans les applications sont pertinentes pour le scénario d’utilisation de chaque application. Au niveau de l’entreprise, un Donnée Master décrivant un client devrait inclure des adresses de livraison/facturation précises, ainsi qu’un email et un numéro de téléphone valide.

Dans l’organisation des données, les données transactionnelles et de reporting s’appuient sur les Données Master (et de Référence). Par conséquent, de mauvaises données master se reflètent dans des rapports non fiables et des pertes d’efficacité opérationnelle.

Donnée Golden

Note: Désolé encore pour l’anglicisme, mais « Données Dorées » sonne décidément très mal !

Maintenant, imaginez une base qui contiendrait les enregistrements des clients (ou des produits, des employés,…) avec:

  • Toutes les informations nécessaires (consolidées à partir des différentes sources opérationnelles),
  • Uniquement des informations valides (sans adresse incorrecte ou d’email qui reviennent en erreur),
  • Aucun doublon.

Cette base serait une mine d’or, contenant des Données Golden.

Les Données Golden sont une version nettoyée, dé-doublonnée, consolidée et validée des données master. Certaines personnes les nomment (avec les majuscules) « Version Unique de la Vérité » (Single Version of Truth) ou « Vision à 360° » (360° Customer View).

Comme vous pouvez l’imaginer ces données golden ont une valeur énorme pour toutes les applications (Décisionnelles, Opérationnelles et autres). Elles lèvent en outre de nouveaux défis, que je discuterai dans de futurs articles.

3 replies
  1. BEKRI
    BEKRI says:

    Un article très claire et bien cohérent touts mes remerciement et bonne continuation, j’attends la suite avec impatience

    Répondre

Leave a Reply

Want to join the discussion?
Feel free to contribute!

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *