Le Framework de Qualité de Données de Convergence for MDM transforme les enregistrements sources envoyés au MDM par les émetteurs (applications sources ou saisie directe de données) en enregistrements « Golden » consolidés et certifiés. Ce processus est automatisé et implique plusieurs phases générées depuis les règles et contraintes exprimées dans le modèle logique. Ce framework permet une mise en production rapide de l’implémentation MDM. Il vous permet de démarrer de manière tactique et d’impliquer le métier de manière itérative en vue de créer une synergie positive pour la mise en place de votre stratégie de gouvernance de données.

Enrichissement et standardisation

Le framework de certification de données utilise des enrichissements pour normaliser, standardiser et enrichir les données sources soumises par les émetteurs au hub. Grâce à l’utilisation des enrichissements, les données provenant des diverses sources sont amenées à un même niveau de complétude, ce qui les rend plus appropriées à la création de Master Data.

Validation qualité de données

Plusieurs types de validations de la qualité des données sont supportés par la plate-forme. Ceux-ci incluent : l’intégrité référentielle, les clés uniques, les attributs obligatoires, les listes de valeur ou encore les validations complexes. Ces validations peuvent être exécutées à plusieurs étapes du processus de certification de données. Les enregistrements qui n’atteignent pas le niveau de qualité requis sont isolés et peuvent être revus par les intendants de données.

Puissance de rapprochement de données

Les enregistrements en doublon sont détectés par le processus de certification. Le rapprochement des données utilise des algorithmes hautement optimisés. Il peut être personnalisé pour chaque entité en utilisant des expressions complexes. Ce rapprochement permet le dé-doublonnage de tout type d’entité conçu dans le hub.

Consolidation par champ ou par enregistrement

Les doublons détectés sont consolidés en enregistrements Golden par le processus de certification. La consolidation peut se faire au niveau de l’enregistrement (retenir l’enregistrement le plus pertinent) ou champ par champ (retenir la valeur la plus pertinente pour chaque champ). Plusieurs stratégies possibles sont disponibles pour la consolidation comme par exemple la fréquence d’une valeur, la complétude, la priorité des sources, la taille, etc.

Langage de manipulation de données Model-Driven

Les règles qui dirigent le processus de certification peuvent être écrites dans le langage de manipulation model-driven : SemQL. Avec SemQL, vous pouvez très simplement créer des enrichissements, des validations, des règles de rapprochement et de consolidation qui utilisent la terminologie métier telle que définie dans le modèle de données logique.

Extensibilité

Semarchy Convergence for MDM permet l’extension de ses capacités natives d’enrichissement, validation et rapprochement en utilisant l’Architecture Plug-in Ouverte. Cette architecture permet d’utiliser des produits ou services tiers fournissant des moteurs de contenu tels que Google ou Yahoo au sein même du processus de certification de données.

Matching d’adresses utilisant Convergence for Address Verification and Geocoding

L’option Convergence for Address Verification and Geocoding offre des possibilités de géolocalisation, d’enrichissement, de standardisation et de validation d’adresses postales mondiales de manière très précise avec un modèle de tarification judicieux. Elle permet au processus de certification de créer des adresses postales complètes à partir de données partielles, de valider et corriger les éléments d’adresse au niveau de la rue, et ce pour pratiquement tous les pays du monde.