DQM Déduplication

Tout responsable de Base de Données traque les doublons, sa hantise.

En effet, l’opérateur de saisie, lorsqu’il ajoute un enregistrement, cherche rarement s’il existe déjà dans la base, a fortiori si cette dernière est importante.

Il en est de même lors de la fusion de fichiers car il est fréquent de constater que la détection de doublons n’a pas réellement bien fonctionné.

Le doublon reste l’un des fléaux les plus importants de la Base de Données.
Il est à l’origine de nombreuses erreurs :

si un même client est présent plusieurs fois dans la Base de Données, il sera impossible d’en avoir une idée bien précise car tous les différents historiques sont indépendants les uns des autres,
le nombre de clients est surestimé tout comme le taux de pénétration ...
inutile de rappeler les conséquences d’envois multiples à un même client ou prospect.

Plus les points d’alimentation d’enregistrements sont nombreux, plus ces dysfonctionnements se multiplient et s’amplifient.

L’innovation

CBC DEVELOPPEMENT a conçu et mis au point un algorithme exclusif permettant d’obtenir des résultats qui dépassent les limites des « matchcodes » classiques.

Par expérience, nous savons qu’une déduplication BtoB n’a rien à voir avec une déduplication BtoC et nos méthodes et outils en tiennent compte.

De la même manière, il est nécessaire d’analyser précisément les sources de données qui, elles aussi, peuvent nécessiter l’adaptation des méthodes de déduplication à appliquer.

Et enfin, lorsqu’il est utilisé en temps réel, le service DQM Déduplication est en mesure de mettre ses méthodes à la disposition d’une Base de Données distante.

En pratique

Il existe deux contextes d’utilisation de DQM Déduplication :

quand, en temps réel, on veut éviter la création « d’un » doublon,
quand, en prestation de services, sur la base d’un ou plusieurs fichiers à optimiser, on doit mettre en évidence les exemplaires multiples.

Dans ce second cas et après le regroupement des doubles, d’autres étapes peuvent se nécessiter :

le choix, éventuellement multi-critères, de l’enregistrement maître,
l’enrichissement conditionnel  de l’enregistrement maître par les informations contenues dans les doublons,
et tout ce qui est de nature à faciliter la réintégration des résultats ...
Modalités

CBC DEVELOPPEMENT met à disposition ce service en quatre circonstances :

lors d’une prestation de services « ponctuelle »,
dans le cadre d’une prestation de services récurrente sur la base de fichiers envoyés et traités automatiquement,
pour une intégration dans le Système d’Information lors d’une utilisation temps réel, à l’unité ou par lots distants,
pour une intégration dans les univers Microsoft, Oracle et Salesforce, sous la forme d’accès webservices « prêts à l’emploi ». 

Dans ces deux derniers cas, il est fortement suggéré de traiter l’intégralité du stock afin d’homogénéiser le niveau de qualité de l’ensemble de la Base de Données.
Lorsque DQM Déduplication doit être utilisé en temps réel, le principe de tarification est le suivant :

un coût d’initialisation permettant, si nécessaire, d’adapter les méthodes aux spécificités des données,
un abonnement, en fonction de la taille de la Base de Données,
le nombre de requête est illimité.

Lorsque DQM Déduplication doit être utilisé en prestation de services, la tarification est déterminée par un devis préalable.

C’est le cas, par exemple, des fusions et migrations de données.