Données dures, données molles, quelles données pour enrichir les bases clients ?

enrichissement des bases clients

Les bases de données clients comportent en général des données de contactabilité, des données transactionnelles et de réactivité. Avec la vague big data, le sujet de l’enrichissement, notamment des bases B2C, déferle dans les conversations entre marketers. Faut-il ou non enrichir les bases clients, avec quelles données et par quels moyens ? Petit tour d’horizon.

 

Pourquoi enrichir les bases clients ?

La connaissance client est souvent le premier argument mis en avant. En réalité, c’est une réponse un peu rapide.
Pour mieux mieux connaitre ses clients, globalement, ou par segments, ou points de vente… une étude de profil suffit, sans qu’il soit nécessaire de rapatrier physiquement l’information dans la base de données. Le besoin de nouvelles informations au niveau individuel répond à d’autres finalités, comme le ciblage ou la personnalisation.

On distingue 3 principales raisons d’enrichir une base de données clients :
contacter ses clients : avoir plusieurs moyens de contacts (téléphone, adresse postale, email) permet de multiplier ou de combiner les modes de sollicitations. Encore faudra-t-il obtenir le consentement des personnes concernées.
mieux cibler les actions commerciales : certaines données externes, permettent d’améliorer le ciblage des actions commerciales. On pense par exemple à l’âge dans le secteur caritatif, ou des informations encore plus personnelles, comme la détention d’un patrimoine, dans le secteur banque -assurances.
personnaliser les messages : il s’agit là, non pas d’envoyer moins de messages à des clients plus concernés, mais de mieux adapter les messages à la cible visée. Disposer par exemple du revenu du foyer, permet de différencier l’offre.

Pour ces 3 grandes classes d’objectifs, quelles sont les données candidates à l’enrichissement ?

Données dures, données molles, avec quelles données enrichir ?

Lorsqu’on parle d’enrichissement, on parle de données exogènes, ie non présentes dans la base .
De même qu’il existe des sciences dures (physique, mathématiques), et des sciences molles (sociologie, économie, psychologie…), on peut faire la différence entre données dures, et de données molles. Au lieu de prendre en compte les caractéristiques des données (qualitatif, quantitatif), on s’intéresse ici à leur degré de précision.

Les données dures, sont individuelles, factuelles. Ce sont par exemple, les données de contact : numéros de téléphone, adresses e-mail, adresses postales, les données socio-démo : âge, nombre d’enfants, profession, nombre d’habitants de la commune de résidence, environnement rural /urbain… On peut aussi trouver dans cette catégorie, des données attitudinales ou comportementales.
Ce sont des données disponibles en théorie pour tous les individus sans exception, mais elles sont rarement toutes disponibles pour 100% des clients.
Les données molles, moins précises, sont tout aussi importantes, sinon plus. Elles apportent un niveau de qualification plus flou, moins certain, mais très utile, et élément non négligeable, elles sont souvent exhaustives. Des exemples :
• l’âge prénom, est une estimation de l’âge à partir du prénom, qui permet d’enrichir tous les clients dès lors qu’on dispose du prénom. Cette information moins précise, parfois carrément fausse, a prouvé son utilité depuis de nombreuses années.
• selon le principe du « dis-moi où tu habites, je te dirai qui tu es« , les informations géomarketing, permettent de qualifier les individus par des informations socio-démo, à partir de l’environnement proche.
• les modèles prédictifs, les scores, sont intrinsèquement imprécis.

Selon le célèbre statisticien britannique Georges Box, « Tous les modèles sont faux ». Il ajoutait malicieusement, « mais certains sont utiles ».

Les scores permettent d’enrichir les bases clients par des appétences produits, des potentiels, des niveaux d’attachement à la marque… tous éléments probables.

Comment enrichir les bases clients

Globalement il y a 3 approches pour enrichir une base clients :
la collecte directe : c’est le cas des premières données de contact, et parfois de certaines données socio-démo ou mêmes attitudinales, via des questionnaires à remplir. La qualité des données et le taux de renseignement obtenus dépendent de l’implication du client, ou du vendeur, et de perception par le client de la pertinence des données demandées. Le procédé est simple mais long, et n’exclut pas les erreurs de saisie.
la confrontation avec un référentiel, qui peut être :
– un référentiel d’individus, en général une mégabase de données mutualisant plusieurs dizaines de fichiers clients. On y trouve des données de contacts, des données socio -démo, et des données comportementales. Cette méthode présente l’avantage d’un traitement massif et rapide, réalisé en une seule fois. La limite, compte tenu des taux de recouvrement entre les bases, est un enrichissement partiel, voire très partiel. Le coût peut aussi rapidement être un frein.
– un référentiel géomarketing, c’est à dire un référentiel non d’individus mais de zones géographiques. En traitant la totalité des adresses, l’enrichissement géomarketing est une heureuse alternative à l’enrichissement individuel. La précision de ces référentiels s’est beaucoup affinée au fil du temps : niveau communal, niveau IRIS INSEE et aujourd’hui, niveau carreau INSEE. Le coût est bien moindre que celui d’un enrichissement individuel. Autre avantage enfin, ces traitements, qui ne requièrent que l’adresse et un identifiant, échappent à toute contrainte RGPD.
la modélisation : un des moyens d’enrichissement les plus élégants, et presque magique. L’information recherchée n’existe pas, alors on la fabrique! Mais pas n’importe comment, puisqu’elle nécessite des traitements intelligents de données et la mise en oeuvre d’algorithmes prédictifs sophistiqués. Il n’y a pas ou peu de limites aux modèles prédictifs : appétence produit, potentiel client, durée de vie, sensibilité aux types de messages reçus…. Les modèles prédictifs sont construits à partir des données internes, mais peuvent aussi faire intervenir des données exogènes, encore une raison d’enrichir sa base de données. Autre avantage, une fois le modèle construit, il est déployé dans la base et mis à jour périodiquement souvent de manière autonome par l’entreprise. La construction d’un modèle prédictif est rapide et d’un coût très modéré. Pour cette raison, il est dommage que les entreprises n’y aient pas plus souvent recours.

 

En conclusion, ce qui va guider une décision d’enrichissement, c’est d’abord la finalité. Si les données dures, individuelles sont souvent prisées, elles sont parfois difficiles à obtenir. Leur coût et un taux de renseignement limité peuvent inciter les entreprises à se tourner vers d’autres modes d’enrichissement. Moins précises, mais disponibles pour 100% des clients, les données molles, par exemple géomarketing sont une alternative à prendre en considération. Enfin, les informations stratégiques telles que le potentiel, la Life Time Value, l’appétence produit, qui permettent d’orienter les actions et les investissements, qui n’existent que modélisées, devraient faire partie des premiers enrichissements à mettre en place.

COMPLEX SYSTEMS, acteur historique du data marketing, peut vous accompagner sur l’enrichissement de vos bases clients en données molles, prédictives ou géomarketing avec le référentiel Kaliscope® 1er référentiel socio-démo au niveau du carreau.

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *