ÉTUDE DE CAS

Comment nous avons nettoyé
135 000 contacts dans un CRM
en 13 jours

Le défi

Notre client, une PME SaaS en forte croissance (50 collaborateurs, 3M€ de CA), faisait face à plusieurs défis majeurs avec son CRM HubSpot contenant 135 000 contacts accumulés sur 5 ans :

  • Données obsolètes massives : 65% des contacts avaient des informations incomplètes ou périmées (postes obsolètes, personnes ayant changé d’entreprise, coordonnées invalides).
  • Délivrabilité en danger : 12% de taux de rebond sur les campagnes email menaçait la réputation d’expéditeur et la capacité à atteindre les prospects.
  • Temps commercial gaspillé : Les commerciaux perdaient 40% de leur temps (280h/mois) à chercher manuellement les bonnes informations au lieu de vendre.
  • Opportunités manquées : Impossibilité de qualifier correctement les leads et de prioriser les contacts à forte valeur faute de données fiables.

L’objectif

Développer une stratégie digitale complète pour positionner l’entreprise comme leader de son secteur tout en automatisant l’enrichissement de contenu.

Notre méthode

  • Stratégie de contenu (blog, ghost writing dirigeant, lead magnet,…)
  • Collecte et enrichissements des données via knowledge base et automatisation

Notre approche

1. Audit & connexion intelligente (Jour 1-2)

Diagnostic complet du CRM
→ Création d’un rapport HubSpot pour identifier les 87 450 contacts avec données manquantes ou obsolètes
→ Priorisation des champs à forte valeur : titre, email vérifié, LinkedIn,
téléphone, taille entreprise
→ Nettoyage des valeurs aberrantes (« unknown », « N/A », « 1234 »)
→ Création des propriétés custom de traçabilité

Connexion HubSpot ↔ Clay
→ Intégration native sans export/import manuel
→ Création de « active lists » segmentées (ex: contacts sans téléphone mais avec LinkedIn)
→ Import dans Clay avec l’ID HubSpot comme clé unique pour éviter les doublons

2. Validation & vérification (Jour 2-5)

Validation ICP systématique

Avant tout enrichissement, vérification automatique des critères ICP (taille, secteur, poste, localisation).

Hors ICP ? Marqué « hors scope » (18 750 contacts exclus)
Dans l’ICP ? Workflow continue (116 250 contacts traités)

Vérification des postes via LinkedIn

Clay interroge LinkedIn pour vérifier si chaque personne occupe toujours le même poste.

Toujours au même poste ? On passe au suivant
Changement détecté ? Mise à jour intelligente (poste seul ou poste + entreprise)

Résultat : 23 400 contacts mis à jour, économie de crédits sur les contacts déjà valides.

3. Enrichissement & nettoyage (Jour 2-13)

Waterfall multi-sources

Configuration d’un enrichissement en cascade pour maximiser la complétude :

  • Emails : Fullenrich → Icypeas → People Data Labs
  • Titres : LinkedIn → Apollo → LeadMagic
  • Téléphones : LeadMagic → Fullenrich → Nimbler

Le waterfall s’arrête dès qu’une source valide répond (économie de ~40% sur les crédits).

Nettoyage IA automatisé

Utilisation de Claygent (GPT) pour normaliser :

  • Titres : retirer parenthèses, harmoniser les formats
  • Téléphones : format international unifié +33xxxxxxxxx

Filtrage qualité
→ Exclusion des doublons
→ Validation emails via ZeroBounce (seuls « valid » et « catch-all » gardés)
→ Suppression de 11 234 emails invalides avant envoi

Résultat : Taux de complétude de 76-89% selon les champs, 0 doublon créé.

4. Push sécurisé & traçabilité

Mapping protégé

Règle stricte : « Écrire seulement si le champ CRM est vide » pour ne jamais écraser une donnée déjà bonne.

→ Test sur 100 contacts avant déploiement massif
→ 0 donnée écrasée par erreur

Mise à jour automatisée

→ Push en temps réel vers HubSpot via l’action « Update Object »
→ 10 385 contacts/jour traités en moyenne
→ 135 000 contacts mis à jour en 13 jours

Traçabilité complète

→ Ajout colonne « Clay_batch_source » pour identifier l’origine
→ Création de rapports HubSpot (champs enrichis, taux de complétude, revenus générés)
→ Échantillonnage 2-5% pour validation qualité manuelle

5. Maintenance automatisée (Ongoing)

  • Cycle mensuel : Enrichissement nouveaux contacts + mise à jour « Last enriched date »
  • Cycle trimestriel : Audit doublons + ajustement waterfall selon performance fournisseurs
  • Règle d’économie : Ne jamais ré-enrichir si « Last enriched date » < 30 jours
  • Résultat : CRM qui reste propre dans le temps sans intervention manuelle.

Les résultats

+ 87 %

de contacts enrichis
avec toutes les données essentielles

/4

le taux de rebond email
De 12% à 3% de rebond

x 4,5

le taux de prise de RDV

Les enseignements clés

  1. L’automatisation intelligente permet de traiter des volumes impossibles à gérer manuellement
  2. La qualité des données est cruciale pour un enrichissement pertinent.
    Valider l’ICP avant d’enrichir permet d’économiser ~40% des crédits
  3. Une approche multicanale (waterfall) démultiplie les résultats
    Aucune source de données n’a 100% de couverture. Le waterfall compense les faiblesses de chaque fournisseur et atteint 76-89% de complétude selon les champs.
  4. L’expertise sectorielle combinée à la technologie crée un avantage concurrentiel durable
    Comprendre les critères ICP du SaaS B2B + maîtriser Clay + connaître les meilleures sources = résultats impossibles à reproduire avec des outils seuls.