ÉTUDE DE CAS
Comment nous avons nettoyé
135 000 contacts dans un CRM
en 13 jours
Le défi
Notre client, une PME SaaS en forte croissance (50 collaborateurs, 3M€ de CA), faisait face à plusieurs défis majeurs avec son CRM HubSpot contenant 135 000 contacts accumulés sur 5 ans :
- Données obsolètes massives : 65% des contacts avaient des informations incomplètes ou périmées (postes obsolètes, personnes ayant changé d’entreprise, coordonnées invalides).
- Délivrabilité en danger : 12% de taux de rebond sur les campagnes email menaçait la réputation d’expéditeur et la capacité à atteindre les prospects.
- Temps commercial gaspillé : Les commerciaux perdaient 40% de leur temps (280h/mois) à chercher manuellement les bonnes informations au lieu de vendre.
- Opportunités manquées : Impossibilité de qualifier correctement les leads et de prioriser les contacts à forte valeur faute de données fiables.
L’objectif
Développer une stratégie digitale complète pour positionner l’entreprise comme leader de son secteur tout en automatisant l’enrichissement de contenu.
Notre méthode
- Stratégie de contenu (blog, ghost writing dirigeant, lead magnet,…)
- Collecte et enrichissements des données via knowledge base et automatisation
Notre approche
1. Audit & connexion intelligente (Jour 1-2)
Diagnostic complet du CRM → Création d’un rapport HubSpot pour identifier les 87 450 contacts avec données manquantes ou obsolètes → Priorisation des champs à forte valeur : titre, email vérifié, LinkedIn, téléphone, taille entreprise → Nettoyage des valeurs aberrantes (« unknown », « N/A », « 1234 ») → Création des propriétés custom de traçabilitéConnexion HubSpot ↔ Clay → Intégration native sans export/import manuel → Création de « active lists » segmentées (ex: contacts sans téléphone mais avec LinkedIn) → Import dans Clay avec l’ID HubSpot comme clé unique pour éviter les doublons
2. Validation & vérification (Jour 2-5)
Validation ICP systématique
Avant tout enrichissement, vérification automatique des critères ICP (taille, secteur, poste, localisation).
→ Hors ICP ? Marqué « hors scope » (18 750 contacts exclus)
→ Dans l’ICP ? Workflow continue (116 250 contacts traités)
Vérification des postes via LinkedIn
Clay interroge LinkedIn pour vérifier si chaque personne occupe toujours le même poste.
→ Toujours au même poste ? On passe au suivant
→ Changement détecté ? Mise à jour intelligente (poste seul ou poste + entreprise)
Résultat : 23 400 contacts mis à jour, économie de crédits sur les contacts déjà valides.
3. Enrichissement & nettoyage (Jour 2-13)
Waterfall multi-sourcesConfiguration d’un enrichissement en cascade pour maximiser la complétude :
- Emails : Fullenrich → Icypeas → People Data Labs
- Titres : LinkedIn → Apollo → LeadMagic
- Téléphones : LeadMagic → Fullenrich → Nimbler
Le waterfall s’arrête dès qu’une source valide répond (économie de ~40% sur les crédits).
Nettoyage IA automatisé
Utilisation de Claygent (GPT) pour normaliser :
- Titres : retirer parenthèses, harmoniser les formats
- Téléphones : format international unifié +33xxxxxxxxx
Filtrage qualité → Exclusion des doublons → Validation emails via ZeroBounce (seuls « valid » et « catch-all » gardés) → Suppression de 11 234 emails invalides avant envoi
Résultat : Taux de complétude de 76-89% selon les champs, 0 doublon créé.
4. Push sécurisé & traçabilité
Mapping protégé
Règle stricte : « Écrire seulement si le champ CRM est vide » pour ne jamais écraser une donnée déjà bonne.
→ Test sur 100 contacts avant déploiement massif
→ 0 donnée écrasée par erreur
Mise à jour automatisée
→ Push en temps réel vers HubSpot via l’action « Update Object »
→ 10 385 contacts/jour traités en moyenne
→ 135 000 contacts mis à jour en 13 jours
Traçabilité complète
→ Ajout colonne « Clay_batch_source » pour identifier l’origine
→ Création de rapports HubSpot (champs enrichis, taux de complétude, revenus générés)
→ Échantillonnage 2-5% pour validation qualité manuelle
5. Maintenance automatisée (Ongoing)
- Cycle mensuel : Enrichissement nouveaux contacts + mise à jour « Last enriched date »
- Cycle trimestriel : Audit doublons + ajustement waterfall selon performance fournisseurs
- Règle d’économie : Ne jamais ré-enrichir si « Last enriched date » < 30 jours
- Résultat : CRM qui reste propre dans le temps sans intervention manuelle.
Les résultats
+ 87 %
de contacts enrichis
avec toutes les données essentielles
/4
le taux de rebond email
De 12% à 3% de rebond
x 4,5
le taux de prise de RDV
Les enseignements clés
- L’automatisation intelligente permet de traiter des volumes impossibles à gérer manuellement
-
La qualité des données est cruciale pour un enrichissement pertinent.
Valider l’ICP avant d’enrichir permet d’économiser ~40% des crédits - Une approche multicanale (waterfall) démultiplie les résultats Aucune source de données n’a 100% de couverture. Le waterfall compense les faiblesses de chaque fournisseur et atteint 76-89% de complétude selon les champs.
- L’expertise sectorielle combinée à la technologie crée un avantage concurrentiel durable Comprendre les critères ICP du SaaS B2B + maîtriser Clay + connaître les meilleures sources = résultats impossibles à reproduire avec des outils seuls.