So entferne ich 7.000 Duplikate aus HubSpot

Meine regelbasierten Aufräumarbeiten mit koalify und ein paar weitere Tricks.

TL;DR: Gleich zum Lösungsansatz springen.

Data Governance statt Datadumping

Ich kenne CRMs selbst von kleinen Unternehmen mit zehntausenden Firmeneinträgen und hunderttausenden von Kontakten. Resultat: Chaos!

Die Gründe dafür sind meist undifferenzierter Import großer Leadlisten oder bei Softwareherstellern auch allzu großzügige User-Synchronisation aus der eigenen Anwendung.

Für mich ist ein Datenchaos im CRM auch ein Symptom für mangelnden Fokus und veraltete Spray-and-Pray-Taktiken im Vertrieb. Deshalb ist Data Governance für die Datenhygiene entscheidend und Account-Based Marketing hilft auch dabei, das gut zu strukturieren.

Shit in / Shit out.
Gute Datenhygiene beginnt beim kontrollierten Input.

Ohne Data Governance ist kein nachhaltiges Cleanup möglich. In diesem Beitrag zeige ich aber, wie wir die einmal eingebrockte Suppe wieder auslöffeln. Speziell beim Thema Duplikate.

Duplikate in Masse entfernen

Wer tausende Duplikate im System hat, kann das nicht mehr händisch bewältigen. HubSpot bietet einen eingeschränkten „Duplicate Check“. Wer wirklich (halb-)automatisch Duplikate bereinigen will, muss den HubSpot Operations Hub kaufen oder nutzt ein Tool wie Koalify.

Koalify Setup

Primary Rules festlegen

Primary Rules legen fest, welcher Account primär behandelt wird und in den das Duplikat hinein verschmilzt.

Für Kontakte

Zuerst: Lifecycle Stage Customer,
dann wer das Last Activity Date hat.

Das bedeutet, wenn ein Kundenkontakt gewonnen wird, immer über einen Lead. Sind beide Kunden, gewinnt der Kontakt mit dem aktuelleren Datum einer Aktivität. Ich definiere noch weitere Kriterien, aber die sind spezifisch für das Unternehmen. Man muss wissen, was wichtige Datenpunkte für mein Unternehmen sind, die einen wertvollen Kontakt implizieren.

Für Unternehmen

Habe ich neben kundenspezifische Properties ebenfalls den Status als Kunde, Status in einer Lead oder Deal Pipeline, Last Activity und Last Engagement genommen.

Fuzzy Rules

Damit lässt sich einstellen, ob ähnliche Name oder Dinge wie Domain Extension (zB derfabian.at und derfabian.eu) als Duplikate zählen sollen.

Bei einer großen Aufräumaktion würde ich alle aktivieren.

Duplicate Rules

Hier kann man exakt festlegen, wann ein Kontakt als Duplikat zählt. Etwa bei Kontakten, wenn es einen Match gibt bei E-Mail.

Ich nutze immer zwei Kriterien fürs Matching. Etwas Namensgleichheit bei Kontaktnamen und Firmennamen.

Property Sync

Standardmäßig lassen sich Assoziierungen nicht fürs Matching nutzen. Ich kann also nicht sagen, zeige mir Kontakte mit gleichen Namen an, die mit derselben Firma verknüpft sind.

Das lässt sich allerdings mit einem sogenannten “Property Sync” Property in HubSpot lösen. Damit wird etwa die Record ID einer Firma auf allen assoziierten Kontakte übertragen. Diese Property lässt sich dann wieder matchen.

Das ist insofern wichtig, weil koalify nicht artverwandte Domain Extension matchen kann wie etwa und .

Wenn beide Kontakte mit diesen E-Mails aber derselben Firma zugeordnet sind, dann hilft “Property Sync”. Hier ein Hilfsartikel zu Property Sync von kaolify.

HubSpot Duplicate Check von Auto Clicker

Die Duplikate-Prüfung von HubSpot schafft es hingegen schon, etwa artverwandte Domain Extension zu matchen. Natürlich in einem gewissen Umfang mit False Positives.

Ohne Operations Hub muss ohnehin jeder Merge mit Klick bestätig werden. Keine “Bulk-Edits” möglich.

Ein Weg drumherum ist, sich eine Browser-Erweiterung wie Auto Clicker zu installieren, das Klicks simulieren kann.

Ich nutzte das, nachdem die meisten Duplikate schon mit koalify bereinigt wurden und unter Ausschluss von Kundenkontakten und -firmen.

7000 Merges später

Über 7000 Duplikate konnte ich bereinigen. Das macht die tägliche Arbeit im CRM wieder wesentlich einfacher. Wichtig aber ist auch gleich an einer sinnvollen Data Governance zu arbeiten, damit diese Probleme sich nicht mehr wiederholen.

Fabian Greiler

Fabian Greiler

Ich baue Marketing Automations und GTM Motions für B2B SaaS & AI. Beruflich wie privat prägen diese vier Prinzipien mein Weltbild.

🟣 Pending (bot is replying) 🟢 Open (live agent connected)