Agglomeratives hierarchisches Clustering: Der umfassende Leitfaden 2026

Business

Erfahren Sie, was agglomeratives hierarchisches Clustering ist, wie es funktioniert und wie Sie es in Ihrem Unternehmen anwenden können. Ein umfassender Leitfaden mit Beispielen in Python.

Agglomeratives hierarchisches Clustering: Der umfassende Leitfaden 2026

Fabio Lauria

CEO und Gründer von ELECTE

Fassen Sie diesen Artikel mit AI zusammen

Dein CRM ist voll mit Kontakten, der Bestellhistorie deines E-Commerce-Shops, Daten zu Marketingkampagnen, Support-Tickets und vielleicht sogar Excel-Tabellen, die von verschiedenen Teams erstellt wurden. Alles ist vorhanden. Alles ist nützlich. Aber oft ist alles durcheinander.

Für viele KMU ist nicht der Mangel an Daten das Problem, sondern der Mangel an Struktur. Ein Retail-Manager möchte herausfinden, welche Kunden ein ähnliches Kaufverhalten zeigen. Ein Betriebsleiter möchte sehen, welche Produkte sich gemeinsam verkaufen. Ein Finanzteam möchte normales Verhalten von solchen Abweichungen unterscheiden, die besondere Aufmerksamkeit erfordern. Ohne eine klare Methode bleiben die Daten ein Archiv, anstatt als Leitfaden zu dienen.

Hier kommtdas agglomerative hierarchische Clustering ins Spiel. Es handelt sich um eine Technik des maschinellen Lernens, die Beobachtungen in Gruppen organisiert, indem sie eine Hierarchie von unten nach oben aufbaut. Das ist keine neue Erfindung. Es handelt sich um eine etablierte Technik: Sie wurde in den 1960er Jahren eingeführt und in Italien bereits 1985 in einem Projekt zu sozioökonomischen Daten angewendet, bei dem 50 Regionen auf 7 Hauptcluster reduziert wurden (Referenz hier). Das ist wichtig, weil es eine einfache Tatsache verdeutlicht: Wenn Daten chaotisch erscheinen, kann das hierarchische Clustering eine erkennbare Struktur offenbaren.

Wenn du dir zunächst einen umfassenderen Überblick über die Datennutzung im Unternehmen verschaffen möchtest, ist dieser Leitfadenzur Unternehmensdatenanalyse eine hervorragende Ergänzung.

Inhaltsverzeichnis

Einleitung: Vom Datenchaos zur strategischen Klarheit
Was unterscheidet diese Methode von anderen?

Erste Frage: Wie misst man die Ähnlichkeit?
Zweite Frage: Wie verbindet man zwei Cluster?
Vergleich der Verknüpfungsmethoden
Wie man die Wahl entsprechend dem Unternehmenskontext trifft
Ein konkretes Beispiel
Auch der Rechenaufwand spielt eine Rolle

Wie man ein Dendrogramm ohne unnötige Fachausdrücke liest
So wählen Sie den Schnittpunkt aus

Die Daten richtig aufbereiten
Einfaches Implementierungsbeispiel
Die drei Entscheidungen, auf die es wirklich ankommt

Kundensegmentierung, die dem Marketing wirklich nützt
Produkte und Lagerbestand
Finanzrisiko und Cybersicherheit

Wo ein internes Team tatsächlich ins Stocken gerät
Was ändert sich durch einen automatisierten Workflow?

Schlussfolgerungen und wichtige Punkte, die man sich merken sollte

Einleitung: Vom Datenchaos zur strategischen Klarheit

Montagmorgen. Der Vertriebsleiter öffnet das CRM, die Marketingabteilung prüft Kampagnen mit sehr unterschiedlichen Ergebnissen, die Logistik meldet Produkte mit unvorhersehbaren Umschlagzeiten. Die Daten sind vorhanden, aber es fehlt eine aussagekräftige Übersicht, um Entscheidungen zu treffen.

An dieser Stelle beginnt ein KMU-Manager, sich die richtigen Fragen zu stellen. Welche Kunden weisen tatsächlich ähnliche Verhaltensweisen auf? Welche Produkte verdienen eine eigene Strategie? Welche Standorte oder Geschäftsbereiche sollten nach unterschiedlichen Kriterien geführt werden, auch wenn sie heute alle in demselben Bericht zusammengefasst sind?

Das agglomerative hierarchische Clustering dient dazu, dieses Durcheinander in eine übersichtliche Struktur zu verwandeln. Anstatt von vornherein festgelegte Kategorien aufzuzwingen, ordnet es die Elemente nach Ähnlichkeit und zeigt, wie sich die Gruppen Schritt für Schritt herausbilden. Das Ergebnis ist nicht nur eine statistische Übung. Es ist eine konkrete Hilfe für die Marktsegmentierung, operative Prioritäten und Positionierungsentscheidungen.

Für ein Unternehmen kommt es nicht darauf an, den Namen des Algorithmus zu kennen. Es geht vielmehr darum, drei praktische Hebel richtig einzusetzen: die für den jeweiligen Fall geeignete Verknüpfungsmethode auszuwählen, ein Dendrogramm zu lesen, ohne sich in technischen Details zu verlieren, und zu verstehen, an welcher Stelle die Hierarchie aufgeteilt werden muss, um für das Geschäft nützliche Cluster zu erhalten.

Hierin liegt der Unterschied zwischen einer akademischen Herangehensweise und der Anwendung von Clustering im Management.

Wenn Sie bereits an der Segmentierung, Berichterstellung oder Analyse von Unternehmensdaten arbeiten , um schnellere und fundiertere Entscheidungen zu treffen, hilft Ihnen diese Methode dabei, Zusammenhänge zu erkennen, die in Excel-Tabellen verborgen bleiben. Und mit Tools wie ELECTE kann auch ein KMU ohne ein Team von Datenwissenschaftlern diesen Ansatz in seine täglichen Prozesse integrieren – von der Datenauswertung bis hin zur operativen Entscheidung.

Was ist agglomeratives hierarchisches Clustering und wie funktioniert es?

Das agglomerative hierarchische Clustering beginnt von unten. Jeder Datensatz beginnt als eigenständige Gruppe. Anschließend vergleicht der Algorithmus die Ähnlichkeiten, führt die beiden ähnlichsten Elemente zusammen und wiederholt diesen Schritt, bis eine vollständige Hierarchie aufgebaut ist.

Für ein KMU ist dieser Ansatz nützlich, da er einen realistischen Entscheidungsprozess widerspiegelt. Zu Beginn weißt du noch nicht, wie viele Segmente du tatsächlich benötigst. Du weißt lediglich, dass sich einige Kunden ähnlich verhalten, dass bestimmte Produkte vergleichbare Muster aufweisen und dass es sich lohnt, bestimmte Geschäftsbereiche gemeinsam zu betrachten. Das agglomerative Clustering ordnet diese Zusammenhänge, ohne dass du dich sofort auf eine bestimmte Anzahl von Gruppen festlegen musst.

Ein älterer Mann, der ein blaues Buch aus einem Regal einer gut sortierten Hausbibliothek auswählt.

Die Funktionsweise ist einfach:

Jede Beobachtung steht für sich allein. Ein Kunde, ein Produkt oder eine Transaktion bilden jeweils eigene Cluster.
Es wird berechnet, wie unterschiedlich zwei Elemente oder zwei Gruppen sind.
Die nächstgelegenen Cluster werden gemäß der gewählten Regel zusammengefasst.
Die Struktur wird aktualisiert und der Vergleich wird wiederholt.
Man fährt fort, bis man einen einzigen hierarchischen Baum erhält, der alle möglichen Gruppierungen anzeigt.

An dieser Stelle entsteht oft Verwirrung. Der Algorithmus liefert nicht sofort „die 4 richtigen Cluster“ oder „die 6 korrekten Segmente“. Er erstellt zunächst eine Nachbarschaftskarte. Die Entscheidung darüber, wie viele Gruppen beibehalten werden sollen, erfolgt erst später, wenn man diese Hierarchie im Hinblick auf das Geschäftsziel auswertet.

Ein Beispiel verdeutlicht dies. Wenn Sie Ihren Kundenstamm analysieren, stellen Sie möglicherweise fest, dass sich einige Kunden hinsichtlich der Kaufhäufigkeit ähneln, andere hinsichtlich des Durchschnittswerts und wieder andere hinsichtlich der saisonalen Schwankungen. Beim agglomerativen Clustering müssen Sie sich nicht sofort für eine Detailebene entscheiden. Es zeigt Ihnen sowohl Mikrogruppen, die für gezielte Kampagnen nützlich sind, als auch Makrosegmente, die für die Festlegung von Budgets, Serviceleistungen und geschäftlichen Prioritäten hilfreich sind.

Was unterscheidet diese Methode von anderen?

Der praktische Unterschied zu Methoden wie k-Means ist einfach. Bei k-Means muss man zunächst festlegen, wie viele Cluster man finden möchte. Beim agglomerativen hierarchischen Clustering baut man eine Hierarchie auf und entscheidet erst danach, wo man aufhören möchte.

Für einen Manager macht das einen großen Unterschied. Es bedeutet, von einer offenen Frage ausgehen zu können und nicht von einer vorab angenommenen Antwort. Wenn das Vertriebsteam vermutet, dass es verschiedene Kundenprofile gibt, aber noch nicht weiß, wie viele es genau sind, bietet diese Methode einen nützlicheren Ansatzpunkt für die Erörterung einer Strategie.

Es gefällt auch aus einem anderen Grund. Das Ergebnis ist gut nachvollziehbar. Man erhält nicht nur endgültige Bezeichnungen für die Datensätze, sondern einen Ablauf, der Schritt für Schritt zeigt, wie sich die Gruppen bilden. Genau diese hierarchische Struktur macht die Methode für unternehmerische Entscheidungen interessant, da sie die statistische Analyse mit einer konkreten Entscheidung verknüpft: wo es sinnvoll ist, Gruppen zu trennen, um verwertbare Erkenntnisse zu gewinnen.

Faustregel: Verwende hierarchisches Clustering, wenn du die Datenstruktur untersuchen möchtest, bevor du feste operative Segmente definierst.

Wenn du diesen Ansatz mit anderen Algorithmen des maschinellen Lernens für verschiedene geschäftliche Probleme vergleichen möchtest, ist es sinnvoll, sie anhand der Entscheidung zu bewerten, die du treffen musst, und nicht nur anhand der Technik.

Distanzmaße und Verknüpfungsmethoden – Die Entscheidung, die Ihre Cluster bestimmt

Zwei Unternehmen können denselben Algorithmus verwenden und dennoch zu sehr unterschiedlichen Segmentierungen gelangen. Der Grund dafür liegt fast immer darin, wie der Abstand gemessen wird und wie entschieden wird, welche Gruppen zusammengeführt werden sollen.

Infografik zur Erläuterung der Distanzmaße und Verknüpfungsmethoden für die hierarchische Clusteranalyse.

Für einen Manager eines KMU ist dies keine technische Feinheit. Es ist eine Entscheidung, die sich auf das Betriebsergebnis auswirkt. Sie kann zu nützlichen Clustern für Marketingkampagnen und die Preisgestaltung führen – oder zu unübersichtlichen Gruppen, die das Team nicht nutzen kann.

Erste Frage: Wie misst man die Ähnlichkeit?

Die Distanzmetrik dient dazu, zu messen, wie stark sich zwei Beobachtungen voneinander unterscheiden. Ob du nun Kunden, Produkte oder Verkaufsstellen analysierst – dies ist die Regel, nach der der Algorithmus die Profile miteinander vergleicht.

Die häufigsten sind:

Euklidischer Abstand. Misst die Entfernung in gerader Linie zwischen zwei Punkten. Er eignet sich für die Arbeit mit numerischen Variablen, die miteinander vergleichbar sind, beispielsweise Umsatz, Kaufhäufigkeit und durchschnittlicher Belegwert, nachdem diese ordnungsgemäß normalisiert wurden.
Manhattan-Distanz. Summiert die absoluten Abweichungen jeder Variablen. Funktioniert gut, wenn man ein Maß sucht, das weniger empfindlich auf einzelne Abweichungen reagiert und eher einer „blockartigen“ Logik folgt, was bei bestimmten operativen Datensätzen nützlich ist.

Hier liegt ein häufiger Fehler auf der Hand. Wenn eine Variable einen wesentlich größeren Wertebereich aufweist als die anderen, wird sie die Berechnung der Abstände dominieren. In der Praxis orientiert sich die Clusterbildung dann fast ausschließlich an dieser Spalte. Aus diesem Grund sollte man vor der Wahl der Verknüpfungsmethode prüfen, ob die Daten standardisiert wurden.

Zweite Frage: Wie verbindet man zwei Cluster?

Die Verknüpfung kommt erst später ins Spiel. Sie vergleicht nicht zwei einzelne Punkte, sondern zwei bereits gebildete Gruppen.

Eine gute Analogie ist folgende: Die Metrik bestimmt, wie man die Entfernung zwischen zwei Geschäften auf der Karte misst. Die Verknüpfung bestimmt, wie man die Entfernung zwischen zwei ganzen Ladenketten bewertet. Das macht einen großen Unterschied.

Die wichtigsten Methoden sind:

Einfachverknüpfung. Betrachtet die beiden nächstgelegenen Punkte zwischen verschiedenen Clustern.
Vollständige Verknüpfung. Betrachte die beiden am weitesten voneinander entfernten Punkte.
Durchschnittsverknüpfung. Verwendet den Durchschnitt der Abstände zwischen allen Punkten der beiden Cluster.
Ward. Er fasst die Cluster zusammen, die die interne Varianz so wenig wie möglich erhöhen.

Vergleich der Verknüpfungsmethoden

Linkage-Methode	So funktioniert es	Pro	Dagegen	Ideal für
Einfachgelenk	Verwende den Mindestabstand zwischen den Punkten zweier Cluster	Erfassung von progressiven Verbindungen	Es können wenig kompakte „Ketten“-Cluster entstehen	Eng miteinander verbundene Muster, erste Erkundung
Vollständige Verknüpfung	Verwende den maximalen Abstand zwischen den Punkten zweier Cluster	Erzeugt kompaktere Cluster	Das kann Gruppen, die eigentlich nahe beieinander liegen, zu sehr voneinander trennen	Segmentierungen, bei denen es auf Homogenität ankommt
Durchschnittliche Verknüpfung	Durchschnittliche Abstände zwischen den Punkten der beiden Cluster	Guter Kompromiss	Für die Geschäftswelt weniger leicht zu erklären	Ausgewogene Analysen
Ward	Minimiert den Anstieg der Varianz innerhalb der Cluster	Erzeugt stabile und lesbare Partitionen	Erfordert gut vorbereitete numerische Variablen	Kundensegmentierung, Geschäftsanalyse

Die richtige Wahl hängt von der Entscheidung ab, die du in deinem Unternehmen treffen musst, und nicht von einer abstrakten Präferenz.

Wenn es dein Ziel ist, Cluster zu finden, die durch progressive Ähnlichkeiten miteinander verbunden sind, kann „Single Linkage“ in der explorativen Phase hilfreich sein. Wenn du hingegen klare Segmente bilden musst, die Kampagnen, Preislisten oder Servicelevels zugeordnet werden sollen, liefern „Complete“ oder „Ward“ in vielen Fällen Gruppen, die leichter zu interpretieren sind. „Average Linkage“ ist oft ein guter Mittelweg, wenn du weder zu starre Cluster noch zu langgestreckte Strukturen wünschst.

Faustregel: Wenn du die Cluster dem Vertrieb, dem Marketing oder der Geschäftsleitung präsentieren musst, beginne mit Ward. Wenn das Ergebnis zu „gekünstelt“ wirkt, vergleiche es mit Average Linkage.

Wie man die Wahl entsprechend dem Unternehmenskontext trifft

In der Lehre beschränken sich die Leitfäden oft auf die Definition. In der Praxis hingegen braucht es eine Entscheidungslogik.

Verwende diesen Track:

Möchtest du kompakte und leicht zu erklärende Cluster? Beginne mit Complete- oder Ward-Clustern.
Möchtest du schwache Verbindungen oder sehr unregelmäßige Strukturen untersuchen? Dann ziehe „Single Linkage“ in Betracht.
Möchtest du einen Kompromiss zwischen Stabilität und Flexibilität? Probier doch mal die „Average Linkage“-Methode aus.
Hast du Variablen mit unterschiedlichen Skalen oder eine uneinheitliche Mischung von Indikatoren? Überprüfe zunächst die Datenaufbereitung und die Metrik, da die Verknüpfung sonst zu Unrecht als fehlerhaft eingestuft wird.

Mit anderen Worten: Es gibt keine absolut beste Methode. Es gibt nur die Methode, die am besten zur geschäftlichen Anforderung passt.

Ein konkretes Beispiel

Nehmen wir an, du möchtest die Kunden eines kleinen oder mittleren Einzelhandelsunternehmens anhand der Kaufhäufigkeit, des durchschnittlichen Bestellwerts und der Anzahl der gekauften Produktkategorien segmentieren.

Bei einer einfachen Verknüpfung könntest du einen sehr weitreichenden Cluster erhalten, der durch fließende Übergänge zwischen recht unterschiedlichen Kunden verbunden ist. Das ist nützlich, wenn du Kontinuität im Verhalten beobachten möchtest, weniger jedoch, wenn du unterschiedliche Marketingmaßnahmen erstellen musst.

Durch die vollständige Verknüpfung werden die Gruppen enger zusammengeführt. Die Kunden innerhalb jedes Clusters ähneln sich stärker, sodass es dem Marketingteam leichter fällt, maßgeschneiderte Werbeaktionen zu entwickeln.

Mit Ward erhält man oft übersichtliche und gut lesbare Segmente. Deshalb wird es häufig gewählt, wenn es nicht nur darum geht, zu analysieren, sondern zu einer Entscheidung zu gelangen.

Auch der Rechenaufwand spielt eine Rolle

Das agglomerative hierarchische Clustering kann bei großen Datensätzen sehr ressourcenintensiv sein. Dies hat konkrete Auswirkungen: lange Laufzeiten, höherer Speicherbedarf und weniger Spielraum für schnelle Tests mit verschiedenen Metriken und Verknüpfungsmethoden.

Für ein KMU geht es nicht darum, theoretisch über Algorithmen zu diskutieren. Es geht vielmehr darum, zu wissen, ob die Analyse mit den verfügbaren Daten, der Zeit, die dem Team zur Verfügung steht, und den verwendeten Tools überhaupt durchführbar ist.

Deshalb sollte die technische Entscheidung drei einfache Fragen beantworten:

Werden die Cluster klar genug sein, um Maßnahmen zu leiten?
Wird die tatsächliche Datenstruktur durch die Methode gut berücksichtigt?
Ist der Prozess ohne übermäßigen manuellen Aufwand nachhaltig?

Genau hier ELECTE eine Plattform wie ELECTE . Sie vereinfacht den technisch anspruchsvollsten Teil der Konfiguration und erleichtert den Vergleich verschiedener Optionen, auch wenn Sie kein internes Team von Datenwissenschaftlern haben. Der Mehrwert liegt nicht im „Clustering“ an sich, sondern darin, eine Segmentierung zu wählen, die das Unternehmen verstehen, validieren und nutzen kann.

Erstellen und Interpretieren eines Dendrogramms – Einen Baum in Aktion umwandeln

Der wahre Wertdes agglomerativen hierarchischen Clusterings wird deutlich, wenn man sich sein typischstes Ergebnis ansieht: das Dendrogramm. Es handelt sich dabei nicht um eine dekorative Grafik, sondern um eine Entscheidungsübersicht.

Eine Fachkraft interagiert in einem modernen Büro mit einer holografischen Schnittstelle, die ein komplexes Baumdiagramm anzeigt.

Wie man ein Dendrogramm ohne unnötige Fachausdrücke liest

Auf der horizontalen Achse findest du die Beobachtungen oder kleine Gruppen von Beobachtungen. Auf der vertikalen Achse siehst du den Abstand oder die Unähnlichkeit, bei der die Zusammenführungen stattfinden.

Die wichtigste Faustregel lautet: Je höher auf der Hierarchieebene eine Fusion stattfindet, desto unterschiedlicher waren die fusionierten Gruppen.

Dadurch kannst du etwas tun, was viele Manager sofort zu schätzen wissen. Du akzeptierst keine Clusteranzahl, die durch eine „Black-Box“-Formel ermittelt wurde. Du betrachtest die Datenstruktur und entscheidest, wo es sinnvoll ist, aufzuhören.

Zum Beispiel:

Wenn viele Zusammenführungen in niedrigen Höhen stattfinden, enthalten die Daten sehr ähnliche Gruppen;
Wenn an einer bestimmten Stelle ein deutlicher vertikaler Sprung auftritt, fügst du wahrscheinlich Gruppen zusammen, die sich bereits ziemlich stark unterscheiden;
Dieser Sprung ist oft ein guter Anhaltspunkt für den richtigen Schnittpunkt am Baum.

Ein Dendrogramm setzt eine statistische Entscheidung in eine visuelle Darstellung um. Deshalb ist es nicht nur in Python-Notebooks, sondern auch in Besprechungen nützlich.

Eine visuelle Darstellung kann helfen, das Konzept zu verinnerlichen:

So wählen Sie den Schnittpunkt aus

Viele bleiben an dieser Stelle hängen. „Wie viele Cluster muss ich betreiben?“ Die ehrliche Antwort lautet: Das hängt davon ab, welches Problem du lösen möchtest.

Wenn du Marketingmaßnahmen umsetzen musst, erschweren zu viele Cluster die Umsetzung. Wenn du sehr unterschiedliche Verhaltensweisen analysierst, besteht die Gefahr, dass zu wenige Cluster nützliche Muster überdecken.

Ein praktischer Anhaltspunkt ist folgender:

Achte auf die größten vertikalen Sprünge im Dendrogramm.
Ziehe eine horizontale Linie an einer deutlichen Stufe.
Zähle die abgeschnittenen Zweige. Das ist die Anzahl der resultierenden Cluster.

Nehmen wir an, der Schnitt schneidet vier Hauptäste. Man erhält vier Segmente. Ab diesem Punkt ist die Führungsarbeit nicht mehr statistischer Natur. Sie wird interpretativ.

Frag dich selbst:

Sind diese Gruppen für das Marketing, den Vertrieb oder den operativen Bereich sinnvoll?
Kann ich sie verständlich beschreiben?
Führt jede Gruppe zu einer anderen Aktion?

Anmerkung zur Anwendung: Das beste Dendrogramm ist nicht unbedingt das eleganteste. Es ist dasjenige, mit dem man die gewählte Segmentierung gegenüber denjenigen begründen kann, die sie anwenden sollen.

Praktischer Leitfaden mit Python und Scikit-learn

Du hast einen Kundendatensatz, einige nützliche Variablen und eine konkrete Frage: Gibt es Gruppen, die unterschiedliche Marketingmaßnahmen erfordern? Python dient genau dazu, diese Frage in einen schnellen, nachvollziehbaren und wiederholbaren Test umzuwandeln.

Dazu verwendet man in der Regel scikit-learn zur Erstellung des Modells und SciPy zur Darstellung des Dendrogramms. Der technische Teil ist leicht verständlich. Für ein KMU kommt es jedoch vor allem darauf an, die Daten richtig aufzubereiten und das Ergebnis kritisch zu interpretieren.

Die Daten richtig aufbereiten

Der häufigste Fehler entsteht bereits vor dem Algorithmus. Wenn man eine Variable wie den Jahresumsatz und eine wie die Anzahl der Bestellungen in dasselbe Modell einbezieht, besteht die Gefahr, dass die Variable mit dem größeren Umfang viel stärker ins Gewicht fällt. Der resultierende Cluster spiegelt daher eher die Maßeinheiten wider als die tatsächlichen Ähnlichkeiten zwischen Kunden oder Produkten.

Die Standardisierung dient dazu, dieses Problem zu vermeiden. Praktisch gesehen bringst du die numerischen Variablen auf eine vergleichbare Skala. Es ist eine einfache Maßnahme, die das Ergebnis jedoch deutlich verändert, vor allem wenn du das Ward-Linkage verwenden möchtest, das mit gut aufbereiteten numerischen Daten gut funktioniert.

Bevor du das Modell startest, überprüfe drei Punkte:

Numerische Variablen auf unterschiedlichen Skalen. Standardisiere sie.
Kategoriale Variablen. Konvertiere sie in ein für das Modell verwendbares Format.
Fehlende Werte. Behandle sie zuerst, sonst wird das Clustering instabil oder unbrauchbar.

Hier ist eine hilfreiche Analogie: Du vergleichst Kunden, als müsstest du sie mit derselben Maßeinheit bewerten. Wenn der eine in Euro gemessen wird und der andere in Bruttozahlen, ist der Vergleich von vornherein unausgewogen.

Einfaches Implementierungsbeispiel

Hier ist ein einfaches Beispiel mit scikit-learn:

import pandas as pdfrom sklearn.preprocessing import StandardScalerfrom sklearn.cluster import AgglomerativeClustering# Esempio: dataset con variabili numerichedf = pd.DataFrame({"frequenza_acquisto": [12, 10, 2, 3, 15, 1],"scontrino_medio": [80, 75, 20, 25, 95, 15],"numero_categorie": [5, 4, 1, 2, 6, 1]})# 1. Scalingscaler = StandardScaler()X_scaled = scaler.fit_transform(df)# 2. Modellomodel = AgglomerativeClustering(n_clusters=3,linkage="ward")# 3. Assegnazione clusterlabels = model.fit_predict(X_scaled)df["cluster"] = labelsprint(df)

Der Code ist kurz. Das Management-Verständnis ist wichtiger.

In diesem Beispiel gibst du dem Modell folgende Anweisung: „Gruppiere diese Beobachtungen in drei Cluster, indem du die ähnlichsten Fälle schrittweise zusammenführst.“ Das Endergebnis ist die Spalte Cluster, also die jedem Datensatz zugewiesene Kennung. Von dort an beginnt die für das Unternehmen relevante Arbeit: herauszufinden, was Cluster 0 von Cluster 1 unterscheidet und welche Entscheidungen sich daraus ergeben.

Wenn du auch die vollständige hierarchische Struktur anzeigen möchtest, verwendest du in der Regel scipy.cluster.hierarchy.linkage zusammen mit Dendrogramm. Scikit-learn hilft dir dabei, die Cluster zu ermitteln. SciPy hilft dir dabei, zu verstehen, wie sie entstanden sind.

Die drei Entscheidungen, auf die es wirklich ankommt

Im Unternehmen hängt der Nutzen des Clusterings nicht von der Komplexität des Notebooks ab. Er hängt vielmehr von der Qualität dreier Entscheidungen ab.

Welche Variablen sollten einbezogen werden? Wenn du wenig aussagekräftige Spalten wählst, erhältst du Cluster, die schwer zu interpretieren sind.
Welches Linkage-Verfahren soll man verwenden? Ward ist oft eine gute Grundlage bei standardisierten numerischen Daten, aber nicht immer die beste Wahl für jedes Problem.
Wie viele Cluster sind erforderlich, damit die Ergebnisse verwertbar sind? Ein Modell mit acht Gruppen mag zwar präzise erscheinen, kann aber für Marketing, Vertrieb oder den operativen Bereich unüberschaubar werden.

Hier zeigt sich der Unterschied zwischen einer technischen Übung und einem Entscheidungsinstrument. Ein Manager muss nicht abstrakt „Cluster bilden“. Er braucht Segmente, die man benennen, erklären und nutzen kann.

Wenn du also mit Python arbeitest, solltest du dich nicht nur auf die vom Modell zugewiesene Klassifizierung verlassen. Betrachte den Mittelwert der Variablen für jeden Cluster, vergleiche die sich abzeichnenden Profile und frage dich sofort: Erfordert diese Gruppe eine andere Vorgehensweise als die anderen? Wenn die Antwort „nein“ lautet, liegt das Problem nicht im Code. Meistens liegt es an der Auswahl der Variablen, der Verknüpfungsmethode oder dem Schwellenwert.

Anwendungsbeispiele, um Ihr Geschäft auszubauen

Ein Algorithmus ist dann wirklich von Bedeutung, wenn er eine konkrete Maßnahme bewirkt.Das agglomerative hierarchische Clustering erweist sich als nützlich, wenn es Datenbankzeilen in Segmente umwandelt, die das Unternehmen nutzen kann.

Kundensegmentierung, die dem Marketing wirklich nützt

Viele KMU segmentieren ihre Kunden noch immer auf sehr einfache Weise. Nach Alter, geografischem Gebiet, vielleicht auch nach Umsatzklasse. Das ist ein Anfang, reicht aber oft nicht aus.

Mit einem hierarchischen Clustering kannst du Verhaltensvariablen wie Kaufhäufigkeit, Durchschnittswert, bevorzugte Kategorien und Reaktion auf Werbeaktionen kombinieren. Das Ergebnis ist nicht nur eine Liste von Profilen. Es ist eine Hierarchie, die dir zeigt, welche Gruppen sich wirklich nahe stehen und welche stattdessen mit unterschiedlichen Botschaften angesprochen werden sollten.

Dies hilft dem Marketingteam dabei, präzisere Entscheidungen zu treffen:

Treue Kunden, die durch Treueprogramme gebunden werden sollen
Gelegenheitskäufer, die durch gezielte Kampagnen wiedergewonnen werden sollen
Neukunden, die beim zweiten Kauf begleitet werden sollen
Unberechenbare Personen, die überwacht werden müssen, bevor sie sich entfernen

Produkte und Lagerbestand

Im Einzelhandel und im E-Commerce dient Clustering nicht nur dazu, Menschen zu verstehen. Es dient auch dazu, Produkte zu verstehen.

Sie können Produkte nach Kaufmustern, Kaufkombinationen, Saisonabhängigkeit oder der Reaktion auf Werbeaktionen gruppieren. Dies ermöglicht es Ihnen, verschiedene operative Entscheidungen zu verbessern:

Sortiment. Erkenne, welche Produkte ähnliche Verkaufstrends aufweisen.
Sonderangebote. Stellen Sie stimmigere Bundles zusammen.
Lagerbestand. Vermeiden Sie es, Artikel mit sehr unterschiedlichen Eigenschaften gleich zu behandeln.

Der betriebswirtschaftliche Vorteil liegt hier auf der Hand. Man betrachtet einzelne Artikel nicht isoliert, sondern identifiziert Produktfamilien, die gemeinsam geplant werden können.

Wenn sich Produkte in ähnlichen Clustern bewegen, werden auch die Entscheidungen bezüglich Nachbestellungen und Werbeaktionen einheitlicher.

Finanzrisiko und Cybersicherheit

Im Finanzwesen kann Clustering dabei helfen, normale Muster von solchen zu unterscheiden, die einer weiteren Analyse bedürfen. Es ersetzt zwar weder aufsichtsrechtliche Kontrollen noch spezielle Modelle, kann aber eine nützliche Perspektive bieten, um ähnliche Verhaltensweisen zu ordnen und Anomalien aufzudecken.

Es gibt zudem eine interessante Entwicklung im Bereich Cybersicherheit. Ein aufkommender Trend betrifft den Einsatz fortschrittlicher AHC-Verfahren für den Netzwerkverkehr in italienischen KMU. Im Jahr 2025 stiegen die Ransomware-Angriffe auf italienische IT-KMU um 27 %, und AHC-Frameworks auf Basis von Innerprodukten verbesserten die Erkennung von Ausreißern bei italienischen Netzwerkverkehrsdatensätzen um 18 % (siehe hier zitierte JMLR-Referenz).

Das sollte man richtig verstehen. Das bedeutet nicht, dass jedes KMU sofort eine Clustering-Pipeline für die Sicherheit aufbauen muss. Es bedeutet jedoch, dass hierarchisches Clustering nicht auf Marketing oder den Einzelhandel beschränkt ist. Es kann zu einer bereichsübergreifenden Analysestruktur werden, die vom Kundenverhalten bis hin zur Risikoüberwachung reicht.

So ELECTE das Clustering für Ihr Unternehmen

Du hast Kundendaten im CRM, Bestellungen im E-Commerce, Margen in einer Excel-Datei und einige betriebliche Informationen im Verwaltungssystem. Solange diese Daten getrennt bleiben, bleibt das Clustering eine theoretische Übung. Für ein KMU besteht das Problem nicht darin, zu verstehen, dass Cluster nützlich sein können. Das Problem besteht darin, zu lesbaren, konsistenten und ausreichend zuverlässigen Clustern zu gelangen, die als Grundlage für geschäftliche oder betriebliche Entscheidungen dienen können.

Genau hier kommt eine Plattform wie ELECTE ins Spiel, die den manuellen Aufwand ELECTE und die Methode für diejenigen praktischer macht, die Entscheidungen treffen müssen – und nicht programmieren.

Wo ein internes Team tatsächlich ins Stocken gerät

In der Praxis gibt es vier häufig auftretende Hindernisse.

Datenquellen, die sich auf CRM, E-Commerce, lokale Dateien und Finanztools verteilen
Variablen, die schwer zu berechnen sind, da sie unterschiedliche Skalen und Einheiten haben
Die Wahl des Verknüpfungsmodells ist wenig intuitiv, vor allem wenn unklar ist, ob Kompaktheit, Stabilität oder Empfindlichkeit gegenüber Ausreißern Vorrang haben soll
Schwer lesbare Ausgaben für Manager und operative Teams, die nicht täglich mit Python arbeiten

Der am meisten unterschätzte Punkt ist genau dieser: Der Algorithmus allein reicht nicht aus. Es bedarf eines Prozesses, der von den Rohdaten zu einer Segmentierung führt, die das Unternehmen nutzen kann. ELECTE bereits beim ersten Schritt, indem es die Unternehmensquellen systematisch miteinander verknüpft. Wenn du sehen möchtest, welche Integrationen verfügbar sind, kannst du die Seite mit den in ELECTE verknüpfbaren Datenquellen aufrufen.

Screenshot von https://www.electe.net/placeholder-dashboard-clustering.jpg

Es gibt noch eine zweite Schwierigkeit, die eher strategischer als technischer Natur ist. Die Wahl der falschen Verknüpfungsmethode kann zu Segmenten führen, die für das Unternehmen wenig nützlich sind, selbst wenn das Modell korrekt ausgeführt wurde. Ein Manager muss nicht jedes mathematische Detail kennen. Er muss verstehen, welche Konfiguration Segmente erzeugt, die stabil genug sind, um eine Kampagne, eine Lagerpolitik oder eine Überprüfung des Kundenportfolios zu stützen.

Was ändert sich durch einen automatisierten Workflow?

Mit einem automatisierten Workflow ähnelt der Prozess eher einer gut organisierten Produktionslinie als einer Reihe von manuell durchgeführten Tests. Die Daten werden eingegeben, einheitlich aufbereitet, verschiedene Konfigurationen werden verglichen, und das Endergebnis wird in einer lesbaren Form ausgegeben.

Konkret kann der Ablauf folgende Schritte umfassen:

Führen Sie Daten aus den Unternehmenssystemen in einer einzigen Umgebung zusammen.
Legen Sie die Variablen nach einheitlichen Regeln fest, damit der Umsatz nicht unverhältnismäßig stark ins Gewicht fällt im Vergleich zur Kaufhäufigkeit.
Vergleichen Sie verschiedene Clustering-Einstellungen, ohne jeden Test manuell wiederholen zu müssen.
Lies aussagekräftige Datensätze mit Bezeichnungen und Mustern, die für Vertrieb, Marketing oder den operativen Bereich relevant sind.
Setzen Sie die Cluster in konkrete Maßnahmen um, beispielsweise in geschäftliche Prioritäten, Werbemålgruppen oder Nachbestellrichtlinien.

Der Vorteil liegt nicht in der Automatisierung an sich. Er liegt darin, dass das Team seine Zeit für das Wesentliche nutzen kann: das Dendrogramm zu interpretieren, die geeignete Segmentierungsebene auszuwählen und zu entscheiden, wie mit diesen Gruppen verfahren werden soll.

Für ein KMU macht das einen großen Unterschied. Anstatt sich abstrakt zu fragen, ob man Ward, Average oder Complete verwenden soll, wird der Vergleich konkret: Welche Methode liefert klarere Cluster für unsere Kunden, unsere Produkte und unsere Ziele? ELECTE diese Frage auch ohne ein internes Team von Datenwissenschaftlern leichter zugänglich.

Die Automatisierung ersetzt also nicht das unternehmerische Urteilsvermögen. Sie ordnet es an die richtige Stelle im Prozess ein.

Schlussfolgerungen und wichtige Punkte, die man sich merken sollte

Das agglomerative hierarchische Clustering ist nicht nur ein Thema für den Hochschulunterricht. Es ist ein konkretes Werkzeug, um Ordnung in Daten zu bringen, die andernfalls fragmentiert bleiben.

Es gibt nur wenige, aber entscheidende Punkte, die man beachten sollte:

Man geht von unten nach oben vor. Jede Beobachtung beginnt für sich allein und wird nach und nach mit anderen ähnlichen Beobachtungen verknüpft.
Es legt k zu Beginn nicht fest. Das macht die Methode nützlich, wenn man noch nicht weiß, wie viele Segmente sinnvoll sind.
Die Wahl des Linkage beeinflusst das Ergebnis. Ward, Complete, Average und Single führen nicht zu derselben Struktur.
Das Dendrogramm hilft bei der Entscheidungsfindung. Es ist nicht nur eine visuelle Darstellung. Es ist ein Instrument, um statistische Strukturen in Managementmaßnahmen umzusetzen.

Für ein KMU liegt hier der wahre Wert. Kunden, Produkte und Betriebsabläufe besser zu verstehen, ohne sich allein auf die Intuition zu verlassen. Wenn dein Team über technische Kenntnisse verfügt, kannst du mit Python und scikit-learn beginnen. Wenn du hingegen schneller zu aussagekräftigen Erkenntnissen gelangen möchtest, reduziert ein automatisierter Ansatz Reibungsverluste und Zeitaufwand.

Es geht nicht darum, einen „fortschrittlichen“ Algorithmus zu verwenden. Es geht darum, klarere Entscheidungen zu treffen – mit mehr Kontext und weniger Störfaktoren.

Wenn du verstreute Daten in klare Segmente und operative Entscheidungen umwandeln möchtest, erfahre hier, wie ELECTE die Analyse auch ohne ein Team von Datenwissenschaftlern zugänglich macht. Sie können Ihre Datenquellen verbinden, aussagekräftige Erkenntnisse gewinnen und schneller von der Analyse zur Umsetzung übergehen.