Clustering Verständins

Dr Franke Ghostwriter
leider hänge ich noch beim Thema Clustering.
Ich habe verstanden wie die einzelnen Distanzen zu berechnen sind und wie man den Startpunkt der Zusammenführung findet.
Allerdings erschließt sich mir die Formel für single/complete linkage nicht.
Die Dokumente hier im Forum dazu kann ich nicht runterladen 🙁

Könnte vielleicht jemand an einem einfachem Beispiel erklären welche Zahlen ich auswählen muss?

Vielen Dank vorab
 
pillul,

auf Seite 101 in KE 2 ist ein ganz anschauliches Rechenbeispiel für das Single Linkage. Für das complete-Linkage ändert sich nur das letzte Vorzeichen bei der Berechnung (siehe Skript S. 99 Tabelle).

Viele Grüße
 
Fk87,

Danke für deine Rückmeldung, die Inhalt in der KE habe ich natürlich ausgiebig studiert. 😉
Mir ist auch so halbwegs klar welche Formel ich einsetzen muss (steht ja meist in der Aufgabenstellung).
Wo es aber happert ist auf welche Zahlen die Formel anzuwenden ist, d.h welche Zahl(en) entfallen und welche muss ich neu berechnen und welche Zahlen benutze ich dann für diese Berechnung.

Viele Grüße
 
pillul,

die Formel brauchst du für alle Distanzen, die sich durch die Bildung des neuen Clusters ändern. Angenommen, du hast vier Dimensionen (A, B, C und D) und fasst B und C zu einem Cluster zusammen. Dann musst du an der Distanz zwischen A und D nichts ändern. Aber du musst die Distanzen zwischen dem neuen Cluster B,C und A sowie zwischen B,C und D neu berechnen. Für diese Berechnung verwendest du die "alten" Distanzen von vor der Clusterbildung (z.B. also "B-A" und "C-A" für die Berechnung der Distanz "B,C und A").

Hoffe, das konnte dir weiterhelfen.

Viele Grüße
 
Oben