1. EA SS 2016

#1
Hallo zusammen,

hier mein erster Vorschlag für die EA. Ich würde mich über Rückmeldungen und Verbeserungen freuen
Vielen Dank und viele Grüße


Aufgabe 1

a) A

b) C

c) B

d) D



Aufgabe 2

a) Syntaktischer Fehler: keine Interpretation der Marke Golf und des Modells VW möglich

Semantischer Fehler: Anrede „Herr“ für den Vornamen Marie

Coverage Fehler: fehlende Farbe bei Lfd Nr. 573

upload_2016-4-30_0-17-53.png




b) Familienstand: 0,5 x 5/12 + 0,5 x 6/12 = 11/24

Alter: 0,5 x 1/3 + 0,5 x 1/3 = 1/3

Einkommen: 0,25 x 0 + 0,5 x 0,5 + 0,25 x 0 = 0,25
upload_2016-4-30_0-18-22.png

c) verheiratete Personen, älter als 40 mit „mittleren bis höherem Einkommen“

Aufgabe 3

a) – Minimierung der paarweisen Distanzen innerhalb des Clusters

- Maximierung der paarweisen Distanzen zwischen zwei Clustern

Optimierung der Partitionierung bzgl der Kriterien lassen sich nicht stets vereinbaren Kompromisse sind notwendig. Es wird zunächst eine Partionierung bestimmt und dann Trainingsinstanzen iterativ verschoben bis keine Verbesserung mehr erzielt werden können.



Euklidische Distanz


Manhatten Distanz




b)
upload_2016-4-30_0-19-47.png


c
upload_2016-4-30_0-20-26.png

Aufgabe 4

a) Falsch

b) Richtig

c) Richtig

d) Falsch

e) Falsch

f) Richtig

g) Richtig

h) Richtig

i) Richtig

j) Richtig
 
#2
Hi Simona!
Wollte gerade meine Antwort zu Aufgabe 3 posten. Ist aber überflüssig, weil ich es - mit Ausnahme der Grafik - genauso wie du machen würde!
Die Grafik würde ich wie folgt erstellen:
1. Schritt: zusammenfassen von x4 und x5 mit der Balkenlänge 2
2. Schritt: zusammenfassen von x1 und x2 mit der Balkenlänge 3
3. Schritt: zusammenfassen von x3 und x4,5 mit der Balkenlänge bis 4
4. Schritt: zusammenfassen von x1,2 und x3,4,5 mit der Balkenlänge bis 5
 
#3
Hallo Matthias,

vielen Dank für dein Feedback. Ich habe auch gesehen, dass ich hier einen Wurm drin hab. Hab zwar X4,X5 gedankliche zusammengefasst, aber nicht so hingeschrieben und dann auch nicht so gezeichnet. Du hast natürlich vollkommen recht mit der Grafik. :)
 
#6
Hallo zusammen,

ich sitze noch an Aufgabe 2b...
Ich hatte diese Aufgabe zunächst analog zum Beispiel im Skript gelöst, bin dann in der Aufgabenstellung über folgenden Satz gestolpert:
"Für den Zweiklassenfall entspricht die Impurity dem Anteil der Minderheitsklasse an
den Trainingsinstanzen zum Knoten t."

Kann mir jemand erklären was hiermit gemeint ist und wie sich das auf den Lösungsweg auswirkt?

@Simona E. : Ich kann leider die Dateianhänge nicht komplett anschauen, aber auf den ersten Blick sieht es für mich so aus, als wenn du die Impurity nur einmal für den Ausgangszustand berechnet hast und die Knoten dann der Reihenfolge nach aufgeteilt hast. Im Skript wird die Impurity nach jeder Aufteilung für jedes Attribut neu bestimmt...

Meine Lösungen...
zu Aufgabe 1:
a) C
b) C
c) C
d) D

zu Aufgabe 4:
a) --> falsch
b) --> richtig
c) --> falsch
d) --> falsch
e) --> richtig
f) --> falsch
g) --> richtig
h) --> richtig
i) --> falsch
j) --> richtig
 
#13
Hallo zusammen,

ich sitze noch an Aufgabe 2b...
Ich hatte diese Aufgabe zunächst analog zum Beispiel im Skript gelöst, bin dann in der Aufgabenstellung über folgenden Satz gestolpert:
"Für den Zweiklassenfall entspricht die Impurity dem Anteil der Minderheitsklasse an
den Trainingsinstanzen zum Knoten t."

Kann mir jemand erklären was hiermit gemeint ist und wie sich das auf den Lösungsweg auswirkt?
ich habe die Aufgabe auch analog Skript gelöst und komme auf
Familienstand: 1/2 * 1/6 + 1/2 * 1/6 = 1/6
Alter: 1/2 * 1/3 + 1/2 * 1/3 = 1/3
Einkommen: 1/4 * 0 + 1/2 * 1/2 + 1/4 * 0 = 1/4

Somit Splittung nach Familienstand.
Dann für Knoten verheiratet
Einkommen: 1/3 * 0 + 1/ 2 * 0 + 1/6 * 0 = 0 -> somit Endknoten
analog für Knoten ledig
Einkommen: 1/6 * 0 + 1/ 2 * 0 + 1/3 * 0 = 0 -> somit Endknoten

Damit Zielgruppe verheiratet & mittleres Einkommen.
 
#14
Hallo zusammen,

ich sitze noch an Aufgabe 2b...
Ich hatte diese Aufgabe zunächst analog zum Beispiel im Skript gelöst, bin dann in der Aufgabenstellung über folgenden Satz gestolpert:
"Für den Zweiklassenfall entspricht die Impurity dem Anteil der Minderheitsklasse an
den Trainingsinstanzen zum Knoten t."

Kann mir jemand erklären was hiermit gemeint ist und wie sich das auf den Lösungsweg auswirkt?
Ich denke das heißt folgendes:
Bisher hatten wir immer nur 2 Ausprägungen, z.B. Van und Kleinwagen.
Angenommen, wir haben 3 Ausprägungen Van, KW und SUV
Dann errechnet sich die Purity als Anteil der zutreffenden Alternativen von der Teilmenge:
Z.B. Teilmenge "hohes Einkommen" = 8 Elemente
davon
1 mit Van -> Purity = 1/8 (Anteil Minderheitsheitsklasse)
2 mit KW -> Purity = 2/8
5 mit SUV -> Purity = 5/8
Impurity = 1 - Max (1/8, 2/8, 5/8) = 1 - 5/8 = 3/8

Hätte man nur 2 Ausprägungen z.B. nur Van und KW gilt immer
1 mit Van -> Purity = 1/8 (Anteil Minderheitsklasse)
7 mit KW -> Purity = 7/8
Impurity = 1 - Max (1/8, 7/8) = 1 - 7/8 = 1/8 = Anteil Minderheitsklasse
 
#15
Hallo Zusammen, ich habe bei 2B eine andere Lösung (siehe unten) und bin nun unsicher - muss ich ALLE Merkmale verwenden, auch wenn ich ohne das Alter aufgrund der Impurity bei Einkommen = 0 schneller ans Ende komme? Oder habe ich irgendwo einen Gedanken-/Rechenfehler? Danke vorab!
upload_2016-5-24_20-58-8.png
upload_2016-5-24_20-58-27.png
 
#16
Hallo zusammen! Zur Aufgabe 2b: Ich habe als zweite Aufteilung das Einkommen, und eine Impurity von Null. Damit bin ich, denke ich, fertig ohne das Alter zu benutzen. Stimmt ihr da überein?
 
#18
Hallo, ich hatte die Grafik so wie hier auch angegeben. Laut Musterlösung aber falsch.
Hier sind z.B. x2 und x4 mit einer Distanz von 1 zusammengefasst.
Hat jemand eine Idee, wie man auf die Musterlösung kommt?
Der Lehrstuhl hat mir geholfen: Man muss nur die Aufgabe richtig lesen ;-).
Das Dendogramm sollte man zur Tabelle 5 malen und nicht zur Aufgabe mit Tabelle 4!
 
#19
Hallo,

ist es nicht einfacher bei der Aufgabe 2a - Verkäufername einfach als Attribut zu "bestellt" eingeben?
 

Anzeige