EA 2 SS17

#1
Hallo zusammen,

vllt können wir die EA 2 besprechen und gemeinsam diskutieren.

zu Aufgabe 1:

a) ???

b) A

c) C (vllt. Auch D)

d) D

was meint ihr?
 
#2
Ich bin auch gerade dabei und habe für Aufgabe 1 folgendes raus: D, A, C, B

Probleme habe ich eher damit herauszufinden, wie die Projektionsmethoden in 2.1.) lauten.
Projektion 3 ist eine Eins-aus-N Kodierung, Projektion 2 ist zwar eine transformierte Darstellung, nur finde ich nirgends den Namen dieser Methode. Bei Projektion 1 komme ich nicht darauf, was es sein soll.
 
#3
Hallo zusammen,
im Moment kämpfe ich noch mit den Aufgaben 2 und 3.
Hier mal meine Vorschläge für die Aufgaben 1 und 4 zur Diskussion:
zu A1: B A C B
zu A4: F R F F R F R R F R
 
#4
Bez. Aufgabe 2.1 komme ich auf die folgenden Projektionsmethoden:
1. Standardisierung
2. Normalisierung
3. Eins-aus-N-Kodierung
 
Zustimmungen: Fab.
#5
Diese Projektionsmethoden habe ich auch beschrieben. Für die anderen Kodierungsarten gibt es keinen Anhaltspunkt. Für die Dummy Kodierung fehlt der Attributwert, bei dem alle Attribute den Wert 0 annehmen. Für die Effekt-Kodierung gilt das Gleiche, wobei hier dieses N-1 Attribut die Attributwerte -1 annehmen würde.
 
#6
Hallo zusammen,

hier mal meine Lösungen:

A1:
a) D
b) A
c) C
d) B

A2:
2.1) 1. Standardisierung
2. Normalisierung
3. Eins-aus-N-Kodierung

2.2)

https://picload.org/view/riapwagr/imag0712.jpg.html

A3:
3.1)
- Paarweise Distanz innerhalb der Cluster soll minimiert werden
- Paarweise Distanz zwischen zwei Cluster soll maximiert werden

Zwischen beiden Kriterien müssen häufig Kompromisse gefunden werden

Euklidisch Distanz & Manhatten Distanz

3.2)
Schritt kleinste Distanz Cluster
0 2 {x1}, {x2}, {x3}, {x4}, {x5}
1 3 {x1}, {x2}, {x3}, {x4, x5}
2 4 {x1, x2}, {x3}, {x4, x5}
3 5 {x1, x2}, {x3, x4, x5}
4 - {x1, x2, x3, x4, x5}

3.3)

https://picload.org/view/riapwaga/imag0711.jpg.html

A4:
F R F F R F R R R R
 
#7
Hallo zusammen,
zur Sicherheit muss ich nun doch nochmal nachfragen:
Das Thema hier dreht sich um die erste EA im SS2017 (bez. KE2), oder?
Dazu würde auch der o.g. Beitrag zu den Projektionsmethoden in Aufg. 2.1 passen.
 
#8
Habe eine Frage zur Aufgabe 2.2:
Ich habe mich dabei am Beispiel aus dem Skript mit den medizinischen Daten orientiert.
Demnach wäre das Ziel der Klassifikation, eine Einteilung in bestanden oder nicht vorzunehmen.
Davon ausgehend habe ich analog zum Skript für die Bestimmung des ersten Attributs jeweils die gesamte Impurity für eine mögliche Aufteilung nach Interesse, Anspruch und Motivation vorgenommen.
Was mich nun irritiert ist, dass ich für alle drei die gleiche Impurity, nämlich 3/5 erhalten habe.
Wie sollte die erste Aufspaltung im Entscheidungsbaum dann vorgenommen werden?
 
#9
Hallo zusammen,

bei Aufgabe 1 habe ich als Lösung auch D,A,C,B.

Bei Aufgabe 2.1 Erkenne ich 2. als Normalisierung und 3. als Eins aus N-Kodierung.

Aber auch wenn ich bei 1. vermute, dass es die Standardisierung darstellen soll, komme ich nicht drauf.

Als Mittelwert habe ich 4,065 als Varianz 1,79818421und Standardabweichung 1,3409639.

Eingesetzt ergibt sich daraus für z.B. die Note 2,3 => (2,3-4,065)/1,3409639 = - 1,32 und NICHT wie in der Tabelle aufgeführt -1,03.

Könnte mir jemand erklären, was ich falsch mache?
 
#11
=========== ab hier Dikussion der "echten EA2" (d.h. KE3) ============================================

Hallo,
ich möchte mal die MC-Aufgaben zu KE3 zur Diskussion stellen:

1.1 C
1.2 D
1.3 B
1.4 C

4.1) W Das Business Motivation Model stellt den Zusammenhang zwischen Geschäftsregeln, der Geschäftspolitik und der Unternehmensstrategie dar.
4.2) W Unter den Business Rules zeichnen sich Ableitungsregeln dadurch aus, dass auf bereits bestehende Regeln und Informationen zurückgegriffen wird.
4.3) F? Wenn Business Rules nur in einem eingeschränkten Zeitraum gelten, wird dies mit dem Begriff der „Einschränkungen" bezeichnet.
4.4) F Das Durchführungslevel „vorherige Autorisierung" bezeichnet den Sachverhalt, dass die Umsetzung einer Business Rule stets von Vorgesetzten autorisiert werden muss.
4.5) F Das Ziel dispositiver Daten ist die Unterstützung des Tagesgeschäftes.
4.6) F Dispositive Daten zeichnen sich durch einen tagesaktuellen Zeitbezug aus.
4.7) W Erst durch die Existenz vieler Data Marts und die Verknüpfung dieser kann ein zentrales DWH in einem Unternehmen entstehen. [Der Satz steht wortwörtlich in den Musterlösungen im Anhang von KE3 auf S. 88]
4.8) F Ein Ziel eines DWH ist die Schaffung von Insellösungen, sodass jede Abteilung ein eigenes Datenhaltungssystem haben kann.
4.9) W Die Basisdatenbank hat drei Funktionen: eine Sammel- bzw. Integrationsfunktion, eine Distributionsfunktion und eine Auswertungsfunktion.
4.10) W? Data Mining kann sowohl auf herkömmliche Daten als auch auf strukturierte Metadaten angewendet werden.
 
#12
Hallo zusammen,

bei Aufgabe 1 habe ich als Lösung auch D,A,C,B.

Bei Aufgabe 2.1 Erkenne ich 2. als Normalisierung und 3. als Eins aus N-Kodierung.

Aber auch wenn ich bei 1. vermute, dass es die Standardisierung darstellen soll, komme ich nicht drauf.

Als Mittelwert habe ich 4,065 als Varianz 1,79818421und Standardabweichung 1,3409639.

Eingesetzt ergibt sich daraus für z.B. die Note 2,3 => (2,3-4,065)/1,3409639 = - 1,32 und NICHT wie in der Tabelle aufgeführt -1,03.

Könnte mir jemand erklären, was ich falsch mache?
Ich habe beim Nachrechnen die gleichen Werte wie du heraus bekommen. Standardabweichung: 1,34.. und Mittelwert:4,065

Ich bekomme also auch andere Werte als in der Tabelle raus. Ich würde also vermuten, dass die Zahlen dort falsch sind. Oder hat noch jemand eine andere Meinung?
 
#13
Ich hab mich das ebenfalls gefragt. Allerdings habe ich es zunächst so hingenommen, weil es einen an der weiteren Bearbeitung der Aufgabe nicht hindert!

Auf moodle antwortet vllt, jemand!
 
#14
Hallo Freunde,
könnte bitte jemand die Aufgabenstellung der Hausarbeit verfügbar machen.
(Ich schreibe zwar die Klausur, den Kurs in diesem Semester aber nicht belegt)
Vielen Dank im Voraus!