Fragen

Dr Franke Ghostwriter
am Donnerstag hatten Frank, Antonio und ich uns nach langem mal wieder in der Bib zu einem Statistiklerntag getroffen. Es war wie immer sehr lustig auch wenn man das bei diesem Fach nicht unbedingt vermuten würde 🙂
aber leider konnten wir auch zu Dritt nicht alles klären und so blieben ein paar Fragen offen. Aber ich hoffe dass ihr uns ein bißchen weiterhelfen könnt.

I.Frage

KE 4 S.23 letzter Abschnitt

"Bei diesem Skalierungsverfahren ergibt sich stets eine Konfiguration der Objekte, deren Schwerpunkt im Ursprung des q-dimensionalen Koordinatensystems liegt; dies ist dadurch bedingt, dass die Matrix A zunächst von beiden Seiten mit dem Projektor K multipliziert wird, wodurch A gerade um den Mittelwert bereinigt wird."

Reaktionenabfolge:

1. "Ja klar" 🙂🙂🙂
2. "Hääääää?????"😕😕😕
3. "Was soll der Sch...."😡😡😡

Nein Spaß bei Seite...

Also zunächst einmal was ist eine Projektor-Matrix? Zur Info sie hat folgendes Aussehen: alle Elemente sind gleich und zwar in der Form 1-1/n.
Dann was heißt um den Mittelwert bereingit, heißt dass das er jetzt Null ist oder wie? und drittens wieso ist er bereinigt wenn ich von beiden Seiten mit der Projektormatrix multipliziere.

II. Frage

Klausur März 2007 Aufgabenteil Multivariate Verfahren Die QQ-Plot Aufgabe.

Ich habe nur ein Merkmal gegeben in unserem Skript wird allerdings immer mit mehreren Merkmalen gerechnet. Man könnte meinen uni müsste einfacher sein als multi tja in dem Fall leider nicht jedenfalls bezogen auf die Aufgabenstellung.

In Aufgabe a.) soll man zunächst die Distanzen berechnen. Aber kann es bei einem Merkmal Distanzen geben, in diesen Fall gibt es doch auch keine Kovarinz oder? Also wir haben dann in einem Übungsbuch von Hartung eine ähnliche Aufgabe gefunden und dort wurde sie einfach so gelöst das man die Werte standardisiert hat und dann die zugehörigen Standardnormalverteilungsquantile berechnet hat. Dann wurde diese Werte als Koordinaten benutzt und die Punkt in ein Koordinatensystem eingetragen und fertig, bei dieser Lösung braucht man aber an keiner Stelle die Chi-Quadratverteilung also wofür ist dann der Hinweis in der Aufgabenstellung, der erklärt wie man von der einen zu anderen Verteilung kommt?

III. Frage

Auch Klausur März 2007 Teil Multivariate Verfahren Aufgabe 3e.)

Wie errechne ich dieses erwartungstreuen Schätzer???

Es wäre wirklich super, wenn ihr euch diesen Frage annehmen könntet, denn wir haben schon so viele Stunden darüber gegrübelt und 🙁wir können nicht mehr...:hmmm:

Vielen Dank
Sandra
 
Sandra,

kleiner Forumswechsel.... ich fange mal klein an und versuche erst mal eine Frage zu beantworten. Hoffe natürlich auch, daß diese eine der von Dir angesprochen, unbeantworteten Fragen ist.

Bei Deiner letzte Frage(MV 03/07 2!e), denke ich, daß die Varianz in der Kovarianzmatrix des KQ-Schätzers einfach für die Kovarianzmatrix der Responsvariablen steht(KE 6 Seite 5 unten). Anders bezeichnet ist die KM der RV ein "erwartungstreuer Schätzer für die Konvarianzmatrix der Fehlervektoren e1,...,en"(vgl. Hartung Aufl. 5 Multivariate Statistik Seite 663). Damit solltest Du die Aufgabe jetzt lösen können.

Viele Grüße
Holger
 
[
II. Frage

Klausur März 2007 Aufgabenteil Multivariate Verfahren Die QQ-Plot Aufgabe.



In Aufgabe a.) soll man zunächst die Distanzen berechnen. Aber kann es bei einem Merkmal Distanzen geben, in diesen Fall gibt es doch auch keine Kovarinz oder? Also wir haben dann in einem Übungsbuch von Hartung eine ähnliche Aufgabe gefunden und dort wurde sie einfach so gelöst das man die Werte standardisiert hat und dann die zugehörigen Standardnormalverteilungsquantile berechnet hat. Dann wurde diese Werte als Koordinaten benutzt und die Punkt in ein Koordinatensystem eingetragen und fertig, bei dieser Lösung braucht man aber an keiner Stelle die Chi-Quadratverteilung also wofür ist dann der Hinweis in der Aufgabenstellung, der erklärt wie man von der einen zu anderen Verteilung kommt?

Die Distanz selbst bezieht sich nicht auf die Distanz zwischen den Objekten n der Beobachtungsvektoren y1,...,yp, sondern zwischen den Objekten der Beobachtungvektoren (z.B yi1 und yi2) und den Stichprobenmittelwerten der Vektoren der Matrix. Dementsprechend gibt es hier Distanzen zwischen den Werten, in diesem Fall, einen Vektors und dem Stichprobenmittelwert, entsprechend der Anzahl der n Objekte 9 Distanzen.

Um das QQ-Plot zeichnen zu können sind die Werte der CHi-Quadrat Verteilung m. E. nach nötig(vergl. KE 8 Seite 14 Abb 11.4 oder Hartung MV Aufl. 5 Seite 678 Abb. 3). Da in der CQ-Tabelle der Klausur nur die Werte für ein paar bestimmte Quantile angegeben sind, mußt Du die restlichen Werte ausrechnen und zwar mit der angegeben Formel.
Bsp. Quantil der kürzesten Distanz di ist (i/(n+1) = 1/10 = 0,1. Eingesetzt in die angegebene Formel (Phi^-1((0,1+1)/2))^2 = (Phi^-1(0,55)^2. Den Z-Wert für FZ = 0,55 kannst Du in der Normalverteilungstabelle ablesen.
Z wäre dann ca. 0,1256. 0.1256^2 = 0,01577.

Eine Frage stellte sich aber für mich noch:
Für die kürzeste Distanz berechne man den CQ-Wert mit dem kleinsten Quantil, für die größte Distanz dann natürlich mit dem größten Quantil. Bei einigen der Distanzen habe ich aber bei dieser Aufgabe gleiche Werte ermittelt. Ich vermute zwar, daß es keine Rolle spielt, da die Formel für die Quantile ja i/(n+1) ist und es sozusagen auf i ankommt und 9 Distanzen di gibt, es stellt für mich aber einen Unsicherheitmoment dar. Kann da jemand etwas dazu sagen?

Viele Grüße
Holger
 
Holger,

danke für deine Antworten. Die Kovarianzmatrix lasse ich dann aber bei der Berchnung der Distanzen weg, oder? Habe die Aufabe jetzt nicht vor mir, aber ich erinnere mich dass wir uns da auch nicht so einig waren was mit der Matrix passiert.

Gut, die Lösung verstehe ich aber ich Frage mich dann wieso in dem anderen Hartung Buch so ein anderer Lösungsweg dargestellt wird. Naja ich werde die beiden Aufgaben und vor allem die Aufgabenstellungen nochmal vergleichen, vielleicht gab es ja doch einen Unterschied, und wenn ich was gefunden habe, werde ich hier davon berichten.

so bis später dann ...
 
Oben