Konfidenzintervall - ein oder zweiseitig?

Dr Franke Ghostwriter
Konfidenzintervall - ein oder zweiseitig?

liebe Leute,

kann mir bitte jemand erklären, woran ich erkennen kann wann es sich
um ein einseitiges oder zweiseitiges Konfidenzintervall handelt ?

danke schön
gruß Linus :confused
 
Also um es mal ganz einfach (wenn auch nicht ganz mathematisch korrekt zu sagen): Einseitige Konfidenzintervalle erfassen werte nur in eine Richtung (steigend oder sinkend). Bei zweiseitigen Konfidenzintervallen können die Werte in beide Richtungen abweichen.
 
Also das Intervall selber hat nichts damit zu tun, ob ich ein- oder zweiseitig testen muss. Ein 95%-Intervall gibt an, dass in 95% der Fälle der wahre Wert innerhalb der Intervallgrenzen liegt. Bei einem einseitigen Test wird abglehnt, wenn ein kritischer Wert über- oder unterschritten wird. Bei einem zweiseiten Test gibt es eine kritische Ober- und Untergrenze.
 
richtig, ich kann Patrick nur zustimmen, ob es einseitig oder zweiseitig ist, ergibt sich natürlich nicht aus dem Konfidenzintervall sondern aus der Aufgabenstellung.

Mal zwei Beispiele für einseitige Tests:
Alkoholkonsum verschlechtert die Reaktionszeit im Straßenverkehr
bzw.
Frauen haben durchschnittlich einen höheren IQ als Männer


und für zweiseitige:
Alkoholkonsum verändert die Reaktionszeit im Straßenverkehr (die Reaktionszeit könnte sich verschlechtern oder aber auch verbessern)
bzw.
Der IQ von Frauen unterscheidet sich von dem der Männer (auch hier sind zwei Richtungen möglich: Der IQ ist höher oder niedriger als der der Männer)


hab ich aus einer Präsentation im Internet kopiert, fand ich ganz hilfreich.
 
Schöne Beispiele. Was dabei auffällt: Auf die Formulierung achten! Anhand der Formulierung kann man ablesen, ob man zwei- oder einseitig testen muss. Es gibt aber auch Fälle, wo man zweiseitig testen müsste, aber ein einseitiger Test bereits das korrekte Ergebnis liefert.
 
Hmm.. was ich dann aber nicht verstehe ist z.B. Aufgabe 10 aus der Klausur März 2010.

Hier mal kurz die Aufgabenstellung:

Obsthändler verspricht, dass der Vitamine C Gehalt im O Saft normalverteilt ist mit dem Erwartungswert von 75mg und einer Standardabweichung von 5 mg. Es werden 16 Orangen getestet. Durchschnittswert = 73 mg und eine empirische Standardaweichung von s = 5,15625 mg.

Richtig ist A + B

A = mit der Standardabweichung von 5 ergibt sich das zweiseitige Konfidenzintervall für den Erwartungswert zum Niveau von 0,975 zu ( 70,2;75,8)

B = mit Standardab. von 5 ergibt seich ein seinseitiges KI für den EW zum Niveau von 0,975 zu (-unendlich; 75,45)

Wie kann ein KI sowohl einseitig, als auch zweiseitig sein????
 
A) Mit der vorausgesetzten Standardabweichung von 5 ergibt sich dass zweiseitige Konfidenzintervall für µ zum Niveau 0,975 zu (70,2 ; 75,8)

B) Mit der vorausgesetzten Standardabweichung von 5 ergibt sich ein einseitiges Konfidenzintervall für µ zum Niveau 0,975 zu (-unendlich ; 75,45)

??????
 
So ich meld mich mal zur Wort.

Bei den Antworten A und B haben wir die Standardabweichung (der Grundgesamtheit) als "Gott gegeben" vorausgesetzt und es ist ein Konfidenzintervall zu einem bestimmten Niveau gesucht. Maßgebend ist Glossar S. 84 Printversion.


Aufgabenteil A) Das Konfidenzintervall soll zweiseitig sein, also eine Ober- und eine Untergrenze besitzen.

Ich wandere das Diagramm entlang:

Sigma bekannt? --> JA! (Siehe Aufgabentext!)

X_ ist näherungsweise normalverteilt? --> JA! (Siehe Aufgabentext!)

SigmaX_ = Sigma/n^0,5 = 5/16^0,5 = 5/4 = 1,25

µo = X_ + z * SigmaX_ = 73 + z*1,25
µu = X_ - z * SigmaX_ = 73 - z*1,25

Jetzt haben wir das Niveau 1-a = 0,975 vorgegeben und müssen noch z bestimmen.
Das heißt, dass die Fläche unter der Gaußschen Dichtefunktion 0,975 betragen muss. Wir nehmen deshalb die Normalverteilung, weil es ja normalverteilt ist (siehe Aufgabenstellung) und folglich haben wir hier Konfidenzintervallgrenzen, die so liegen wie auf Glossar Seite 104 Printversion, rechter Hügel. Diese Fläche da heißt F2(z) und soll nun 0,975 sein. Aus der Tabelle entnehmen wir dann, dass
F2(2,25) = 0,9756 gilt.

Also:
µo = 73 + 2,25*1,25 = 75,8125 = rund 75,8
µu = 73 - 2,25*1,25 = 70,1875 = rund 70,2

Wie man erkennt, sind die Tabellen immer ein wenig ungenau. Man wähle stets jenen z-Wert, wo die F-Werte mindestens erreicht werden, also ist eine minimale Überschreitung einer minimalen Unterschreitung vorzuziehen. Soviel zur Lösungstechnik.

Damit ist A richtig.


Jetzt ist bei B) von einem einseitigen Konfidenzintervall die Rede. Hier stehen grunbdsätzlich zwei Intervalle zur Verfügung. Eines, welches nach unten hin beschränkt ist (und nach oben offen) und eines, was nach unten hin offen ist, aber nach oben beschränkt. Damit wir nicht rätselraten müssen, wurde ja bei Aufgabe B) ein einseitiges Konfidenzintervall, welches eine Obergrenze hat, angegeben.
Aber stimmt auch der Wert?
Schauen wir mal:
Ich wandere das Diagramm entlang:

Sigma bekannt? --> JA! (Siehe Aufgabentext!)

X_ ist näherungsweise normalverteilt? --> JA! (Siehe Aufgabentext!)

SigmaX_ = Sigma/n^0,5 = 5/16^0,5 = 5/4 = 1,25

µo = X_ + z * SigmaX_ = 73 + z*1,25

Und auch hier müssen wir wieder das z aus der Normalverteilungsübersicht herausfischen. Diesesmal ist es der linke Hügel auf Seite 104, wir suchen also Fz(z) = 0,975.
Und da ergibt sich gemäß Tabelle: Fz(1,96) = 0,975 (auf den Punkt genau, yeah!)

Demnach:

µo = 73 + 1,96*1,25 = 75,45

Also ist auch B richtig.


Wichtig ist, dass man Kondidenzintervalle und Testverfahren strikt trennen muss. In der Aufgabe ist noch von einem Test eines Instituts die Rede aber in den Antwortmöglichkeiten plötzlich von Konfidenzintervall. Da muss man AUFPASSEN HOCH 2!


Merke:
SCHÄTZVERFAHREN:
Konfidenzintervalle sind immer Zufallsintervalle. Die Grenzen können je nach Stichprobe ganz unterschiedlich ausfallen. (1-a)*100% aller Intervalle überdecken dann den wahren Parameter, aber nicht: der wahre Parameter liegt mit (1-a)*100%iger Wahrscheinlichkeit im Intervall. Er liegt entwerder drin oder draußen!

TESTVERFAHREN:
Es wird eine Nullhypothese formuliert, von der wir ausgehen, dass sie richtig sei. Die Nullhypothese berücksichtigt anschaulich gesprochen den Umstand, dass es in der realen Welt immer Zufallsschwankungen gibt. Ein Erwartungswert von µ = 75mg Vitamin C bedeutet ja nicht zwingend, dass in einer Stichprobe von 16 Orangen mit X_ = 73mg (Achtung! X_ ist ein erwartungstreuer und effizienter Schätzer für µ, aber eben nicht µ selbst) die Herstellergarantie nicht eingehalten wurde. Daher werden zunächst mit der Formulierung von Ho - und jetzt kommt's - FESTE GRENZEN VORHER ERMITTELT - welche den Bereich angeben, wie stark hier vom wahren Wert µ = 75mg abgewichen werden darf. Natürlich ist es klar, dass auch der wahre Wert nicht immer bekannt ist, weswegen Testverfahren ja auch zu einem Fehler erster und zweiter Art (Glossar Seite 20 Printversion) führen können. Die Stichprobenfunktion, die hier eine Realisation einer Zufallsvariable ist (unabhängige Ziehungen von Orangen!) und konkret den Wert 73mg annimmt, liegt dann zu 97,5% im Intervall - Irrtum mit 2,5% vorbehalten.


Im Glossar manifestiert sich dieser immer wieder gern abgeprüfte Umstand ganz einfach dadurch,
dass beim Konfidenzintervall z.B. gerechnet wird:
µo = X_ + z * SigmaX_ (Der wahre Parameter µ liegt drin oder nicht, wird von (1-a)*100% nach dieser Rechenvorschrift ermittelten Intervallen aber "immerhin" überdeckt)

Bei einem Testverfahren zunächst mal kritische Grenzen ermittelt werden:[/COLOR]
co = µ + z * SigmaX_[/COLOR] (Liegt Testtatistik X_ mit (1-a)*100% drin?)

Man erkennt: µ ist der wahre Wert einer Verteilung und annahmegemäß keine Zufallsvariable, sondenr "Gott gegeben" (Gott würfelt nicht, oder..?! 😉 ), also ist auch die Obergrenze fest, beim Konfidenzintervall ist das nicht so.
Wenn aber die Obergrenze fest ist, ist klar, dass man dan eindeutig eine Wahrscheinlichkeitsaussage treffen kann, was die Teststatistik X_ angeht....
 
Aha!

Was ich nur immer noch nicht verstehe ist folgendes:

Bei den meisten alten Aufgaben zu diesem Thema muss man ja entscheiden, ob es sich um ein einseitiges oder um ein zweiseitiges KI handelt. Deshalb bin ich davon ausgegaben, dass es immer eine "Entweder-oder-Entscheidung" ist.

Hier bei dieser Aufgabenstellung hätte ich mich z.B. für das zweiseitige KI entschieden, da die Werte ja nach oben und nach unten abweichen können. (Es wurde nicht < oder > von von irgendwas gefragt.)

Deswegen verwundert es mich etwas, dass A und B richtig sind. Vorallem, dass B richtig ist. Ich meine, auf die Werte bin ich auch schon gekommen, aber ich dachte halt, das KI ist zweiseitig!
 
Interessanter Einwand!

Anhand Deiner Aussage entnehme ich, dass Du, wärest Du das Orangentest-Institut, ein zweiseitiges Konfidenzintervall genommen hättest, um die Herstellergarantie zu prüfen.
Das ist aber falsch. Wenn überhaupt würdest Du sinnigerweise eine zweiseitige Nullhypothese formulieren mit fester Ober-, sowie Untergrenze.

Wärest Du aber jemand, der einfach den wahren Parameter µ anhand der Stichprobe testen will, also wenn das Orangeninstitut nicht testen, sondern schätzen will, wie hoch der wahre Parameter ist, dann wäre hier ein zweiseitiges Konfidenzintervall durchaus sinnvoll.

Es kann aber auch sein, dass bei dem Schätz- und bei dem Testverfahren jeweils nur eine Seite betrachtet wird, nämlich die negativ empfundenen Vitamin-C-Abweichungen nach unten.

Aber was spielt das für eine Rolle, wenn man in der Aufgabenstellung einfach nur entscheiden soll, ob eine Aussage wahr oder falsch ist?
Es ist ja gar nicht gefragt, ob eine einseitige oder zweiseitige Betrachtung mehr Sinn macht als die jeweils andere...
 
Oben