Was die Regression angeht, so kann man da schon einiges simulieren. Angenommen, ich betrachte die Gleichung
[Tex] y_i = a + bx_i + u_i \qquad \qquad i=1,\ldots,n[/Tex]
[tex]u_i[/tex] ist ein normalverteilter Fehlerterm mit [tex]u_i \sim N(0,\sigma^2)[/tex]
[tex]a, b \quad \text{und} \quad \sigma^2 [/tex] sind unbekannte Parameter. Für Simulationen muß ich die vorgeben, z.B. [tex]a = 1, b = 2 \quad \text{und} \quad \sigma^2 = 1 [/tex] Ebenso n, z.B. n=10. Außerdem muss man die Werte für die unabhängige Variable [tex] x_i[/tex] vorgeben. Hängt natürlich von der Anwendung ab, die einen interessiert. [tex] x_i[/tex] könnte sein das Körpergewicht von Personen, das disponible Einkommen für zehn Jahre, ein linearer Trend: 1, 2, ... 10 etc.
Und jetzt wird simuliert:
Ich erzeuge nacheinander n = 10 normalverteilte Zufallszahlen (z.B. mit Excel) mit Mittelwert 0 und Varianz = [tex]\sigma^2 = 1[/tex] Damit habe ich die Werte für [tex]u_i[/tex]. Die 10 Werte für die [tex] y_i[/tex] bestimme ich aus der obigen Gleichung (alle Werte auf der rechten Seite sind jetzt gegeben). Auf diese Weise erhalte ich eine Stichprobe von y-Werten.
Man könnte jetzt z.B. mit der Methode der kleinsten Quadrate a und b schätzen. damit erhalte ich [tex] \hat{a} [/tex] und [tex] \hat{b} [/tex] Das wäre deshalb interessant, da ich a und b kenne und daher einmal sehen kann. wie Schätzwerte von den Werten, den sie schätzen sollen, abweichen.
Interessant wird es natürlich, wenn ich das Ganze jetzt häufig wiederhole, z.B. 100 mal oder 1000 mal. Bei jedem mal die Zufallszahlen [tex]u_i[/tex] neu erzeugen und wieder in die obige Gleichung einsetzen, um die [tex]y_i[/tex] neu zu berechnen.
Die Werte für die [tex]x_i[/tex] sowie für [tex]a, b \sigma^2 = 1[/tex]werden dabei nicht verändert.
Auf diese Weise kann ich Regressions-Stichproben generieren.