multiple regression - kai arzheimer: publications ... · statistische kontrolle multivariate...

39
Multiple Regression Statistik II

Upload: docong

Post on 18-Sep-2018

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

Multiple Regression

Statistik II

Page 2: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Ubersicht

WiederholungLiteraturRegression

Multivariate ZusammenhangeAssoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

Multiple RegressionDas Multivariate ModellBeispiel: Bildung und VerbrechenFit

Zusammenfassung

Statistik II Multiple Regression (1/33)

Page 3: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

LiteraturRegression

Literatur fur heute

I Agresti ch. 10

I Zur Nach- und Vorbereitung:

I Agresti ch. 11

Statistik II Multiple Regression (2/33)

Page 4: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

LiteraturRegression

Literatur fur nachste Woche

I Mason/Wolfinger: Cohort Analysis.

I Kish: Weighting: Why, When, and How?

Statistik II Multiple Regression (3/33)

Page 5: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

LiteraturRegression

Daten/Kommandos fur heute

I net get from

http://www.kai-arzheimer.com/Statistik-II/stata/

I net describe floridacrime

I net get floridacrime

Statistik II Multiple Regression (4/33)

Page 6: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

LiteraturRegression

Was ist Regression?

I Modellierung konditionaler Verteilung (Mittelwert undStreuung)

I Beschreibung vs. Inferenz

I Daten vs. Modellannahmen

I Bekanntestes und einfachstes Modell: lineare (Einfach)-Regression

Statistik II Multiple Regression (5/33)

Page 7: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

LiteraturRegression

Was ist lineare Einfachregression?

I Der konditionale Mittelwert einer abhangigen Variablen y wirdmodelliert als

I lineare Funktion einer unabhangigen Variablen x und einerKonstanten

I Gemeinsame Verteilung von x und y als Punktewolke(Fehlervarianz) um eine gerade Linie

I Allgemeines Muster fur viele andere statistische Modelle

I Bestimmung der Parameter durch OLS (Minimale quadrierteAbweichung in y -Richtung)

Statistik II Multiple Regression (6/33)

Page 8: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

LiteraturRegression

Wie funktioniert OLS (ohne Mathematik)

I SAQ = Funktion(Daten, Parameterschatzungen)

I Daten sind gegeben

I Welche Parameterschatzungen machen SAQ moglichst klein(guter Fit, gute Schatzung)?

I Minimum der SAQ-Funktion suchen → 1. Ableitung auf nullsetzen, nach Konstante und Steigung auflosen

1. Formeln aus Formelsammlung2. Alternativ: kompakte Matrixalgebra

Statistik II Multiple Regression (7/33)

Page 9: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

Was ist Kausalitat?

I X → YI Hypothetisch-kontrafaktisches Konzept von Kausalitat

I X und Y an einem Fall messenI Realitat fur diesen Fall mit anderem Wert von X

”wiederholen“

– Anderung von Y ?I In der Praxis nicht durchfuhrbar, nur Annaherung an dieses

Ideal

I Statistische Verfahren kein Ersatz fur gutes Design

Statistik II Multiple Regression (8/33)

Page 10: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

Was ist Kausalitat?

I X → YI Hypothetisch-kontrafaktisches Konzept von Kausalitat

I X und Y an einem Fall messenI Realitat fur diesen Fall mit anderem Wert von X

”wiederholen“

– Anderung von Y ?I In der Praxis nicht durchfuhrbar, nur Annaherung an dieses

Ideal

I Experiment:I Viele ObjekteI X von Forscherin variiert, zeitliche Reihenfolge klarI Vergleichbar bezuglich anderer Eigenschaften wg. zufalliger

Aufteilung auf Experimental-/Kontrollgruppe

I Statistische Verfahren kein Ersatz fur gutes Design

Statistik II Multiple Regression (8/33)

Page 11: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

Was ist Kausalitat?

I X → YI Hypothetisch-kontrafaktisches Konzept von Kausalitat

I X und Y an einem Fall messenI Realitat fur diesen Fall mit anderem Wert von X

”wiederholen“

– Anderung von Y ?I In der Praxis nicht durchfuhrbar, nur Annaherung an dieses

Ideal

I Beobachtung/Befragung (ex post facto)I Viele ObjekteI Keine Kontrolle uber X (zeitliche Reihenfolge), keine zufallige

AufteilungI Andere Eigenschaften nur

”statistisch kontrollierbar“

I Statistische Verfahren kein Ersatz fur gutes Design

Statistik II Multiple Regression (8/33)

Page 12: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

Was setzt Kausalitat voraus?

I X → Y

1. (Theorie)

2. Statistische Assoziation (Ubergangdeterministische/probabilistische Aussagen!)

3. Richtige zeitliche Reihenfolge – in ex post facto Designs fastnicht zu prufen

4. Ausschluß von Drittvariablen

Statistik II Multiple Regression (9/33)

Page 13: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

Beispiel: Korpergroße und Mathematik-Leistung

Statistik II Multiple Regression (10/33)

Page 14: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

Beispiel: Pfadfinder und Delingquenz

Statistik II Multiple Regression (11/33)

Page 15: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

Beispiel: Pfadfinder und Delingquenz

Statistik II Multiple Regression (11/33)

Page 16: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

Welche Beziehungen konnen zwischen drei Variablenbestehen?

1.”Scheinkorrelation“/

”scheinbare Non-Korrelation“

2. Mediatorvariable

3. Multiple Verursachung

4. Interaktion

5. . . .

Statistik II Multiple Regression (12/33)

Page 17: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

1.”Scheinkorrelation“

y

z

x

Statistik II Multiple Regression (13/33)

Page 18: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

”Scheinbare Non-Korrelation“ (Suppression)

I Kein Zusammenhang zwischen Bildung und Einkommen?

Statistik II Multiple Regression (14/33)

Page 19: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

2.”Mediatorvariable“

yxz

Statistik II Multiple Regression (15/33)

Page 20: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

3.”Multiple Verursachung“

x

z

y

Statistik II Multiple Regression (16/33)

Page 21: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

4.”Interaktion“

y

x

z

Statistik II Multiple Regression (17/33)

Page 22: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Assoziation und KausalitatStatistische KontrolleMultivariate BeziehungenInferenz

Schluß auf die Grundgesamtheit?

I Kontrolle fur multivariate Beziehungen durch multivariateModelle

I Inferenzen verfugbar

Statistik II Multiple Regression (18/33)

Page 23: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Modell (zwei unabhangige Variablen)

y = β0 + β1x1 + β2x2

I Wert von y von beiden unabhangigen Variablen beeinflußt

I Effekte linear (proportional) und additivI Effekte unabhangig voneinander

I β1 Effekt von x1 wahrend x2 konstant gehalten wird (vgl.Pfadfinder-Tabelle)

I β2 Effekt von x2 wahrend x1 konstant gehalten wird

I D. h. wechselseitige statistische Kontrolle

Statistik II Multiple Regression (19/33)

Page 24: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Graphische Darstellung (zwei unabhangige Variablen)

Statistik II Multiple Regression (20/33)

Page 25: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Beispiel: Bildung und Verbrechen

I 67 counties in Florida

I Sind counties mit hoherem Niveau von formaler Bildung (%high school Absolventen) krimineller (mehr Verbrechen proEinwohner)?

. reg c hs

Source SS df MS Number of obs = 67F( 1, 65) = 18.12

Model 11437.0945 1 11437.0945 Prob > F = 0.0001Residual 41025.0249 65 631.154229 R-squared = 0.2180

Adj R-squared = 0.2060Total 52462.1194 66 794.880597 Root MSE = 25.123

c Coef. Std. Err. t P>|t| [95% Conf. Interval]

hs 1.485977 .3490777 4.26 0.000 .788821 2.183133_cons -50.85691 24.45065 -2.08 0.041 -99.68823 -2.025583

Statistik II Multiple Regression (21/33)

Page 26: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Scatterplot + Regression

graph twoway (scatter c hs) (lfit c hs)

050

100

150

50 60 70 80 90HS

C Fitted values

Statistik II Multiple Regression (22/33)

Page 27: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

”Scheinkorrelation“?

Verbrechen

Urbanisierung

Bildung

I Kontrolle: multiple Regression

I Verbrechen = α + β1Bildung + β2Urbanisierung

I Effekt von Bildung fur jedes denkbare Niveau vonUrbanisierung

I Effekt von Urbanisierung fur jedes denkbare Niveau vonBildung

Statistik II Multiple Regression (23/33)

Page 28: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Regression in Stata

I Grundbefehl (reg)ress y x1 x2 ...

I Variablennamen konnen abgekurzt werden

I Jokerzeichen oder Bereiche fur Variablen

I Ergebnis der letzten Regression → reg

I (Optionen mit Komma abtrennen)

I Postestimation (z. B. predict)

Statistik II Multiple Regression (24/33)

Page 29: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

In Stata. . .

. reg c hs u

Source SS df MS Number of obs = 67F( 2, 64) = 28.54

Model 24731.6571 2 12365.8286 Prob > F = 0.0000Residual 27730.4623 64 433.288473 R-squared = 0.4714

Adj R-squared = 0.4549Total 52462.1194 66 794.880597 Root MSE = 20.816

c Coef. Std. Err. t P>|t| [95% Conf. Interval]

hs -.5833773 .4724591 -1.23 0.221 -1.527223 .3604684u .6825014 .1232126 5.54 0.000 .436356 .9286469

_cons 59.11806 28.36531 2.08 0.041 2.45184 115.7843

I Urbanisierung hat eine starken positiven Effekt

I Bildung hat negativen Effekt

I Partieller Effekt (vs. bivariater Effekt)

Statistik II Multiple Regression (25/33)

Page 30: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Partielle Effekte

I Partielle Effekte = Effekt von Bildung

I Innerhalb einer Gruppe von counties mit identischem (aberbeliebigem) Urbanisierungsgrad

I Schatzung uber alle Niveaus von Urbanisierungsgrad

I Und umgekehrt

I Analog zur Betrachtung von Subgruppen imPfadfinder-Beispiel

I Partielle Koeffizienten 6= Bivariate Koeffizienten wg.Korrelation zwischen unabhangigen Variablen

I Nicht beim Experiment

Statistik II Multiple Regression (26/33)

Page 31: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Warum ist der partielle Effekt negativ?0

5010

015

0

50 60 70 80 90 50 60 70 80 90

Ugrad nicht hoch Ugrad hoch

C

HSGraphs by Urbanisierungsgrad hoch

I Urbanisierungsgrad wird”konstant gehalten“

Statistik II Multiple Regression (27/33)

Page 32: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Visualisierung: Matrixplot

C

U

HS

0

50

100

150

0 50 100 150

0

50

100

0 50 100

50

100

50 100

Statistik II Multiple Regression (28/33)

Page 33: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Partielle Regressionsplots

Verbrechen

Urbanisierung

Bildung

I (Added Variable Plot)

I Residuum: Differenz zwischen beobachtetem und geschatztemWert

I Verbrechen = α1 + β1 Urbanisierung → Residuum =Verbrechen abzuglich Effekt von Urbanisierung

I Bildung = α2 + β2Urbanisierung → Residuum = Bildungabzuglich Effekt von Urbanisierung

Statistik II Multiple Regression (29/33)

Page 34: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Partielle Regressionsplots

I Regression von Residuum 1 auf Residuum 2 → identisch mitpartiellem Regressionskoeffizienten

I Plot . . .

I . . . fur alle unabhangigen Variablen, Identifikation vonAusreißern

I avplotsI Ein plot pro unabhangige VariableI Partieller Effekt dieser Variablen auf abhangige Variable →

Ausreißer

Statistik II Multiple Regression (29/33)

Page 35: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Partielle Regressionsplots-5

00

5010

0e(

c |

X )

-50 0 50e( u | X )

coef = .68250141, se = .12321259, t = 5.54

-40

-20

020

4060

e( c

| X

)

-20 -10 0 10e( hs | X )

coef = -.58337729, se = .47245914, t = -1.23

Statistik II Multiple Regression (29/33)

Page 36: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

Root Mean Squared Error

I Verbrechen: 0 – 128; Residuum = Vorhersagefehler

I Residuum quadrieren und aufsummieren → SAQ

I SAQ/n= Mittlerer quadrierter Fehler

I Wurzel → RMSE

I Wie bei Einfachregression

. predict abweichung, resid

. gen aq=abweichung *abweichung

. sum aq

Variable Obs Mean Std. Dev. Min Max

aq 67 413.8875 495.9546 .8899312 2568.242

. displ sqrt(414)20.34699

Statistik II Multiple Regression (30/33)

Page 37: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

R2

I Analog zur EinfachregressionI R = Korrelation zwischen vorhergesagten/beobachteten Wert

bzw.I Gesamt SAQ (TSS) = Modell-SAQ (MSS) + Residuale SAQ

(RSS)I (PRE-Interpretation)

R2 = TSS−RSSTSS = MSS

TSS =Σ(y−y)2−Σ(y−y)2

Σ(y−y)2

I Kollinearitat zwischen unabhangigen Variablen

I Adjusted R2

Statistik II Multiple Regression (31/33)

Page 38: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Das Multivariate ModellBeispiel: Bildung und VerbrechenFit

R/R2 von Hand ausrechnen

. predict yhat(option xb assumed; fitted values)

. corr yhat c(obs=67)

yhat c

yhat 1.0000c 0.6866 1.0000

. display .69^2

.4761

Statistik II Multiple Regression (32/33)

Page 39: Multiple Regression - Kai Arzheimer: publications ... · Statistische Kontrolle Multivariate Beziehungen Inferenz ... I Statistische Verfahren kein Ersatz f ur gutes Design Statistik

WiederholungMultivariate Zusammenhange

Multiple RegressionZusammenfassung

Zusammenfassung

I Korrelation 6= KausalitatI Multiple Regression

I Keine Kontrolle uber unabhangige Variable(n) (vs. Experiment)I (Schwacher) Ersatz fur Randomisierung

(Drittvariablenkontrolle)

I Partielle vs. bivariate Effekte

I Fit analog zu Einfachregression

I Inferenz fur Koeffizienten?

I Nachste Woche: Agresti ch. 11

Statistik II Multiple Regression (33/33)