„Scheinkorrelation“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
MM-Stat (Diskussion | Beiträge)
K Der erste Satz war etwas unvollständig (es fehlte mE ein Substantiv), habe ihn daher leicht umformuliert, im letzten Satz der Einleitung Punkt aus der Klammer gezogen
Erzbischof (Diskussion | Beiträge)
Scheinregression eingebaut, Hauptautoren in der Versionsgeschichte. http://de.wikipedia.org/w/index.php?title=Scheinregressionen&oldid=49059371
Zeile 1: Zeile 1:
# edits # Minor edits (%) First edit Last edit ATBE*
84.74.103.75 3 0 0.0% 2006-07-22 09:35 2006-07-22 09:36 33 s
Blaubart 3 2 66.7% 2004-07-14 20:01 2004-07-14 20:04 97 s
Jbenno 1 1 100.0% 2008-08-01 16:25 2008-08-01 16:25
Blaufisch 1 0 0.0% 2007-02-26 16:57 2007-02-26 16:57
TableSitter 1 1 100.0% 2006-12-10 16:37 2006-12-10 16:37
89.50.33.190 1 0 0.0% 2006-11-01 18:53 2006-11-01 18:53
134.2.166.14 1 0 0.0% 2006-07-06 16:53 2006-07-06 16:53
DuesenBot 1 1 100.0% 2005-01-03 17:54 2005-01-03 17:54
Pm 1 0 0.0% 2004-08-10 14:51 2004-08-10 14:51
DasBee 1 1 100.0% 2004-07-15 07:07 2004-07-15 07:07


'''Scheinkorrelation''' oder ([[Englische Sprache|engl.]]) '''spurious correlation''' bezeichnet eine Korrelation zwischen zwei Größen, der kein Kausalzusammenhang zu Grunde liegt. Häufig ist dies der Fall, wenn sogenannte [[intervenierende Variable]]n nicht berücksichtigt werden.
'''Scheinkorrelation''' oder ([[Englische Sprache|engl.]]) '''spurious correlation''' bezeichnet eine Korrelation zwischen zwei Größen, der kein Kausalzusammenhang zu Grunde liegt. Häufig ist dies der Fall, wenn sogenannte [[intervenierende Variable]]n nicht berücksichtigt werden.
Das Phänomen ist seit den Anfangstagen der Statistik bekannt, der Begriff ''spurious correlation'' wurde 1954 von [[Herbert Simon|H. A. Simon]] geprägt. Die deutsche Übersetzung ist missverständlich, da nicht nur zum Schein, sondern tatsächlich eine Korrelation vorliegt, aber eben keine Kausalität. (Siehe [[Korrelation#Abgrenzung Regression .2F Fehlinterpretation Korrelation|→Korrelation]] zur Abgrenzung der Konzepte.)
Das Phänomen ist seit den Anfangstagen der Statistik bekannt, der Begriff ''spurious correlation'' wurde 1954 von [[Herbert Simon|H. A. Simon]] geprägt. Die deutsche Übersetzung ist missverständlich, da nicht nur zum Schein, sondern tatsächlich eine Korrelation vorliegt, aber eben keine Kausalität. (Siehe [[Korrelation#Abgrenzung Regression .2F Fehlinterpretation Korrelation|→Korrelation]] zur Abgrenzung der Konzepte.)
Zeile 8: Zeile 21:


== Scheinregression in der Ökonometrie ==
== Scheinregression in der Ökonometrie ==

Die '''Scheinregression''' ist ein Spezialfall der [[Regression]], bei der ein statistisch [[Statistische Signifikanz|signifikanter]] Zusammenhang zwischen einer Variablen <math>Y_t</math> und einer Variablen <math>X_t</math> festgestellt werden kann, der sachlogisch nicht zu begründen ist. Scheinregressionen sind auf einen gemeinsamen [[Trend (Statistik)|Trend]] in den beteiligten [[Variable|Variablen]] zurückzuführen. Ein Hinweis auf Scheinregression ist ein hohes [[Bestimmtheitsmaß]] <math>R^2</math> und ein [[Durbin-Watson-Test|Durbin-Watson-Koeffizient]] von nahezu Null (hohe positive [[Autokorrelation]] erster Ordnung).


[[Datei:Spurious_regression.svg|thumb|Regressionsgerade zwischen zwei unabhängigen [[ARMA|AR]](1)-Prozessen mit Einheitswurzel inklusive <math>t</math>-Statistik.]]
[[Datei:Spurious_regression.svg|thumb|Regressionsgerade zwischen zwei unabhängigen [[ARMA|AR]](1)-Prozessen mit Einheitswurzel inklusive <math>t</math>-Statistik.]]

Version vom 8. November 2009, 23:36 Uhr

# edits # Minor edits (%) First edit Last edit ATBE* 84.74.103.75 3 0 0.0% 2006-07-22 09:35 2006-07-22 09:36 33 s Blaubart 3 2 66.7% 2004-07-14 20:01 2004-07-14 20:04 97 s Jbenno 1 1 100.0% 2008-08-01 16:25 2008-08-01 16:25 Blaufisch 1 0 0.0% 2007-02-26 16:57 2007-02-26 16:57 TableSitter 1 1 100.0% 2006-12-10 16:37 2006-12-10 16:37 89.50.33.190 1 0 0.0% 2006-11-01 18:53 2006-11-01 18:53 134.2.166.14 1 0 0.0% 2006-07-06 16:53 2006-07-06 16:53 DuesenBot 1 1 100.0% 2005-01-03 17:54 2005-01-03 17:54 Pm 1 0 0.0% 2004-08-10 14:51 2004-08-10 14:51 DasBee 1 1 100.0% 2004-07-15 07:07 2004-07-15 07:07


Scheinkorrelation oder (engl.) spurious correlation bezeichnet eine Korrelation zwischen zwei Größen, der kein Kausalzusammenhang zu Grunde liegt. Häufig ist dies der Fall, wenn sogenannte intervenierende Variablen nicht berücksichtigt werden. Das Phänomen ist seit den Anfangstagen der Statistik bekannt, der Begriff spurious correlation wurde 1954 von H. A. Simon geprägt. Die deutsche Übersetzung ist missverständlich, da nicht nur zum Schein, sondern tatsächlich eine Korrelation vorliegt, aber eben keine Kausalität. (Siehe →Korrelation zur Abgrenzung der Konzepte.) Scheinkorrelation ist die statistische Entsprechung des in der Philosophie betrachteten Fehlschluss Cum hoc ergo propter hoc (gemeinsames Auftreten impliziert keine Kausalität).

Beispiel

Ein bekanntes Beispiel in der Statistik ist die Korrelation zwischen der Zahl der Kindergeburten und der Zahl der Storchenpaare in verschiedenen Regionen. Obwohl es eine Korrelation zwischen der Zahl der Geburten und der Zahl der Storchenpaare gibt, gibt es keinen kausalen Zusammenhang. Tatsächlich gibt es aber einen kausalen Zusammenhang zu einer dritten (intervenierenden) Variable: der Ländlichkeit der Region. Je ländlicher eine Region ist, desto höher ist die Zahl der Kindergeburten und desto größer ist die Zahl der Storchenpaare. Dies führt zu der Korrelation zwischen der Zahl der Kindergeburten und der Zahl der Storchenpaare.

Scheinregression in der Ökonometrie

Die Scheinregression ist ein Spezialfall der Regression, bei der ein statistisch signifikanter Zusammenhang zwischen einer Variablen und einer Variablen festgestellt werden kann, der sachlogisch nicht zu begründen ist. Scheinregressionen sind auf einen gemeinsamen Trend in den beteiligten Variablen zurückzuführen. Ein Hinweis auf Scheinregression ist ein hohes Bestimmtheitsmaß und ein Durbin-Watson-Koeffizient von nahezu Null (hohe positive Autokorrelation erster Ordnung).

Regressionsgerade zwischen zwei unabhängigen AR(1)-Prozessen mit Einheitswurzel inklusive -Statistik.

Ein interessanter Fall in den Anwendungen ist das spurious regression problem der Ökonometrie, auf welches Granger und Newbold 1974 hingewiesen haben, nach dem auch zwei unabhängige Random walks ohne deterministische Trendkomponente (oder andere Formen von stochastischen Prozessen mit Einheitswurzel) korrelieren, obwohl sogar stochastische Unabhängigkeit vorliegt.[1] Genauer formuliert führen solche durch Autokorrelation verursachte Verletzungen der Voraussetzungen eines Regressionsmodells dazu, dass zum Beispiel die Teststatistiken für die Hypothese, dass der Steigungsparameter der Regressionsgeraden gleich Null ist (t-Statistik), mit wachsendem Datenumfang divergieren, also wenn nur genügend Daten erhoben werden, immer ein Zusammenhang festgestellt wird.

Literatur

Allgemeine Literatur
  • Günter Bamberg, Franz Baur, Michael Krapp: Statistik. Oldenbourg Wissenschaftsverlag, 2007, Ausgabe 13, ISBN 3-486-58188-0.
  • Udo Kelle: Die Integration qualitativer und quantitativer Methoden in der empirischen Sozialforschung: theoretische Grundlagen und methodologische Konzepte. VS Verlag, 2007, ISBN 3-531-15312-9, S. 203.
Originalarbeiten
  • H. A. Simon: Spurious correlation: a causal interpretation. In: Journal of the American Statistical Association, Nr. 49, 1954, S. 469-492.
  • C. W. J. Granger und P. Newbold: Spurious regressions in econometrics. In: Journal of Econometrics, Nr. 2, 1974, S. 111–120.

Einzelnachweise

  1. Christopher Dougherty: Introduction to econometrics. Oxford University Press, 3. Ausgabe, 2007, ISBN 0-19-928096-7, S. 388. Google-Books-Link.