Korrelation

Zusammenfassung: Sedlmeier et al. 2018 – Kapitel 7

Die Korrelation bzw. der Zusammenhang zwischen zwei Variablen kann mit Hilfe bestimmter Verfahren analysiert und visualisiert werden. Insbesondere Streudiagramme bieten sich an für die grafische Darstellung des Zusammenhangs. Eine Messwertereihe zu zwei Variablen werden jeweils auf der x- und y-Achse abgetragen. Daraus ergibt sich eine Punktewolke aus der sich verschiedene Merkmale und Muster der Korrelation ableiten lässt.

Folgt die Form des Streudiagramms in etwa einer Geraden, besteht ein linearer Zusammenhang zwischen Variablen. Wenn die Punktewolke eher der Form einer Kurve ähnelt, haben wir es mit einem kurvilinearen Zusammenhang zu tun. Eine weitere Möglichkeit ist das gar kein Zusammenhang besteht, d.h. die beiden Variablen sind unkorreliert. Dies ist der Fall, wenn die Punkte keinen Trendmuster hergeben, bspw. kreisförmig sind.

Ein weiteres Merkmal linearer Korrelationen ist die Richtung. Wenn höhere Werte auf der einen Variable mit höheren Werten auf der anderen Variable zusammenkommen spricht man von einer positiven Korrelation. Hingegen verlaufen die beiden Variablen eher gegenläufig ist das ein Merkmal für eine negative Korrelation.

Der Produkt-Moment-Korrelationskoeffizient (r) ist ein Maß für für lineare Zusammenhänge und beschreibt eben diese beiden Aspekte Stärke und Richtung. Der Koeffizient hat einen Wertebereich von -1 bis +1 und wird wie folgt interpretiert:

  • +1 : Perfekter positiver Zusammenhang
  • 0 : Kein Zusammenhang
  • -1 : Perfekter negativer Zusammenhang

Bei der Analyse des Produkt-Moment-Korrelationskoeffizienten sollten folgende Faktoren berücksichtigt werden:

  • Ausreißerwerte können r in beiden Richtungen verzerren.
  • Eingeschränkte Variabilität für eine oder beide Variablen verzerren r nach unten.
  • Heterogene Subgruppen können das Ergebnis für die Gesamtstichprobe verfälschen.

Bei der Interpretation von r sollten weiterhin bedacht werden:

  • Eine Korrelation darf nicht mit einem Kausalzusammenhang gleichgesetzt werden.
  • Ferner, könnte es sich bei dem Zusammenhang um eine Scheinkorrelation handeln, welches auf eine oder mehrere andere Variablen zurückzuführen sind. Weitere Erkenntnisse können entweder durch Konstanthalten der Drittvariable oder die Berechnung der Partialkorrelation gewonnen werden.

Für nicht intervallskalierte Variablen gibt es alternative Zusammenhangsmaße:

  • Zwei dichotome, nominalskalierte Variablen: Phi Koeffizient.
  • Zwei ordinalskalierte Variablen: Kendalls Tau.

Schreibe einen Kommentar