Resampling-Verfahren

Zusammenfassung: Sedlmeier et al. 2018 – Kapitel 19

Die klassische Inferenzstatistik beruht auf eine Reihe von Annahmen. Für Signifikanztests werden Stichprobenverteilungen theoretisch hergeleitet, bpsw. Normalverteilung und Varianzgleichheit der Werte in der Population vorausgesetzt. Im Gegensatz dazu funktionieren Resampling-Verfahren auch ohne diese Restriktionen. Die Besonderheit liegt wie der Name schon sagt auf der Generierung einer empirischen Stichprobenverteilung. Dies wird erreicht durch wiederholtes Ziehen aus der ursprünglichen Stichprobe. Die zwei wichtigsten Resampling-Methoden sind:

  • Bootstrapping
  • Randomisierung

Das Bootstrapping basiert auf die Ziehung mit Zurücklegen und wird zumeist für die Konstruktion von Konfidenzintervallen genutzt. Durch den Trick mit dem Zurücklegen werden zigtausende Resamplingstichproben generiert, diese wiederum zur Erstellung der empirischen Stichprobenverteilung verwendet.

Randomisierungstests sind das Pendant zu den Signifikanztests. Da die Stichprobenverteilung zur Testung der Nullhypothese gebraucht wird, wird das Resampling je nach Fall unterschiedlich durchgeführt. Zumeist ist es jedoch Ziehung ohne Zurücklegen. Die Resampling-Stichprobenverteilung muss ggf. zusätzlich modifiziert bspw. verschoben werden.

Resampling-Verfahren sollten immer dann eingesetzt werden, wenn die Voraussetzungen parametrischer traditioneller Tests garnicht oder unzureichend erfüllt sind. Zudem ermöglichen Resampling-Verfahren statistische Kennwerte zu untersuchen, für welche keine adäquate theoretische Stichprobenverteilung existieren.

Schreibe einen Kommentar