R Spickzettel: Inferenzstatistik der Korrelation und Regression

library(tibble)
library(yarrr)
as_tibble(pirates)
# A tibble: 1,000 x 17
      id sex     age height weight headband college tattoos tchests parrots favorite.pirate
   <int> <chr> <dbl>  <dbl>  <dbl> <chr>    <chr>     <dbl>   <dbl>   <dbl> <chr>          
 1     1 male     28   173.   70.5 yes      JSSFP         9       0       0 Jack Sparrow   
 2     2 male     31   209.  106.  yes      JSSFP         9      11       0 Jack Sparrow   
 3     3 male     26   170.   77.1 yes      CCCC         10      10       1 Jack Sparrow   
 4     4 fema~    31   144.   58.5 no       JSSFP         2       0       2 Jack Sparrow   
 5     5 fema~    41   158.   58.4 yes      JSSFP         9       6       4 Hook           
 6     6 male     26   190.   85.4 yes      CCCC          7      19       0 Jack Sparrow   
 7     7 fema~    31   158.   59.6 yes      JSSFP         9       1       7 Blackbeard     
 8     8 fema~    31   173.   74.5 yes      JSSFP         5      13       7 Hook           
 9     9 fema~    28   165.   68.7 yes      JSSFP        12      37       2 Anicetus       
10    10 male     30   184.   84.7 yes      JSSFP        12      69       4 Jack Sparrow   
# ... with 990 more rows, and 6 more variables: sword.type <chr>, eyepatch <dbl>,
#   sword.time <dbl>, beard.length <dbl>, fav.pixar <chr>, grogg <dbl>

t-Test zur Überprüfung des Produkt-Moment-Korrelationskoeffizienten

cor.test(pirates$age, pirates$tchests, use="pairwise.complete.obs")
	Pearson's product-moment correlation

data:  pirates$age and pirates$tchests
t = 6.2602, df = 998, p-value = 5.703e-10
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.1340042 0.2533229
sample estimates:
      cor 
0.1943825 
cor.test(pirates$age, pirates$tchests, use="pairwise.complete.obs", alternative = "greater")
	Pearson's product-moment correlation

data:  pirates$age and pirates$tchests
t = 6.2602, df = 998, p-value = 2.851e-10
alternative hypothesis: true correlation is greater than 0
95 percent confidence interval:
 0.1437912 1.0000000
sample estimates:
      cor 
0.1943825 

t-Test zur Überprüfung des Regressionskoeffizienten

summary(lm(pirates$tchests ~ pirates$age))
Call:
lm(formula = pirates$tchests ~ pirates$age)

Residuals:
    Min      1Q  Median      3Q     Max 
-32.253 -15.885  -6.750   8.225 122.142 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   0.2083     3.6704   0.057    0.955    
pirates$age   0.8217     0.1313   6.260  5.7e-10 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 24.01 on 998 degrees of freedom
Multiple R-squared:  0.03778,	Adjusted R-squared:  0.03682 
F-statistic: 39.19 on 1 and 998 DF,  p-value: 5.703e-10

Verwendete Pakete und Funktionen

base

FunktionBeschreibung
summary(lm(Kriteriumsvariable ~ Prädiktorvariable))Die Ergebniszusammenfassung stellt unter anderem zur Verfügung:
– t-Test für Regressionskoeffizient.
– F-Test für die Gesamtgüte des Regressionsmodells.

stats

FunktionBeschreibung
cor.test(
Variable1,
Variable2,
use=”pairwise.complete.obs”)
t-Test für den Produkt-Moment-Korrelationskoeffizienten.
– Anwendung auf paarweise gültig Fälle
cor.test(
Variable1,
Variable2,
use=”pairwise.complete.obs”,
alternative = “greater”)
t-Test mit gerichteter Hypothese.
lm(Kriteriumsvariable ~ Prädiktorvariable)Einfache lineare Regression durchführen.

tibble

FunktionBeschreibung
as_tibble()Eine Datensatz, wie bspw. einen Data Frame, eine List oder Matrix in ein sogenanntes Tibble umwandeln. Ein Tibble ist ein Data Frame der Klasse tbl_df.

Schreibe einen Kommentar