1 Toepassing

Gebruik de tekentoets om de mediaan van een steekproef te vergelijken met een bekende mediaan of norm in een populatie.1 Deze toets wordt gebruikt als er niet aan de assumpties is voldaan bij sterkere toetsen zoals de one sample t-toets en de Wilcoxon signed rank toets. Als de verdeling van de steekproef bij benadering normaal verdeeld is, dan kan de one sample t-toets gebruikt worden om het gemiddelde van een steekproef te vergelijken met een bekend gemiddelde of norm in een populatie. Als de verdeling symmetrisch is, kan de Wilcoxon signed rank toets gebruikt worden om de mediaan van een steekproef te vergelijken met een bekende mediaan of norm in een populatie. De Wilcoxon signed rank toets heeft in dat geval een hoger onderscheidend vermogen2.

2 Onderwijscasus

De opleidingsdirecteur van de school voor Journalistiek is benieuwd wat alumni verdienen ten opzichte van de gemiddelde Nederlander. Daarom wil zij de jaarinkomens van oud-studenten vergelijken met het mediane jaarinkomen van werknemers in Nederland van €35.200.3 Op deze manier vergaart zij meer informatie over het succes op de arbeidsmarkt na de opleiding Journalistiek.

Dit onderzoek vertaalt zich in de volgende combinatie van hypothesen, waarbij de nulhypothese zo geformuleerd is dat er geen effect of verschil is en de alternatieve hypothese zo geformuleerd is dat er wel een effect of verschil is.

H0: De mediaan van het jaarinkomen van alumni Journalistiek is gelijk aan €35.200, het mediane jaarinkomen in Nederland.

HA: De mediaan van het jaarinkomen van alumni Journalistiek is niet gelijk aan €35.200, het mediane jaarinkomen in Nederland.

3 Assumpties

Het meetniveau van de variabele is continu.4

4 Uitvoering

Er is data ingeladen met jaarlijkse bruto inkomens van alumni van de school voor Journalistiek genaamd Jaarlijks_inkomen. De directeur wil kijken hoe haar oud-studenten scoren ten opzichte van het mediane jaarinkomen in Nederland.

4.1 De data bekijken

Gebruik head() en tail() om de data te bekijken.

## Eerste 6 observaties
head(Jaarlijks_inkomen)
##   Studentnummer Inkomen
## 1       4466713   44047
## 2       4000958   66004
## 3       4136967   49442
## 4       4090719   42890
## 5       4414229   59478
## 6       4191784   61857

## Laatste 6 observaties
tail(Jaarlijks_inkomen)
##    Studentnummer Inkomen
## 24       4061987   34349
## 25       4401307   32022
## 26       4179848   66667
## 27       4392861   42721
## 28       4425075   43956
## 29       4016485   38288

Inspecteer de data met mean(), sd(), median() en length() om meer inzicht te krijgen in de data.

mean(Jaarlijks_inkomen$Inkomen)
## [1] 50902.48
sd(Jaarlijks_inkomen$Inkomen)
## [1] 14511.16
median(Jaarlijks_inkomen$Inkomen)
## [1] 49234
length(Jaarlijks_inkomen$Inkomen)
## [1] 29

Het gemiddelde jaarinkomen van de alumni is €50902,48 met een standaardafwijking van €14511,16 (n = 29). De mediaan van het inkomen is €49234.

4.2 De data visualiseren

Visualiseer de data om een goed beeld van de jaarinkomens van de alumni te krijgen. Geef de verdeling van de data weer in een histogram5. Focus bij het analyseren van een histogram op de symmetrie van de verdeling, de hoeveelheid toppen (modaliteit) en mogelijke uitbijters.6, 7

## Histogram met ggplot2
library(ggplot2)

ggplot(Jaarlijks_inkomen, 
       aes(x = Inkomen)) +
  geom_histogram(aes(y = ..density..),
                 binwidth = 10000, 
                 color = "white", 
                 fill = "#158CBA") +
  #geom_density(alpha = .2, adjust = 1) +
  ylab("Frequentiedichtheid") +
  xlab("Jaarlijks inkomen") +
scale_x_continuous(labels = as.character(seq(20000, 100000, 20000)), 
                   breaks = seq(20000, 100000, 20000)) +
labs(title = "Jaarinkomen alumni Journalistiek", 
     subtitle = "")

De verdeling heeft één top en geen uitbijters. De histogram laat echter ook zien dat de verdeling een langere staart aan de rechterkant heeft en dus enigszins afwijkt van de (symmetrische) normaalverdeling. Aangezien de verdeling niet symmetrisch is, kan de Wilcoxon signed rank toets niet gebruikt worden om een hypothese over de mediaan te toetsen.

5 Tekentoets

Voer een tweezijdige tekentoets uit om te bepalen of het mediane jaarinkomen van de alumni Journalistiek hoger ligt dan het mediane jaarinkomen in Nederland van €35.200. Gebruik van het DescTools package de SignTest() functie met de argumenten x = Jaarlijks_inkomen voor de data van de steekproef, mu = 35200 voor de waarde van de mediaan die getoetst wordt en alternative = "two.sided" om een tweezijdige alternatieve hypothese te toetsen.

library(DescTools)
SignTest(x = Jaarlijks_inkomen$Inkomen, mu = 35200, alternative = "two.sided")
## 
##  One-sample Sign-Test
## 
## data:  Jaarlijks_inkomen$Inkomen
## S = 25, number of differences = 29, p-value = 0.0001037
## alternative hypothesis: true median is not equal to 35200
## 97.6 percent confidence interval:
##  42721 59478
## sample estimates:
## median of the differences 
##                     49234
  • De mediaan van de steekproef is significant verschillend van €35.200, S = 25, N = 29, p < 0,001. De H0 wordt verworpen. 8
  • De toetsstatistiek S is het aantal positieve verschillen (inkomen hoger dan het mediane jaarinkomen in Nederland), N is het totaal aantal verschillen
  • Van de 29 alumni verdienen 25 alumni boven het mediane jaarinkomen in Nederland
  • De geschatte mediaan van de steekproef is 49234 met bijbehorend 95%-betrouwbaarheidsinterval van 42721 tot 59478.

6 Rapportage

De tekentoets is uitgevoerd om te toetsen of het mediane inkomen van alumni van de opleiding Journalistiek veschilt van het mediane jaarinkomen van werknemers in Nederland van €35.200. Het mediane inkomen van alumni verschilt significant van €35.200 (S = 25, N = 29, p < 0,001). De geschatte mediaan is €49234 met bijbehorend 95%-betrouwbaarheidsinterval van €42721 tot €59478. Van de 29 alumni verdienen 25 alumni boven het mediane jaarinkomen in Nederland. Deze resultaten duiden op een verschil tussen het mediane jaarinkomen van alumni van de opleiding Journalistiek en het mediane jaarinkomen van de gemiddelde Nederlander waarbij de inkomens van de alumni hoger lijken te liggen.


  1. Van Geloven, N. (25 mei 2016). Tekentoets Wiki Statistiek Academisch Medisch Centrum.

  2. Onderscheidend vermogen, in het Engels power genoemd, is de kans dat de nulhypothese verworpen wordt wanneer de alternatieve hypothese waar is.

  3. Doorsnee inkomen werkenden al 10 jaar vrijwel constant (22 maart 2019). Centraal Bureau voor de Statistiek

  4. Miller, I. & Miller, C. (2012). John E. Freund’s Mathematical Statistics with Applications. Pearson: eighth edition.

  5. De breedte van de staven van het histogram wordt vaak automatisch bepaald, maar kan handmatig aangepast worden. Aangezien de breedte van de staven bepalend zijn voor de indruk die de visualisatie geeft, is het verstandig om hier goed op te letten.

  6. Outliers (13 augustus 2016). UvA Wiki Methodologiewinkel.

  7. Uitbijters kunnen bepalend zijn voor de uitkomst van toetsen. Bekijk of de uitbijters valide uitbijters zijn en niet een meetfout of op een andere manier incorrect verkregen data. Het weghalen van uitbijters kan de uitkomst ook vertekenen, daarom is het belangrijk om verwijderde uitbijters te melden in een rapport.

  8. In dit voorbeeld wordt uitgegaan van een waarschijnlijkheid van 95% c.q. een p-waardegrens van 0,05. De grens is naar eigen inzicht aan te passen; houd hierbij rekening met type I en type II fouten.