Disclaimer: Het peer review proces voor deze toets is nog niet afgerond; daarom is deze pagina nog in concept.

1 Toepassing

Gebruik Mood’s mediaan toets om de medianen van twee ongepaarde groepen te vergelijken.1,2 Deze toets wordt gebruikt als er niet aan de assumpties is voldaan bij sterkere toetsen zoals de ongepaarde t-toets en de Mann-Whitney U toets. Als de verdelingen van beide groepen bij benadering normaal verdeeld zijn, dan kan de ongepaarde t-toets gebruikt worden om de gemiddelden te vergelijken. Als de verdelingen van beide groepen dezelfde vorm hebben, kan de Mann-Whitney U toets gebruikt worden om de medianen te vergelijken.3 De Mann-Whitney U toets heeft in dat geval een hoger onderscheidend vermogen4.

2 Onderwijscasus

De onderwijsdirecteur van de opleiding Business Administration van een hogeschool vraagt zich af of er verschil is in de studieresultaten van studenten met een Nederlandse vooropleiding en een buitenlandse vooropleiding. Met name in het tweede studiejaar lijken er verschillen op te treden die hij wil begrijpen om mogelijke interventies met zijn docenten te bespreken. Hij vraagt zich af: ‘Verschilt het aantal studiepunten in het tweede studiejaar van studenten met een Nederlandse vooropleiding van het aantal studiepunten in het tweede studiejaar van studenten met een buitenlandse vooropleiding?

Dit onderzoek vertaalt zich in de volgende combinatie van hypothesen, waarbij de nulhypothese zo geformuleerd is dat er geen effect of verschil is en de alternatieve hypothese zo geformuleerd is dat er wel een effect of verschil is.

H0: De verdeling van het behaalde aantal studiepunten in het tweede jaar van studenten met een buitenlandse vooropleiding is hetzelfde als de verdeling van studenten met een Nederlandse vooropleiding.

HA: De verdeling van het behaalde aantal studiepunten in het tweede jaar van studenten met een buitenlandse vooropleiding is anders dan de verdeling van studenten met een Nederlandse vooropleiding.

3 Assumpties

Het meetniveau van de afhankelijke variabele is continu.5,6

3.1 Groepsgroottes

Mood’s mediaan toets toetst het verschil tussen de medianen van twee ongepaarde groepen. Eerst wordt de mediaan berekend van de samengevoegde observaties van beide groepen. Daarna worden voor beide ongepaarde groepen het aantal observaties groter dan en kleiner dan of gelijk aan de mediaan geteld. Dit levert een kruistabel op die vervolgens getoetst kan worden met de Chi-kwadraat toets voor onafhankelijkheid. Een voorbeeld van zo’n kruistabel is te zien in Tabel 1.

Groep 1 Groep 2
Aantal observaties groter dan mediaan 20 25
Aantal observaties kleiner dan of gelijk aan mediaan 30 40

Tabel 1. Kruistabel met aantal observaties groter dan en kleiner dan of gelijk aan mediaan voor twee ongepaarde groepen.

Een assumptie van de Chi-kwadraat toets voor onafhankelijk is dat niet meer dan 20% van de cellen van de kruistabel een verwacht aantal observaties van vijf of minder heeft. Als dit niet het geval is, is Fisher’s exact toets een beter alternatief. Zie de toetspagina van de Chi-kwadraat toets voor onafhankelijkheid voor een uitgebreide uitleg over deze assumptie.

4 Uitvoering

Er is een dataset Studiepunten_studiejaar2 ingeladen met het aantal punten dat studenten in het tweede jaar halen.

4.1 De data bekijken

Gebruik head() en tail() om de structuur van de data te bekijken.

## Eerste 6 observaties
head(Studiepunten_studiejaar2)
##      Studentnummer Studiepunten Vooropleiding
## 658        3000364            0    Nederlands
## 1020       3000372           57   buitenlands
## 948        3000548           12    Nederlands
## 1453       3000715            0   buitenlands
## 611        3000964           42    Nederlands
## 315        3001081           48    Nederlands
## Eerste 6 observaties
tail(Studiepunten_studiejaar2)
##      Studentnummer Studiepunten Vooropleiding
## 176        3994944           48    Nederlands
## 1442       3995230            6   buitenlands
## 215        3995911           51    Nederlands
## 830        3996339            0    Nederlands
## 1059       3996684           57   buitenlands
## 1047       3997148           66   buitenlands

Bekijk de grootte, de mediaan en de kwantielen van het aantal studiepunten met length() en quantile(). De mediaan en kwantielen worden vaak gebruikt als maat wanneer een verdeling niet symmetrisch is.

Vooropleiding_Nederlands <- Studiepunten_studiejaar2$Vooropleiding == "Nederlands"
length(Studiepunten_studiejaar2$Studiepunten[Vooropleiding_Nederlands])
## [1] 950
quantile(Studiepunten_studiejaar2$Studiepunten[Vooropleiding_Nederlands])
##   0%  25%  50%  75% 100% 
##    0    6   45   57   66
length(Studiepunten_studiejaar2$Studiepunten[!Vooropleiding_Nederlands])
## [1] 550
quantile(Studiepunten_studiejaar2$Studiepunten[!Vooropleiding_Nederlands])
##   0%  25%  50%  75% 100% 
##    0    0   12   48   66
  • Mediaan studenten Nederlandse vooropleiding: 45, n = 950.
  • Mediaan studenten buitenlandse vooropleiding: 12, n = 550.

4.2 De data visualiseren

Maak een histogram7 om de verdeling van het aantal studiepunten in het tweede jaar voor studenten met een Nederlandse en buitenlandse vooropleiding visueel weer te geven.

## Histogram met ggplot2
library(ggplot2)

ggplot(Studiepunten_studiejaar2,
  aes(x = Studiepunten)) +
  geom_histogram(aes(y = ..density..),
                 color = "grey30",
                 fill = "#0089CF") +
  facet_wrap(~ Vooropleiding, labeller = labeller(Vooropleiding = c(Nederlands = "Nederlandse vooropleiding", buitenlands = "Buitenlandse vooropleiding"))) +
  ylab("Frequentie") +
  labs(title = "Studiepunten van studenten Business Administration in het tweede jaar ")

Beide histogrammen bevatten een grote groep studenten met een laag aantal studiepunten (twaalf of minder). De overige studenten volgen een ietwat scheve verdeling met de top rond de vijftig studiepunten. De verdelingen van beide groepen studenten hebben echter niet dezelfde vorm. De frequentiedichtheid van het aantal studenten rond de vijftig studiepunten is veel hoger voor de studenten met Nederlandse vooropleiding, terwijl de frequentiedichtheid van het aantal studenten met twaalf of minder studiepunten juist hoger is voor de studenten met een buitenlandse vooropleiding.

4.3 Assumptie groepsgrootte

Maak een kruistabel met het aantal observaties hoger en lager dan de mediaan voor beide ongepaarde groepen. Bereken vervolgens de verwachte aantallen observaties met chisq.test()$expected met als argument de kruistabel Kruistabel.

# Bereken de mediaan van alle observaties samengevoegd
Mediaan <- median(Studiepunten_studiejaar2$Studiepunten)

# Bepaal voor elke observatie of deze hoger of lager/gelijk aan de mediaan is
Index_hoger_lager <- Studiepunten_studiejaar2$Studiepunten > Mediaan 

# Maak een kruistabel
Kruistabel <- table(Index_hoger_lager, Studiepunten_studiejaar2$Vooropleiding)

# Print de kruistabel
print(Kruistabel)
##                  
## Index_hoger_lager buitenlands Nederlands
##             FALSE         361        395
##             TRUE          189        555
# Bereken de verwachte aantallen observaties
chisq.test(Kruistabel)$expected
##                  
## Index_hoger_lager buitenlands Nederlands
##             FALSE       277.2      478.8
##             TRUE        272.8      471.2

Geen van de verwachte aantallen observaties is kleiner dan vijf, dus er is voldaan aan de assumptie over de groepsgroottes. Voer Mood’s mediaan toets uit met behulp van de Chi-kwadraat toets.

4.4 Mood’s mediaan toets

Gebruik de functie mood.medtest() van het package RVAideMemoire om Mood’s mediaan toets uit te voeren. Het eerste argument Studiepunten ~ Vooropleiding bevat de afhankelijke variabele Studiepunten en de variabele Vooropleiding die beide ongepaarde groepen aangeeft, het tweede argument bevat de dataset Studiepunten_studiejaar2 en het derde argument exact= FALSE geeft aan dat de Chi-kwadraat toets voor onafhankelijkheid uitgevoerd moet worden. Gebruik exact = TRUE om Fisher’s exact toets uit te voeren.

library(RVAideMemoire)
mood.medtest(Studiepunten ~ Vooropleiding, Studiepunten_studiejaar2, exact = FALSE)
## 
##  Mood's median test
## 
## data:  Studiepunten by Vooropleiding
## X-squared = 79.686, df = 1, p-value < 2.2e-16

Bereken vervolgens de mediaan van de verschilscores en bijbehorend 95%-betrouwbaarheidsinterval.8,9 Gebruik hiervoor de functie HodgesLehmann() van het package DescTools met als argumenten het aantal studiepunten van studenten met Nederlandse vooropleiding Studiepunten_studiejaar2$Studiepunten[Vooropleiding_Nederlands], het aantal studiepunten van studenten met een buitenlandse vooropleiding Studiepunten_studiejaar2$Studiepunten[!Vooropleiding_Nederlands] en conf.level = 0.95 om het 95%-betrouwbaarheidsinterval te schatten.10

library(DescTools)
HodgesLehmann(Studiepunten_studiejaar2$Studiepunten[Vooropleiding_Nederlands], Studiepunten_studiejaar2$Studiepunten[!Vooropleiding_Nederlands], conf.level = 0.95)
##       est    lwr.ci    upr.ci 
##  8.999982  6.000008 11.999980
  • χ2 1 = 79,69, p = < 0,0001
  • De p-waarde is kleiner dan 0,05, dus de H0 wordt verworpen.11
  • De mediaan van de verschilscores is 9 met een 95%-betrouwbaarheidsinterval van 6 tot 12. De mediaan van de verschillen tussen studenten met een Nederlandse en buitenlandse vooropleiding is dus 9 studiepunten.

5 Rapportage

Mood’s mediaan toets is uitgevoerd om te toetsen of de mediaan van het behaald aantal studiepunten in het tweede jaar van de bachelor Business Administration hetzelfde is voor studenten met buitenlandse vooropleiding als voor studenten met Nederlandse vooropleiding. De resultaten van de toets laten zien dat er een significant verschil is tussen beide medianen, χ2 1 = 79,69, p = < 0,0001. Het geschatte mediaan van de verschilscores is 9 met bijbehorend 95%-betrouwbaarheidsinterval van 6 tot 12. Studenten met een Nederlandse vooropleiding lijken dus meer studiepunten te behalen in het tweede jaar dan studenten met een buitenlandse vooropleiding.


  1. Statistics How To (28 februari 2016). Mood’s Median Test: Definition, Run the Test and Interpret Results. Statistics How to.

  2. Brown, G. W., & Mood, A. M. (1951). On median tests for linear hypotheses. In Proceedings of the Second Berkeley Symposium on Mathematical Statistics and Probability. The Regents of the University of California.

  3. Onderscheidend vermogen, in het Engels power genoemd, is de kans dat de nulhypothese verworpen wordt wanneer de alternatieve hypothese ‘waar’ is.

  4. Brown, G. W., & Mood, A. M. (1951). On median tests for linear hypotheses. In Proceedings of the Second Berkeley Symposium on Mathematical Statistics and Probability. The Regents of the University of California.

  5. SPSS Tutorials. SPSS Median Test for 2 Independent Medians. Bezocht op 22 april 2020. Statistics How to.

  6. Mood’s mediaan toets kan ook uitgevoerd worden om de medianen te vergelijken van twee of meer ordinale variabelen. Echter, de Mann-Whitney U toets of de Kruskal Wallis toets zijn dan alternatieven met een hoger onderscheidend vermogen.

  7. De breedte van de staven van het histogram wordt vaak automatisch bepaald, maar kan handmatig aangepast worden. Aangezien de breedte van de staven bepalend zijn voor de indruk die de visualisatie geeft, is het verstandig om hier goed op te letten.

  8. De mediaan van de verschilscores kan bij twee ongepaarde steekproeven bijvoorbeeld geschat worden door alle m x n verschilscores te berekenen tussen m observaties uit de ene steekproef en n observaties uit de andere steekproef. De mediaan van deze m x n verschilscores is dan de schatting.

  9. Wikipedia (10 maart 2020). Hogdes-Lehmann estimator. https://en.wikipedia.org/wiki/Hodges%E2%80%93Lehmann_estimator

  10. In dit voorbeeld wordt uitgegaan van een waarschijnlijkheid van 95% c.q. een p-waardegrens van 0,05. De grens is naar eigen inzicht aan te passen; houd hierbij rekening met type I en type II fouten.

  11. In dit voorbeeld wordt uitgegaan van een waarschijnlijkheid van 95% c.q. een p-waardegrens van 0,05. De grens is naar eigen inzicht aan te passen; houd hierbij rekening met type I en type II fouten.