Gebruik de Wilcoxon signed rank toets om te toetsen of de som van de rangnummers1 van de verdelingen van twee gepaarde groepen van elkaar verschillen.2 Deze toets is een alternatief voor de gepaarde t-toets als de verschilscores van de gepaarde groepen niet normaal verdeeld zijn. Alleen als de verdeling van de verschilscores symmetrisch is, kan de Wilcoxon signed rank toets gebruikt worden om een verschil tussen de medianen van gepaarde groepen te toetsen.3 Als de verdeling van verschilscores niet symmetrisch is, gebruik dan de gepaarde tekentoets om medianen te toetsen.
De directeur van de Academie Mens & Maatschappij wil bekijken hoe het inkomen van zijn alumni zich ontwikkelt nadat zij zijn afgestudeerd. Hij is nieuwsgierig of het inkomen gedurende deze jaren groeit of juist stagneert voor deze alumni. Deze informatie is interessant om te gebruiken bij voorlichtingsactiviteiten van de Academie. Hij bekijkt het bruto jaarinkomen van de alumni één jaar na afstuderen en vergelijkt het met het bruto jaarinkomen vijf jaar na afstuderen.
Dit onderzoek vertaalt zich in de volgende combinatie van hypothesen, waarbij de nulhypothese zo geformuleerd is dat er geen effect of verschil is en de alternatieve hypothese zo geformuleerd is dat er wel een effect of verschil is.
H0: Er is geen verschil in de som van rangnummers van de verdeling tussen het bruto jaarinkomen van de alumni van de Academie Mens & Maatschappij één jaar na afstuderen en vijf jaar na afstuderen.
HA: Er is een verschil in de som van rangnummers van de verdeling tussen het bruto jaarinkomen van de alumni van de Academie Mens & Maatschappij één jaar na afstuderen en vijf jaar na afstuderen. Een van beide verdelingen bevat hogere waarden wat betreft het bruto jaarinkomen.
Het meetniveau van de afhankelijke variabele is ordinaal4 of continu.5 In deze toetspagina staat een casus met continue data centraal; een casus met ordinale data met bijbehorende uitwerking is te vinden in de Wilcoxon signed rank toets II.
De Wilcoxon signed rank toets is een alternatief voor de gepaarde t-toets. Een voordeel van de Wilcoxon signed rank toets is dat de data niet aan de assumptie van normaliteit hoeven te voldoen. Maar als de data wel normaal verdeeld is, heeft de Wilcoxon signed rank toets minder onderscheidend vermogen6 dan de gepaarde t-toets.7 Vandaar dat ondanks het voordeel van de grotere robuustheid minder vaak voor de Wilcoxon signed rank toets gekozen wordt.
De Wilcoxon signed rank toets schrijft geen assumpties voor over de verdeling van de verschilscores (verschillen tussen beide meetmomenten voor alle deelnemers8).9 In principe toetst de Wilcoxon signed rank toets een hypothese over het verschil tussen de verdelingen van twee gepaarde groepen. De Wilcoxon signed rank toets maakt een rangschikking van de absolute waarden van de verschilscores en telt vervolgens de rangnummers op voor de positieve en negatieve verschilscores. Het verschil tussen de som van de positieve en negatieve rangnummers bepaalt de significantie van de toets.
Als er geen symmetrische verdeling van verschilscores is, doet de Wilcoxon signed rank toets een uitspraak over het verschil tussen verdelingen. Een verschil tussen verdelingen kan meerdere oorzaken hebben. De top of toppen van de verdelingen kunnen verschillend zijn, maar ook de spreiding van de verdeling kan verschillen. In alle gevallen is er echter een verschil tussen de som van de rangnummers van de verdelingen. In andere woorden, de ene verdeling bevat hogere waarden dan de andere verdeling. Benoem daarom de sommen van positieve en negatieve rangnummers in de rapportage en visualiseer de verdeling van beide gepaarde groepen om duidelijk te maken op welke manier de verdelingen van elkaar verschillen.
Als de verschilscores echter symmetrisch zijn, toetst de Wilcoxon signed rank toets ook een hypothese over het verschil tussen de medianen van twee gepaarde groepen. In dat geval heeft de Wilcoxon signed rank toets een hoger onderscheidend vermogen10 dan de tekentoets om medianen te toetsen.11 De tekentoets vereist niet dat de verschilscores symmetrisch zijn en toetst alleen een hypothese over het verschil tussen medianen van gepaarde groepen.
De p-waarde geeft aan of een (mogelijk) verschil tussen twee groepen significant is. De grootte van het verschil of effect is echter ook relevant. Een effectmaat is een gestandaardiseerde maat die de grootte van een effect weergeeft, zodat effecten van verschillende onderzoeken met elkaar vergeleken kunnen worden.12
De Wilcoxon signed rank toets heeft als effectmaat r. Een indicatie om r te interpreteren is: rond 0,1 is het een klein effect, rond 0,3 is het een gemiddeld effect en rond 0,5 is het een groot effect.13 De effectmaat r wordt voor de Wilcoxon signed rank toets berekend door de z-waarde behorend bij de p-waarde van de toets te delen door de wortel van het aantal deelnemers, i.e. \(\frac{z}{\sqrt{N}}\).14 Een correlatie tussen twee variabelen wordt vaak ook aangeduid met het symbool r. Beide zijn effectmaten, maar er is verder geen verband tussen de correlatie en de effectmaat van de Wilcoxon signed rank toets.
Er is data ingeladen met het bruto jaarinkomen van alumni van de Academie Mens & Maatschappij genaamd Alumni_jaarinkomen. De directeur wil een vergelijking maken tussen het inkomen één jaar na afstuderen (meetmoment T1) en vijf jaar na afstuderen (meetmoment T2).
Gebruik head() en tail() om de structuur van de data te bekijken.
## Eerste 6 observaties
head(Alumni_jaarinkomens)
## Studentnummer Meetmoment Inkomen
## 1 3343469 T1 25127
## 2 3836434 T1 27217
## 3 3634330 T1 29363
## 4 3010816 T1 44690
## 5 3570949 T1 25839
## 6 3983531 T1 29467
## Laatste 6 observaties
tail(Alumni_jaarinkomens)
## Studentnummer Meetmoment Inkomen
## 53 3140183 T2 30786
## 54 3705137 T2 24621
## 55 3434481 T2 30241
## 56 3120294 T2 21424
## 57 3865043 T2 29047
## 58 3862839 T2 31131
Bekijk de groepsgrootte en de mediaan van de data met length() en median(). Omdat inkomens vaak een scheve verdeling hebben, is de mediaan informatiever dan het gemiddelde.
Alumni_jaarinkomens_T1 <- Alumni_jaarinkomens$Inkomen[Alumni_jaarinkomens$Meetmoment == "T1"]
Alumni_jaarinkomens_T2 <- Alumni_jaarinkomens$Inkomen[Alumni_jaarinkomens$Meetmoment == "T2"]
length(Alumni_jaarinkomens_T1)
## [1] 29
median(Alumni_jaarinkomens_T1)
## [1] 29212
length(Alumni_jaarinkomens_T2)
## [1] 29
median(Alumni_jaarinkomens_T2)
## [1] 29453
Maak een histogram15 om de verdeling van de bruto jaarinkomens van de alumni één jaar en vijf jaar na afstuderen visueel weer te geven.16
## Histogram met ggplot2
library(ggplot2)
ggplot(Alumni_jaarinkomens,
aes(x = Inkomen)) +
geom_histogram(color = "grey30",
fill = "#0089CF",
binwidth = 2000) +
facet_wrap(~ Meetmoment, labeller = labeller(Meetmoment = c(T1 = "Een jaar na afstuderen", T2 = "Vijf jaar na afstuderen"))) +
ylab("Frequentie") +
labs(title = "Bruto jaarinkomen alumni Mens & Maatschappij")
Op beide meetmomenten is te zien dat de meeste alumni tussen de 0 en €35.000 euro per jaar verdienen en dat een paar alumni hierboven zit. Beide verdelingen hebben één top, maar zijn niet symmetrisch omdat de meerderheid van de observaties links van de top ligt. Beide verdeling lijken niet echt op elkaar qua vorm en spreiding.
Maak vervolgens een histogram van de verschilscores om te onderzoeken of deze verdeling symmetrisch is.
# Maak een dataset met de verschilscores
Alumni_verschilscores <- data.frame(Verschilscores = Alumni_jaarinkomens$Inkomen[Alumni_jaarinkomens$Meetmoment == "T2"] - Alumni_jaarinkomens$Inkomen[Alumni_jaarinkomens$Meetmoment == "T1"])
## Histogram met ggplot2
library(ggplot2)
ggplot(Alumni_verschilscores,
aes(x = Verschilscores)) +
geom_histogram(color = "grey30",
fill = "#0089CF",
binwidth = 250) +
geom_density(alpha = .2, adjust = 1) +
ylab("Frequentiedichtheid") +
labs(title = "Verschilscores bruto jaarinkomen alumni Mens & Maatschappij")
De verdeling van de verschilscores bevat voornamelijk positieve waarden en een paar negatieve waarden; de meeste alumni zijn er dus in bruto jaarinkomen op vooruitgegaan. De verdeling is niet symmetrisch. Gebruik de Wilcoxon signed rank toets dus niet om een uitspraak te doen over het verschil in medianen.
Voer de Wilcoxon signed rank toets uit om de vraag te beantwoorden of de verdeling van de bruto jaarinkomens van alumni verschillend is voor de inkomens één jaar en vijf jaar na afstuderen. Gebruik de functie wilcox.test() met als eerste argument Inkomen ~ Meetmoment waarin Inkomen de afhankelijke variabele is en Meetmoment de onafhankelijke variabele is die twee meetmomenten aangeeft. Gebruik het argument paired = TRUE om aan te geven dat de twee meetmomenten aan elkaar gepaard zijn. Toets tweezijdig door het argument alternative = "two.sided" te gebruiken.
wilcox.test(Inkomen ~ Meetmoment, Alumni_jaarinkomens,
paired = TRUE,
alternative = "two.sided")
##
## Wilcoxon signed rank test
##
## data: Inkomen by Meetmoment
## V = 6, p-value = 5.215e-08
## alternative hypothesis: true location shift is not equal to 0
Bereken de effectmaat r vervolgens op basis van de p-waarde van de Wilcoxon signed rank toets.
# Sla de p-waarde op
pwaarde <- wilcox.test(Inkomen ~ Meetmoment,
Alumni_jaarinkomens,
paired = TRUE,
alternative = "two.sided")$p.value
# Bereken de effectgrootte voor een tweezijdige toets
r <- abs(qnorm(pwaarde/2)) / sqrt(length(Alumni_jaarinkomens_T1))
# Bereken de effectgrootte voor een eenzijdige toets
#r <- abs(qnorm(pwaarde)) / sqrt(length(Alumni_jaarinkomens_T1))
# Print de effectgrootte
paste("De effectmaat is", r)
## [1] "De effectmaat is 1.01088936801673"
Bereken de aantallen en de sommen van positieve en negatieve rangnummers op basis van de verschilscores.
# Bereken verschilscores
Verschilscores <- Alumni_jaarinkomens$Inkomen[Alumni_jaarinkomens$Meetmoment == "T2"] - Alumni_jaarinkomens$Inkomen[Alumni_jaarinkomens$Meetmoment == "T1"]
# Rangschik de absolute waarden van verschilscores
Rangnummers <- rank(abs(Verschilscores))
# Maak een vector met daarin de tekens (plus of min) van verschilscores)
Tekens <- sign(Verschilscores)
# Bereken het aantal en de som van de positieve rangnummers
N_positief <- length(Tekens[Tekens == 1])
Som_positief <- sum(Rangnummers[Tekens == 1])
# Bereken het aantal en de som van de negatieve rangnummers
N_negatief <- length(Tekens[Tekens == -1])
Som_negatief <- sum(Rangnummers[Tekens == -1])
# Print de resultaten
N_positief
## [1] 26
Som_positief
## [1] 429
N_negatief
## [1] 3
Som_negatief
## [1] 6
De Wilcoxon signed rank toets is uitgevoerd om de vraag te beantwoorden of de verdeling van het bruto jaarinkomen van de alumni van de Academie Mens & Maatschappij verschillend is voor de inkomens één jaar na afstuderen en vijf jaar na afstuderen. De resultaten van de toets laten zien dat er een significant verschil is tussen het bruto jaarinkomen van de alumni van de Academie Mens & Maatschappij één jaar en vijf jaar na afstuderen, V = 6, p < 0,0001, r = 1,01. Er zijn 26 alumni die vijf jaar na afstuderen meer verdienen dan één jaar na afstuderen (som van rangnummers is 429) en er zijn 3 alumni die vijf jaar na afstuderen minder verdienen dan één jaar na afstuderen (som van rangnummers is 6). Alumni lijken dus meer te verdienen wanneer ze vijf jaar afgestudeerd zijn.
Bij de Wilcoxon signed rank toets en andere nonparametrische toetsen wordt de data eerst gerangschikt zodat elke observatie een rangnummer toegewezen krijgt. Deze rangnummers worden vervolgens gebruikt om de toets uit te voeren.↩
Laerd Statistics (2018). Wilcoxon Signed-Rank Test using SPSS Statistics. https://statistics.laerd.com/spss-tutorials/wilcoxon-signed-rank-test-using-spss-statistics.php↩
Statistics How To (27 mei 2018). One Sample Median Test. Statistics How to.↩
Een ordinale variabele is een categorische variabele waarbij de categorieën geordend kunnen worden. Een voorbeeld is de variabele beoordeling met de categorieën Onvoldoende, Voldoende, Goed en Uitstekend.↩
Laerd Statistics (2018). Wilcoxon Signed-Rank Test using SPSS Statistics. https://statistics.laerd.com/spss-tutorials/wilcoxon-signed-rank-test-using-spss-statistics.php↩
Onderscheidend vermogen, in het Engels power genoemd, is de kans dat de nulhypothese verworpen wordt wanneer de alternatieve hypothese waar is.↩
Field, A. (2013). Discovering statistics using IBM SPSS statistics. Sage.↩
Met een deelnemer wordt het object bedoeld dat geobserveerd wordt, bijvoorbeeld een student, een inwoner van Nederland, een opleiding of een organisatie. Met een observatie wordt de waarde bedoeld die de deelnemer heeft voor een bepaalde variabele. Een deelnemer heeft dus meestal een observatie voor meerdere variabelen.↩
Field, A. (2013). Discovering statistics using IBM SPSS statistics. Sage.↩
Onderscheidend vermogen, in het Engels power genoemd, is de kans dat de nulhypothese verworpen wordt wanneer de alternatieve hypothese waar is.↩
Field, A. (2013). Discovering statistics using IBM SPSS statistics. Sage.↩
Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R. London: Sage publications.↩
Allen, P. & Bennett, K. (2012). SPSS A practical Guide version 20.0. Cengage Learning Australia Pty Limited.↩
Allen, P. & Bennett, K. (2012). SPSS A practical Guide version 20.0. Cengage Learning Australia Pty Limited.↩
De breedte van de staven van het histogram wordt vaak automatisch bepaald, maar kan handmatig aangepast worden. Aangezien de breedte van de staven bepalend zijn voor de indruk die de visualisatie geeft, is het verstandig om hier goed op te letten.↩
De breedte van de staven van het histogram worden hier automatisch bepaald, maar kunnen handmatig aangepast worden. Aangezien de breedte van de staven bepalend zijn voor de indruk die de visualisatie geeft, is het verstandig om hier goed op te letten.↩
In dit voorbeeld wordt uitgegaan van een waarschijnlijkheid van 95% c.q. een p-waardegrens van 0,05. De grens is naar eigen inzicht aan te passen; houd hierbij rekening met type I en type II fouten.↩