1 Toetskeuze

De eerste stap van een analyse begint bij een vraag: een opleidingsdirecteur wil bijvoorbeeld weten wat de verschillen zijn tussen bepaalde groepen of het effect van een bepaalde cursus of interventie Zodra een vraagstuk bekend is, moet de onderzoeker bepalen wat er nodig is om de vraag te kunnen beantwoorden. Hierbij is het van belang wat voor type afhankelijke variabele er is, wat voor type onafhankelijke variabele er is en hoe de data verzameld is.

De toetsmatrices tonen per type afhankelijke en onafhankelijke variabele(n) welke toets er gebruikt kan worden voor die combinatie. Iedere optie is voorzien van een relevante casus uit het hoger onderwijs, een uitleg van de situaties waarin de toets gekozen kan worden, de assumpties en uitwerking van de toets in R, Python of SPSS, een interpretatie van de resultaten, en een rapport dat de resultaten beschrijft. In toetsmatrix I worden voornamelijk statistische toetsen uitgewerkt om groepen te vergelijken. In toetsmatrix II ligt de focus op regressiemodellen en andere technieken waarin de relatie tussen meerdere onafhankelijke variabelen en een afhankelijke variabele getoetst wordt. De keuze tussen toetsmatrix I en II hangt af van het aantal onafhankelijke variabelen. Gebruik toetsmatrix I bij één onafhankelijke variabele en toetsmatrix II bij meerdere onafhankelijke variabelen

3 Toetsmatrix II

Onder de toetsmatrix staat een uitgebreide beschrijving van de verschillende opties voor het type afhankelijke en onafhankelijke variabele.

Onafhankelijke variabelen
cross-sectioneel longitudinaal hiërarchisch
categorische variabelen continue en categorische variabelen categorische variabelen continue en categorische variabelen continue en categorische variabelen
Afhankelijke variabele continu
(interval en ratio)
Multipele lineaire regressie / Factoriele ANOVA Multipele lineaire regressie / ANCOVA Factoriele repeated measures ANOVA / Mixed ANOVA / Multilevel lineaire regressie Multilevel lineaire regressie Multilevel lineaire regressie
gecensureerd
continu
Survival analyse Survival analyse
binair
Logistische regressie / Loglineaire analyse Logistische regressie Multilevel logistische regressie I Multilevel logistische regressie I Multilevel logistische regressie II
nominaal
Multinomiale logistische regressie / Loglineaire analyse Multinomiale logistische regressie Multilevel multinomiale logistische regressie I Multilevel multinomiale logistische regressie I Multilevel multinomiale logistische regressie II
ordinaal Ordinale logistische regressie Ordinale logistische regressie Multilevel ordinale logistische regressie I Multilevel ordinale logistische regressie I Multilevel ordinale logistische regressie II
Meerdere continue
variabelen
MANOVA
 
  Gereed Onder handen
Toetsmatrix II. Schematisch overzicht van verschillende toetsen per type afhankelijke en onafhankelijke variabele.

4 Toelichting op de mogelijke keuzes

4.1 Afhankelijke variabele

Continu

  • Continu: Een continue variabele kan iedere waarde aannemen tussen twee meetpunten. De meest bekende continue variabelen zijn lengte en lichaamsgewicht.1 Bij semi-continue variabelen is de variabele discreet, bijvoorbeeld gehele getallen, met zoveel mogelijkheden dat de data geanalyseerd kunnen worden alsof ze continu zijn. Voorbeelden zijn het aantal studenten dat een tentamen maakt en het aantal broden dat een bakker per dag verkoopt.2

Categorisch

  • Nominaal: Nominale variabelen bevatten categorieën die onafhankelijk van elkaar zijn en niet betekenisvol geordend kunnen worden op basis van de inhoud. Voorbeelden hiervan zijn de antwoordmogelijkheden ‘man’ of ‘vrouw’, ‘rood’, ‘wit’ of ‘blauw’, of verschillende faculteiten binnen een instelling in het hoger onderwijs.
  • Binair: Een binaire variabele bestaat uit maximaal twee categorieën die elkaar uitsluiten, zoals ‘ja’ of ‘nee’, 0 of 1, ‘man’ of ‘vrouw’. Een binaire variabele is in feite een nominale variabele met twee categorieën Nominale variabelen kunnen echter ook meerdere categorieën hebben.
  • Ordinaal: Ordinale variabelen bevatten categorieën die onafhankelijk van elkaar zijn waarin wel een ordening gemaakt worden tussen de categorieën Een voorbeeld hiervan is de beoordeling van een toets als ‘onvoldoende’, ‘voldoende’ of ‘goed’.

Normaal verdeeld

Bepaalde toetsen bevatten de assumptie dat de afhankelijke variabele normaal verdeeld is. Dit kan ingeschat worden door naar een histogram, QQ-plot of boxplot te kijken en kan worden getoetst door normaliteitstoetsen.3

4.2 Soort vergelijking

  • Vergelijking van één groep met een referentie: Een bekende gemiddelde of norm van de totale populatie, zoals het gemiddelde cijfer van een universiteit, wordt vergeleken met een specifieke groep, zoals het gemiddelde cijfer van een opleiding.
  • Gepaard: Bij een gepaarde steekproef worden meerdere metingen van dezelfde observationele eenheid (bijvoorbeeld een student) of van gematchte observationele eenheden met elkaar vergeleken. Een voorbeeld is een studie waarbij studenten vóór een cursus en nà een cursus getest worden op algemene kennis. De score van de algemene kennis van een student voor de cursus wordt gepaard met de score van de algemene kennis van dezelfde student na de cursus. Door de verschillen tussen de voor- en nameting te vergelijken kunnen conclusies worden getrokken over het effect van de cursus op de algemene kennis van de studenten.
  • Ongepaard: Bij ongepaarde steekproeven zijn de observationele eenheden onafhankelijk van elkaar. Er zijn meerdere groepen met meestal verschillende observationele eenheden waartussen geen paring/matching heeft plaatsgevonden. Een voorbeeld is het vergelijken van het gemiddeld cijfer van drie verschillende bacheloropleidingen.