De strijd om data

Tekst Claudia van Kruistum
Gepubliceerd op 17-10-2016
Claudia van Kruistum - Het is verleidelijk om in het kader van opbrengsten, efficiëntie en effectiviteit op grote schaal gegevens te verzamelen en te koppelen.


Bloed, zweet en tranen

Inlichtingendiensten en techbedrijven verzamelen met groot gemak enorme hoeveelheden data, maar voor onderwijsonderzoekers kost dat nog altijd veel werk. Aan de totstandkoming van een studie alleen al gaan soms jaren van inspanning vooraf. Een voorbeeld daarvan is het onderzoek naar mindmappen in de kleuterklas waar ik bij betrokken ben. Het idee daarvoor ontstond toen mijn collega Chiel van der Veen in 2013 voor zijn promotieonderzoek op een school in Friesland kwam, waar hij een bevlogen lerares trof die mindmaps maakte om haar leerlingen te helpen bij het begrijpen van verhalen. Zij constateerde dat de scores op het onderdeel kritisch luisteren van de Cito Taal voor Kleuters verbeterden, hij raakte geïntrigeerd en een mooie samenwerking was geboren.

Het idee werd verder ontwikkeld, een subsidieaanvraag werd geschreven, de aanvraag werd afgewezen, een pilotonderzoek werd uitgevoerd door een student, twee artikelen voor vaktijdschriften werden gepubliceerd en er werd een nieuwe subsidieaanvraag opgesteld. Zoals ik al zei, een hoop werk, maar op den duur wierp dit vruchten af: begin 2016 werd een bescheiden budget toegekend vanuit het programma kortlopend praktijkgericht onderwijsonderzoek van het Nationaal Regieorgaan Onderwijsonderzoek (NRO).

Het mislukken van cohortonderzoek

Op woensdag 21 september van hetzelfde jaar zaten we met het voltallige onderzoeksteam bij de inspiratiebijeenkomst die NRO organiseerde voor deelnemers aan de gehonoreerde projecten. Rolf van der Velden, hoogleraar aan de Universiteit van Maastricht, presenteerde er nieuwe plannen voor een Nationaal Cohortonderzoek Onderwijs. Dit type onderzoek is heel waardevol, bijvoorbeeld omdat het ons in staat stelt om grote groepen leerlingen over langere tijd te volgen (zoals in COOL5-18, www.cool5-18.nl) en om vergelijkingen met leerlingen in het buitenland te maken (zoals in PISA, www.pisa.nl).

Maar dit type onderzoek kampt met grote problemen, zo constateert Rolf van der Velden met Han van der Maas in het rapport Naar een toekomstbestendig cohortonderzoek (door mij geraadpleegd op 21 september 2016). Scholen hebben een “geringe responsbereidheid”, want deelname vraagt een flinke inspanning en heeft geen duidelijke meerwaarde. Het koppelen van data is lastig vanwege de overgangen tussen primair onderwijs, secundair onderwijs en vervolgonderwijs. De data zijn daarnaast niet toegankelijk genoeg voor onderzoekers van buiten de direct betrokken instituten. Kortom: het kost veel geld, tijd en werk – en levert weinig op.

Datahonger

Maar dat hoeft niet zo te zijn. In het rapport wordt geconstateerd: “De verruimde mogelijkheden van de registerdata, de ontwikkeling van leerlingvolgsystemen en de verplichte rapportages van scholen aan de inspectie voorzien mogelijk al in een belangrijk deel van de gewenste data.” (p. 1) Met andere woorden: er is al veel informatie beschikbaar via DUO, het CBS, de gemeentelijke basisadministratie en de databases van scholen. Concreet gaat het om gegevens over individuele leerlingen zoals:

  • onderwijsloopbaan (onderwijspositie per jaar)

  • cognitieve prestaties (leerjaar 3-8 in het primair onderwijs, CITO eindtoets, advies basisschool, leerjaar 1-3 in het secundair onderwijs, het eindexamen)

  • achtergrondinformatie over het kind en andere gezinsleden (het wonen in een zogenaamd “armoedeprobleemcumulatiegebied”, samenstelling van het huishouden, opleidingsniveau ouders, echtelijke status, geboorteland, onderwijsloopbaan van broers/zussen)

Het advies van de opstellers van het rapport is om scholen standaard de gegevens die zij hebben aan het CBS of DUO te laten leveren en om al deze gegevens te koppelen. Deze data vormen een basisregistratie waarmee veel onderzoeksvragen kunnen worden beantwoord. Ze kunnen bovendien verder worden verrijkt met:

  • overige achtergrondinformatie over het gezin (inkomen, vermogen, werk/uitkering, bezit eigen huis, WOZ-waarde eigen huis)

  • geboortegegevens (geboortegewicht, APGAR-score)

  • gegevens van AWBZ of zorgverzekeraars (medicijngebruik, ziekenhuisopnamen, gegevens van Jeugdzorg/bureau HALT/etc.)

  • overige gegevens van de GGD (ontwikkeling in de eerste zes jaren)

“Deze data zijn potentiële goudmijnen,” staat letterlijk in het rapport (p. 34). En er wordt met bewondering gekeken naar het buitenland, waar in toonaangevend cohortonderzoek leerlingen al voor de leerplichtige leeftijd worden gevolgd en zelfs middelen zijn gereserveerd om dat tot ver na de pensioengerechtigde leeftijd te blijven doen. (Er wordt rekening mee gehouden dat deze leerlingen 115 worden!)

Van grondrecht tot paarse krokodil

Er is geen levendige fantasie voor nodig om hier een parallel te zien met De cirkel van Dave Eggers, een roman over een enorm softwarebedrijf dat met de beste bedoelingen – het tegengaan van misdaad, het vergroten van onderwijssucces – technologische mogelijkheden creëert tot volledige openheid. Het uiteindelijke doel is “Voltooiing”, het rondmaken van de cirkel, oftewel volledige kennis van elke burger hebben:

“We zijn bijna zover dat we van alle leerlingen die van school komen en zich aanmelden voor een vervolgstudie precies weten wat ze hebben geleerd. Elke letter die ze hebben gelezen, elk woord dat ze hebben opgezocht, elke zin die ze hebben gehighlight, elke som die ze hebben gemaakt, elk antwoord en elke correctie. Nattevingerwerk wat de capaciteiten en de kennis van onze leerlingen betreft behoort voorgoed tot het verleden.” (p. 310)

Dat zal menig onderzoeker als muziek in de oren klinken. Geen gedoe met respondenten werven, goedkeuring aan een ethische commissie vragen, consent van ouders krijgen, scholen tevreden houden, uitval en non-respons bij het indienen van publicaties rechtbreien, en rapporten schrijven en workshops organiseren om toch maar iets aan de onderwijspraktijk terug te geven. Voor deze onderzoekers zijn zulke handelingen een “paarse krokodil”, voortvloeisels van overdreven en onredelijke bureaucratie.

Nieuwe privacywetgeving

Van der Velden en Van der Maas tonen zich bewust van de keerzijde van grootschalige datadeling. Scholen verplichten gegevens af te staan ligt politiek moeilijk, wordt in het rapport vermeld. En bij koppeling van individuele gegevens bestaat er het risico op onthulling. De oplossing? Goede afspraken maken met het management van instituten of vakgroepen, luidt het voorstel. En neem afschrikwekkende clausules op, zoals toekomstige uitsluiting van NRO-onderzoek bij overtreding van de privacyregels.

Moet ons dat geruststellen? Het stellen van die vraag komt neer op het lijdzaam accepteren van de datahonger van onderzoekers en hun financiers. Voor we ons de vraag stellen hoe we het delen van gegevens zo veilig mogelijk kunnen doen, zouden we ons de vraag moeten stellen of dit legitiem is. Van wie zijn deze gegevens eigenlijk? Hoeveel zeggenschap behoren leerlingen en hun ouders over persoonlijke gegevens te houden? Mag een school die éénmaal bij intake van een leerling toestemming krijgt om gegevens te verzamelen en delen dat ongebreideld blijven doen?

Tijdens de inspiratiemiddag van NRO gaf Rolf van der Velden zelf al aan dat er juridische haken en ogen aan de in zijn rapport geformuleerde adviezen zitten. Bovendien treedt in 2018 de nieuwe Europese privacywetgeving in werking. Die moet er onder meer voor zorgen dat scholen alleen noodzakelijke gegevens verzamelen (onder de noemer “dataminimalisatie”) en dat leerlingen en hun ouders goed geïnformeerd worden. Kennisnet houdt hier een dossier over bij (door mij geraadpleegd op 2 september 2016). Het is twijfelachtig of de adviezen hiermee in overeenstemming zijn. Maar óók als ze juridisch door de beugel blijken te kunnen, moeten we ons de lastige vragen blijven stellen en diverse belanghebbenden bij het debat betrekken.

De prachtige worsteling van onderwijsonderzoek

Het is verleidelijk om in het kader van opbrengsten, efficiëntie en effectiviteit op grote schaal gegevens te verzamelen en te koppelen. Als onderzoeken naar deze datasets goed worden uitgevoerd, vertrekkend vanuit duidelijk geformuleerde hypothesen, kunnen ze zeer waardevol zijn voor de onderwijspraktijk. Het vraagt dan ook om moed om de moeilijke weg te bewandelen, om contacten met scholen te leggen en te onderhouden, om voor één leerling die ziek was op de dag van een testafname van Amsterdam naar Friesland te rijden, om met scholen zorgen te bespreken die zij hebben over de belasting voor leerkrachten en leerlingen, om ouders uit te leggen waar het onderzoek over gaat, om een amendement in te dienen bij de ethische commissie als er op het laatste moment wordt besloten om toch een extra instrument af te nemen. Het is een worsteling, maar een prachtige worsteling. Het welzijn van de leerling, de warme contacten met de onderwijspraktijk en het benodigde vertrouwen in de wetenschap maken het namelijk de moeite waard.

Claudia van Kruistum is onderwijsonderzoeker aan de Vrije Universiteit Amsterdam. Met dank aan Chiel van der Veen voor het kritisch meelezen.

Bronvermelding

1 Naar een toekomstbestendig cohortonderzoek
2 Privacy op school

Verder lezen

1 Nationaal Cohortonderzoek
2 Wat is er mis met een goede steekproef?

Een ogenblik geduld...
Click here to revoke the Cookie consent