De Nederlandse Organisatie voor Wetenschappelijk Onderzoek wil dat wetenschappers hun data openbaar maken. Onderzoekers zijn graag transparant, maar zien ook nadelen.
Een Nederlandse onderzoeker ontdekt een nieuwe techniek die baarmoederhalskanker kan voorkomen. Hij zet zijn ruwe data op het internet. Een maand later staat op de voorpagina van ‘The New York Times’ dat een Amerikaanse wetenschapper een nieuwe techniek heeft ontdekt die baarmoederhalskanker voorkomt.
Deze scene is verzonnen, maar dit soort piraterij dreigt nu de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) wil dat onderzoekers hun data openbaar maken. Het NWO is de grootste onafhankelijke financier van wetenschappelijk onderzoek in Nederland. Elke wetenschapper die subsidie krijgt van NWO, moet bereid zijn de data te delen met andere onderzoekers. NWO doet dat vanuit zijn positie als producent en wil hiermee toegankelijkheid en transparantie afdwingen. “Het gaat ons niet om het openbaar maken, maar om het delen van de data”, benadrukt Ron Dekker, directeur Instituten bij NWO. “Dataverzameling is een dure aangelegenheid. Waarom zou je een bepaalde verzameling twee keer moeten doen?”
Hoe de data openbaar wordt gemaakt, is volgens Dekker ook afhankelijk van de discipline. “Bij de medische wetenschappen kunnen privacy-aspecten een rol spelen. Dan kun je de gegevens bijvoorbeeld eerst anonimiseren.” Het is volgens Dekker vooral de bedoeling dat onderzoekers onderling elkaars data kunnen inzien en gebruiken. En dit is volgens hem logisch: “Los van het feit of je data deelt, heb je bepaalde software nodig om überhaupt data te kunnen lezen. Ook heb je kennis nodig om data te kunnen analyseren.”
Wat vinden onderzoekers van deze eis? Waar zitten de problemen? En wat betekent dit voor de internationale positie van Nederland in de wetenschap? Een rondgang langs vijf onderzoekers aan de Universiteit van Amsterdam (UvA).
Transparantie
Data moeten openbaar zijn want het vergroot de transparantie, daar zijn alle vijf ondervraagden het over eens. Jelte Wicherts, universitair docent Psychologische Methodeleer: “Als je denkt dat een analyse niet deugt en ‘m opnieuw wil doen, moet je de data kunnen opvragen”. Dat is de volgens Wicherts “een van de belangrijkste regels van het wetenschapsspel”. Onderzoeker van Programmagroep Brein en Cognitie bij Psychologie, Dick Bierman voegt toe: “Het is publiek geld, dat betekent publieke return. Ik zie niet in dat ook maar één wetenschapper anders kan beweren”.
Maar de onderzoekers willen wel eerst weten wat de NWO precies onder ‘data’ verstaat. “Het standpunt van de NWO is op dit moment zo verschrikkelijk vaag”, zegt Bernard Nienhuis, hoogleraar theoretische natuurkunde en verbonden aan het Instituut van Theoretische Fysica. “Je kunt geen betekenis geven aan de doelstelling ‘data toegankelijk maken’. Om welke data gaat het?” Ook Mark Golden, hoogleraar instrumentele natuurkunde en oud-directeur van het Van der Waals-Zeeman onderzoeksinstituut, vraagt zich dit hardop af: “Zijn het de grafieken in de publicatie, of alle oorspronkelijke meetdata?” Hij redeneert: “Als mijn promovendus in een grafiekje een x- en een y-waarde meet, komt daar een curve uit. Vervolgens nemen we een kopje koffie, gaan we overleggen en besluiten we: ruis uit de curve halen en een nieuwe curve meten. Deze nieuwe curve behoort niet tot de oorspronkelijke meetdata, maar het is wel data”. Golden vraagt zich ook af of de NWO genoeg datacapaciteit heeft om al die versies op hun server te zetten. “Het begrip ‘data’ heeft een ruime definitie”, reageert Dekker, directeur Instituten bij NWO. “Het is de hele range: van ruwe data tot aan de publicatie.” En, vervolgt Dekker “we begrijpen heel goed dat data delen niet zomaar kan. Het moet technisch haalbaar zijn en goed georganiseerd worden.”
Mogelijke problemen
Hoewel alle vijf onderzoekers dus voor openbaarheid zijn, zien ze ook mogelijke problemen. Zo is tien procent van psychologieonderzoek volgens Wicherts privacygevoelig en daarom moeilijk openbaar te maken. “Voor veel onderzoekers is het onduidelijk hoe ze data moeten bijhouden”, aldus Wicherts, “Als je een statistiekboek opentrekt over analyse wordt veel aandacht besteed aan statistisch toetsen, maar nergens staat hoe je data netjes bijhoudt of moet archiveren”.
Hoogleraar instrumentele natuurkunde Golden zegt dat de universiteit het meeste betaalt, niet de NWO. “Zij betalen mij, het gebouw, de apparatuur, de verwarming en het wc-papier. De NWO betaalt alleen de promovendus.” Volgens Golden is de universiteit daarom ook mede-eigenaar van de data. En hij ziet nog een probleem: “Stel ik doe een gezondheidsonderzoek of het eten van kroketten de kans op kanker verhoogd. Ik volg 1000 Nederlandse pubers die één kroket per dag eten. Totdat ze kanker krijgen, of dood gaan, kan ik niks over het onderzoek zeggen. Maar als ik tussendoor mijn data publiek moet maken, gaan mensen allerlei voorbarige conclusies trekken”. Het is volgens Golden aan “de ambacht van de wetenschap” te weten hoe lang data moeten lopen om er iets “relevants” over te zeggen.
Je geeft de carrière van een jonge onderzoeker uit handen als in een vroeg stadium de data openbaar worden gemaakt, vindt Jelle Koopmans, adjunct-directeur Instituut voor Cultuur en Geschiedenis, lid KNAW en universitair hoofddocent Franse taal en letterkunde (UvA). Jonge onderzoekers komen volgens hem op basis van hun proefschrift “binnen in de grote wetenschappelijke wereld”. Koopmans: “Ik vind het geen wenselijke ontwikkeling alles naar buiten te gooien, voordat ze hun eerste hoofdstuk hebben geschreven.”
Nienhuis wil liever geen voorbeeld geven omdat hij niet als tegenstander van openbaarheid wil overkomen. Maar na aandringen bedenkt hij er toch een: “Als je onderzoek doet naar bepaalde besmettelijke ziektes, kan iemand anders die data gebruiken voor het ontwikkelen van biologische wapens. Dan help je onderzoek met de verkeerde doelstellingen”.
Bierman, onderzoeker Brein en Cognitie, is bang dat de onderzoeker – door het direct openbaar maken van data – teveel onder druk wordt gezet. “Laat ‘m in alle rust het model en de hypothesen toetsen. Onder druk toetsen, is geen goed idee en zorgt niet voor een goede uitwerking. Laat de onderzoeker eerst publiceren en maak daarna de data publiek.”
Daar zijn alle vijf de ondervraagden het over eens: eerst publiceren, vervolgens data openbaar maken. Hoogleraar theoretische Natuurkunde Nienhuis: “Het beschikbaar stellen van de resultaten is een veel belangrijker streven dan het beschikbaar stellen van de data”. Is dit de arrogantie van de wetenschap? De onderzoekers moeten om deze vraag lachen en antwoorden ontkennend. “Dat is ook een van de problemen: onderzoekers die data verzamelen, denken vaak dat deze van hen zijn”, zegt Universitair docent Psychologische Methodeleer Wicherts.
Verschil alpha en bèta
In de bètawetenschappen zijn bijna alle data al openbaar. “Het zelfreinigend vermogen van de bètawetenschappen is groot”, zegt Golden, hoogleraar instrumentele Natuurkunde hierover. “Als ik iets moois claim, maar de rest het onderzoek niet kan repliceren, is mijn resultaat niet meer geldig.” Bierman: “Naarmate een wetenschap harder en objectiever is, is het makkelijker data uit te wisselen”. Volgens Wicherts is bètaonderzoek gemakkelijker te controleren: “Onder die en die omstandigheden is dit en dat gevonden. Een bètawetenschapper gaat deze omstandigheden in zijn eigen lab nabouwen. Lukt het niet, dan gaan de alarmbellen rinkelen.”
Wicherts wijst op een verschil tussen de bèta- en de gammawetenschappen: “In de psychologie kun je niet in deze mate van detail andermans onderzoek nadoen.” Want er worden volgens hem in de gammawetenschappen veel meer keuzes gemaakt in de analyse van de data. En een variabele in deze wetenschappen kan op verschillende manieren worden geïnterpreteerd. Wicherts: “Een onderzoeker zegt: deze behandeling zorgt voor minder depressie. Uiteindelijk blijkt dat deze behandeling bij mannen beter werkt. Of bij vrouwen. Het is dus denkbaar dat veel meer interessants te vinden is in die data, of dat de onderzoeker iets nalaat op te schrijven. De enige manier om hier achter te komen is de data te bekijken. Dus die moet openbaar zijn”
Bij alfawetenschappen is het simpel: de meeste data zijn al openbaar. “Vaak is deze kwestie bij ons totaal irrelevant. Als voorbeeld iemand die schrijft over de ontwikkelingen van de moderne Marokkaanse roman. Die boeken kun je gewoon bestellen”, zegt Koopmans. Of je kunt het opvragen in een publieke collectie. “Mensen die onderzoek doen naar de berichtgeving in de Nederlandse pers tijdens de nationalistische acties in Indonesië, kijken in archieven en kranten. Het is geen taak van hen om ook nog deze data te verzorgen. Die vind je gewoon in de Koninklijke Bibliotheek.”
Concurrentiepositie
Als de NWO de data openbaar maakt, is dit niet slecht voor de Nederlandse positie in de wetenschappelijke wereld, vinden de onderzoekers. Het is eerder een positieve ontwikkeling, vooral als meer landen zouden volgen. Hoogleraar theoretische natuurkunde Nienhuis: “Deze beweging moet wereldwijd op gang komen. Het is goed als Nederland hierin het voortouw neemt, maar niet alleen. De NWO is mans genoeg om ook in contact te treden met buitenlandse organisaties.” Koopmans: “De huidige academische cultuur in de geesteswetenschappen is vooral gericht op de persoon van de onderzoeker”. Bierman: “Een onderzoeker wordt niet alleen beoordeeld op grond van de publicaties, maar ook op de citaties. En hoe meer data je openbaar maakt, hoe meer citaties”. Wicherts geeft de onderzoekers die tegen het openbaar maken van data zijn één tip: “Je bent een oelewapper als je in een keer alle extra data openbaar maakt. Met één data-set kun je soms twee of drie artikelen schrijven. Maar dit komt goed, ze zijn niet achterlijk”.