Bouwen met bits en bytes: op zoek naar de core offering van een digitale onderzoeksinfrastructuur
Waarom digitale onderzoeksinfrastructuur
Het begrip ‘onderzoeksinfrastructuur’ roept snel het beeld op van grootschalige onderzoeksfaciliteiten die door verschillende onderzoeken gebruikt kunnen worden. Fysieke infrastructuur dus, voor klassieke onderzoeken. Maar we leven nu in een digitaal tijdperk. Daarin vindt steeds meer onderzoek plaats met digitale data. De opkomst van big data, open data en steeds verdergaande ontwikkeling in artificial intelligence maken het mogelijk om kennis en inzicht te ontwikkelen zonder steekproeven en experimenten. In een maatschappij die steeds verder digitaliseert groeit het aantal digitale datasets explosief. Onderzoek wordt dan ook steeds meer gedreven door data. De datasets zijn echter afkomstig van verschillende bronnen en hebben uiteenlopende structuren, variabelen en metingen. Om deze datasets effectief en efficiënt te gebruiken, is innovatie nodig: op zowel technisch als organisatorisch vlak. Uitdagingen hierbij zijn: Hoe vind je de juiste data? Hoe zorg je ervoor de data op de juiste manier geïnterpreteerd wordt? Hoe waarborg je de integriteit van de data? En welke afspraken moeten er gemaakt worden over datatoegang en datagebruik?
Het antwoord op deze vragen zit in de ontwikkeling van een digitaal ‘wegennet’, oftewel een digitale onderzoeksinfrastructuur, een belangrijk thema in de onderzoeksprogramma’s van de EU. Zo’n digitale onderzoeksinfrastructuur kan niet alleen onderzoekers, maar ook andere stakeholders helpen met hun data-driven onderzoek, bijvoorbeeld in de ontwikkeling van citizen science waar consumenten en burgers steeds meer actief bij betrokken zijn.
Core offering van een digitale onderzoeksinfrastructuur
Maar hoe ontwikkel je een digitale onderzoeksinfrastructuur? Waar begin je mee? Wie moet je erbij betrekken? En welke meerwaarde moet deze onderzoeksinfrastructuur bieden? Hoe maak je zo’n kostbare onderzoeksinfrastructuur dan duurzaam en robuust? Om deze vragen te beantwoorden moet je eerst de core offering van de onderzoeksinfrastructuur bepalen.
Een voorbeeld van een digitale onderzoeksinfrastructuur is het programma ‘Research Infrastructure for Food, Health, and Nutrition’ waar verschillende onderzoeksprojecten aan verbonden zijn. Het EU H2020-project RICHFIELDS is er een van. Als onderzoeker werk ik sinds 2015 aan RICHFIELDS. Een ambitieus project, omdat we hiermee de basis willen leggen voor een gezamenlijke Europese infrastructuur voor onderzoek naar voeding, gezondheid en gedrag.
De infrastructuur waar we aan werken, is primair een onderzoeksinfrastructuur waarmee we wetenschappelijke data en inzichten veel makkelijker kunnen delen, koppelen en gebruiken. Maar om oplossingen te vinden voor maatschappelijke uitdagingen die gerelateerd zijn aan voeding en gezondheid, kunnen we niet zonder de betrokkenheid van andere schakels in de keten. Denk aan consumenten en bedrijven, die ons voeden met data over aankoopgedrag, bereiding, consumptie en leefstijl. Denk ook aan beleidsmakers, die beleidsbeslissingen rond voeding, gezondheid en gedrag baseren op gevalideerde onderzoeksgegevens.
Het is verleidelijk om voor zo’n infrastructuur allerlei functionaliteiten te bedenken om zo veel mogelijk stakeholders te kunnen bedienen. Maar een onderzoeksproject heeft maar een beperkte looptijd en middelen. Dit bekent dat niet alles mogelijk is binnen de beschikbare tijd en middelen. Een keuze vanuit de kernwaarde is dan onvermijdelijk. Met andere woorden: wat is je core offering? Wat wil je in vier jaar, de looptijd van het project, bereikt hebben? En wat kan daarna verder ontwikkeld worden? Wordt het een datahub? Of is het vooral een portal met links naar verschillende databronnen? Bouw je nieuwe standaarden of ga je vooral bestaande standaarden harmoniseren?
Bouwstenen met elkaar definiëren
Idealiter moet de onderzoeksinfrastructuur alle schakels in de (data)keten meerwaarde bieden. Het is echter een lange zoektocht naar de core offering van RICHFIELDS, juist omdat we alle schakels van de keten meerwaarde willen bieden.
Het ontwerp van de onderzoeksinfrastructuur is tot stand gekomen in nauw overleg met vertegenwoordigers van consumenten, bedrijven en overheden. Een belangrijke uitkomst hiervan is het definiëren van de bouwstenen. Bouwstenen van de digitale onderzoeksinfrastructuur zijn bijvoorbeeld datamodellen om variabelen uit verschillende databases vergelijkbaar te maken. Stel bijvoorbeeld dat we onderzoek willen doen naar de bijdrage van het ontbijt aan de gezondheid van Europese consumenten, dan moeten we eerst goed definiëren wat we onder ‘ontbijt’ verstaan. Ontbijtgewoonten verschillen namelijk sterk in Europa, waardoor gegevens uit verschillende onderzoeken niet zomaar te koppelen zijn.
Bouwstenen zoals datamodellen zijn de technische elementen van de digitale onderzoeksinfrastructuur. Een digitale onderzoeksinfrastructuur heeft ook organisatorische bouwstenen nodig. Daarover schrijft mijn collega Marc-Jeroen Bogaardt in een volgende blog.
Zoektocht naar de core offering van RICHFIELDS
Heb jij al ideeën voor de toepassing van de infrastructuur? Laat je ideeën of vragen hieronder achter. Rechtstreeks contact opnemen mag natuurlijk ook!
Wil je meer weten over dit onderwerp? Bezoek dan ook Onderzoeksinfrastructuur voor voeding en gezondheid op wur.nl.