Nederlands Instituut voor Ecologie (NIOO-KNAW)
Data and Information Portal

Project Info

About |  Project II |  Project I |  Vooronderzoek 

Uit een rondvraag bij de verschillende werkgroepen op het NIOO-CEME is gebleken dat er nood is aan een adequaat beheer van en een goede toegankelijkheid tot alle NIOO-CEME data. Door ondermaats beheer is er op het instituut heel wat data die weinig of helemaal niet beschikbaar/toegankelijk is en vaak zelfs onbruikbaar wordt of verloren gaat.

Er zijn op het eerste zicht drie grote sets van gegevens te onderscheiden:

  • Er is het LIMS (Laboratorium Informatie Systeem) met alle meetwaarden die uit de labo analyses voortkomen.
  • Er is het BIS (Benthos Informatie Systeem), een database met de benthische gegevens die door het instituut worden gegenereerd.
  • Door het verloop van personeel (tijdelijke werknemers, doktoraatsstudenten, projectgebonden post-docs,...) is er een groot aantal databestanden dat na het afronden van een onderzoek onbeheerd achterblijft op hard disks van pc's of op losse schijven en op termijn onbruikbaar wordt of verloren gaat.

Het is vooral dit laatste deel van data waarvoor dringend een duurzame oplossing dient gevonden te worden. Om een inschatting te kunnen maken van de omvang en aard van deze laatste groep van data en om te achterhalen wat voor deze data de meest geschikte benadering, wordt een vooronderzoek voorgesteld.

Het vooronderzoek moet leiden tot een beter inzicht in de stappen die gezet dienen te worden om te komen tot een goed beheer en beschikbaarheid van alle NIOO-CEME data.

Deeltaken Vooronderzoek

  Inventarisatie

  • In overleg met een aangestelde contactpersoon per werkgroep zal een overzicht worden opgemaakt van de datasets die binnen elke werkgroep aanwezig zijn.
    • De werkgroepen kunnen zelf naar believen datasets voorschotelen. Er wordt naar gestreefd zoveel mogelijk datasets te inventariseren (binnen de tijdspanne die hiervoor voorzien is). De stimulans voor toelevering door de wetenschapper ligt in het feit dat alle datasets die worden boven water gehaald binnen deze voorstudie ook zullen worden gearchiveerd.
    • Ook een algemene bespreking met betrekking tot data en informatiebeheer maakt deel uit van dit overleg. De gevoerde enquŕte (download) zal dienen als leiddraad bij deze bespreking.
      • Er zal gepeild worden naar de mening van de wetenschapper omtrent de ideale structurele opzet van het databeheer binnen elke werkgroep (bijvoorbeeld invoer door assistenten versus door wetenschappers).
      • Er zal nagegaan worden welke specifieke wensen en verwachtingen de wetenschappers hebben ten aanzien van een data opslagsysteem voor hun data.
      • Er zal bij de wetenschappers gepeild worden naar de nood aan opleiding in data en informatiebeheer.
  • De datasets zullen getraceerd worden en voor elk van de datasets zal een gedetailleerde beschrijving worden opgemaakt aan de hand van de metadata elementen voorzien in de IMIS datasets module. Deze informatie zal als afzonderlijke "NIOO"- collectie in het IMIS informatiesysteem worden opgeslagen zodat deze info gelinkt kan worden aan de gearchiveerde files en deze informatie bevraagbaar kan worden gemaakt via een zoekinterface. Er zal worden nagegaan:
    • om welke datatypes het gaat (vb. laboexperiment, sedimentologische bodemstalen, gis layers, ...). Een indeling in datatypes is belangrijk aangezien de mogelijkheden/keuzes voor het beheer van de datasets hiervan afhankelijk zijn.
    • in welke opslagformaten de datasheets zijn georganiseerd en op welke fysische media de data bewaard worden.
    • welke vereiste (required) metadata ontbreekt of te onvolledig is om goed hergebruik van de datasets mogelijk te maken.
    • welke facultatieve (optional) metadata nodig zijn om de dataset grondig te kunnen beschrijven.
    • wat de omvang is van de datasets zodat de datasets onderling vergelijkbaar worden.
    • wat de oorsprong is van de datasets. Om de datasets te plaatsen binnen hun context zullen waar mogelijk links voorzien worden naar literatuur, projecten, personen, en uiteraard naar de werkgroep(en).
  • Samenvattend zal een inhoudelijke en beheersmatige indeling worden gemaakt van de datasets:
    • Inhoudelijke indeling van de datasets per thema.
    • Beheersmatig overzicht van de datasets per datatype, per formaat en per fysische drager.
    • Beheersmatig overzicht van welke datasets op eenvoudige wijze kunnen ge´ntegreerd worden in de huidige IMERS database (of een andere nog uit te werken generische relationele data structuur) en welke data zeer moeilijk te integreren zijn in een dergelijk relationeel systeem en beter kunnen gearchiveerd worden in een data archief.

  Data integratie - oefening

Om een goede inschatting te kunnen maken van de workload die de data integratie van de NIOO-CEME data met zich mee zal brengen, zullen een aantal datasets of subsets van datasets worden ingevoerd in het IMERS systeem. Rekening houdend met de tijdspanne die binnen deze voorstudie voorzien is voor data integratie, zal een prioriteitenlijstje worden opgesteld van datasets (of subsets ervan) die zullen ge´ntegreerd worden. Er zal bij voorkeur worden gekozen voor het bijeenbrengen van afzonderlijke datasets waarvan de integratie een duidelijke meerwaarde kan bieden. Als deel van deze integratie oefening zal ook gekeken worden naar data van het LIMS, waardoor eventuele problemen omtrent overdracht en koppeling van LIMS naar IMERS zullen worden blootgelegd.

  Data archiveringsoefening

Om een inschatting te kunnen maken van de workload die de data archivering van de NIOO-CEME data met zich meebrengt, zullen alle ge´nventariseerde originele datafiles als een afzonderlijke "NIOO"-collectie in het VLIZ data archief worden opgeslagen. Er komt zodoende dus een kopij van alle in punt 1 getraceerde datasets op de archief server te staan.

  Beschikbaar maken resultaten

Op een afzonderlijke (indien gewenst, afgeschermde) webpagina zal een zoekinterface worden voorzien op de NIOO-collecties van de IMERS en IMIS database. Dit zal ervoor zorgen dat de resultaten van de data integratie en van de inventarisatie (en archivering) door de werkgroepen optimaal kunnen benut en beoordeeld worden. Daarnaast zullen alle resultaten worden opgenomen in een finaal rapport. Dit rapport omvat een bespreking van alle resultaten uit de hierboven vermelde activiteiten inclusief de papieren versie van de inventarisatie die als bijlage in het rapport zal worden opgenomen.

  Formulieren conclusie & adviezen

Op basis van de resultaten zullen bepaalde conclusies en adviezen worden geformuleerd met betrekking tot de stappen die gezet dienen te worden om te komen tot een goed beheer en beschikbaarheid van alle NIOO-CEME data. Deze conclusies, die beschreven zullen worden in het eindrapport, zullen onder meer omvatten:
  • Conclusies in verband met data archivering versus data integratie. Een inschatting van de tijd en effort die zal gaan naar respectievelijk archivering en integratie van de bijeengebrachte datasets.
  • Conclusies in verband met welk soort integratie voor de verschillende datasets het meest lijkt aangewezen.
  • Conclusies in verband met de fractie van de bestaande datasets die per werkgroep werden beschreven en aangeven van eventuele oorzaken waarom overblijvende datasets niet in het vooronderzoek konden worden opgenomen.
  • Conclusie in verband met de fractie van de historische data die niet langer bruikbaar zijn.
  • Conclusie in verband met de grenzen van IMERS ten aanzien van de aanwezige datatypes op NIOO-CEME en oplijsting van de noodzakelijke aanpassingen voor IMIS & IMERS (inclusief deze voor koppeling met LIMS).
  • Adviezen met betrekking tot het opzetten van eventuele vaste formaten voor databeheer voor de op het NIOO-CEME aanwezige data.
  • Adviezen met betrekking tot een goede structurele opzet voor een duurzame informatie en databeheer op het NIOO-CEME.

Planning Vooronderzoek

  Voorbereidend overleg te VLIZ, 24 april 2006, Oostende.

aanwezig: Saskia Woutersen (nioo), Karline Soetaert (nioo-ceme), Edward Vanden Berghe (vliz), Klaas Deneudt (vliz), Roeland 't Jampens (vliz) en Simon Claus (vliz).

  Voorbereidend overleg te NIOO-CEME, 3 oktober 2006, Yerseke.

aanwezig: Saskia Woutersen (nioo), Karline Soetaert (nioo-ceme), Jikke Adema (nioo-ceme), Adri Knuijt (nioo-ceme), Klaas Deneudt (vliz), Tjess Hernandez (vliz) en Robin Brackez (vliz).

  1ste bezoek NIOO-CEME in kader van voorstudie, 5 - 9 maart 2007, Yerseke.

aanwezig: Klaas Deneudt (vliz), Pieter Deckers (vliz) en An Vanhoorne (vliz).

  • maandag 5 maart 2007
    • 10.00 - 12.00: Adri Knuijt (Analytisch laboratorium)
    • 12.30 - 14.00: Jacco Kromkamp (Marine Microbiology)
    • 15.00 - 17.00: Karline Soetaert (Ecosysteem Studies)
  • Woensdag 7 maart 2007
    • 10.00 - 12.00: Herman Hummel & Wil Sistermans (MT)
    • 12.30 - 14.30: Ad Huiskes (Polar Ecology)
  • Donderdag 8 maart 2007
    • 10.00 - 12.00: Peter Herman & Annete Wielemaker (Spatial Ecology)

      2e bezoek NIOO-CEME in kader van voorstudie, week 12 2007, Yerseke.

    aanwezig: Klaas Deneudt (vliz), Pieter Deckers (vliz) en An Vanhoorne (vliz).

  • woensdag 21 maart 2007
    • 10.00 - 12.00: Saskia Woutersen & M.vanderHeijden@nioo.knaw.nl
  • donderdag 22 maart 2007
  • vrijdag 23 maart 2007

      Oplevering eindrapport vooronderzoek, 5 mei 2007.

  • Het eindrapport van het vooronderzoek kan worden gedownload via deze link.

      Presentatie resultaten, 29 mei 2007, Yerseke.

  • This website has been set up to display the results of data and information management project at NIOO
    Hosted by the Flanders Marine Institute (VLIZ) Helpdesk