Resultaat onderzoek project NDE-Bruikbaar "Organisaties en Datasets"


Welke erfgoedinstellingen hebben gegevens over hun collectie in digitale vorm beschikbaar? Hoe kunnen gebruikers deze gegevens benaderen? Is de collectie zelf ook digitaal benaderen of alleen de metadata? Welke middelen zijn daarvoor nodig? Is er overlap tussen de collecties? Is er een eenduidige manier te vinden waarop we de gegevens over collecties kunnen beschrijven?

Het onderzoek


In 2019 vond er een inventarisatie plaats waarin een antwoord op deze vragen werd gezocht. In het netwerk van erfgoedinstellingen is de oproep gedaan om aan te geven welke datasets de organisaties beschikbaar stellen. Vervolgens is er een script gebouwd waarmee automatisch deze informatie kan worden verzameld. Er is nu een overzicht van organisaties en de datasets. Hiermee hebben we ook andere informatie gekregen, zoals: in welke formaten worden de gegevens aangeboden, volgens welke protocollen, wat zijn de onderwerpen van de datasets.

De data is afkomstig uit de Bruikbaar Register DataSpace

Organisaties en datasets

Het volgende overzicht laat zien hoeveel datasets er op een of andere manier (eigenaar, uitgever, beheerder) bij een organisatie horen:

Datasets komen vaak voor in een zogenaamd register. Een register kan de vorm aannnemen van een catalogus, een portaal of gewoon een website. Sommige registers bevatten erg veel datasets. :

Datasets kunnen gegevens via verschillende kanalen distribueren. Onderstaand overzicht geeft weer wat de verhouding is tussen organisaties, registers, datasets en distibuties.

Er zijn veel verschillende data formaten:

...en het deel Linked Data van al die datasets is:

Meer werk nodig

De formaten waarin de datasets worden aangeboden verschillen nogal. Deze lijst moet duidelijk genormaliseerd worden via meer navraag bij de bron..:

Hoe zit het met dubbelingen? Deze datasets komen meerdere keren voor (dit komt door de wijze van harvesten):

Er zijn ook meer organisatie URIs die dezelfde naam hebben (dit komt door de wijze van harvesten):

De organisatienamen en in welke graph ze voorkomen:

In het bestand van het project Aggregatoren zitten meer organisaties dan we hebben onderzocht in het project Organisaties en Datasets. Deze onderstaande organisaties komen niet voor in het register: