piwik-script

Intern
Research Data Management

Dokumentation und Metadaten

Damit Sie Ihre Daten identifizieren und auffinden oder sie anderen Forschenden zugänglich machen können, müssen Sie Ihre Daten erschließen. Dazu werden Ihre Daten mit Hilfe eines Metadatenschemas beschrieben und gleichzeitig erläutert. Durch die Benutzung geeigneter Metadaten können Sie Ihre Forschungsdaten nicht nur managen, sondern sie über lange Zeiträume verstehen und benutzen oder auch anderen Forschenden zur Verfügung stellen.

So erfasst beispielsweise der weit verbreitete allgemeine Metadatenstandard Dublin Core Informationen zu den Identifikatoren (ISBN, DOI etc.), den technische Angaben (Dateiformate etc.), der inhaltlichen Beschreibung Ihrer Daten (wie zugrundeliegende Fragestellungen oder angewandte Forschungsmethoden) und sogar Verweise auf Dokumente, zu denen Ihre Daten einen Bezug haben.

Ein guter Überblick über disziplinspezifische Metadatenstandards ist auf den Seiten des britischen Digital Curation Centre (DCC) und der RDA Metadata Standards Directory Working Group zu finden. Zusätzlich können geeignete Standards für spezifische Datentypen über FAIRsharing.org gesucht werden.

Um eine erschöpfende Nutzung der Metadaten zu ermöglichen, sollten möglichst einheitliche Begrifflichkeiten und gleichartige Beschreibungen gebraucht werden. Nur wenn gleiche Dinge auch gleich benannt werden, ist es möglich, anhand der verwendeten Begriffe exakte und vollständige Suchergebnisse zu erzielen und Forschungsdaten folgerichtig miteinander zu verknüpfen.

Deshalb sollten Sie beim Ausfüllen der Metadaten-Felder ein sogenanntes kontrolliertes Vokabular benutzen. Es handelt sich dabei um die Vorgabe bzw. Definition von festen Begriffen und Regeln, zusammengefasst in Wortlisten oder strukturierten Thesauri. Ein solches kontrolliertes Vokabular kann für den jeweiligen Einzelfall projektintern selbst erstellt und benutzt werden. Zur Vereinheitlichung der sprachlichen Vielfalt ist jedoch empfehlenswert, standardisierte Vokabulare und Thesauri zu verwenden. Sie weisen häufig eine fachspezifische oder institutionelle Ausrichtung auf und werden von den zuständigen Einrichtungen fortlaufend gepflegt und verbreitet.

Zu den kontrollierten Vokabularen zählen auch sog. Normdaten. Es handelt sich um Datensätze, die Personen, Organisationen, aber auch Konzepte oder Werke der Literatur, Musik, des Films, von Artefakten, Bauwerken und Orten beschreiben. Dabei werden der jeweilige semantische Kontext abgebildet und dauerhafte Identifikatoren hinzugefügt. Wissenschaftseinrichtungen im deutschsprachigen Raum nutzen oftmals Normdaten der Gemeinsamen Normdatei (GND).

Auch sogenannte Klassifikationen gehören zu kontrollierten Vokabularen. Durch ihren Einsatz werden Daten systematisch geordnet und gleichzeitig einheitlich beschrieben.

Ein weltweites Verzeichnis von kontrollierten Vokabularen, Normdateien, Klassifikationen, Thesauri, Ontologien und Taxonomien wird an der Universität Basel entwickelt (BARTOC Basel Register of Thesauri, Ontologies & Classifications).