piwik-script

Deutsch Intern
Research Data Management

Datenspeicherung

Wahl eines geeigneten Datenformats

Die gezielte Wahl des Datenformats bei der Datenspeicherung kann die Nachnutzbarkeit von Forschungsdaten erheblich verbessern oder sogar erst ermöglichen.

Folgende Aspekte sollten Sie bei der Entscheidung für ein Datenformat berücksichtigen:

  • Das gewählte Format sollte in Ihrer Wissenschaftsdisziplin etabliert sein.
  • Es sollte im Hinblick auf seine Zukunftsfähigkeit überprüft werden. Hier ist jedoch nur eine Prognose möglich: Je mehr Softwareprodukte das Datenformat  lesen können, desto eher wird dieses Format auch zukünftig unterstützt werden.
  • Achten Sie darauf, dass die Dokumentation des Formates frei zugänglich ist. Nur dann kann auch in Zukunft eine Software zur Verwendung des Formats entwickelt werden.
  • Es dürfen keine technischen Beschränkungen, wie z.B. Verschlüsselungen oder DRMs, die Verarbeitung des Formats behindern.
  • Es sollten zudem keine rechtlichen Beschränkungen für die Nutzung des Formates bestehen (z.B. Patente wie MP3).
  • Das Format sollte nur die Informationen mit einbeziehen, die für die Forschungsdaten relevant sind. Insbesondere unnötige Formatierungsinformationen (z.B. Schriftgrad für tabellarische Messdaten in ODS oder XLS) sollten vermieden werden.

Wir empfehlen folgende Dateiformate:

Inhalt Empfohlenes Format
Text

PDF, ideal: PDF/A

ohne Formatierung: TXT

für Editierbarkeit: ODT, RTF, HTML

mit Formeln: LaTeX (TEX)

In geisteswissenschaftlichen Editionsprojekten: TEI/P5

 

 

Tabelle   

CSV / TSV

numerische Daten: HDF5

 
Rastergraphik PNG, TIFF (baseline)  
Vektorgraphik SVG, EPS  
Multimedia

Container: MKV, WebM, OGG

Video-Codec: VP8, Theora

Audio-Codec: FLAC, WAV (PCM-Daten), Vorbis, Opus

 
relationale Datenbank SQL Dump, XML, siehe auch Tabellenformate  
allg. strukturierte Daten XML bzw. verbreitete XML-Dialekte, JSON, YAML