Datenspeicherung
Wahl eines geeigneten Datenformats
Die gezielte Wahl des Datenformats bei der Datenspeicherung kann die Nachnutzbarkeit von Forschungsdaten erheblich verbessern oder sogar erst ermöglichen.
Folgende Aspekte sollten Sie bei der Entscheidung für ein Datenformat berücksichtigen:
- Das gewählte Format sollte in Ihrer Wissenschaftsdisziplin etabliert sein.
- Es sollte im Hinblick auf seine Zukunftsfähigkeit überprüft werden. Hier ist jedoch nur eine Prognose möglich: Je mehr Softwareprodukte das Datenformat lesen können, desto eher wird dieses Format auch zukünftig unterstützt werden.
- Achten Sie darauf, dass die Dokumentation des Formates frei zugänglich ist. Nur dann kann auch in Zukunft eine Software zur Verwendung des Formats entwickelt werden.
- Es dürfen keine technischen Beschränkungen, wie z.B. Verschlüsselungen oder DRMs, die Verarbeitung des Formats behindern.
- Es sollten zudem keine rechtlichen Beschränkungen für die Nutzung des Formates bestehen (z.B. Patente wie MP3).
- Das Format sollte nur die Informationen mit einbeziehen, die für die Forschungsdaten relevant sind. Insbesondere unnötige Formatierungsinformationen (z.B. Schriftgrad für tabellarische Messdaten in ODS oder XLS) sollten vermieden werden.
Wir empfehlen folgende Dateiformate:
Inhalt | Empfohlenes Format | |
---|---|---|
Text | ohne Formatierung: TXT für Editierbarkeit: ODT, RTF, HTML mit Formeln: LaTeX (TEX) In geisteswissenschaftlichen Editionsprojekten: TEI/P5 |
|
Tabelle | numerische Daten: HDF5 | |
Rastergraphik | PNG, TIFF (baseline) | |
Vektorgraphik | SVG, EPS | |
Multimedia | ||
relationale Datenbank | SQL Dump, XML, siehe auch Tabellenformate | |
allg. strukturierte Daten | XML bzw. verbreitete XML-Dialekte, JSON, YAML |