piwik-script

Intern
Research Data Management

Datenspeicherung

Die folgenden Speicherlösungen stellt die JMU ihren Wissenschaftler:innen zur Verfügung.

Datenspeicherung im Forschungsprozess

Cloud-Lösungen sind zu empfehlen, wenn Sie in einer Arbeitsgruppe Dateien austauschen sowie gemeinsam bearbeiten möchten. Cloud-Speicher bieten eine geräteübergreifende Synchronisierung von Ordnern und Dateien auf allen internetfähigen Endgeräten. Dadurch sind die Daten von überall aus zugänglich und alle Arbeitsschritte in einer Gruppe können mittels Versionsverlauf nachvollzogen werden.

Die JMU bietet mit bwSync&Share, TeamDrive und Dropbox Education derzeit drei Cloud-Lösungen an.

bwSync&Share

bwSync&Share ist ein DFN-Cloud-Dienst für die Forschung und Lehre, der durch das Steinbuch Centre for Computing (SCC) am Karlsruher Institut für Technologie (KIT) betrieben wird. Die Daten liegen auf den Servern des SCC am KIT. Der standardmäßige Speicherplatz umfasst 50 GB. Er kann jedoch auf bis zu 200 GB erhöht werden. Der Cloud-Dienst ist kostenpflichtig über den WebShop zu bestellen. Gäste können auch auf die Cloud zugreifen, wenn Sie eingeladen werden. Sie haben allerdings kein eigenes Speicherkontingent.

Dropbox Education

Dropbox Education ist ein smarter Workspace für zeit- und ortsunabhängige Teamzusammenarbeit. Der Dienst wird von Dropbox Inc. mit Sitz in den USA betrieben. Die Daten liegen im ruhenden Zustand auf Servern in Frankfurt a. Main. Die standardmäßige Speicherkapazität umfasst 15 GB, kann jedoch erweitert werden. Dropbox-Education ist kostenpflichtig über den WebShop zu bestellen.

Besonders schützenswerte Daten sollten nur verschlüsselt in der Cloud gespeichert werden. Wir empfehlen hierfür Cryptomator oder Veracrypt.

Teamdrive

Teamdrive ist ein sicherer, datenschutzkonformer und kostenfreier Cloud-Dienst. Die Daten liegen auf den Servern der Bundeswehr-Universität München, die auch den Dienst betreibt und regelmäßige Backups der Daten durchführt. Die Daten werden Ende-zu-Ende verschlüsselt, sobald sie Ihren Client bei der Datenübertragung verlassen. Der Schlüssel verbleibt auf Ihrem Computer und muss von Ihnen ebenfalls in ein Backup integriert werden. Denn ohne diesen Schlüssel, lassen sich die Daten auf dem Server nicht mehr lesen. Die standardmäßige Speicherkapazität umfasst 5 GB. Sie kann für Wissenschaftler:innen unter https://teamdrive.unibw.de auf bis zu 50 GB erhöht werden.

Der Cloud-Dienst bwSync&Share soll Teamdrive mittelfristig vollständig ersetzen. Teamdrive wäre deshalb nur noch für Forschungsvorhaben eine Option, die bis Ende 2024 abgeschlossen sind.

Individueller Speicherplatz

Für Forschungsdaten, die nicht mit anderen geteilt werden sollen, stellt die JMU jedem Universitätsangehörigen einen individuellen Speicherplatz auf den Servern der JMU bereit (Persönliches Netzlaufwerk J:). Die standardmäßige kostenfreie Speicherkapazität umfasst 5 GB. Sie kann für Wissenschaftler:innen jedoch kostenpflichtig über den WebShop erhöht werden.

Speicherplatz für Arbeitsgruppen und Projekte

Wenn Sie gemeinsam genutzte Dokumente an einem Ort speichern möchten, so dass mehrere Personen an der JMU Zugriff auf die Dateien haben, können Sie einen Speicherplatz für Arbeitsgruppen und Projekte im WebShop beantragen (sog. Institutslaufwerke L:).

Rechtemanagement: Die Zugriffsrechte auf das Netzlaufwerk innerhalb der Gruppe werden im User-Portal durch den/die Gruppenadministrator:in festgelegt. Auf den beiden obersten Ordnerebenen können die Zugriffsrechte definiert werden. Die Rechte vererben sich dann auf die unteren Ebenen weiter.

Weitere Informationen zu Netzlaufwerken

Die Forschungsdaten, die auf den Netzlaufwerken (Persönliches Netzlaufwerk, Gruppen-/Projektlaufwerk) liegen, werden zentral auf Servern im Rechenzentrum gespeichert. Alle Netzlaufwerke sind in die regelmäßigen Backups des Rechenzentrums integriert. Um auf die Daten außerhalb des universitätsweiten Datennetzes zuzugreifen, ist eine VPN-Verbindung notwendig.

Daten mit normalem Schutzbedarf können auf den Netzlaufwerken abgelegt werden. Forschungsdaten mit höherem Schutzbedarf, beispielsweise personenbezogene Daten, sollten nur mit zusätzlicher Verschlüsselung auf den Laufwerken aufbewahrt werden. Wir empfehlen hierfür Cryptomator oder Veracrypt.

  • Kostenpflichte Bestellung von Netzwerkspeicher im WebShop
  • Informationen des Rechenzentrums zu Netzlaufwerken

GigaMove

Um große Dateien mit internen oder externen Kooperationspartner:innen bidirektional auszutauschen, können Sie GigaMove nutzen. Die Dateien können in GigaMove zwischen 7 bis 14 Tage gespeichert und anderen Personen über einen Link per Mail zur Verfügung gestellt werden. Dateien bis zu einer Größe von 100 GB können über den File-Upload-Dienst ausgetauscht werden. Ingesamt steht allen Mitarbeiter:innen der Universität Würzburg 1 TB Speicher auf dem System zur Verfügung.

GigaMove ist ein Dienst, der von der RWTH Aachen betrieben wird. Der Datenaustausch findet über einen Server der RWTH-Aachen statt. Für vertrauliche und personenbezogen Daten ist der Dienst nicht zu empfehlen. Falls solche Daten doch über GigaMove ausgetauscht werden, dann sollten die Dateien immer vorher verschlüsselt werden.

Die Anmeldung bei GigaMove erfolgt über folgenden Link: https://gigamove.rwth-aachen.de/de

Server-Housing von Hardware-Servern

Falls Sie als Arbeits- oder Projektgruppe ein eigenes Speichersystem zur Verfügung haben, das Sie selbst administrieren möchten und dafür einen möglichst sicheren Standort suchen, können Sie auf die Infrastruktur des Rechenzentrums zurückgreifen. Das Rechenzentrum stellt dezentrale, klimatisierte und zugangsbeschränkte Serverräume sowie eine abgesicherte Stromversorgung unter Einhaltung der Brandvorschriften bereit.

Server-Housing von Virtuellen Maschinen

Falls sie in einer Arbeits- oder Projektgruppe fachspezifische Anwendungen einrichten, speichern und auswerten möchten und eine Infrastruktur benötigen, können Sie sich am Rechenzentrum einen virtuellen Server in einer VMware vSphere-Umgebung mieten. Dadurch entfallen für Sie Beschaffungsprozesse und der Betrieb eigener Serverhardware. Ihre Aufgabe beschränkt sich darauf, Ihre Anwendung zu installieren, zu konfigurieren und die virtuelle Maschine selbständig zu administrieren.

Datenspeicherung nach dem Forschungsprozess

Falls Sie größere Mengen an Forschungsdaten haben, die Sie nicht mehr aktiv im Forschungsprozess benötigen und die Sie im Sinne der guten wissenschaftlichen Praxis an einem sicheren Speicherort für 10 Jahre aufbewahren möchten, steht Ihnen der Archivserver des Rechenzentrums zur Verfügung.

Wenn Sie Forschungsdaten nach den FAIR-Prinzipien veröffentlichen möchten, können sie als Wissenschaftler:in der Universität Würzburg das institutionelle Forschungsdatenrepositorium WueData nutzen.

WueData bietet folgende Leistungen:

  • Sehr große Bandbreite an Datentypen, die veröffentlicht werden können
  • Beschreibung der Daten mit Metadaten, damit die Datenpublikation leichter gefunden werden kann
  • Festlegen einer (offenen) Lizenz, um Urheberrechte transparent zu machen
  • Vergabe eines Digital Object Identifiers (DOI) für eine dauerhafte Auffindbarkeit der Datenpublikation
  • Ergänzung der Forschungsdaten um Studiendokumente, um die Nachnutzbarkeit zu erhöhen
  • Lokale Datenspeicherung inklusive Backup auf den Servern der Universität Würzburg
  • Garantierte Mindestaufbewahrungsdauer von 10 Jahren

Wahl eines geeigneten Datenformats

Die gezielte Wahl des Datenformats bei der Datenspeicherung kann die Nachnutzbarkeit von Forschungsdaten erheblich verbessern oder sogar erst ermöglichen.

Folgende Aspekte sollten Sie bei der Entscheidung für ein Datenformat berücksichtigen:

  • Das gewählte Format sollte in Ihrer Wissenschaftsdisziplin etabliert sein.
  • Es sollte im Hinblick auf seine Zukunftsfähigkeit überprüft werden. Hier ist jedoch nur eine Prognose möglich: Je mehr Softwareprodukte das Datenformat  lesen können, desto eher wird dieses Format auch zukünftig unterstützt werden.
  • Achten Sie darauf, dass die Dokumentation des Formates frei zugänglich ist. Nur dann kann auch in Zukunft eine Software zur Verwendung des Formats entwickelt werden.
  • Es dürfen keine technischen Beschränkungen, wie z.B. Verschlüsselungen oder DRMs, die Verarbeitung des Formats behindern.
  • Es sollten zudem keine rechtlichen Beschränkungen für die Nutzung des Formates bestehen (z.B. Patente wie MP3).
  • Das Format sollte nur die Informationen mit einbeziehen, die für die Forschungsdaten relevant sind. Insbesondere unnötige Formatierungsinformationen (z.B. Schriftgrad für tabellarische Messdaten in ODS oder XLS) sollten vermieden werden.

Wir empfehlen folgende Dateiformate:

Inhalt Empfohlenes Format
Text

PDF, ideal: PDF/A

ohne Formatierung: TXT

für Editierbarkeit: ODT, RTF, HTML

mit Formeln: LaTeX (TEX)

In geisteswissenschaftlichen Editionsprojekten: TEI/P5

 

 

Tabelle   

CSV / TSV

numerische Daten: HDF5

 
Rastergraphik PNG, TIFF (baseline)  
Vektorgraphik SVG, EPS  
Multimedia

Container: MKV, WebM, OGG

Video-Codec: VP8, Theora

Audio-Codec: FLAC, WAV (PCM-Daten), Vorbis, Opus

 
relationale Datenbank SQL Dump, XML, siehe auch Tabellenformate  
allg. strukturierte Daten XML bzw. verbreitete XML-Dialekte, JSON, YAML